Hệ thống học tập liên kết (Federated Learning) NVIDIA Clara dự đoán các yêu cầu mà không cần chia sẻ dữ liệu và xây dựng mô hình AI tổng quát hơn bất kể vị trí địa lý, số lượng bệnh nhân hoặc kích thước dữ liệu.
Các nhà nghiên cứu tại bệnh viện Massachusetts General Brigham và NVIDIA đã phát triển một mô hình AI để xác định liệu một người có mặt trong phòng cấp cứu với các triệu chứng COVID-19 có cần bổ sung vài giờ cấp oxy, thậm chí vài ngày, sau cuộc kiểm tra đầu tiên hay không.
Mô hình ban đầu, được đặt tên là CORISK, được phát triển bởi tiến sĩ, nhà khoa học Quanzheng Li tại Mass General Brigham. Nó kết hợp hình ảnh y tế và hồ sơ sức khỏe để giúp các bác sĩ lâm sàng quản lý hiệu quả hơn các trường hợp nhập viện vào thời điểm mà nhiều quốc gia có thể bắt đầu chứng kiến làn sóng bệnh nhân COVID-19 thứ hai.
Để phát triển một mô hình AI mà các bác sĩ tin tưởng và phổ biến cho càng nhiều bệnh viện càng tốt, NVIDIA và Mass General Brigham đã bắt tay vào một sáng kiến có tên EXAM ( E MR C X R A I M odel), sáng kiến học tập liên kết đa dạng và lớn nhất với 20 bệnh viện từ khắp nơi trên thế giới.
Chỉ trong hai tuần, sự hợp tác toàn cầu đã đạt được một mô hình với 0.94 diện tích dưới đường cong (với mục tiêu AUC là 1.0), kết quả đã dự đoán một cách tuyệt vời về mức độ oxy cần thiết cho bệnh nhân đến nhập viện. Mô hình học tập liên kết sẽ được phát hành như một phần của NVIDIA Clara trên NGC trong những tuần tới.
Nhìn vào bên trong Sáng kiến ’EXAM’
Sử dụng nền tảng học tập liên kết (Federated Learning Framework) NVIDIA Clara , các nhà nghiên cứu tại các bệnh viện riêng lẻ có thể sử dụng X-quang phổi, thông số bệnh nhân và các giá trị lấy từ các labs để đào tạo mô hình cục bộ và chỉ chia sẻ một tập hợp con trọng số mô hình trở lại với mô hình toàn cục trong một kỹ thuật đảm bảo tính riêng tư được gọi là học tập liên kết (federated learning).
Mục tiêu cuối cùng của mô hình này là dự đoán khả năng một người có mặt trong phòng cấp cứu sẽ cần oxy bổ sung hay không, có thể hỗ trợ các bác sĩ xác định mức độ chăm sóc thích hợp cho bệnh nhân, bao gồm cả việc đặt ICU.
Tiến sĩ Ittai Dayan, giám đốc phát triển và triển khai AI tại Mass General Brigham, đã đồng dẫn đầu sáng kiến EXAM với NVIDIA, và tạo điều kiện cho việc sử dụng CORISK làm điểm khởi đầu cho việc đào tạo học tập liên kết. Những cải tiến đã đạt được bằng cách đào tạo mô hình dựa trên dữ liệu phân tán từ một tập dữ liệu đa quốc gia, đa dạng về bệnh nhân trên khắp Bắc và Nam Mỹ, Canada, Châu Âu và Châu Á.
Ngoài Mass Gen Brigham và các bệnh viện trực thuộc, những người tham gia khác bao gồm: Bệnh viện Quốc gia Nhi đồng ở Washington DC; Trung tâm Nghiên cứu Y sinh NIHR Cambridge; Bệnh viện Trung tâm Lực lượng Phòng vệ ở Tokyo; Đại học Quốc gia Đài Loan MeDA Lab và MAHC và Cục Bảo hiểm Y tế Quốc gia Đài Loan; Bệnh viện Đa khoa Tri-Service ở Đài Loan; Bệnh viện Đại học Quốc gia Kyungpook ở Hàn Quốc; Khoa Y, Đại học Chulalongkorn Thái Lan; Diagnosticos da America SA ở Brazil; Đại học California, San Francisco; VA San Diego; Trường đại học Toronto; Viện Y tế Quốc gia ở Bethesda, Maryland; Đại học Wisconsin-Madison Trường Y khoa và Y tế Công cộng; Trung tâm Ung thư Memorial Sloan Kettering ở New York; và Hệ thống Y tế Mount Sinai ở New York.
Mỗi bệnh viện trong số này đều sử dụng NVIDIA Clara để đào tạo mô hình địa phương và tham gia vào dự án EXAM.
Thay vì cần tập hợp các tia X-quang ngực của bệnh nhân và các thông tin bí mật khác vào một địa điểm duy nhất, mỗi tổ chức sử dụng một máy chủ nội bộ an toàn cho dữ liệu của mình. Một máy chủ riêng biệt, được lưu trữ trên AWS, nắm giữ mạng nơ-ron sâu (deep neural network) toàn cầu và mỗi bệnh viện tham gia sẽ nhận được một bản sao của mô hình để đào tạo trên tập dữ liệu của riêng mình.
Hợp tác trên quy mô toàn cầu
Các dự án học tập liên kết quy mô lớn cũng đang được tiến hành, nhằm mục đích cải thiện việc phát hiện ra ma túy và mang lại lợi ích cho AI.
Owkin đang hợp tác với NVIDIA, King’s College London và hơn mười tổ chức khác trên MELLODDY, một tập đoàn nghiên cứu thuốc có trụ sở tại Anh, để chứng minh việc các kỹ thuật học tập liên kết có thể mang lại cho các đối tác dược phẩm những điều tốt nhất ở cả hai thế giới: khả năng tận dụng bộ dữ liệu về thuốc liên kết lớn nhất thế giới để đào tạo AI mà không ảnh hưởng đến quyền riêng tư của dữ liệu.
Giám đốc điều hành NVIDIA Jensen Huang đã mô tả cách AI có thể tăng tốc độ khám phá ma túy trong một phần của bài phát biểu GTC của ông bên dưới.
King’s College London hy vọng rằng việc học tập liên kết, như một phần của dự án “Medical Imaging and Artificial Intelligence Centre for Value-Based Healthcare” tại London, có thể dẫn đến những đột phá trong việc phân loại đột quỵ và suy giảm thần kinh, xác định nguyên nhân cơ bản của bệnh ung thư và khuyến nghị phương pháp điều trị tốt nhất cho bệnh nhân.
Tìm hiểu thêm về một mô hình AI khác cho COVID-19 sử dụng tập dữ liệu đa quốc gia trong bài báo này và về khoa học đằng sau việc học liên kết trong bài báo này. Và xem NVIDIA’s Huang tóm tắt tất cả các tin tức tại GTC trong video bên dưới.
Bài viết liên quan