Trong cuộc đua toàn cầu để chế ngự sự lây lan của COVID-19, các nhà nghiên cứu khoa học và các công ty dược phẩm trước tiên phải hiểu cấu trúc protein của virus.
Làm như vậy đòi hỏi phải xây dựng các mô hình 3D chi tiết của các phân tử protein, cho đến gần đây vẫn là một công việc tốn rất nhiều thời gian. Phần mềm đột phá của Structura Biotechnology đang giúp đẩy nhanh tiến độ.
Các thuật toán Machine Learning được hỗ trợ bởi GPU nằm trong phần mềm của Structura cung cấp sức mạnh cho giai đoạn xử lý hình ảnh của công nghệ được gọi là kính hiển vi điện tử lạnh (cryo-electron microscopy), hay cryo-EM, một bước đột phá mang tính cách mạng trong hóa sinh, và cũng là chủ đề của Giải Nobel hóa học 2017.
Cryo-EM cho phép các kính hiển vi điện tử mạnh mẽ ghi lại hình ảnh chi tiết của các phân tử sinh học ở trạng thái gần với tự nhiên của chúng. Những hình ảnh này sau đó có thể được sử dụng để tái tạo mô hình 3D của các phân tử sinh học.
Với cryo-EM cung cấp dữ liệu hình ảnh 2D có giá trị, phần mềm được truyền bằng AI của Structura, được gọi là cryoSPARC, có thể nhanh chóng phân tích dữ liệu hiển vi thu được để giải quyết các cấu trúc nguyên tử 3D của các phân tử protein nhúng. Điều đó cho phép các nhà nghiên cứu đánh giá nhanh hơn mức độ hiệu quả của các loại thuốc trong việc liên kết với các phân tử đó, đẩy nhanh đáng kể quá trình phát hiện ra thuốc.
Hàng trăm phòng thí nghiệm trên khắp thế giới đã sử dụng phần mềm của công ty có trụ sở tại Toronto này, với sự phát triển đáng kể – và cũng không đáng ngạc nhiên – trong năm 2020 này. Trên thực tế, Giám đốc điều hành Ali Punjani tuyên bố rằng phần mềm của Structura đã được các nhà khoa học sử dụng để thể hiện COVID-19 protein trong nhiều ấn phẩm.
Punjani cho biết: “Phần mềm của chúng tôi giúp các nhà khoa học hiểu được các protein của chúng trông như thế nào và phương pháp trị liệu được đề xuất của họ có thể liên kết như thế nào. Họ càng có thể nhìn thấy nhiều hơn về cấu trúc của mục tiêu nghiên cứu, thì việc thiết kế hoặc xác định một phân tử bám vào cấu trúc đó và ngăn chặn nó càng trở nên dễ dàng hơn”.
Một trường hợp thử nghiệm hấp dẫn
Ý tưởng cho Structura xuất phát từ một cuộc trò chuyện mà Punjani tình cờ nghe được, trong quá trình làm việc tại Đại học Toronto, về việc cố gắng giải các cấu trúc protein bằng hình ảnh hiển vi. Ông ấy nghĩ rằng chủ đề này sẽ trở thành một trường hợp thử nghiệm hấp dẫn cho mối quan tâm đang phát triển của ông ấy đối với các nghiên cứu về Machine Learning.
Punjani thành lập nhóm của mình vào năm 2017 và Structura bắt đầu xây dựng phần mềm của họ, được hỗ trợ bởi các thuật toán thị giác máy tính (Computer Vision) và suy luận quy mô lớn giúp khôi phục mô hình 3D từ dữ liệu hình ảnh 2D. Ông nói, điều quan trọng là thu thập và phân tích – với độ chính xác ngày càng cao – một lượng đủ dữ liệu hiển vi để cho phép tái tạo 3D chất lượng cao.
Punjani nói: “Đó là một lĩnh vực khoa học cao không khoan nhượng với sai sót. Làm sai có thể là một sự lãng phí lớn về thời gian và tiền bạc.”
Phần mềm của Structura được triển khai tại cơ sở, thường là trên phần cứng của khách hàng, phần mềm này phải có nhiệm vụ xử lý dữ liệu kính hiển vi 3D thời gian thực. Punjani cho biết các phòng thí nghiệm thường chạy công việc này trên GPU NVIDIA Quadro RTX 6000 hoặc một dòng GPU khác tương tự, trong khi nhiều công ty dược phẩm lớn hơn đã đầu tư vào các cụm GPU NVIDIA V100 Tensor Core đi kèm với nhiều loại card đồ họa NVIDIA.
Structura thực hiện tất cả đào tạo mô hình và phát triển phần mềm của mình trên các máy chạy các nút đa GPU của GPU V100. Punjani cho biết nhóm của ông viết tất cả các nhân GPU của nó từ đầu vì tính chất đặc biệt và kỳ lạ của vấn đề. Mã chạy trên GPU của Structura được viết bằng CUDA, trong khi cuDNN được sử dụng cho một số tác vụ tính toán cao cấp.
Phần mềm phù hợp vào đúng thời điểm
Với giá trị của những phát kiến từ Structura và tầm quan trọng của cryo-EM, Punjani không kìm hãm tham vọng của mình đối với công ty, gần đây họ đã tham gia NVIDIA Inception, một chương trình tăng tốc được thiết kế để nuôi dưỡng các công ty khởi nghiệp cách mạng hóa ngành công nghiệp với những tiến bộ trong AI và khoa học dữ liệu.
Punjani nói rằng bất kỳ nghiên cứu nào liên quan đến sinh vật sống đều có thể sử dụng thông tin từ các cấu trúc protein 3D mà cryo-EM cung cấp và do đó, có rất nhiều sự chú ý của ngành tập trung vào loại công việc mà phần mềm của Structura cho phép.
Ông nói: “Những gì chúng tôi đang xây dựng ngay bây giờ là một khối xây dựng cơ bản cho cryo-EM để cho phép tốt hơn việc khám phá thuốc dựa trên cấu trúc. “Cryo-EM được thiết lập để trở nên phổ biến trong tất cả các nghiên cứu sinh học.”
Bài viết liên quan