NVIDIA World Foundation Model: Chìa khóa để thúc đẩy trí tuệ nhân tạo vật lý – Physical AI

Trong bối cảnh AI đang liên tục bùng nổ, việc phát triển các mô hình có thể mô phỏng và dự đoán chính xác kết quả trong môi trường thực tế ngày càng trở nên quan trọng để tạo điều kiện cho thế hệ các hệ thống AI vật lý tiên tiến.

Ming-Yu Liu, phó chủ tịch nghiên cứu tại NVIDIA và là thành viên của IEEE, đã có cuộc nói chuyện trên NVIDIA AI Podcast để thảo luận về tầm quan trọng của các mô hình nền tảng thế giới (World Foundation Model) — mạng nơ-ron mạnh mẽ có thể mô phỏng môi trường vật lý. WFM có thể tạo video chi tiết từ dữ liệu đầu vào văn bản hoặc hình ảnh và dự đoán cách một cảnh vật được phát triển lên bằng cách kết hợp trạng thái hiện tại của nó (hình ảnh hoặc video) với các hành động (như câu lệnh prompt hoặc tín hiệu điều khiển).

“Các mô hình nền tảng thế giới rất quan trọng đối với các nhà phát triển AI vật lý”, Liu nói. “Họ có thể tưởng tượng ra nhiều môi trường khác nhau và có thể mô phỏng cả tương lai, vì vậy chúng tôi có thể đưa ra quyết định tốt hơn dựa trên các mô phỏng này”.

Điều này đặc biệt có giá trị đối với các hệ thống AI vật lý, chẳng hạn như robot và xe tự lái, những hệ thống phải tương tác an toàn và hiệu quả với thế giới thực.

Tại sao mô hình nền tảng thế giới lại quan trọng?

Việc xây dựng mô hình của thế giới thực thường đòi hỏi lượng dữ liệu khổng lồ, có thể khó khăn và rất tốn kém để thu thập. WFM có thể tạo dữ liệu tổng hợp (synthetic data), cung cấp tập dữ liệu phong phú, đa dạng giúp nâng cao quá trình đào tạo.

Ngoài ra, việc đào tạo và thử nghiệm các hệ thống AI vật lý trong thế giới thực tốn nhiều tài nguyên. WFM cung cấp môi trường 3D ảo, nơi các nhà phát triển có thể mô phỏng và thử nghiệm các hệ thống này trong môi trường được kiểm soát mà không có rủi ro và chi phí liên quan đến các thử nghiệm trong thế giới thực.

Truy cập mở vào các mô hình World Foundation Model

Tại triển lãm thương mại CES, NVIDIA đã công bố NVIDIA Cosmos, một nền tảng WFM tạo ra giúp đẩy nhanh quá trình phát triển các hệ thống AI vật lý như robot và xe tự lái.

Nền tảng này được thiết kế mở và dễ dàng truy cập, bao gồm các WFM được đào tạo trước dựa trên kiến ​​trúc khuếch tán và tự hồi quy, cùng với các tokenizer có thể nén video thành các token cho các mô hình transformer.

Liu giải thích rằng với các mô hình mở này, các doanh nghiệp và nhà phát triển có tất cả các thành phần họ cần để xây dựng các mô hình quy mô lớn. Nền tảng mở cũng cung cấp cho các nhóm sự linh hoạt để khám phá các tùy chọn khác nhau để đào tạo và tinh chỉnh các mô hình hoặc xây dựng mô hình của riêng họ dựa trên các nhu cầu cụ thể.

Cải thiện quy trình làm việc AI trong nhiều lĩnh vực

WFM dự kiến ​​sẽ cải thiện quy trình làm việc và phát triển AI trong nhiều ngành công nghiệp khác nhau. Liu nói rằng anh đã thấy những tác động đặc biệt đáng kể trong hai lĩnh vực:

“Ngành công nghiệp xe tự lái và ngành công nghiệp [robot] hình người sẽ được hưởng lợi rất nhiều từ việc phát triển mô hình thế giới thực”, Liu cho biết. “[WFM] có thể mô phỏng các môi trường khác nhau mà sẽ khó có thể có trong thế giới thực, để đảm bảo rằng các [agent] có thể hành động hợp lý”.

Đối với xe tự lái, các mô hình này có thể mô phỏng môi trường cho phép thử nghiệm và tối ưu hóa toàn diện. Ví dụ, xe tự lái có thể được thử nghiệm trong nhiều điều kiện thời tiết và tình huống giao thông mô phỏng khác nhau để giúp đảm bảo xe hoạt động an toàn và hiệu quả trước khi triển khai trên mặt đường.

Trong ngành robot, WFM có thể mô phỏng và xác minh hành vi của các hệ thống robot trong các môi trường khác nhau để đảm bảo chúng thực hiện nhiệm vụ một cách an toàn và hiệu quả trước khi triển khai.

NVIDIA đang hợp tác với các công ty như 1X, Huobi và XPENG để giúp giải quyết những thách thức trong phát triển AI vật lý và cải tiến hệ thống của họ.

“Chúng ta vẫn đang trong giai đoạn đầu của quá trình phát triển mô hình nền tảng thế giới thực — nó hữu ích, nhưng chúng ta cần làm cho nó hữu ích hơn”, Liu cho biết. “Chúng ta cũng cần nghiên cứu cách tích hợp tốt nhất các mô hình thế giới này vào các hệ thống AI vật lý theo cách thực sự có thể mang lại lợi ích cho chúng”.

____
Bài viết liên quan
Góp ý / Liên hệ tác giả