Physical AI là gì? Cách thức hoạt động như thế nào?

Trí tuệ nhân tạo vật lý là gì?

Trí tuệ nhân tạo vật lý (Physical AI) cho phép các hệ thống tự động như robot, xe tự lái và không gian thông minh nhận thức, hiểu và thực hiện các hành động phức tạp trong thế giới thực (vật lý). Nó cũng thường được gọi là “trí tuệ nhân tạo vật lý” vì khả năng tạo ra hiểu biết và hành động.

Physical AI hoạt động như thế nào?

Các mô hình AI tạo sinh — các mô hình ngôn ngữ lớn như GPT và Llama — được đào tạo trên một lượng lớn dữ liệu văn bản và hình ảnh, phần lớn được thu thập từ Internet. Các AI này có khả năng đáng kinh ngạc trong việc tạo ra ngôn ngữ của con người và các khái niệm trừu tượng, nhưng chúng bị hạn chế trong việc nắm bắt thế giới vật lý và các quy tắc của nó.

Trí tuệ nhân tạo vật lý tạo ra mở rộng trí tuệ nhân tạo hiện tại với sự hiểu biết về các mối quan hệ không gian và hành vi vật lý của thế giới 3D mà tất cả chúng ta đang sống. Điều này được thực hiện bằng cách cung cấp dữ liệu bổ sung có chứa thông tin về các mối quan hệ không gian và các quy tắc vật lý của thế giới thực trong quá trình đào tạo AI.

Dữ liệu đào tạo 3D được tạo ra từ các mô phỏng máy tính có độ chính xác cao, đóng vai trò vừa là nguồn dữ liệu vừa là nền tảng đào tạo AI.

Việc tạo dữ liệu dựa trên vật lý bắt đầu bằng một bản sao kỹ thuật số của một không gian, chẳng hạn như một nhà máy. Trong không gian ảo này, các cảm biến và máy móc tự động như rô-bốt được thêm vào. Các mô phỏng mô phỏng các tình huống trong thế giới thực được thực hiện và các cảm biến nắm bắt các tương tác khác nhau như động lực học của vật thể rắn—chẳng hạn như chuyển động và va chạm—hoặc cách ánh sáng tương tác trong môi trường.

Vai trò của học tăng cường trong AI vật lý là gì?

Học tăng cường dạy các kỹ năng của máy tự động trong môi trường mô phỏng để thực hiện trong thế giới thực. Nó cho phép máy tự động học các kỹ năng một cách an toàn và nhanh chóng thông qua hàng nghìn hoặc thậm chí hàng triệu hành động thử và sai.

Kỹ thuật học này thưởng cho mô hình AI vật lý khi hoàn thành thành công các hành động mong muốn trong mô phỏng, do đó mô hình liên tục thích ứng và cải thiện. Với việc học tăng cường lặp đi lặp lại, các máy tự động cuối cùng sẽ thích ứng với các tình huống mới và những thách thức không lường trước một cách phù hợp, chuẩn bị cho chúng hoạt động trong thế giới thực. Theo thời gian, một máy tự động có thể phát triển các kỹ năng vận động tinh tinh vi cần thiết cho các ứng dụng trong thế giới thực, chẳng hạn như đóng gói hộp gọn gàng, giúp chế tạo xe hoặc điều hướng môi trường mà không cần trợ giúp.

Tại sao AI vật lý lại quan trọng?

Trước đây, máy móc tự động không thể nhận thức và cảm nhận thế giới xung quanh. Nhưng với AI vật lý tạo sinh, robot có thể được chế tạo và đào tạo để tương tác liền mạch và thích nghi với môi trường xung quanh trong thế giới thực.

Để xây dựng AI vật lý, các nhóm cần các mô phỏng mạnh mẽ dựa trên vật lý, cung cấp một môi trường an toàn, được kiểm soát để đào tạo máy móc tự động. Điều này không chỉ nâng cao hiệu quả và độ chính xác của robot trong việc thực hiện các nhiệm vụ phức tạp mà còn tạo điều kiện cho các tương tác tự nhiên hơn giữa con người và máy móc, cải thiện khả năng truy cập và chức năng trong các ứng dụng thực tế.

Trí tuệ nhân tạo vật lý đang mở ra những khả năng mới sẽ biến đổi mọi ngành công nghiệp. Ví dụ:

Robot: Với AI vật lý, robot thể hiện những tiến bộ đáng kể về khả năng hoạt động trong nhiều bối cảnh khác nhau.

  • Robot di động tự động (AMR) trong kho có thể di chuyển trong môi trường phức tạp và tránh chướng ngại vật, bao gồm cả con người, bằng cách sử dụng phản hồi trực tiếp từ các cảm biến trên tàu.
  • Người điều khiển có thể điều chỉnh lực nắm và vị trí dựa trên tư thế của các vật thể trên băng chuyền, thể hiện cả kỹ năng vận động tinh và thô phù hợp với loại vật thể.
  • Robot phẫu thuật được hưởng lợi từ công nghệ này bằng cách học các nhiệm vụ phức tạp như xỏ kim và khâu, làm nổi bật độ chính xác và khả năng thích ứng của AI vật lý tạo ra trong việc đào tạo robot thực hiện các nhiệm vụ chuyên biệt.
  • Robot hình người — robot đa năng — cần cả kỹ năng vận động thô và tinh, cũng như khả năng nhận thức, hiểu, điều hướng và tương tác với thế giới vật chất, bất kể nhiệm vụ được giao là gì.

Xe tự hành (AV): AV sử dụng cảm biến để nhận biết  và hiểu môi trường xung quanh, cho phép chúng đưa ra quyết định sáng suốt trong nhiều môi trường khác nhau, từ đường cao tốc mở đến cảnh quan thành phố. Đào tạo AV về AI vật lý cho phép chúng phát hiện người đi bộ chính xác hơn, phản ứng với điều kiện giao thông hoặc thời tiết và tự động điều hướng khi thay đổi làn đường, thích ứng hiệu quả với nhiều tình huống bất ngờ.

Không gian thông minh: Trí tuệ nhân tạo vật lý đang tăng cường chức năng và sự an toàn của các không gian trong nhà và ngoài trời lớn như nhà máy và nhà kho, nơi các hoạt động hàng ngày liên quan đến lưu lượng người, phương tiện và rô-bốt ổn định. Sử dụng camera cố định và các mô hình thị giác máy tính tiên tiến, các nhóm có thể tăng cường lập kế hoạch tuyến đường động và tối ưu hóa hiệu quả hoạt động bằng cách theo dõi nhiều thực thể và hoạt động trong các không gian này. Các tác nhân AI phân tích video cải thiện thêm sự an toàn và hiệu quả bằng cách tự động phát hiện các bất thường và cung cấp cảnh báo theo thời gian thực.

Bạn có thể bắt đầu với AI vật lý như thế nào?

Việc xây dựng thế hệ hệ thống tự động tiếp theo bằng AI vật lý đòi hỏi một quá trình phối hợp trên nhiều máy tính chuyên dụng.

  1. Xây dựng môi trường 3D ảo: Cần có một môi trường ảo có độ trung thực cao, dựa trên vật lý để thể hiện môi trường thực và tạo ra dữ liệu tổng hợp cần thiết để đào tạo AI vật lý. NVIDIA Omniverse là nền tảng API, SDK và dịch vụ cho phép bạn dễ dàng tích hợp công nghệ kết xuất Universal Scene Description (OpenUSD) và NVIDIA RTX vào các công cụ phần mềm và quy trình làm việc mô phỏng hiện có để xây dựng các môi trường 3D này. Môi trường này được hỗ trợ bởi các hệ thống NVIDIA OVX. Bước này cũng bao gồm việc ghi lại các cảnh hoặc dữ liệu quy mô lớn cần thiết cho mô phỏng hoặc đào tạo mô hình. Một đột phá công nghệ quan trọng cho phép đào tạo và suy luận mô hình AI hiệu quả với các tập dữ liệu 3D phong phú được gọi là fVDB , biểu diễn hiệu quả các tính năng và là phần mở rộng của PyTorch. Nó cho phép thực hiện các hoạt động học sâu trên dữ liệu 3D quy mô lớn.
  2. Tạo dữ liệu tổng hợp 3D-to-real:  Sử dụng Omniverse Replicator SDK để ngẫu nhiên hóa môi trường và miền đối tượng. Kết xuất các cảnh ngẫu nhiên dưới dạng hình ảnh hoặc video, sau đó sử dụng các mô hình NVIDIA Cosmos ™ để tạo video ảnh thực 3D-to-real để nhân rộng thêm tập dữ liệu.
  3. Đào tạo và xác thực: NVIDIA DGX là một nền tảng AI phần cứng và phần mềm được tích hợp đầy đủ. Nó có thể được sử dụng với dữ liệu dựa trên vật lý để đào tạo hoặc tinh chỉnh các mô hình AI với các framework như TensorFlow, PyTorch hoặc NVIDIA TAO, cùng với các mô hình thị giác máy tính được đào tạo trước có sẵn trên NVIDIA NGC. Sau khi được đào tạo, mô hình và ngăn xếp phần mềm của nó có thể được xác thực trong mô phỏng bằng các ứng dụng tham chiếu như NVIDIA Isaac Sim. Bạn cũng có thể sử dụng các khuôn khổ nguồn mở, chẳng hạn như Isaac Lab , để tinh chỉnh các kỹ năng của rô-bốt bằng cách sử dụng học tăng cường.
  4. Triển khai:  Cuối cùng, mô hình ngăn xếp và chính sách được tối ưu hóa có thể được triển khai thông qua NVIDIA Blueprints trên NVIDIA Jetson hoặc NVIDIA DRIVE AGX để chạy nhúng trong robot tự động, xe cộ hoặc không gian thông minh. Ví dụ, bạn có thể triển khai “Mega”, một NVIDIA Omniverse Blueprint để mô phỏng hoạt động của nhà máy và xây dựng các tác nhân AI phân tích video với Metropolis AI Blueprint để tìm kiếm và tóm tắt video nhằm cung cấp giám sát về hiệu suất và sự an toàn của nhà máy.
____
Bài viết liên quan
Góp ý / Liên hệ tác giả