Trong bài phát biểu quan trọng của GTC, Giám đốc điều hành NVIDIA Jensen Huang đã giới thiệu một loạt các sản phẩm và sáng kiến mới của NVIDIA, trong đó bao gồm các lĩnh vực như thực tế ảo (VR), AI doanh nghiệp, an ninh mạng, điện toán lượng tử (Quantum Computing), những phát triển mới trong ngành ô tô và chăm sóc sức khỏe, v.v.
Hình ảnh tổng hợp từ camera và dữ liệu phân tích tương ứng thể hiện sự phân vùng đối tượng được sinh ra bởi hệ thống NVIDIA DRIVE Sim và nền tảng Omniverse Replicator.
NVIDIA tuần này sẽ giới thiệu cách họ sẽ giúp các doanh nghiệp bước vào thế giới ảo, cho phép tạo ra các mô phỏng như đời thực và mô hình đại diện (avatar) mang tính tương tác cao. Kế hoạch mở rộng Omniverse, nền tảng mở rộng quy trình công việc sang lĩnh vực ảo, chỉ là một phần trong số các công bố được đưa ra vào Ngày thứ nhất trong sự kiện NVIIDIA GTC Mùa Thu năm 2021, nơi hãng đang đặt ra kế hoạch thúc đẩy lĩnh vực điện toán tăng tốc.
“Một chủ đề liên tục mà bạn sẽ thấy – cách Omniverse được sử dụng để mô phỏng các phiên bản số “song sinh” của các nhà kho, nhà máy và công xưởng, hệ thống vật lý và sinh học, công nghệ 5G, robot, ô tô tự lái và thậm chí cả hình mẫu đại diện của cá nhân”, Giám đốc điều hành NVIDIA Jensen Huang cho biết. Nhấn mạnh về mức độ tham vọng của NVIDIA đối với Omniverse, ông Huang cho biết NVIDIA sẽ xây dựng một phiên bản số song sinh (digital twin) để mô phỏng và dự đoán biến đổi khí hậu có tên là “E-2”, hay “Earth Two”.
Cùng với việc mở rộng Omniverse, NVIDIA đã công bố một loạt các sản phẩm và sáng kiến mới của NVIDIA, bao gồm AI dành cho doanh nghiệp, an ninh mạng và điện toán lượng tử, cũng như những tiến bộ trong lĩnh vực ô tô và chăm sóc sức khỏe.
Omniverse
Bắt đầu với Omniverse, NVIDIA đã giới thiệu Omniverse Replicator, một công cụ tạo dữ liệu tổng hợp. Omniverse Replicator là một công cụ toàn diện sẽ giúp các tổ chức xây dựng các phiên bản số song sinh tốt hơn – và do đó, các công cụ hỗ trợ AI tốt hơn trong thế giới thực. NVIDIA đang giới thiệu hai ứng dụng khác nhau được xây dựng với Replicator, thể hiện một số ứng dụng của nó: Ứng dụng đầu tiên là NVIDIA Drive Sim, một thế giới ảo để lưu trữ phiên bản số của các phương tiện giao thông. Tiếp theo, NVIDIA Isaac Sim là một thế giới ảo dành cho phiên bản số của các robot thao tác kỹ thuật. Dữ liệu là điều kiện tiên quyết cần thiết để xây dựng các mô hình AI, nhưng NVIDIA lập luận, tất cả các dự án AI đều bị thiếu dữ liệu chất lượng cao.
Tiếp theo, NVIDIA đang đưa Omniverse vượt ra ngoài các bản sao của thế giới thực với nền tảng Omniverse Avatar mới. Avatar là một nền tảng end-to-end đầy đủ để tạo ra các AI hiện thân mà con người tương tác. Nó kết nối các công nghệ của NVIDIA về AI giọng nói, thị giác máy tính, hiểu ngôn ngữ tự nhiên, công cụ đề xuất và công nghệ mô phỏng. Avatar được tạo trong nền tảng là các nhân vật tương tác với đồ họa 3D theo tia (ray-traced 3D). Họ có thể nhìn và nói về nhiều chủ đề và hiểu được ý định nói một cách tự nhiên. Nhiều công nghệ NVIDIA đằng sau Avatar bao gồm Riva, một bộ phát triển phần mềm mới có quy mô lớn để xử lý AI bằng giọng nói tiên tiến.
Ngoài Replicator và Avatar, NVIDIA đã công bố một loạt các bản cập nhật khác cho Omniverse, bao gồm các tính năng AR, VR và render đa GPU mới. Ngoài ra còn có các tích hợp mới cho hạ tầng và các ứng dụng “phiên bản số” (digital-twin) công nghiệp với phần mềm của Bentley Systems và Esri.
HPC và Enterprise AI
Trong lĩnh vực điện toán hiệu suất cao, NVIDIA đã công bố Modulus, một framework để xây dựng các mô hình học máy có nhận biết vật lý. Nó được thiết kế để xây dựng AI có thể thực hiện các mô phỏng vật lý ở quy mô rất lớn. Các mô hình được cung cấp dữ liệu từ thế giới thực cũng như dữ liệu được tạo ra bằng cách sử dụng các mô phỏng trên các phiên bản số. Modulus được thiết kế để tận dụng tối đa kiến trúc điện toán NVIDIA trên các siêu máy tính quy mô lớn. Nó sẽ phục vụ một loạt các lĩnh vực có thể được hưởng lợi từ các phiên bản số hướng vật lý, chẳng hạn như kỹ thuật protein và khoa học khí hậu.
NVIDIA Modulus thúc đẩy các ứng dụng tạo ra phiên bản số đa vật lý cho máy tạo hơi nước thu hồi nhiệt.
NVIDIA cũng đã công bố một loạt các SDK, bao gồm CuNumeric – một thư viện mới để tăng tốc NumPy cho các nhà khoa học, nhà khoa học dữ liệu và nhà nghiên cứu học máy trong cộng đồng Python. Nó khai thác API NumPy để tự động mở rộng quy mô sang hệ thống đa GPU và đa node mà không có bất kỳ thay đổi mã nào. Thư viện ReOpt mới dành cho ngành kho vận đưa ra các thuật toán song song tiên tiến giúp tối ưu hóa các tuyến xe, lựa chọn kho hàng và kết hợp đội xe.
Tiếp theo, công ty đã công bố các bản cập nhật cho Triton, nền tảng suy luận AI của mình. Triton hiện đang được sử dụng bởi hơn 25.000 khách hàng, bao gồm Capital One, Microsoft, Samsung Medison, Siemens Energy và Snap. Các bản cập nhật quan trọng cho phần mềm Triton Inference Server bao gồm tích hợp mới với Amazon SageMaker, hỗ trợ cho CPU Arm và tính năng đa node, đa GPU.
Trong khi đó, NeMo Megatron framework mới cho phép doanh nghiệp vượt qua các thách thức về đào tạo các mô hình xử lý ngôn ngữ tự nhiên phức tạp, đào tạo các mô hình ngôn ngữ với hàng nghìn tỷ tham số. Nó được tối ưu hóa để mở rộng quy mô trên hạ tầng điện toán tăng tốc quy mô lớn của DGX SuperPOD của NVIDIA. Megatron 530B là mô hình ngôn ngữ có thể tùy chỉnh lớn nhất thế giới hiện nay, có thể được đào tạo cho các lĩnh vực (domain) và ngôn ngữ mới.
NVIDIA đã cập nhật thế hệ tiếp theo của nền tảng mạng InfiniBand, được gọi là Quantum-2, cho các nhà cung cấp dịch vụ điện toán đám mây và các trung tâm siêu máy tính. Nền tảng mạng InfiniBand 400Gbps bao gồm switch Quantum-2, bộ giao tiếp mạng ConnectX-7, bộ xử lý dữ liệu BlueField-3 (DPU) và phần mềm hỗ trợ kiến trúc mới.
Quantum
Các SDK cuQuantum tăng tốc độ mô phỏng của máy tính lượng tử trên hệ thống cổ điển. Thư viện đầu tiên từ cuQuantum hiện đang ở phiên bản beta công khai, đã sẵn sàng để tải xuống. Được gọi là cuStateVec, nó là một bộ tăng tốc cho phương pháp mô phỏng vector trạng thái. Cách tiếp cận đó theo dõi trạng thái đầy đủ của hệ thống trong bộ nhớ và có thể mở rộng đến hàng chục qubit. Thư viện thứ hai sẽ ra mắt vào tháng 12, cuTensorNet, là một bộ tăng tốc sử dụng phương pháp tensor netưork. Nó có thể xử lý lên đến hàng nghìn qubit trên một số thuật toán ngắn hạn đầy hứa hẹn.
NVIDIA đã tích hợp cuStateVec vào qsim, trình mô phỏng vector trạng thái của Google Quantum AI, có thể được sử dụng thông qua Cirq, một framework mã nguồn mở để lập trình cho các máy tính lượng tử. Vào tháng 12, cuStateVec sẽ sẵn sàng để sử dụng với Qiskit Aer, một framework mô phỏng hiệu suất cao cho các mạch lượng tử của IBM.
Ngoài ra, các phòng thí nghiệm quốc gia bao gồm Phòng thí nghiệm Quốc gia Oak Ridge, Argonne, Phòng thí nghiệm Quốc gia Lawrence Berkeley và Phòng thí nghiệm Quốc gia Tây Bắc Thái Bình Dương, các nhóm nghiên cứu đại học tại Caltech, Oxford và MIT, và các công ty bao gồm IonQ đều đang tích hợp cuQuantum vào quy trình làm việc của họ. NVIDIA cũng cho biết họ đã tạo ra mô phỏng lớn nhất từ trước đến nay của một thuật toán lượng tử để giải quyết vấn đề MaxCut bằng cách sử dụng cuQuantum. Các thuật toán MaxCut được sử dụng để thiết kế các mạng máy tính lớn, tìm cách bố trí tối ưu của các chip với hàng tỷ đường dẫn silicon và khám phá lĩnh vực vật lý thống kê.
Chăm sóc sức khỏe
Các bệnh viện đang sử dụng các công nghệ được hỗ trợ bởi GPU mới của NVIDIA như hệ thống DGX để thúc đẩy các dự án và nghiên cứu ung thư tăng tốc bằng AI. Các nhóm nghiên cứu tại Trung tâm Ung thư MD Anderson của Đại học Texas đang nghiên cứu mạng lưới thần kinh phức hợp giúp họ tìm ra những trường hợp nào có nhiều khả năng phát triển thành ung thư ác tính nhất để các bác sĩ lâm sàng có thể hỗ trợ tốt hơn cho những bệnh nhân có nguy cơ mắc bệnh.
Theo Tiến sĩ Jeremiah Sanders, một nhà vật lý hình ảnh y tế tại MD Anderson, bệnh viện đang triển khai công nghệ GPU cho nhiều dự án bao gồm lập mô hình AI để lập kế hoạch điều trị liệu pháp não và đánh giá chất lượng điều trị. Sanders và một bác sĩ khác cũng đang làm việc trên một ứng dụng AI phân tích các nghiên cứu MRI của tuyến tiền liệt để xác định chất lượng của việc phân phối bức xạ.
Tiến sĩ Kristy Brock, giáo sư Vật lý Hình ảnh và Vật lý Bức xạ tại MD Anderson, cho biết bà đang sử dụng công nghệ NVIDIA trong nghiên cứu phát hiện bất thường giúp xác định các trường hợp mô hình AI bao quanh khối u gan từ chụp CT không thành công.
Dự án NVIDIA Clara Discovery – một tập hợp các framework hiện đại, các ứng dụng và các mô hình được đào tạo trước được xây dựng để nắm bắt về cách mở khóa hàng tỷ phân tử thuốc tiềm năng tương tác bên trong cơ thể chúng ta – được trang bị một số công cụ machine learning và nền tảng phần mềm để triển khai công nghệ của NVIDIA, như GPU DGX A100 Tensor Core.
Bệnh viện Nghiên cứu Trẻ em St. Jude, Trung tâm Nghiên cứu Ung thư Đức và Trung tâm Ung thư Memorial Sloan Kettering đều đang sử dụng các nền tảng AI được hỗ trợ bởi công nghệ NVIDIA để tiếp tục nghiên cứu các bệnh suy nhược.
Các công ty như Johnson và Johnson và nhiều công ty khác đang sử dụng công nghệ NVIDIA trong các hệ thống robot y tế và máy chụp ảnh để tăng tốc độ tham vấn và giảm thời gian chờ đợi. Nền tảng điện toán AI cho thiết bị y tế NVIDIA Clara Holoscan sẽ ra mắt vào 15 tháng 11.
Lĩnh vực ô tô
Nền tảng AV (autonomous vehicle) end-to-end NVIDIA Drive sẽ cho phép các công ty sản xuất xe tự hành kiểm tra phương tiện của họ, thực hiện các bài tập lập bản đồ và đào tạo, mô phỏng các tuyến đường và thử nghiệm ô tô trên đường.
Drive Hyperion 8, dự kiến sẽ được đưa vào xe vào năm 2024, được cung cấp bởi Orin SoC truyền động kép và đi kèm với bộ cảm biến đủ tiêu chuẩn có 12 camera, 9 radar, 1 LIDAR và 12 siêu âm.
Bảo mật
NVIDIA đã công bố việc tạo ra một nền tảng an ninh mạng “zero-trust” kết hợp ba công nghệ – NVIDIA BlueField DPUs, NVIDIA DOCA và framework AI cho an ninh mạng NVIDIA Morpheus.
NVIDIA DOCA 1.2 có sẵn với quyền truy cập sớm cho các nhà phát triển xây dựng ứng dụng cho các DPU của NVIDIA BlueField.
Công cụ này được xây dựng để cung cấp mức độ bảo mật cao hơn cho các công ty điều hành trung tâm dữ liệu. Nó cách ly các ứng dụng khỏi cơ sở hạ tầng và cung cấp tường lửa cứng hơn đồng thời cung cấp “sức mạnh của tính toán tăng tốc và học sâu để theo dõi và phát hiện các mối đe dọa liên tục – với tốc độ nhanh hơn 600 lần so với các máy chủ không có bộ tăng tốc NVIDIA.”
Juniper Networks và Palo Alto Networks là những công ty an ninh mạng đầu tiên sử dụng cả BlueField và DOCA trong sản phẩm của họ. Nó sẽ được phổ biến rộng rãi vào ngày 30 tháng 11, trong khi Morpheus đã có sẵn ngay bây giờ.
Theo NVIDIA, BlueField “giảm bớt gánh nặng cho CPU khi chạy phần mềm bảo mật và trao quyền cho các nhà phát triển sử dụng các khả năng bảo mật không gian mạng mới của NVIDIA DOCA 1.2 để xây dựng các dịch vụ đám mây có kiểm soát quyền truy cập tài nguyên, xác thực từng ứng dụng và người dùng, cô lập các máy có khả năng bị xâm phạm và giúp bảo vệ dữ liệu khỏi vi phạm và thất thoát. ”
DOCA làm việc song song với framework học sâu cho an ninh mạng Morpheus để đóng vai trò là phần mềm nền tảng cung cấp sức mạnh cho NVIDIA BlueField DPU.
Bài viết liên quan
- Tôi có cần CPU kép không?
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- Hướng dẫn lựa chọn GPU phù hợp cho AI, Machine Learning
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- LLM: Lịch sử và tương lai của các mô hình ngôn ngữ lớn
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson