Tại GTC 2022, NVIDIA công bố một số cập nhật cho danh mục máy chủ DGX để tạo ra những đột phá mới trong phát triển AI trong doanh nghiệp.
Các hệ thống NVIDIA DGX H100 hiện đã có thể được đặt hàng. Những mảnh ghép hạ tầng này hỗ trợ các giải pháp AI toàn diện dành cho doanh nghiệp của NVIDIA.
Với hiệu suất 32 petaflop ở độ chính xác FP8, NVIDIA DGX H100 mang lại một bước nhảy vọt về hiệu suất cho phát triển AI trong doanh nghiệp. Cung cấp mức TCO thấp hơn 3 lần và tiết kiệm năng lượng nhiều hơn 3,5 lần so với thế hệ trước.
Phần mềm NVIDIA Base Command mới, đơn giản hóa và tăng tốc độ phát triển AI, cung cấp sức mạnh cho mọi hệ thống DGX – từ các node đơn đến cụm hệ thống siêu máy tính DGX SuperPOD.
NVIDIA cũng tiếc lộ rằng hệ thống DGX BasePOD – một bước tiến từ DGX POD – sẽ giúp cho việc triển khai AI ở trung tâm dữ liệu doanh nghiệp trở nên đơn giản hơn và nhanh hơn cho các đội ngũ CNTT, các đội triển khai và quản lý.
Nhiều nhà cung cấp hàng đầu về AI trên thế giới đang tạo nên những đột phá về công nghệ – từ ô tô tự hành đến trợ lý bằng giọng nói – bằng cách sử dụng phần mềm và hệ thống NVIDIA DGX, giúp cho tốc độ đổi mới không hề chậm lại.
Các tính năng mới của NVIDIA Base Command
NVIDIA Base Command cung cấp tính năng điều phối và quản lý cụm cấp doanh nghiệp, đồng thời nó cũng được trang bị một lớp phần mềm toàn diện để tối đa hóa năng suất của nhà phát triển AI, khả năng quản lý tài nguyên CNTT và hiệu suất của cả tải công việc.
Các tính năng quản lý quy trình làm việc của Base Command hiện bao gồm các hỗ trợ cho môi trường DGX SuperPOD on-premises, cho phép các doanh nghiệp giành quyền kiểm soát tập trung đối với các dự án phát triển AI với sự cộng tác đơn giản cho các nhóm dự án cũng như tích hợp các dashboard cho việc giám sát và báo cáo.
Base Command hoạt động với bộ phần mềm NVIDIA AI Enterprise, hiện được bao gồm trong tất cả các hệ thống DGX bán ra. Phần mềm NVIDIA AI cho phép phát triển và triển khai AI từ đầu đến cuối với các công cụ khoa học dữ liệu và AI được hỗ trợ, các framework được tối ưu hóa và các mô hình được đào tạo trước.
Ngoài ra, Base Command cung cấp khả năng quản lý quy trình công việc doanh nghiệp và tích hợp MLOps với DGX-Ready Software cung cấp bởi Domino Data Lab, Run.ai, Weights & Biases và NVIDIA Inception. Bao gồm các thư viện được tối ưu hóa và tăng tốc hạ tầng xử lý, lưu trữ và mạng – đồng thời đảm bảo tối đa thời gian hoạt động, bảo mật và độ tin cậy của hệ thống.
Kiến trúc DGX BasePOD Reference mới
DGX BasePOD cung cấp kiến trúc tham chiếu cho các hệ thống DGX kết hợp các phương pháp thiết kế tốt nhất để tích hợp hệ thống xử lý, mạng, lưu trữ và phần mềm.
Khách hàng đã sử dụng NVIDIA DGX POD để thúc đẩy sự phát triển của một loạt các ứng dụng doanh nghiệp. DGX BasePOD được xây dựng dựa trên sự thành công của DGX POD với các giải pháp công nghiệp mới nhắm đến các cơ hội AI lớn nhất, bao gồm xử lý ngôn ngữ tự nhiên, chăm sóc sức khỏe và khoa học đời sống cũng như phát hiện gian lận.
Được cung cấp dưới dạng các dịch vụ tích hợp đầy đủ, sẵn sàng triển khai thông qua NVIDIA Partner Network, các giải pháp DGX BasePOD có kích thước đa dạng, từ 02 đến hàng trăm node DGX, với bộ lưu trữ hiệu suất cao được chứng nhận từ các đối tác công nghệ lưu trữ cho NVIDIA DGX bao gồm DDN, Dell, NetApp, Pure Storage, VAST Data and WEKA.
Các công ty hàng đầu tạo đột phá AI với hệ thống DGX
Các doanh nghiệp trên khắp thế giới chọn hệ thống NVIDIA DGX để cung cấp hiệu suất cho tải công việc AI tiên tiến nhất. Trong số các nhà đổi mới AI đang phát triển các khả năng AI quan trọng trên hệ thống DGX A100 bao gồm có:
- Phòng nghiên cứu ML và sản phẩm Adept đang xây dựng một đội ngũ AI được hỗ trợ bởi một mô hình ngôn ngữ lớn được tạo mẫu trên NVIDIA DGX Foundry, sau đó được mở rộng với GPU NVIDIA A100 và NVIDIA Megatron trên Oracle Cloud Infrastructure.
- Hyundai Motor Group đang sử dụng DGX SuperPOD 40 node để khai phá tải công việc AI hyperscale.
- Telecom company KT đang phát triển LLM với khoảng 40 tỷ tham số cho nhiều ứng dụng tiếng Hàn, bao gồm loa thông minh GiGA Genie, sử dụng NVIDIA NeMo Megatron framework, phần mềm NVIDIA DGX SuperPOD và NVIDIA Base Command.
- Đại học Wisconsin-Madison đang nhanh chóng đưa AI vào các thiết bị hình ảnh y tế sử dụng hệ thống NVIDIA DGX với nền tảng nghiên cứu Flywheel và ứng dụng chăm sóc sức khỏe NVIDIA Clara . Sử dụng NVIDIA Federated Learning Application Runtime Environment, hoặc NVIDIA FLARE , phối hợp với các bệnh viện khác, trường đang đào tạo một cách an toàn cho các mô hình AI trên hệ thống DGX với hình ảnh y tế, các chú thích và các phân loại .
Nguồn NVIDIA
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100