Hãng NVIDIA đã công bố loạt đầu tiên của danh sách các “Hệ thống được chứng nhận bởi NVIDIA” (NVIDIA-Certified Systems) cho các công ty muốn chạy các workload trí tuệ nhân tạo trên quy mô lớn.
Hãng cho biết họ đã làm việc với các nhà sản xuất máy chủ, bao gồm có Dell Technologies Inc., Hewlett Packard Enterprise Co., Gigabyte Technology, Inspur Group và Super Micro Computer Inc., để chứng nhận các hệ thống của họ đáp ứng các phương pháp thiết kế và có thể cung cấp hiệu suất tối ưu cho các tác vụ phân tích dữ liệu và Machine Learning tiên tiến nhất.
Các hệ thống này được trang bị GPU A100 tiên tiến nhất của NVIDIA và kết hợp với bộ điều hợp mạng Mellanox tốc độ cao, cung cấp cho các công ty các tùy chọn khác nhau để chạy workload AI của họ trong các trung tâm dữ liệu của công ty hoặc ở rìa mạng.
Adel El Hallak, giám đốc quản lý sản phẩm GPU Cloud của Nvidia, cho biết “AI đã trở thành xu hướng chủ đạo” và khách hàng đang tìm kiếm chức năng, hiệu suất, khả năng mở rộng và bảo mật được đảm bảo.
El Hallak nói: “Triển khai AI trên quy mô lớn là rất khó và cho đến nay vẫn theo cách tự làm, tự xây dựng. Ông nói thêm rằng các hệ thống mới được chứng nhận sẽ giúp ‘biến thứ gì đó phức tạp trước đây thành một thứ… chìa khóa trao tay’. ”
Hãng giải thích rằng mỗi hệ thống được chứng nhận đã được thử nghiệm trên một loạt các khối lượng công việc AI, từ những tác vụ yêu cầu nhiều node xử lý đến những công việc chỉ cần một phần nhỏ sức mạnh của một GPU. Mỗi ứng dụng trong số chúng đã được tối ưu hóa để chạy các ứng dụng AI từ danh mục NGC của Nvidia, là trung tâm của công ty về các ứng dụng AI được tối ưu hóa bằng GPU.
Chứng nhận liên quan đến việc vượt qua các bài kiểm tra về workload AI bao gồm đào tạo và suy luận học sâu, thuật toán học máy, phân tích video thông minh, giảm tải mạng và lưu trữ, sử dụng các AI framework phổ biến nhất trong danh mục NGC, Nvidia giải thích.
“Chúng tôi đang khai thác khối lượng công việc thực tế mà mọi người sử dụng và chúng tôi đang thử nghiệm trên quy mô lớn”, El Hallak nói.
Nhà phân tích Holger Mueller của Constellation Research Inc. nói với SiliconANGLE rằng NVIDIA đang trên con đường thành công trong lĩnh vực AI bằng cả phần mềm và phần cứng của mình, và “các hệ thống được chứng nhận” là một chiến lược điển hình và đã được chứng minh cho tương lai về sau.
“Giám đốc điều hành công ty thích các hệ thống được chứng nhận nền tảng vì chúng đảm bảo tính khả thi và tính di động”, Mueller nói. “Quan trọng hơn, điều này giúp các doanh nghiệp có thể chạy AI cục bộ, theo cách có thể chứng minh được trong tương lai, vì Nvidia cũng đã quản lý để hỗ trợ nền tảng của mình trong tất cả các đám mây công cộng lớn. Kết quả là Nvidia trở thành nền tảng máy tính cho AI, cho phép khả năng di chuyển workload giữa các hệ thống tại chỗ và đám mây công cộng cho các ứng dụng thế hệ tiếp theo”.
Nvidia cho biết 14 hệ thống đã được chứng nhận cung cấp khả năng điện toán tăng tốc khi ra mắt, bao gồm máy chủ rack Dell EMC PowerEdge R740 và R7525, R281-G30 của Gigabyte, R282-Z96, G242-Z11, G482-Z54, G492-Z51, HPE’s Apollo 6500 Gen10 System và Máy chủ HPE ProLiant DL380 Gen10, máy chủ NF5488A5 của Inspur và Máy chủ Supermicro A + AS -4124GS-TNR và AS -2124GQ-NART.
Mỗi hệ thống đó đều được gắn nhãn “NVIDIA-Certified Systems” chứng nhận chúng đáp ứng các phương pháp thiết kế tốt nhất của hãng và có thể xử lý workload AI có yêu cầu khắt khe nhất. Hỗ trợ cấp doanh nghiệp hiện hữu trên toàn bộ dãy phần mềm, bao gồm cả hỗ trợ cho mã nguồn mở.
NVIDIA cho biết khoảng trên 70 hệ thống từ 11 nhà sản xuất máy chủ hiện đang tham gia vào chương trình của mình và họ hy vọng sẽ sớm công bố thêm các hệ thống với nhãn “NVIDIA-Certified Systems” khác.
→ Tham khảo: Danh mục các máy chủ được NVIDIA chứng nhận cho AI
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- Đánh giá GPU máy trạm: Nvidia RTX 6000 Ada Generation
- Hướng dẫn lựa chọn GPU phù hợp cho AI, Machine Learning
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson