NVIDIA đã ghi dấu ấn đặc biệt trong thử nghiệm MLPerf mới với vi xử lý GH200 Grace Hopper Superchip. Trong các thử nghiệm xử lý dữ liệu tại trung tâm dữ liệu, GH200 Grace Hopper Superchip không chỉ vượt qua tất cả các kiểm tra mà còn mở rộng khoảng cách hiệu suất so với các GPU Tensor Core H100 của NVIDIA. Điều này không chỉ thể hiện sự xuất sắc của NVIDIA mà còn cho thấy tính đa dạng và khả năng linh hoạt của nền tảng trí tuệ nhân tạo của hãng từ đám mây đến mép mạng.
Sự Kết Hợp Đỉnh Cao
GH200 Grace Hopper Superchip kết hợp một GPU Hopper và một CPU Grace trong một siêu vi xử lý, mang lại thêm bộ nhớ, băng thông và khả năng chuyển đổi nguồn điện tự động giữa CPU và GPU để tối ưu hiệu suất.
Phần Mềm Tối Ưu Inference
NVIDIA cũng công bố phần mềm inference mới, TensorRT-LLM, giúp tối ưu hiệu suất, hiệu quả năng lượng và chi phí sở hữu tổng cộng. Thông qua thử nghiệm nội bộ, TensorRT-LLM đã giúp tăng tốc lên đến 8 lần so với các GPU thế hệ trước khi chạy GPT-J 6B mà không cần phần mềm này.
Sự Nổi Bật Tại Mọi Lĩnh Vực
Bằng chứng rõ ràng nhất về sự dẫn đầu của NVIDIA xuất hiện trong các lĩnh vực đa dạng, từ các hệ thống gợi ý, đến các mô hình ngôn ngữ lớn (LLMs) được sử dụng trong trí tuệ nhân tạo sáng tạo. Sự đa dạng này cũng thể hiện qua việc NVIDIA cung cấp các giải pháp tăng tốc với tiêu thụ điện năng thấp tại mép mạng.
Sự Dẫn Đầu và Tính Linh Hoạt
Kết quả của MLPerf không chỉ là minh chứng cho sự xuất sắc của NVIDIA mà còn là bằng chứng về sự minh bạch và công bằng. Điều này giúp người dùng có thể tin tưởng vào kết quả để đưa ra quyết định mua hàng thông tin. Đồng thời, việc NVIDIA liên tục nâng cao phần mềm giúp người dùng có được hiệu suất ngày càng tốt mà không tăng chi phí, đồng thời có thể áp dụng linh hoạt trong nhiều công việc trí tuệ nhân tạo khác nhau.
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- Hyperscale computing: Làm cách nào để đạt được năng lực điện toán quy mô lớn tốt hơn
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Cluster Computing – Thế nào là điện toán cụm?