GTC22 – NVIDIA hôm nay đã công bố CPU trung tâm dữ liệu chuyên biệt dựa trên kiến trúc Arm® Neoverse™ đầu tiên được thiết kế cho hạ tầng AI và điện toán hiệu suất cao, mang lại hiệu năng cao nhất, gấp đôi băng thông bộ nhớ và tiết kiệm năng lượng so với các chip máy chủ hàng đầu hiện nay.
NVIDIA Grace™ CPU Superchip bao gồm hai chip CPU được kết nối chặt chẽ với nhau qua NVLink ® -C2C, một kết nối giữa chip-to-chip mới, tốc độ cao, độ trễ thấp.
Grace CPU Superchip bổ sung cho module tích hợp CPU-GPU đầu tiên của NVIDIA, Grace Hopper Superchip, được công bố vào năm ngoái, được thiết kế để phục vụ các ứng dụng HPC và AI quy mô lớn kết hợp với GPU dựa trên kiến trúc NVIDIA Hopper™. Cả hai superchip đều chia sẻ cùng một kiến trúc CPU nền tảng bên dưới, cũng như kết nối NVLink-C2C.
Jensen Huang, người sáng lập kiêm Giám đốc điều hành của NVIDIA cho biết: “Một loại trung tâm dữ liệu mới đã xuất hiện – các “nhà máy AI” xử lý và tinh chỉnh hàng núi dữ liệu khổng lồ để tạo ra trí thông minh. “Grace CPU Superchip cung cấp hiệu suất cao nhất, băng thông bộ nhớ và nền tảng phần mềm NVIDIA trong một con chip và sẽ tỏa sáng như một CPU cho hạ tầng AI của thế giới.”
Giới thiệu Nền tảng CPU của NVIDIA
Được tạo ra để cung cấp hiệu suất cao nhất, Grace CPU Superchip đóng gói 144 lõi Arm trong một socket duy nhất, cung cấp hiệu suất ước tính hàng đầu trong ngành là 740 dựa trên điểm chuẩn SPECrate ® 2017_int_base. (1) Con số này cao hơn 1,5 lần so với mức của CPU kép trang bị trong DGX™ A100 hiện nay, theo ước tính trong các phòng thí nghiệm của NVIDIA với cùng loại trình biên dịch. (2)
Grace CPU Superchip cũng cung cấp băng thông bộ nhớ và hiệu quả năng lượng hàng đầu trong ngành với memory subsystem đầy sáng tạo bao gồm bộ nhớ LPDDR5x với ECC để có sự cân bằng tốt nhất giữa tốc độ và mức tiêu thụ điện năng. LPDDR5x memory subsystem cung cấp băng thông gấp đôi so với thiết kế DDR5 truyền thống với tốc độ 1 terabyte mỗi giây trong khi tiêu thụ ít điện năng hơn đáng kể với toàn bộ CPU, bao gồm cả bộ nhớ chỉ tiêu thụ 500 watt.
Grace CPU Superchip dựa trên kiến trúc trung tâm dữ liệu mới nhất, Arm® v9. Kết hợp hiệu suất lõi đơn luồng cao nhất với sự hỗ trợ cho thế hệ mở rộng vectơ mới của Arm, Grace CPU Superchip sẽ mang lại lợi ích tức thì cho nhiều ứng dụng.
Grace CPU Superchip sẽ chạy tất cả các ngăn xếp phần mềm máy tính của NVIDIA, bao gồm NVIDIA RTX™, NVIDIA HPC, NVIDIA AI và Omniverse. Grace CPU Superchip cùng với NVIDIA ConnectX ® -7 NIC mang lại sự linh hoạt khi được cấu hình thành các máy chủ như các hệ thống chỉ dành cho CPU độc lập hoặc như các máy chủ được tăng tốc GPU với một, hai, bốn hoặc tám GPU dựa trên Hopper, cho phép khách hàng tối ưu hóa hiệu suất cho tải công việc cụ thể của họ trong khi vẫn duy trì một stack phần mềm duy nhất.
Được thiết kế cho các ứng dụng AI, HPC, Cloud và Hyperscale
The Grace CPU Superchip sẽ vượt trội hơn các ứng dụng HPC, AI, phân tích dữ liệu, tính toán khoa học và điện toán siêu quy mô với hiệu suất cao nhất, băng thông bộ nhớ, hiệu quả năng lượng và khả năng cấu hình.
144 lõi xử lý và băng thông bộ nhớ 1TB/s của Grace CPU Superchip sẽ cung cấp hiệu suất chưa từng có cho các ứng dụng tính toán hiệu suất cao dựa trên CPU. Các ứng dụng HPC có nhu cầu cao về xử lý, đòi hỏi các lõi có hiệu suất cao nhất, băng thông bộ nhớ cao nhất và dung lượng bộ nhớ phù hợp cho mỗi lõi để tăng tốc độ ra kết quả.
NVIDIA đang làm việc với các khách hàng hàng đầu về HPC, siêu máy tính, hyperscale và đám mây cho Grace CPU Superchip. Cả nó và Grace Hopper Superchip dự kiến sẽ có mặt trên thị trường vào nửa đầu năm 2023.
Để tìm hiểu thêm về Grace CPU Superchip, bạn có thể xem lại bài phát biểu GTC 2022 của Huang.
Bài viết liên quan