Các ứng dụng phổ thông đạt được gấp 2 lần hiệu suất tiết kiệm điện năng so với các nền tảng x86 đối với microservices, phân tích, mô phỏng,…
Kết quả đã có và chúng chỉ ra một kỷ nguyên mới trong điện toán tiết kiệm năng lượng.
Trong các thử nghiệm về những workload thực tế, NVIDIA Grace CPU Superchip đạt hiệu suất gấp 2 lần so với các bộ vi xử lý x86 ở cùng mức công suất trên các ứng dụng CPU chính của trung tâm dữ liệu. Điều đó mở ra một loạt các cơ hội mới.
Điều đó có nghĩa là các trung tâm dữ liệu có thể xử lý lưu lượng cao gấp đôi. Họ có thể cắt giảm một nửa hóa đơn tiền điện. Họ có thể đóng gói nhiều khả năng xử lý hơn vào các không gian hạn chế ở rìa mạng – hoặc bất kỳ sự kết hợp nào của những thứ trên.
Hiệu quả Năng lượng – Ưu tiên của Trung tâm dữ liệu
Các nhà quản lý trung tâm dữ liệu cần những tùy chọn này để phát triển mạnh trong kỷ nguyên tiết kiệm năng lượng ngày nay.
Định luật Moore đã chết, một cách hiệu quả. Lĩnh vực vật lý không còn cho phép các kỹ sư đóng gói nhiều transistor hơn trong cùng một không gian với cùng công suất.
Đó là lý do tại sao các CPU x86 mới thường mang lại mức tăng so với các thế hệ trước dưới 30% và cũng là lý do tại sao ngày càng nhiều trung tâm dữ liệu bị giới hạn công suất.
Với mối đe dọa ngày càng tăng của sự nóng lên toàn cầu, các trung tâm dữ liệu không có điều kiện để mở rộng công suất nhưng chúng vẫn cần phải đáp ứng nhu cầu ngày càng tăng về điện toán.
Điều mong muốn: Cùng công suất, hiệu suất cao hơn
Nhu cầu điện toán đang tăng 10% mỗi năm ở Mỹ và sẽ tăng gấp đôi trong vòng 8 năm từ 2022-2030, theo một nghiên cứu của McKinsey.
“Do đó, áp lực để làm cho các trung tâm dữ liệu trở nên bền vững là rất cao và một số cơ quan quản lý cũng như chính phủ đang áp đặt các tiêu chuẩn bền vững đối với các trung tâm dữ liệu mới được xây dựng”.
Với sự kết thúc của định luật Moore, sự tiến triển của trung tâm dữ liệu về tính hiệu quả của điện toán đã bị chậm lại – theo một khảo sát mà McKinsey đã trích dẫn (xem biểu đồ bên dưới).
Trong môi trường ngày nay, mức tăng gấp 2 lần mà NVIDIA Grace mang lại là điều đáng kinh ngạc tương đương với một bước nhảy vọt qua nhiều thế hệ. Nó đáp ứng những yêu cầu của các giám đốc điều hành trung tâm dữ liệu ngày nay.
Zac Smith – người đứng đầu cơ sở hạ tầng biên tại Equinix, nhà cung cấp dịch vụ toàn cầu quản lý hơn 240 trung tâm dữ liệu, đã nêu rõ những nhu cầu này trong một bài viết về điện toán tiết kiệm năng lượng.
Ông nói: “Hiệu suất bạn nhận được đối với tác động carbon mà bạn có là những gì chúng ta cần hướng tới.”
“Chúng tôi có 10.000 khách hàng trông cậy vào sự giúp đỡ của mình trong hành trình này. Họ yêu cầu nhiều dữ liệu hơn và nhiều trí thông minh hơn, thường là với AI và họ muốn điều đó một cách bền vững”, ông nói thêm.
Bộ ba cải tiến trong CPU
CPU Grace mang lại hiệu suất hiệu quả đó nhờ vào 3 cải tiến.
Nó sử dụng một kết cấu cực nhanh để kết nối 72 core Arm Neoverse V2 trong một khuôn đơn lẻ, có băng thông fabric bisection là 3.2 TB/s, một thước đo thông lượng tiêu chuẩn. Tiếp theo, nó kết nối hai trong số các khuôn đó trong một superchip package với NVIDIA NVLink-C2C interconnect, cung cấp băng thông 900 GB/s.
Cuối cùng, đây là CPU trung tâm dữ liệu đầu tiên sử dụng bộ nhớ LPDDR5X cấp máy chủ. Điều đó cung cấp thêm tới 50% băng thông bộ nhớ với chi phí tương tự nhưng công suất chỉ bằng 1/8 so với bộ nhớ máy chủ thông thường. Và kích thước nhỏ gọn của nó cho phép gấp đôi mật độ của các thiết kế bộ nhớ card-based điển hình.
So với các CPU x86 hiện tại, NVIDIA Grace có thiết kế đơn giản hơn, cung cấp nhiều băng thông hơn và sử dụng ít công suất hơn.
Những kết quả đầu tiên
Các kỹ sư của NVIDIA hiện đang chạy những workload của trung tâm dữ liệu thực trên Grace.
Họ nhận thấy rằng so với các CPU x86 hàng đầu trong các trung tâm dữ liệu sử dụng cùng mức tiêu thụ công suất, thì Grace:
- Nhanh hơn 2.3 lần đối với microservices.
- Nhanh hơn gấp 2 lần trong xử lý dữ liệu chuyên sâu về bộ nhớ
- Và nhanh hơn 1.9 lần trong tính toán động lực học chất lỏng, được sử dụng trong nhiều ứng dụng tính toán kỹ thuật.
Các trung tâm dữ liệu thường phải chờ hai thế hệ CPU trở lên để có được những lợi ích này, được tóm tắt trong biểu đồ bên dưới.
Ngay cả trước khi có những kết quả này trên các CPU đang hoạt động, người dùng cũng đã phản hồi về những đổi mới trong Grace.
Phòng thí nghiệm quốc gia Los Alamos đã công bố vào tháng 5 rằng họ sẽ sử dụng Grace trong Venado, một siêu máy tính AI 10 exaflop sẽ thúc đẩy công việc của phòng thí nghiệm trong các lĩnh vực như khoa học vật liệu và năng lượng tái tạo. Trong khi đó, các trung tâm dữ liệu ở Châu Âu và Châu Á đang đánh giá Grace đối với các workload của họ.
NVIDIA Grace hiện đang tạo mẫu và sản xuất vào nửa cuối năm nay. ASUS, Atos, GIGABYTE, Hewlett Packard Enterprise, QCT, Supermicro, Wistron và ZT Systems đang xây dựng các máy chủ có thể sử dụng nó.
Tìm hiểu sâu về Điện toán bền vững
Để đi sâu vào chi tiết, hãy đọc sách trắng này về kiến trúc Grace.
Tìm hiểu thêm về điện toán bền vững từ phiên này tại NVIDIA GTC: Three Strategies to Maximize Your Organization’s Sustainability and Success in an End-to-End AI World.
Đọc sách trắng về NVIDIA BlueField DPU để tìm hiểu cách xây dựng mạng lưới tiết kiệm năng lượng.
Và xem bài phát biểu quan trọng tại GTC của người sáng lập kiêm Giám đốc điều hành NVIDIA – Jensen Huang để có được bức tranh toàn cảnh.
Theo NVIDIA
Bài viết liên quan
- Nvidia ‘đang chuẩn bị cho thời kỳ AI không dùng GPU’
- NVIDIA World Foundation Model: Chìa khóa để thúc đẩy trí tuệ nhân tạo vật lý – Physical AI
- Có gì mới với NVIDIA tại sự kiện CES 2025?
- Các chuyên gia AI của NVIDIA dự báo gì cho năm 2025
- Sovereign AI là gì?
- Top các xu hướng trung tâm dữ liệu trong năm 2025