Lộ trình sản phẩm Data Center của NVIDIA với các dòng chip AI GX200NVL, GX200, X100 và X40 đến năm 2025

NVIDIA gần đây đã tiết lộ lộ trình sản phẩm dành cho Data Center của họ, một điều họ thường chỉ làm trong các dịp GTC. Công ty đang đẩy mạnh hoạt động trong lĩnh vực trung tâm dữ liệu với kỳ vọng rằng nó sẽ tăng trưởng ít nhất gấp 3 lần ở mảng gaming và 4.5x nếu bao gồm Enterprise AI và các dịch vụ DGX Cloud của họ. Do vậy, lộ trình đã được tăng tốc với các sản phẩm mới như H200, B100, X100, B40, X40, GB200, GX200, GB200NVL, GX200NVL, v.v. Thậm chí còn có con đường đến với 1.6T Ethernet trong hai năm tới.

Lộ trình trung tâm dữ liệu của NVIDIA

Một thay đổi lớn là NVIDIA hiện đang tung ra các sản phẩm dựa trên Arm và x86, với Arm đang dẫn đầu. Để tham khảo, hiện tại một khách hàng bình thường thậm chí không thể mua NVIDIA Grace hoặc Grace Hopper, vì vậy, việc thể hiện nó trên đỉnh của lộ trình 2023-2025 là một chi tiết quan trọng. Dưới đây là lộ trình mà NVIDIA đã thể hiện:


Lộ trình NVIDIA tháng 10 năm 2023

Với Arm, chúng ta có GH200NVL vào năm 2024, GB200NVL vào năm 2024 và sau đó vào năm 2025 chúng ta có GX200NVL. Chúng ta cũng đã thấy dòng x86 NVL ra mắt cùng với NVIDIA H100 NVL nhưng đây là những giải pháp dựa trên Arm. Sau đó là GH200NVL sẽ ra mắt vào năm 2024. Tiếp theo là GB200NVL và sau đó là GX200NVL. Ngoài ra còn có các phiên bản không phải NVL. NVIDIA Hopper GH200 (non-NVL) với bộ nhớ 142GB/ 144GB HBM3e đã từng được giới thiệu với cấu hình kép, và cuối cùng nó có thể trở thành GH200NVL. GB200 sẽ là bộ xử lý tăng tốc thế hệ tiếp theo vào năm 2024 và GX200 vào năm 2025.


Dual NVIDIA GH200 phiên bản Refresh

Đối với thị trường x86, H200 sẽ có mặt vào năm 2024 mà chúng ta mong đợi nó sẽ là một phiên bản refresh với nhiều bộ nhớ hơn vẫn còn dựa trên kiến ​​trúc Hopper. B100 và B40 là các bộ phận kiến ​​trúc thế hệ tiếp theo, tiếp theo là X100 và X40 vào năm 2025. Do B40 và X40 nằm trong làn sóng “Enterprise”, và L40S hiện tại là card PCIe, 2 sản phẩm này có thể cũng là card PCIe.


NVIDIA L40S Supernova

Về mảng networking, cả Infiniband và Ethernet sẽ tăng từ 400Gbps lên 800Gbps vào năm 2024 và sau đó lên 1.6Tbps vào năm 2025. Do có sự xuất hiện của con chip chuyển mạch Broadcom Tomahawk 4 64-port 400GbE và các Switches cùng với nó vào đầu năm 2023 và cả các bộ switches 800G Broadcom Tomahawk 5 trong năm nay, có vẻ như danh mục sản phẩm Ethernet của NVIDIA có phần bị tụt lại phía sau. Dòng 800G 2022-2023 của Broadcom dường như phù hợp với bản nâng cấp năm 2024 của NVIDIA, với việc NVIDIA công bố Spectrum 4 vào giữa năm 2023 trong khi Tomahawk 5 được công bố khoảng 21-22 tháng trước đó. Trong ngành công nghệ điện toán, nhìn chung có một khoảng cách đáng kể giữa thời điểm công bố chip và thời điểm nó đi vào sản xuất.


NVIDIA Spectrum 4 Switch Chip tại Computex 2023

Ở mảng Infiniband, NVIDIA chỉ có “một mình một chợ”. Và một thứ còn thiếu trong roadmap có lẽ là lộ trình dành cho NVSwitch/NVLink.

Tóm lại

Các công ty phần cứng dành cho AI khác chắc hẳn sẽ lo lắng trước lộ trình AI cấp doanh nghiệp của NVIDIA. Việc tham gia trong lĩnh vực suy luận và đào tạo AI có nghĩa là một thế hệ sản phẩm được làm mới của kiến trúc Hopper hiện tại vào năm 2024, sau đó chuyển sang thế hệ Blackwell vào cuối năm 2024 với một kiến ​​trúc khác vào năm 2025. Về mặt CPU, chúng ta có thể thấy nhịp độ cập nhật có phần chậm chạp, dẫn đến cuộc chiến về số lượng nhân ở mảng x86 với những bước nhảy vọt gần đây. Ví dụ: số lượng nhân Xeon hàng đầu của Intel dự kiến ​​​​sẽ tăng hơn 10 lần từ đầu quý 2 năm 2021 đến quý 2 năm 2024. NVIDIA dường như đang ở tốc độ đó trong mảng trung tâm dữ liệu. Đối với các công ty khởi nghiệp AI, đây hiện là cuộc đua dựa trên tốc độ với lộ trình mới của NVIDIA.

Đối với Intel, AMD và có lẽ cả Cerebras, các mục tiêu sẽ thay đổi khi NVIDIA đang bán những con chip có tỷ suất lợi nhuận cao. Họ cũng đang đưa các giải pháp dựa trên Arm của mình lên hàng đầu để có thể đạt được tỷ suất lợi nhuận cao không chỉ ở phía GPU/bộ tăng tốc mà còn ở phía CPU.

Một điểm chậm trễ đáng chú ý có vẻ là về mảng Ethernet. Điều này có vẻ kỳ lạ vì thực tế là một số nơi đang sử dụng các DPU NVIDIA BlueField-2 cho Ethernet hàng ngày một cách hiệu quả và một trong các NIC nhanh nhất cho đến nay là card NVIDIA ConnectX-7 400GbE.

____
Bài viết liên quan
Góp ý / Liên hệ tác giả