Tuần này là tuần của sự kiện COMPUTEX 2024, chính thức diễn ra từ ngày 4 đến ngày 7 tháng 6/2024 tại Đài Bắc và NVIDIA đã bắt đầu sự kiện này bằng bài keynote đầu tiên của chuỗi sự kiện. Trong bài phát biểu này, chúng tôi mong đợi được nghe nhiều thứ về AI và các nền tảng mới sử dụng GPU của hãng.
Keynote COMPUTEX 2024 của NVIDIA
Bài phát biểu bắt đầu bằng cuộc thảo luận “Bạn mua càng nhiều, bạn càng tiết kiệm”. Hầu hết các bài phát biểu của Jensen đều có chút hương vị của điều này và nó đã diễn ra trong nhiều năm.
NVIDIA COMPUTEX 2024 – Mua càng nhiều, tiết kiệm càng nhiều
Máy tính xách tay NVIDIA AI
Đây sẽ là kỳ Computex của PC AI. NVIDIA nêu bật ba máy tính xách tay ASUS và một máy tính xách tay MSI và nói rằng họ không chỉ có PC AI mà còn có PC AI chạy CUDA, ngôn ngữ của AI tạo sinh cao cấp. Máy tính xách tay AI NVIDIA COMPUTEX 2024
Đây sẽ là một thử thách thực sự thú vị đối với NVIDIA. Khi Intel, AMD, Qualcomm và những hãng khác cho biết rằng họ đã có bộ tăng tốc AI chuyên dụng,
NVIDIA Grace Blackwell GB200
Về nền tảng Blackwell mới, Jensen cho biết MTBF của cụm 10.000 GPU được tính bằng giờ. MTBF của cụm 100.000 GPU được đo bằng phút. Đó là lý do tại sao GB200 sở hữu cỗ máy RAS.
NVIDIA Compex 2024 Blackwell RAS
Đây là sản phẩm Grace Blackwell GB200.
NVIDIA COMPUTEX 2024 với Grace Blackwell GB200 phiên bản production
Đây là một biểu đồ thú vị. Nó là biểu đồ của NVIDIA về lượng điện năng cần thiết để huấn luyện GPT-4 bằng cách sử dụng từng thế hệ GPU của NVIDIA.
NVIDIA COMPUTEX 2024 – Sức mạnh training GPT-4
Dưới đây là các tản nhiệt trên bo mạch NVIDIA HGX B200 15kW, theo Jensen.
NVIDIA COMPUTEX 2024 – Bo mạch HGX B200 15kW
Thêm một điều thú vị. Có vẻ như GB200 NVL72 hiện giờ là 100kW chứ không phải 120kW nữa.
NVIDIA COMPUTEX 2024 – DGX Blackwell Jump
Đây là Switch NVLink thế hệ thứ 5 giúp GB200 NVL72 trở nên khả thi.
NVIDIA COMPUTEX 2024 – NVSwitch thế hệ thứ 5
Jensen khoe trục kết nối NVLink thụ động (spine). Nếu các đầu nối trông hơi lệch thì chúng phải có một chút linh hoạt để hỗ trợ việc kết nối thuận lợi.
NVIDIA COMPUTEX 2024 – NVLink Spine
NVIDIA cũng đã trình bày về Spectrum-X cho kỷ nguyên 400GbE, Spectrum-X800 Ultra 51,2T cho kỷ nguyên ConnectX-8. Sau đó, nó có lộ trình tới kỷ nguyên switch ConnectX-9 NIC và 102.4T cho mạng 1.6Tbps.
NVIDIA COMPUTEX 2024 – Lộ trình của Spectrum X
Có vẻ như họ đang lên kế hoạch cho mạng 800Gbps (mà một máy chủ duy nhất yêu cầu PCIe Gen6) vào năm 2025 và sau đó là mạng 1.6Tbps vào năm 2026. Vì vậy, điều này dường như cho thấy NVIDIA cũng đang lên kế hoạch cho một NIC PCIe Gen7 vào năm 2026. Khi chúng ta thảo luận về tốc độ PCIe bước tăng tốc, đây là một tín hiệu chắc chắn.
NVIDIA COMPUTEX 2024 – CPU Rubin và Rubin Ultra Vera
Tiếp theo sẽ là GPU NVIDIA Rubin và sau đó là CPU NVIDIA Vera. Điều này trùng với điểm rơi của ConnectX-9 vào năm 2026. Có vẻ như chúng ta có Blackwell vào năm 2024, Blackwell Ultra vào năm 2025, sau đó là Rubin vào năm 2026 với Rubin Ultra có lẽ là vào năm 2027.
NVIDIA NVL2
Không có gì bí mật khi NVIDIA DGX GB200 NVL72 sẽ nằm ngoài tầm với của nhiều người, đặc biệt với mức giá vài triệu và ngân sách điện năng 120kW cho mỗi tủ rack. NVIDIA đã bán khối cơ bản Grace Blackwell chỉ có hai GPU thay vì 72 và gọi nó là NVL2.
Lời cuối cùng
Có rất nhiều thứ đang diễn ra ở NVIDIA. Rõ ràng là trong khi chúng ta thảo luận về phần cứng của NVIDIA như là động lực mang lại lợi nhuận cho hãng hiện nay, thì NVIDIA đang dành nhiều thời gian hơn cho phần mềm của mình, ngay cả ở Đài Loan, nơi sản xuất phần cứng chủ yếu. Câu hỏi trị giá hàng nghìn tỷ đô la là NVIDIA sẽ kiếm tiền từ mảng phần mềm như thế nào.
Bài viết liên quan
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson
- Phát triển ứng dụng AI tại biên với NVIDIA Jetson AGX Orin & Developer Kit
- Giải mã hiệu suất AI trên PC và Workstation RTX AI
- Nvidia “thần tốc” công bố thế hệ chip AI tiếp theo