Thông tin sản phẩm Máy chủ Trí tuệ Nhân tạo NVIDIA Vera Rubin NVL72
GroqNode™ Rubin G72 là giải pháp điện toán cấp độ tủ rack (Rack-scale solution), kết hợp sức mạnh của 72 chip LPU™ thế hệ mới trong một kiến trúc thống nhất. Được thiết kế để đối đầu trực tiếp với các hệ thống NVL72, GroqNode G72 mang lại tốc độ phản hồi Token chưa từng có, biến những mô hình ngôn ngữ nghìn tỷ tham số (Trillion-parameter models) thành các ứng dụng thời gian thực thực thụ.
Sức mạnh phần cứng cấp độ Cluster (Hardware Power)
Kiến trúc 72-LPU Interconnect: Tích hợp 72 bộ xử lý LPU™ Rubin-class bên trong một tủ rack duy nhất, hoạt động như một thực thể tính toán khổng lồ nhờ công nghệ GroqFabric™.
Thiết kế tản nhiệt lỏng (Liquid-Cooled): Hệ thống làm mát bằng chất lỏng tiên tiến tương tự chuẩn NVL72, cho phép duy trì hiệu suất đỉnh cao liên tục mà vẫn tối ưu hóa diện tích và điện năng tiêu thụ (PUE).
- Băng thông nội bộ cực đại: Hệ thống kết nối chip-to-chip không thông qua giao thức mạng truyền thống, giúp giảm độ trễ giữa các node xuống mức nano giây.
| Chỉ số | Khả năng của GroqNode™ G72 |
| Tốc độ suy luận (Inference) | Đạt mức triệu Token/giây cho toàn bộ hệ thống |
| Độ trễ phản hồi (Time-to-First-Token) | < 0.05 giây cho các mô hình MoE lớn nhất |
| Băng thông nội bộ Rack | Lên đến 30 TB/s nhờ GroqFabric |
| Khả năng xử lý ngữ cảnh (Context) | Hỗ trợ cửa sổ ngữ cảnh (Context Window) lên tới hàng triệu Token mà không giảm tốc độ |