HIỆU SUẤT PHÁ KỶ LỤC VỀ TRUYỀN DẪN MẠNG
NVIDIA Quantum-2, thế hệ thứ bảy của kiến trúc NVIDIA InfiniBand, mang đến cho các nhà phát triển AI và các nhà nghiên cứu khoa học hiệu suất mạng nhanh nhất và các bộ tính năng sẵn có để giải quyết các vấn đề khó khăn nhất trên thế giới. NVIDIA Quantum-2 mang đến cho các trung tâm dữ liệu siêu máy tính hàng đầu thế giới với nền tảng Software-Defined Networking, In-Network Computing, cô lập hiệu suất, các engine tăng tốc tiên tiến, truy cập bộ nhớ trực tiếp từ xa (RDMA) và tốc độ nhanh nhất lên đến 400Gb/s.
HIỆU SUẤT MANG TÍNH MỞ ĐƯỜNG
Tăng cường năng lực HPC cùng với các siêu máy tính và ứng dụng AI
Tăng tốc cho In-Network Computing
Cơ sở hạ tầng điện toán hiệu suất cao (HPC), AI và hyperscale ngày nay yêu cầu kết nối nội bộ nhanh hơn và kết nối mạng thông minh hơn để phân tích dữ liệu và chạy các mô phỏng phức tạp với tốc độ và hiệu quả cao hơn. NVIDIA Quantum-2 tăng cường và mở rộng In-Network Computing với các engine tính toán được cấu hình sẵn và có thể lập trình, chẳng hạn như thế hệ thứ ba của NVIDIA Scalable Hierarchical Aggregation and Reduction Protocol (SHARPv3), Message Passing Interface (MPI), MPI All-to-All mang lại chi phí trên mỗi node và ROI tốt nhất.
Cô lập hiệu suất
Nền tảng NVIDIA Quantum-2 InfiniBand cung cấp giám sát chủ động và quản lý tắc nghẽn đổi mới giúp cách ly lưu lượng, gần như loại bỏ hiện tượng chập chờn hiệu suất và đảm bảo hiệu suất dự đoán như thể ứng dụng đang được chạy trên một hệ thống riêng biệt.
Siêu máy tính Cloud-Native
Nền tảng Siêu máy tính NVIDIA Cloud-Native tận dụng kiến trúc đơn vị xử lý dữ liệu (DPU) NVIDIA® BlueField® với NVIDIA Quantum-2 InfiniBand networking tốc độ cao, độ trễ thấp. Giải pháp mang lại hiệu suất bare-metal, quản lý và cô lập người dùng, bảo vệ dữ liệu, các dịch vụ HPC và AI theo nhu cầu – đơn giản và bảo mật.
CUNG CẤP DỮ LIỆU VỚI TỐC ĐỘ ÁNH SÁNG
Host Channel Adapter
NVIDIA ConnectX-7 InfiniBand Host Channel Adapter (HCA), với hỗ trợ PCIe Gen4 và Gen5, có sẵn ở nhiều form-factor khác nhau, cung cấp các cổng mạng single và dual ở tốc độ 400Gb/s.
Các HCA bao gồm những khả năng In-Network Computing nâng cao và trang bị các engine có thể lập trình bổ sung cho phép xử lý trước các thuật toán dữ liệu và giảm tải các đường dẫn điều khiển ứng dụng đến mạng.
Fixed-Configuration Switch
Dòng switch cấu hình cố định NVIDIA Quantum-2 bao gồm 64 cổng 400Gb/s hoặc 128 cổng 200Gb/s trên các đầu kết nối vật lý 32 Octal Small Form-Factor (OSFP). Thiết kế switch 1U nhỏ gọn bao gồm các phiên bản làm mát bằng khí và chất lỏng được quản lý bên trong hoặc bên ngoài.
NVIDIA Quantum-2 mang đến tổng thông lượng hai chiều 51.2 Tb/s với sức chứa hơn 66.5 triệu gói mỗi giây.
Modular Switches
Dòng switch mô-đun NVIDIA Quantum-2 cung cấp các cấu hình cổng sau:
- 2,048 cổng 400Gb/s hoặc 4,096 cổng 200Gb/s
- 1,024 cổng 400Gb/s hoặc 2,048 cổng 200Gb/s
- 512 cổng 400Gb/s hoặc 1,024 cổng 200Gb/s
Switch dạng mô-đun lớn nhất mang tổng thông lượng hai chiều là 1,64 Pb/s, gấp 5 lần so với switch mô-đun NVIDIA Quantum InfiniBand thế hệ trước.
Transceiver and Cable
Các tùy chọn kết nối NVIDIA Quantum-2 cung cấp tính linh hoạt tối đa cho việc lựa chọn. Chúng bao gồm nhiều loại transceiver và multi-fiber push-on connector (MPO), active copper cable (ACC) và direct attached cable (DAC) với các tùy chọn splitter 1-2 và 1-4.
Khả năng tương thích ngược cũng có sẵn để kết nối các cụm 400Gb/s mới với cơ sở hạ tầng 200Gb/s hoặc 100Gb/s hiện có.
HIỆU SUẤT, KHẢ NĂNG MỞ RỘNG VÀ HIỆU QUẢ MẠNG HÀNG ĐẦU THẾ GIỚI
Hiệu suất
- Băng thông 400Gb/s mỗi cổng.
- 64 cổng 400Gb/s hoặc 128 cổng 200Gb/s trong một switch đơn.
- 2,048 cổng 400Gb/s hoặc 4,096 cổng 200Gb/s trong một switch mô-đun đơn.
- Hơn 66,5 tỷ gói tin mỗi giây (hai chiều) từ một thiết bị chuyển mạch NVIDIA Quantum-2 duy nhất.
Phá vỡ kỷ lục của chính mình
- Băng thông trên mỗi cổng gấp 2 lần so với thế hệ trước
- Cơ số switch gấp 3 lần so với thế hệ trước
- Hiệu suất MPI gấp 4 lần
- Sức mạnh tăng tốc AI cao hơn 32 lần trên mỗi switch so với thế hệ trước
- Hơn một triệu node 400Gb/giây trong một mạng 4-switch-tier (three hops) DragonFly+, cao hơn 6,5 lần thế hệ trước
- Giảm 7% điện năng và không gian trong trung tâm dữ liệu
Các tính năng chính
- Giảm tải full transport
- RDMA, GPUDirect ® RDMA, GPUDirect Storage
- Các engine In-Network Computing có thể lập trình
- Tăng tốc phần cứng MPI All-to-All
- Tăng tốc phần cứng MPI Tag Matching
- NVIDIA SHARPv3
- Định tuyến thích ứng nâng cao, kiểm soát tắc nghẽn và QoS
- Mạng tự phục hồi
Bài viết liên quan
- Hyperscale computing: Làm cách nào để đạt được năng lực điện toán quy mô lớn tốt hơn
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Cluster Computing – Thế nào là điện toán cụm?
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- CPU cho các hệ thống hiệu suất cao: Số lượng nhân so với tốc độ xung nhịp
- Máy chủ Supermicro X14: Hiệu suất mạnh mẽ, hiệu quả tối đa cho AI, Cloud, Storage, 5G/Edge