NVIDIA HGX AI Supercomputer: Nền tảng điện toán AI hàng đầu thế giới

Trong thế giới của Trí tuệ Nhân tạo (AI), mô phỏng phức tạp và các tập dữ liệu lớn đòi hỏi nhiều GPU với kết nối nhanh chóng và một bộ cài đặt phần mềm được tối ưu hoàn toàn. Nền tảng siêu máy tính AI NVIDIA HGX™ kết hợp sức mạnh đầy đủ của GPU NVIDIA, NVLink®, mạng lưới NVIDIA, và bộ cài đặt phần mềm AI và tính toán hiệu suất cao (HPC) tối ưu hoàn toàn để cung cấp hiệu suất ứng dụng cao nhất và thúc đẩy thời gian nhanh nhất đến thông tin chi tiết.

Nền tảng tính toán tăng tốc toàn diện

Các máy chủ NVIDIA HGX B200 và HGX B100 tích hợp GPU Blackwell Tensor Core của NVIDIA với kết nối tốc độ cao để đẩy trung tâm dữ liệu vào một thời đại mới của tính toán tăng tốc và AI sáng tạo. Là một nền tảng tăng tốc tựa như đỉnh cao với hiệu suất phân giải lên đến 15 lần so với thế hệ trước đó, các hệ thống HGX dựa trên Blackwell được thiết kế cho các khối lượng công việc generative AI, phân tích dữ liệu, và HPC đòi hỏi nhất.

NVIDIA HGX H200 kết hợp GPU Tensor Core H200 với kết nối tốc độ cao để cung cấp hiệu suất, khả năng mở rộng và bảo mật đặc biệt cho mỗi trung tâm dữ liệu. Các cấu hình lên đến tám GPU mang lại sự tăng tốc chưa từng có, với hiệu suất đáng kinh ngạc lên đến 32 petaFLOPS để tạo ra nền tảng máy chủ tăng tốc tựa như đỉnh cao nhất thế giới cho AI và HPC.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

HGX Stack

Cả HGX H200 và HGX H100 đều bao gồm các tùy chọn mạng lưới tiên tiến – với tốc độ lên đến 400 gigabit mỗi giây (Gb/s) – sử dụng NVIDIA Quantum-2 InfiniBand và Spectrum™-X Ethernet để đạt được hiệu suất AI cao nhất. HGX H200 và HGX H100 cũng bao gồm các đơn vị xử lý dữ liệu (DPUs) NVIDIA® BlueField®-3 để kích hoạt mạng lưới điện toán đám mây, lưu trữ tổ hợp, bảo mật không tin tưởng và đàn hồi tính toán GPU trong các đám mây AI quy mô lớn.

Deep Learning Inference: hiệu suất và linh hoạt cao

HGX B200 đạt được hiệu suất suy luận cao hơn tới 15 lần so với thế hệ NVIDIA Hopper™ trước đó đối với các mẫu máy lớn như GPT-MoE-1.8T. Transformer Engine thế hệ thứ hai sử dụng công nghệ Blackwell Tensor Core tùy chỉnh kết hợp với các cải tiến TensorRT™-LLM và Nemo™ Framework để tăng tốc độ suy luận cho các mô hình ngôn ngữ lớn (LLM) và mô hình Hỗn hợp chuyên gia (MoE).

Deep Learning Training: hiệu suất và khả năng mở rộng

Công cụ biến áp thế hệ thứ hai, có dấu phẩy động 8 bit (FP8) và độ chính xác mới, cho phép đào tạo nhanh hơn đáng kể gấp 3 lần đối với các mô hình ngôn ngữ lớn như GPT-MoE-1.8T. Bước đột phá này được bổ sung bởi NVLink thế hệ thứ năm với kết nối GPU-GPU 1,8 TB/giây, mạng InfiniBand và phần mềm NVIDIA Magnum IO™. Cùng với nhau, những điều này đảm bảo khả năng mở rộng hiệu quả cho doanh nghiệp và các cụm điện toán GPU mở rộng.

Mạng lưới NVIDIA: tăng tốc siêu máy tính HGX

Trung tâm dữ liệu là đơn vị tính toán mới, và mạng lưới đóng vai trò thiết yếu trong việc mở rộng hiệu suất ứng dụng trên quy mô lớn. Để khai thác tối đa sức mạnh của HGX, NVIDIA cung cấp các giải pháp mạng tiên tiến, đảm bảo tận dụng toàn bộ tài nguyên tính toán.

  • Đối với trung tâm dữ liệu đám mây AI sử dụng Ethernet: Nền tảng mạng NVIDIA Spectrum-X là lựa chọn hoàn hảo. Kết hợp với switch NVIDIA Spectrum-4 và DPU BlueField-3, Spectrum-X tối ưu hóa hiệu suất AI trên chuẩn Ethernet 400Gb/s, mang lại kết quả nhất quán, dự đoán được cho hàng ngàn tác vụ AI đồng thời ở mọi quy mô. Spectrum-X còn hỗ trợ đa thuê bao đám mây tiên tiến và bảo mật zero-trust.
  • Đối với các trung tâm dữ liệu khác: HGX đạt hiệu suất và tính hiệu quả hàng đầu khi kết hợp với NVIDIA Quantum InfiniBand, đảm bảo sử dụng toàn bộ tài nguyên tính toán.

Ví dụ điển hình: Siêu máy tính trí tuệ nhân tạo tổng hợp quy mô lớn Israel-1 được thiết kế dựa trên nền tảng tham khảo NVIDIA Spectrum-X. Hệ thống này sử dụng máy chủ Dell PowerEdge XE9680 tích hợp card HGX H200 hoặc H100 8 GPU, DPU BlueField-3 và switch Spectrum-4. Israel-1 minh họa sức mạnh của việc kết hợp HGX với các giải pháp mạng tiên tiến của NVIDIA

NVIDIA HGX Specifications

NVIDIA HGX có sẵn dưới dạng bo mạch đơn với bốn GPU H200 hoặc H100 hoặc tám GPU H200, H100, B200 hoặc B100. Sự kết hợp mạnh mẽ giữa phần cứng và phần mềm này đặt nền tảng cho hiệu suất siêu máy tính AI chưa từng có.  → Để biết thêm thông tin về NVIDIA HGX thế hệ mới, truy cập tại đây: https://thegioimaychu.vn/server/nvidia/→ Để biết thêm thông tin, hãy xem lại bài phát biểu quan trọng của GTC 24 tại đây: https://thegioimaychu.vn/blog/ai-hpc/tom-tat-buoi-keynote-cua-nvidia-gtc-2024-p19257/

____
Bài viết liên quan

Góp ý / Liên hệ tác giả