Triển khai AI, HPC linh hoạt và hiệu quả với Supermicro NGC Ready Systems

AI đang giúp giải quyết một số vấn đề phức tạp nhất của thế giới, việc vượt qua những thách thức to lớn này đòi hỏi phải tính toán một lượng lớn dữ liệu với độ chính xác cao. Chính vì vậy, các mô hình AI hiện nay đã được phát triển và tối ưu hóa nhằm đáp ứng cho các hệ thống đòi hỏi quy mô lớn này. NVIDIA GPU Cloud (NGC) là nền tảng phần mềm tập trung được tăng tốc bởi GPU và được tối ưu hóa cho AI và HPC. Hệ thống NGC-Ready của Supermicro giúp chạy các tải công việc lớn dễ dàng và hiệu quả với phần cứng và phần mềm tăng tốc GPU NVIDIA hoàn chỉnh:

• Triển khai và phát triển phần mềm AI ngay lập tức khi hệ thống được bật nguồn. Hệ điều hành, trình điều khiển CUDA, CUDA-X, NVIDIA, cơ sở hạ tầng vùng chứa được tải trước. Hỗ trợ đầy đủ có sẵn.
• Tiếp cận với các mô hình AI học sâu tiên tiến, mới nhất. Sử dụng các mô hình được đào tạo trước, các hệ thống AI mới có thể được xây dựng nhanh chóng với các đào tạo bổ sung.
• Các bộ NGC có thể hoạt động ở bất kỳ đâu, cho dù chúng nằm trên hệ thống Supermicro trong trung tâm dữ liệu, trong các trung tâm dữ liệu ở biên Edge, trên các máy chủ biên và cả trên đám mây nếu Cloud Bursting là cần thiết. Kubernetes có thể sắp xếp các thùng chứa containers trong một bộ hệ thống mở rộng để mở rộng quy mô xử lý cho các doanh nghiệp lớn.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

Triển khai ứng dụng nhanh chóng với cơ sở hạ tầng có thể mở rộng linh hoạt

Hệ thống Supermicro NGC-Ready được xác thực về chức năng và hiệu suất của phần mềm AI từ NVIDIA NGC. Các hệ thống này cùng với NVIDIA NGC, cho phép khách hàng phát triển và triển khai các giải pháp AI từ đầu đến cuối. Hệ thống được cài đặt sẵn hệ điều hành, vùng chứa container, môi trường CUDA cần thiết để chạy phần mềm NVIDIA NGC. Supermicro cung cấp cài đặt phần mềm NVIDIA NGC như một dịch vụ bổ sung. Hỗ trợ cấp doanh nghiệp cho phần cứng và hệ điều hành có sẵn để giúp quản trị viên hệ thống giảm thiểu thời gian ngừng hoạt động của hệ thống, mang lại cho người dùng sự tự tin khi hỗ trợ, triển khai các khối lượng công việc của AI, HPC

Được hỗ trợ bởi NVIDIA A100, V100 và T4, hệ thống Supermicro NGC-Ready cung cấp tốc độ tăng tốc cho cả đào tạo và suy luận. Phần mềm NVIDIA NGC được phân phối dưới dạng bộ chứa Docker, vì vậy chúng có thể chạy ở bất kỳ đâu mà Hệ thống Supermicro NGC-Ready được triển khai:

  • Trong trung tâm dữ liệu hoặc đám mây
  • Trong các trung tâm dữ liệu Edge
  • Ở các vị trí từ xa được phân phối dưới dạng máy chủ EGX có khả năng phục hồi và bảo mật cao

Được hỗ trợ bởi 26 năm kinh nghiệm cung cấp các giải pháp máy tính hiện đại, hệ thống Supermicro là giải pháp máy chủ mạnh mẽ nhất, hiệu suất cao nhất và giá trị cao nhất trên thị trường hiện nay. Với hỗ trợ kết nối mạng và lưu trữ cực nhanh, cũng như GPU NVIDIA Ampere A100, V100, A40…. và T4, hệ thống Supermicro NGC-Ready là những máy chủ đáng tin cậy và có khả năng mở rộng cao nhất để hỗ trợ AI. Khách hàng có thể tự tin chạy cơ sở hạ tầng AI của họ.

Hệ thống Supermicro NGC-Ready có thể hoạt động với bất kỳ phần mềm NGC nào và được cập nhật hàng tháng với các mô hình học sâu mới nhất trên nhiều khuôn khổ, bao gồm Tensorflow, PyTorch, MXNet. Các mô hình được đào tạo trước, cho phép đào tạo nhanh hơn về dữ liệu mới. Một số mô hình ví dụ có sẵn như trong hình.

NVIDIA NGC

NGC là trung tâm của NVIDIA dành cho các bộ chứa ứng dụng AI, ML và HPC được tăng tốc GPU, SDK và các công cụ giúp truy cập nhanh hơn vào phần mềm được tối ưu hóa hiệu suất.

Sổ đăng ký vùng chứa NGC lưu trữ các vùng chứa cho phần mềm khoa học dữ liệu và AI hàng đầu – tất cả đều được điều chỉnh, thử nghiệm và tối ưu hóa bởi NVIDIA – cũng như các vùng chứa đã được thử nghiệm đầy đủ cho các ứng dụng HPC và phân tích dữ liệu. Các vùng chứa này tận dụng lợi thế của GPU NVIDIA tại chỗ và trên đám mây. Mỗi giải pháp đều được tối ưu hóa hoàn toàn và hoạt động trên nhiều giải pháp máy chủ Supermicro với GPU NVIDIA.

NVIDIA NGC cũng lưu trữ các mô hình được đào tạo trước để giúp các nhà khoa học dữ liệu xây dựng các mô hình có độ chính xác cao nhanh hơn và cung cấp các SDK dành riêng cho ngành giúp đơn giản hóa việc phát triển các giải pháp AI từ đầu đến cuối bằng đào tạo và suy luận.

NVIDIA là công ty hàng đầu trong lĩnh vực tăng tốc GPU hiệu suất cao và phần mềm để phát triển và triển khai phần mềm AI. Bằng cách đưa các công nghệ từ nghiên cứu AI mới nhất vào NGC, khách hàng có thể cảm thấy tự tin rằng họ có những lựa chọn tốt nhất để phát triển các ứng dụng AI của mình. Với các mô hình AI được đào tạo trước và học tập chuyển giao, khách hàng có thể phát triển các giải pháp AI nhanh hơn nhiều so với trước đây bằng cách sử dụng NGC.

Sơ đồ giải pháp

Ưu điểm của hệ thống Supermicro NGC-Ready

Hệ thống Supermicro NGC-Ready được xác nhận về hiệu suất và chức năng để chạy các thùng chứa NGC. Kết hợp với phần mềm NVIDIA NGC, hệ thống NGC-Ready cao cấp có thể tổng hợp các GPU qua mạng và bộ nhớ nhanh để đào tạo các mô hình AI lớn với các lô dữ liệu lớn. Hệ thống NGC-Ready cho Edge triển khai các ứng dụng AI cho Inference AI.

Hệ thống Supermicro NGC-Ready cũng cung cấp các khả năng và dịch vụ sau:

  • Các hệ thống đã được xác thực, có hiệu suất cao giúp thúc đẩy thời gian giải quyết và cho phép các nhà quản lý CNTT chọn đúng hệ thống để thích hợp cho khối lượng công việc AI.
  • Supermicro cung cấp một dịch vụ tùy chọn để cho phép phát triển phần mềm AI ngay lập tức khi hệ thống được bật nguồn. Hệ điều hành, CUDA, CUDA-X, trình điều khiển NVIDIA ….
  • Tiếp cận với các mô hình AI học sâu tiên tiến, mới nhất từ ​​NVIDIA NGC. Sử dụng các mô hình được đào tạo trước và dữ liệu của riêng doanh nghiệp bạn, các mô hình AI mới có thể được xây dựng một cách hiệu quả.
  • Dịch vụ hỗ trợ phần cứng, hệ điều hành và NVIDIA NGC có sẵn.
  • Dịch vụ thiết lập tủ rack, máy chủ, lưu trữ và mạng.
  • Dịch vụ tư vấn của Kubernetes để triển khai đa nền tảng, máy chủ….

Supermicro và NGC – Kiến trúc giải pháp

Hệ thống Ready NGC của Supermicro hỗ trợ khách hàng chạy toàn bộ cơ sở hạ tầng AI của họ, từ đào tạo dữ liệu lớn đến suy luận trung tâm dữ liệu, đến suy luận ở vùng biên Edge….Giúp khách hàng dễ dàng và linh hoạt hơn trong việc triển khai các ứng dụng, hạ tầng về AI, HPC…

Kiến trúc giải pháp NGC

Hệ thống Supermicro NGC-Ready, Máy chủ đám mây GPU NVIDIA (NGC) đã được xác thực bới Supermicro và NVIDIA. Những hệ thống này có thể được định cấu hình sẵn để đi kèm với hệ điều hành được cài đặt và các phần mềm hỗ trợ NGC. Chúng sẽ hỗ trợ đầy đủ cho hệ thống phần cứng, hệ điều hành Red Hat hoặc Ubuntu và phần mềm NGC có sẵn.

SUPERMICRO VALIDATED NVIDIA GPU CLOUD (NGC) SERVERS
SYSTEM CONFIGURATION LOCATION
SYS-5019D-FN8TP with NVIDIA T4 GPU Xeon-D, Up to 512GB memory, 1 x PCIe x8 slot for GPU, 1 to 4 internal drives. 9.8” depth Edge
SYS-1019D-FHN13TP with NVIDIA T4 GPUs Xeon-D, max 512GB memory 2x PCI-E 3.0 x16 slots for GPU and I/O, 2 SATA, 15” depth Edge
SYS-1019P-FHN2T with NVIDIA T4 GPUs Single Xeon Scalable Gen 2, max 1.5TB memory 2x PCI-E 3.0 x16 slots for GPU, 2 SATA, 15” depth Edge
SYS-1019P-WTR with NVIDIA T4 GPUs Single Xeon Scalable Gen 2, max 1.5TB memory 2x PCI-E 3.0 x16 slots for GPU, 1 PCI-E 3.0 x8 for I/O, 10 SAS/SATA or 2 NVMe Edge
SYS-2029GP-TR with NVIDIA V100, T4 GPUs Dual Xeon Scalable Gen 2, max 4TB memory 6x PCI-E 3.0 x16 slots for GPU and I/O, 8 SAS/SATA or 2 NVMe Edge
SYS-5039MD18-H8TNR with NVIDIA T4 GPUs 8 Modules in 3U. Each Module has Xeon-D, max 512GB memory 1 PCIe x16 slot for GPU and I/O, 2 SATA with optional NVMe, 23” depth Micro Data Center, Data Center
SYS-1029U-TRT with NVIDIA T4 GPUs Dual Xeon Scalable Gen 2, max 6TB memory 2x PCI-E 3.0 x16 slots for GPU, 2 PCI-E 3.0 x8 for I/O, 10 SAS/SATA or 2 NVMe Micro Data Center, Data Center
SYS-2029GP-TR with NVIDIA V100 GPUs Dual Xeon Scalable Gen 2, max 4TB memory 6 PCIe x16 slots for GPU and I/O, 8 SAS/SATA or 2 NVMe Micro Data Center, Data Center
SYS-4029GP-TRT2 with NVIDIA V100 GPUs Dual Xeon Scalable Gen 2, max 6TB memory 11x PCI-E 3.0 x16 slots for GPU and I/O, 16 SAS/SATA or 8 NVMe Data Center
SYS-4029GP-TVRT with NVIDIA V100 SXM2 GPUs Dual Xeon Scalable Gen 2, max 3TB memory 6x PCI-E 3.0 x16 slots for I/O, Single Root, 8 SAS/SATA/NVMe Data Center
SYS-420GP-TNAR with NVIDIA A100 SXM4 GPUs 4U Dual Processor (3rd Gen Intel® Xeon®) GPU System with NVIDIA HGX A100 8-GPU 40GB/80GB, NVLink, NVSwitch Data Center
SYS-4124GO-NART with NVIDIA A100 SXM4 GPUs 4U Dual Processor (AMD) GPU System with NVIDIA HGX A100 8-GPU 40GB/80GB, NVLink, NVSwitch. Data Center
SYS-420GP-TNR with NVIDIA A100 & Ampere GPUs 4U Dual Processor (3rd Gen Intel® Xeon®), Dual-Root GPU System with Up to 10 PCIe GPUs Data Center
SYS- 4124GS-TNR with NVIDIA A100 & Ampere GPUs 4U Dual Processor (AMD), Dual-Root GPU system with 8 PCI-E GPUs. Data Center
SYS-220GQ-TNAR+ with NVIDIA A100 SXM4 GPUs 2U Dual Processor (Intel) GPU System with NVIDIA HGX A100 4-GPU 40GB/80GB, NVLink, Redundant 3000W Titanium Level Power Supplies Data Center
SYS-2124GQ-NART with NVIDIA A100 SXM4 GPUs 2U Dual Processor (AMD) GPU System with NVIDIA HGX A100 4-GPU 40GB/80GB, NVLink Data Center
SYS-210GP-DNR with NVIDIA A100 & Ampere GPUs 2U 2-Node Multi-GPU System with Single Processor (Intel) and Up to 6 PCI-E GPUs per Node Data Center
SYS-220GP-TNR with NVIDIA A100 & Ampere GPUs 2U Dual Processor (3rd Gen Intel® Xeon®) System with 6 PCIe GPUs Micro Data Center, Data Center

→ Xem thêm: Các máy chủ Supermicro được chứng nhận cho GPU NVIDIA A100

→ Xem thêm: Các sản phẩm GPU NVIDIA

____
Bài viết liên quan

Góp ý / Liên hệ tác giả