Khám phá Hệ Thống NVIDIA OVX của Supermicro: Đột phá mạnh mẽ trong Generative AI với GPU NVIDIA L40S Thế hệ mới

Dòng máy chủ Supermicro GPU System thế hệ mới – được trang bị bởi các GPU L40S mới của NVIDIA đã xuất hiện tại hội nghị SIGGRAPH 2023 ở Los Angeles, trở thành một tâm điểm quan trọng trong kế hoạch của NVIDIA để đẩy mạnh việc triển khai trí tuệ nhân tạo toàn cầu và giới thiệu các ứng dụng trí tuệ nhân tạo sáng tạo (Generative AI) như chatbot thông minh, công cụ tìm kiếm và tóm tắt thông tin đến người dùng trong nhiều ngành công nghiệp khác nhau.

Supermicro GPU System mới được trình diễn dưới dạng một máy chủ NVIDIA OVX và sẽ sớm tích hợp các GPU L40S của NVIDIA vừa mới được công bố. Sự hợp tác này được kỳ vọng sẽ giúp cách mạng hóa việc triển khai trí tuệ nhân tạo, cho phép AI thế hệ tiếp theo, mô phỏng vũ trụ ảo tương tác và quyết định nhận thức trên quy mô lớn.

GPU L40S của NVIDIA

GPU L40S của NVIDIA vừa ra mắt được coi là một bộ xử lý mạnh mẽ và đa dụng cho trung tâm dữ liệu, được thiết kế đặc biệt để tăng tốc các ứng dụng đòi hỏi tính toán cao, bao gồm huấn luyện và suy luận trí tuệ nhân tạo, thiết kế và hiển thị 3D, xử lý video và số hóa công nghiệp với nền tảng Omniverse của NVIDIA. Nó mang lại khả năng gia tăng đột phá cho suy luận và đào tạo mô hình ngôn ngữ lớn (LLM) và các ứng dụng đồ họa và video.

GPU L40S giúp thúc đẩy thế hệ tiếp theo của các ứng dụng âm thanh, ngôn ngữ, hình ảnh 2D, video và 3D có tích hợp trí tuệ nhân tạo và là một thành phần quan trọng cho các nền tảng Omniverse OVX 3.0 sắp tới của NVIDIA, mang lại sự trung thực và độ chính xác cao cho các mô phỏng số và hình ảnh kỹ thuật số.

GPU L40S sẽ là một tài sản quan trọng trong các hệ thống NVIDIA OVX. Được trang bị bởi kiến trúc GPU Ada Lovelace của NVIDIA và bộ nhớ rộng rãi 48GB, mỗi máy chủ có thể chứa tới tám GPU L40S. Nó cũng sở hữu Tensor Cores thế hệ thứ tư và một Engine FP8 Transformer, mang lại khả năng xử lý tensor với công suất 1.45 petaflops đáng kinh ngạc.

So với thế hệ trước đó, GPU L40S thể hiện hiệu suất suy luận AI nhanh hơn lên đến 1.2 lần và hiệu suất đào tạo nhanh hơn lên đến 1.7 lần cho việc xử lý khối lượng công việc AI phức tạp với hàng tỷ tham số và nhiều hình thức dữ liệu.

GPU L40S được thiết kế để phục vụ nhiều quy trình làm việc chuyên nghiệp khác nhau. Nó bao gồm 142 RT Cores thế hệ thứ ba, mang lại hiệu suất ray-tracing 212 teraflops, lý tưởng cho các quy trình làm việc trực tiếp với hình ảnh chất lượng cao như kỹ thuật hiển thị thời gian thực, thiết kế sản phẩm và tạo nội dung 3D.

Ngoài ra, 18,176 lõi CUDA của GPU L40S cung cấp hiệu suất điểm phẩy chính xác đơn (FP32) gần 5 lần so với GPU NVIDIA A100, đảm bảo yêu cầu tính toán cho mô phỏng kỹ thuật và khoa học được đáp ứng một cách hiệu quả nâng cao.

Các hệ thống Supermicro mới nhất sử dụng GPU NVIDIA L40S cung cấp nguồn cung ứng dồi dào và thúc đẩy những đột phá trong việc gia tăng đa nhiệm cho việc suy luận và đào tạo mô hình ngôn ngữ lớn (LLM), đồ họa và ứng dụng video. Sự hợp tác giữa Supermicro và NVIDIA trên hệ thống NVIDIA OVX là nền tảng hàng đầu cho trí tuệ nhân tạo sáng tạo đa phương thức, các giải pháp của Supermicro với GPU L40S cung cấp sự gia tăng từ đầu đến cuối cho quy trình suy luận, đào tạo, đồ họa và làm việc với video, để cung cấp năng lượng cho thế hệ tiếp theo của các ứng dụng âm thanh, ngôn ngữ, hình ảnh 2D, video và 3D được tích hợp trí tuệ nhân tạo.

Supermicro GPU System thế hệ mới cung cấp đa dạng các cấu hình máy chủ , bao gồm hỗ trợ cho các hệ thống NVIDIA HGX A100 4-GPU với NVLink và làm mát lỏng . Ngoài ra, nó tương thích với các cấu hình 4 hoặc 8 GPU có chứa các máy chủ NVIDIA L40S, NVIDIA H100 80GB hoặc NVIDIA H100 NVL trong một system duy nhất.

Hiệu suất có thể mở rộng và các tùy chọn triển khai linh hoạt

Với 256 GPU NVIDIA L40 và mạng 200 Gbps trong một SuperPOD có khả năng mở rộng với 32 nút, các giải pháp Supermicro OVX Rack mang lại hiệu suất không gì sánh bằng để vận hành các bản sao số và thực hiện các mô phỏng lớn một cách dễ dàng.

• Được thiết kế và kiến trúc một cách rõ ràng để đáp ứng nhu cầu tính toán cho các bản sao số và khối lượng công việc đa ứng dụng.

• Giải pháp đã được xác thực giúp thực hiện quy mô và đáng tin cậy cho việc hợp tác thời gian thực và mô phỏng chất lượng cao.

Triển khai các Giải pháp Supermicro Rack Scale của NVIDIA Omniverse™ Enterprise với 1 đến 4 nút như một chứng minh thuật ngữ và nhanh chóng mở rộng lên hàng trăm máy chủ qua các SuperPOD để đáp ứng nhu cầu công việc.

• Thiết kế cắm và chạy đa nút qua nhiều rack. Dễ dàng mở rộng cụm khi khối lượng công việc của tổ chức tăng.

• SYS-420GP-TNR cung cấp hiệu suất hàng đầu và kiến trúc tính toán linh hoạt với bộ xử lý Intel® Xeon® Scalable thế hệ 3 và GPU NVIDIA.

• Mạng hiệu suất cao cho phép băng thông cao và độ trễ thấp cho các khối lượng công việc đồng thời sử dụng nhiều hệ thống.

Lý do Triển khai Giải pháp Supermicro Rack Scale OVX

• Bao gồm toàn bộ ngăn xếp phần mềm NVIDIA Omniverse™ Enterprise – giúp dễ dàng bắt đầu với nền tảng NVIDIA Omniverse.

• Được kích hoạt bởi các công nghệ NVIDIA RTX™ và mạng tốc độ cao – Cho phép phản hồi nhanh chóng để hỗ trợ sự hợp tác tốt nhất.

• Được kiểm tra và tích hợp từ đầu đến cuối – Thiết kế cắm và chạy; Supermicro tụ hợp và kiểm tra toàn bộ cấu hình trước khi gửi tới khách hàng.

• Được xây dựng với mục đích là hiệu suất và gia tăng – Các thành phần được lựa chọn đảm bảo hiệu suất tối ưu sử dụng các CPU và GPU mới nhất.

• Có khả năng mở rộng cao và dễ triển khai từ các cụm máy chủ bốn nút đến nhiều pod để xử lý các khối lượng công việc lớn nhất.

• Bốn cấu hình khả dụng, từ một rack đến nhiều rack, để bắt đầu xây dựng ứng dụng thế giới ảo, thực hiện các mô phỏng quy mô lớn và vận hành các bản sao số.

Kết luận và Tóm tắt

NVIDIA Omniverse™ Enterprise cách mạng hóa sự hợp tác thiết kế, mô phỏng và vận hành các bản sao số. Các nhóm làm việc phân tán trên toàn cầu có thể tăng tốc quy trình làm việc của họ với khả năng tương tác một cú nhấp chuột giữa các công cụ phần mềm hàng đầu và hợp tác mượt mà trong một thế giới ảo chung chạy từ trung tâm dữ liệu.

Giải pháp OVX quy mô rack của Supermicro cho Omniverse cho phép phát triển và vận hành các bản sao số của nhà máy, làm cho dòng dữ liệu thiết kế được điều hòa qua doanh nghiệp và tăng tốc việc hiển thị cho trải nghiệm trong xe, các ứng dụng tùy chỉnh xe hơi và triển lãm ảo.

Omniverse đang thúc đẩy sự biến đổi số và đổi mới thông qua các điểm sau: • Một giải pháp tiên tiến để giúp doanh nghiệp của bạn vượt qua sự cạnh tranh • Kết nối toàn cầu liên tục với tốc độ cao cho phép thiết kế và hợp tác trên quy mô lớn • Tăng năng suất và giảm thời gian đưa sản phẩm ra thị trường • Tiết kiệm tài nguyên và giảm chi phí hoạt động

Tựu chung lại, NVIDIA và Supermicro xem những phát triển này là một bước tiến lớn trong việc đơn giản hóa triển khai trí tuệ nhân tạo, làm cho nó dễ tiếp cận cho các tổ chức có kích thước khác nhau và thúc đẩy trí tuệ biến đổi trong tất cả các ngành.

→ Để biết thêm thông tin về các GPU của NVIDIA, hãy truy cập: https://thegioimaychu.vn/linh-kien-may-chu/gpu-card-may-chu

→ Để biết thêm thông tin về danh mục giải pháp NVIDIA của Supermicro, hãy truy cập: https://thegioimaychu.vn/solution/nvidia-hpc/

Nhất Tiến Chung (NTC) hiện là nhà cung cấp các giải pháp hạ tầng CNTT, điện toán hiệu năng cao (HPC) và lưu trữ cho AI. Chúng tôi là đối tác NPN cấp Elite của NVIDIA cho các hệ thống DGX và hệ thống cụm siêu máy tính DGX SuperPOD với sức mạnh lưu trữ song song của DDN và kết nối mạng tốc độ cao từ hãng Mellanox (thuộc NVIDIA).

Với vai trò là đối tác NPN chính thức của NVIDIA, chúng tôi có thể giúp bạn có được các sản phẩm GPU cao cấp nhất của NVIDIA như L4, L40S, H200, H200 NVL, B200,…, đặc biệt là với thực trạng khan hiếm GPU do các hạn chế thương mại về nhập khẩu GPU như hiện nay.

Bạn muốn trở thành đối tác bán hàng NVIDIA của NTC?

Đăng ký ngay

____
Bài viết liên quan

GPU L40S của NVIDIA

Hiệu suất có thể mở rộng và các tùy chọn triển khai linh hoạt

Lý do Triển khai Giải pháp Supermicro Rack Scale OVX

Kết luận và Tóm tắt

Bạn muốn trở thành đối tác bán hàng NVIDIA của NTC?

Gửi yêu cầu