Các hệ thống OVX tích hợp NVIDIA GPU mới được thiết kế để tăng tốc quy trình đào tạo và suy luận AI, các tải xử lý chuyên sâu về đồ họa. Một loạt các nhà cung cấp lớn như Dell Technologies, Hewlett Packard Enterprise, Lenovo, Supermicro,v.v… sắp cho ra mắt sản phẩm.
NVIDIA công bố các máy chủ NVIDIA OVX tại hội nghị SIGGRAPH vừa qua. Các hệ thống này tích hợp NVIDIA GPU L40S, bộ xử lý trung tâm dữ liệu chuyên sâu, mạnh mẽ được thiết kế để tăng tốc các ứng dụng phức tạp, sử dụng nhiều điện toán nhất, bao gồm đào tạo và suy luận AI, thiết kế và trực quan hóa 3D, xử lý video và số hóa công nghiệp với nền tảng NVIDIA Omniverse.
Sức mạnh của GPU mới đã tăng tốc tải xử lý cho generative AI, đang chuyển đổi quy trình công việc và dịch vụ trong các ngành, bao gồm tạo văn bản, hình ảnh và video, chatbot, phát triển trò chơi, thiết kế sản phẩm và chăm sóc sức khỏe.
Bob Pette, phó chủ tịch phụ trách hình ảnh chuyên nghiệp của NVIDIA cho biết: “Khi generative AI chuyển đổi mọi ngành công nghiệp, các doanh nghiệp đang ngày càng tìm kiếm các tài nguyên điện toán quy mô lớn trong trung tâm dữ liệu. “Các hệ thống OVX với NVIDIA GPU L40S tăng tốc khối lượng công việc xử lý AI, đồ họa và video, đồng thời đáp ứng các yêu cầu khắt khe về hiệu suất của một tập hợp các ứng dụng phức tạp và đa dạng ngày càng tăng.”
Hiệu suất mạnh mẽ cho AI và Đồ họa
Các hệ thống NVIDIA OVX cho phép tối đa 8 NVIDIA GPU L40S trên mỗi máy chủ, mỗi GPU được trang bị bộ nhớ 48GB. Dựa trên kiến trúc NVIDIA Ada Lovelace, L40S bao gồm Tensor Cores thế hệ thứ tư và FP8 Transformer Engine, cung cấp sức mạnh xử lý tensor hơn 1,45 petaflop. Đối với khối lượng công việc AI phức tạp với hàng tỷ tham số và nhiều phương thức dữ liệu chẳng hạn như văn bản và video, L40S cho phép hiệu suất suy luận AI nâng cao hơn tới 1,2 lần và hiệu suất đào tạo lên tới 1,7 lần so với NVIDIA A100 Tensor Core.
Để hỗ trợ các quy trình trực quan hóa chuyên nghiệp có độ trung thực cao như kết xuất thời gian thực, thiết kế sản phẩm và tạo nội dung 3D, NVIDIA GPU L40S bao gồm 142 RT Cores thế hệ thứ ba mang lại hiệu suất ray-tracing lên đến 212 teraflop. Điều này cho phép các chuyên gia sáng tạo – tạo ra trải nghiệm hình ảnh sống động và nội dung chân thực.
Đối với các quy trình công việc đòi hỏi tính toán cao, chẳng hạn như mô phỏng khoa học và kỹ thuật, NVIDIA L40S bao gồm 18.176 CUDA core , cung cấp gần gấp 5 lần hiệu suất single-precision floating-point (FP32) của GPU NVIDIA A100 để tăng tốc các phép tính phức tạp và phân tích dữ liệu chuyên sâu.
Áp dụng sớm
Trong số các nhà cung cấp dịch vụ đám mây đầu tiên cung cấp phiên bản L40S là CoreWeave, chuyên về khối lượng công việc quy mô lớn, tăng tốc GPU.
Brian Venturo, giám đốc công nghệ của CoreWeave cho biết: “Với sự bùng nổ của generative AI, khách hàng của chúng tôi trong các ngành đang tìm kiếm dịch vụ điện toán mạnh mẽ và quy mô để phù hợp với mức độ phức tạp của bất kỳ khối lượng công việc nào từ tương tác video đến thiết kế và tự động hóa AI”. “NVIDIA L40S sẽ tiếp tục mở rộng danh mục giải pháp NVIDIA đa dạng, giúp CoreWeave trở thành nhà cung cấp đám mây chuyên biệt đầu tiên cung cấp các tài nguyên mới để tăng tốc điện toán nhanh, hiệu quả và tiết kiệm chi phí nhằm cung cấp sức mạnh cho làn sóng ứng dụng AI thế hệ kế tiếp.”
Phần mềm để tăng tốc cho AI
Các doanh nghiệp triển khai GPU L40S có thể hưởng lợi từ phần mềm NVIDIA AI Enterprise (vừa công bố một bản cập nhật lớn). Phần mềm cung cấp kèm theo dịch vụ hỗ trợ và bảo mật cấp doanh nghiệp cho hơn 100 frameworks, mô hình, bộ công cụ và phần mềm được đào tạo trước, bao gồm NVIDIA Modulus cho mô phỏng, NVIDIA RAPIDS cho khoa học dữ liệu và NVIDIA Triton Inference Server cho production AI.
Omniverse mở rộng
NVIDIA đã công bố các bản cập nhật lớn cho nền tảng Omniverse, giới thiệu các khả năng và cải tiến nền tảng cho phép các nhà phát triển tăng tốc và nâng cao công cụ OpenUSD cũng như các ứng dụng số hóa với sức mạnh của generative AI. Thế hệ kế tiếp của hệ thống NVIDIA OVX cung cấp năng lượng cho Omniverse Cloud tích hợp GPU L40S để cung cấp AI và hiệu năng đồ họa cần thiết để tăng tốc cho các công cụ generative AI và khối lượng công việc Omniverse.
Kế hoạch ra mắt
NVIDIA L40S sẽ ra mắt cuối năm nay. Các nhà xây dựng hệ thống toàn cầu, bao gồm ASUS, Dell Technologies, GIGABYTE, HPE, Lenovo, QCT và Supermicro, sẽ sớm cung cấp các hệ thống OVX bao gồm NVIDIA L40S. Các máy chủ này sẽ giúp các chuyên gia trên toàn thế giới nâng cao AI và mang đến các ứng dụng generative AI như chatbot thông minh, công cụ tìm kiếm và tổng hợp cho người dùng trong các ngành.
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- LLM: Lịch sử và tương lai của các mô hình ngôn ngữ lớn
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson
- Hướng đến tương lai: Generative AI dành cho các giám đốc điều hành