LAS VEGAS – VMware Explore 2023, VMware và NVIDIA đã thông báo mở rộng hợp tác chiến lược của họ để chuẩn bị sẵn sàng cho hàng trăm nghìn doanh nghiệp chạy trên cơ sở hạ tầng đám mây của VMware cho kỷ nguyên của Trí Tuệ Nhân Tạo sáng tạo.
Với giải pháp VMware Private AI Foundation với NVIDIA, các doanh nghiệp sẽ có khả năng tùy chỉnh các mô hình và chạy ứng dụng Trí Tuệ Nhân Tạo sáng tạo, bao gồm các trợ lý ảo thông minh, hệ thống tìm kiếm và tóm tắt thông tin. Nền tảng này sẽ là một giải pháp tích hợp hoàn chỉnh có phần mềm Trí Tuệ Nhân Tạo sáng tạo và tính toán tăng tốc từ NVIDIA, xây dựng trên nền tảng VMware Cloud Foundation và được tối ưu hóa cho Trí Tuệ Nhân Tạo.
“Trí Tuệ Nhân Tạo sáng tạo và đa nền tảng đám mây là một sự kết hợp hoàn hảo,” Raghu Raghuram, CEO của VMware nói. “Dữ liệu của khách hàng hiện diện ở khắp mọi nơi – trong các trung tâm dữ liệu của họ, tại điểm biên, và trong đám mây của họ. Cùng với NVIDIA, chúng tôi sẽ giúp các doanh nghiệp chạy các khối lượng công việc Trí Tuệ Nhân Tạo sáng tạo gần với dữ liệu của họ một cách tự tin, đồng thời giải quyết các vấn đề về quyền riêng tư, bảo mật và kiểm soát dữ liệu doanh nghiệp.”
“Các doanh nghiệp trên khắp nơi đang đua nhau tích hợp Trí Tuệ Nhân Tạo sáng tạo vào hoạt động kinh doanh của họ,” Jensen Huang, người sáng lập và CEO của NVIDIA nói. “Sự hợp tác mở rộng với VMware của chúng tôi sẽ cung cấp cho hàng trăm nghìn khách hàng – từ dịch vụ tài chính, chăm sóc sức khỏe, sản xuất và nhiều ngành khác – phần mềm và tính toán toàn bộ ngăn xếp mà họ cần để mở khóa tiềm năng của Trí Tuệ Nhân Tạo sáng tạo thông qua các ứng dụng tùy chỉnh được xây dựng từ dữ liệu của họ.”
Tích Hợp Toàn Diện Để Tăng Cường Trí Tuệ Nhân Tạo Sáng Tạo
Nhằm đạt được lợi ích kinh doanh nhanh chóng, các doanh nghiệp đang tìm cách tối ưu hoá quy trình phát triển, kiểm tra và triển khai ứng dụng Trí Tuệ Nhân Tạo sáng tạo. McKinsey ước tính rằng Trí Tuệ Nhân Tạo sáng tạo có thể đóng góp hàng tỷ đô la vào nền kinh tế toàn cầu hàng năm1.
VMware Private AI Foundation cùng với NVIDIA sẽ giúp các doanh nghiệp khai thác khả năng này, tùy chỉnh các mô hình ngôn ngữ lớn; tạo ra các mô hình an toàn và riêng tư hơn cho việc sử dụng nội bộ; cung cấp Trí Tuệ Nhân Tạo sáng tạo như một dịch vụ cho người dùng của họ; và chạy các khối lượng công việc dự đoán an toàn một cách quy mô lớn hơn.
Nền tảng dự kiến sẽ bao gồm các công cụ Trí Tuệ Nhân Tạo tích hợp để giúp các doanh nghiệp chạy các mô hình đã được kiểm chứng được đào tạo trên dữ liệu riêng của họ một cách hiệu quả về chi phí. Được xây dựng trên nền tảng VMware Cloud Foundation và phần mềm NVIDIA AI Enterprise, các lợi ích dự kiến của nền tảng sẽ bao gồm:
- Quyền Riêng Tư — Sẽ giúp khách hàng dễ dàng chạy các dịch vụ Trí Tuệ Nhân Tạo kề cận với bất kỳ nơi nào họ có dữ liệu với một kiến trúc bảo vệ quyền riêng tư dữ liệu và cho phép truy cập an toàn.
- Sự Lựa Chọn — Các doanh nghiệp sẽ có nhiều lựa chọn trong việc xây dựng và chạy mô hình của họ — từ NVIDIA NeMo™ đến Llama 2 và xa hơn — bao gồm cấu hình phần cứng OEM hàng đầu và trong tương lai, trên đám mây công cộng và các ưu đãi từ nhà cung cấp dịch vụ.
- Hiệu Suất — Chạy trên cơ sở hạ tầng được tăng tốc bởi NVIDIA sẽ mang lại hiệu suất ngang bằng hoặc thậm chí vượt qua hiệu suất từng mảng trần cơ bản trong một số trường hợp sử dụng, như đã được chứng minh trong các thước đo ngành công nghiệp gần đây.
- Quy Mô Trung Tâm Dữ Liệu — Tối ưu hóa GPU trong các môi trường ảo hóa sẽ giúp các khối lượng công việc Trí Tuệ Nhân Tạo mở rộng đến 16 vGPU/GPU trong một máy ảo duy nhất và trải qua nhiều nút để tăng tốc việc điều chỉnh và triển khai mô hình Trí Tuệ Nhân Tạo sáng tạo.
- Giảm Chi Phí — Sẽ tối đa hóa việc sử dụng tất cả tài nguyên tính toán, từ GPU, DPU đến CPU để giảm tổng chi phí và tạo ra môi trường tài nguyên gộp có thể chia sẻ một cách hiệu quả giữa các đội.
- Tăng Tốc Lưu Trữ — Kiến trúc Lưu Trữ VMware vSAN Express sẽ cung cấp lưu trữ NVMe tối ưu hóa hiệu suất và hỗ trợ GPUDirect® lưu trữ qua RDMA, cho phép truyền dữ liệu trực tiếp từ lưu trữ đến GPU mà không cần CPU tham gia.
- Tăng Tốc Mạng — Sự tích hợp sâu sẽ giữa vSphere và công nghệ NVIDIA NVSwitch™ sẽ tiếp tục tăng cường khả năng thực hiện mô hình đa GPU mà không có các hạn chế về hiệu suất giữa các GPU.
- Triển Khai Nhanh Chóng và Thời Gian Giá Trị — Hình ảnh và kho ảnh về vSphere Deep Learning VM sẽ cho phép khả năng nguyên mẫu nhanh bằng cách cung cấp một hình ảnh giải pháp ổn định bao gồm các khung cảnh và thư viện tối ưu hóa hiệu suất được cài sẵn.
Nền tảng sẽ tích hợp NVIDIA NeMo, một khung đám mây toàn diện đi kèm với NVIDIA AI Enterprise — hệ điều hành của nền tảng Trí Tuệ Nhân Tạo NVIDIA — cho phép các doanh nghiệp xây dựng, tùy chỉnh và triển khai mô hình Trí Tuệ Nhân Tạo sáng tạo một cách ảo tại bất kỳ nơi nào. NeMo kết hợp khung làm việc tùy chỉnh, bộ công cụ hạn chế, công cụ quản lý dữ liệu và các mô hình đã được đào tạo trước để cung cấp cho các doanh nghiệp một cách tiếp cận dễ dàng, hiệu quả về chi phí và nhanh chóng để áp dụng Trí Tuệ Nhân Tạo sáng tạo.
Để triển khai Trí Tuệ Nhân Tạo sáng tạo trong sản xuất, NeMo sử dụng TensorRT cho Mô Hình Ngôn Ngữ Lớn (TRT-LLM), giúp tăng tốc và tối ưu hiệu suất dự đoán trên các mô hình LLM mới nhất trên GPU NVIDIA. Với NeMo, VMware Private AI Foundation cùng với NVIDIA sẽ cho phép các doanh nghiệp đưa dữ liệu của họ vào để xây dựng và triển khai các mô hình Trí Tuệ Nhân Tạo sáng tạo tùy chỉnh trên cơ sở hạ tầng đám mây lai của VMware.
Tại VMware Explore 2023, NVIDIA và VMware sẽ nhấn mạnh cách các nhà phát triển trong doanh nghiệp có thể sử dụng NVIDIA AI Workbench mới để lấy các mô hình cộng đồng, như Llama 2, có sẵn trên Hugging Face, tùy chỉnh chúng từ xa và triển khai Trí Tuệ Nhân Tạo sáng tạo đáng tin cậy trong môi trường VMware.
Hệ Sinh Thái VMware Private AI Foundation Cùng NVIDIA
VMware Private AI Foundation cùng với NVIDIA sẽ được hỗ trợ bởi Dell Technologies, Hewlett Packard Enterprise (HPE) và Lenovo — những công ty sẽ là những người đầu tiên cung cấp các hệ thống tăng tốc tùy chỉnh và khối lượng công việc dự đoán của doanh nghiệp với NVIDIA L40S GPUs, NVIDIA BlueField®-3 DPUs và NVIDIA ConnectX®-7 SmartNICs.
- GPU NVIDIA L40S cho phép tăng tới 1.2 lần hiệu suất dự đoán Trí Tuệ Nhân Tạo sáng tạo và tăng tới 1.7 lần hiệu suất đào tạo so với GPU NVIDIA A100 Tensor Core.
- DPUs NVIDIA BlueField-3 tăng tốc, giảm gánh nặng tính toán to lớn của ảo hóa, mạng, lưu trữ, bảo mật và các dịch vụ Trí Tuệ Nhân Tạo khác native trên đám mây khỏi GPU hoặc CPU.
- SmartNICs NVIDIA ConnectX-7 cung cấp mạng thông minh, tăng tốc cho hạ tầng trung tâm dữ liệu để tăng cường các khối lượng công việc Trí Tuệ Nhân Tạo đáng khó tính nhất trên thế giới.
VMware Private AI Foundation cùng NVIDIA phát triển trên nền tảng hợp tác kéo dài một thập kỷ giữa hai công ty. Công việc kỹ thuật chung đã tối ưu hóa hạ tầng đám mây của VMware để chạy NVIDIA AI Enterprise với hiệu suất tương tự như trên trần cơ bản. Khách hàng chung cũng được hưởng lợi từ quản lý tài nguyên và hạ tầng cũng như sự linh hoạt do VMware Cloud Foundation mang lại.
→ VMware dự kiến sẽ phát hành VMware Private AI Foundation cùng NVIDIA vào đầu năm 2024.
→ Xem lại bài phát biểu của CEO VMware Raghu Raghuram và NVIDIA CEO Jensen Huang ở VMware Explore 2023 tại đây.
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100