Bộ công cụ dành cho nhà phát triển mới giới thiệu triển khai và điều chỉnh mô hình đơn giản hóa trên nền tảng AI của NVIDIA — Từ PC và máy trạm đến Trung tâm dữ liệu doanh nghiệp, Đám mây công cộng và Đám mây NVIDIA DGX
Tại SIGGRAPH 2023, NVIDIA vừa công bố NVIDIA AI Workbench, một bộ công cụ hợp nhất, dễ sử dụng cho phép các nhà phát triển nhanh chóng tạo, thử nghiệm và tùy chỉnh các mô hình Generative AI được đào tạo trước (pre-trained) trên PC hoặc máy trạm — sau đó mở rộng quy mô của chúng cho hầu hết mọi trung tâm dữ liệu, dịch vụ đám mây hoặc Đám mây NVIDIA DGX.
AI Workbench loại bỏ sự phức tạp khi bắt đầu với một dự án AI cấp doanh nghiệp. Được truy cập thông qua giao diện đơn giản hóa chạy trên hệ thống cục bộ, nó cho phép nhà phát triển tùy chỉnh các mô hình từ các kho lưu trữ phổ biến như Hugging Face, GitHub và NVIDIA NGC bằng cách sử dụng dữ liệu tùy chọn. Các mô hình này sau đó có thể được chia sẻ dễ dàng trên nhiều nền tảng khác nhau.
Manuvir Das, phó chủ tịch mảng điện toán doanh nghiệp của NVIDIA cho biết: “Các doanh nghiệp trên khắp thế giới đang chạy đua để tìm kiếm cơ sở hạ tầng phù hợp và xây dựng các mô hình và ứng dụng Generative AI. NVIDIA AI Workbench cung cấp một lộ trình đơn giản hóa cho các team cộng tác trên các tổ chức khác nhau để tạo ra các ứng dụng dựa trên AI đang ngày càng trở nên thiết yếu trong kinh doanh hiện đại.”
Một kỷ nguyên mới cho các nhà phát triển AI
Mặc dù hiện có hàng trăm nghìn mô hình được đào tạo trước, nhưng việc tùy biến chúng bằng nhiều công cụ nguồn mở có thể yêu cầu tìm kiếm qua nhiều repository trực tuyến để tìm đúng framework, công cụ và container, cũng như sử dụng các kỹ năng phù hợp để tùy biến một mô hình cho một ứng dụng cụ thể.
Với NVIDIA AI Workbench, các nhà phát triển có thể tùy biến và chạy Generative AI chỉ bằng vài cú nhấp chuột. Nó cho phép họ tập hợp tất cả các mô hình, framework, bộ công cụ phát triển phần mềm (SDK) và thư viện cấp doanh nghiệp cần thiết từ các repo mã nguồn mở và nền tảng AI của NVIDIA thành một bộ công cụ hợp nhất dành cho nhà phát triển.
Các nhà cung cấp cơ sở hạ tầng AI hàng đầu — bao gồm Dell Technologies, Hewlett Packard Enterprise, HP Inc., Lambda, Lenovo và Supermicro — đang sử dụng AI Workbench để có khả năng tăng cường thế hệ mới nhất của máy trạm để bàn hỗ trợ nhiều GPU, máy trạm di động cao cấp và máy trạm ảo.
Các nhà phát triển có PC hoặc máy trạm NVIDIA RTX dựa trên Windows hoặc Linux cũng sẽ có thể bắt đầu, thử nghiệm và tinh chỉnh các dự án Generative AI cấp doanh nghiệp trên các hệ thống RTX cục bộ của họ, đồng thời dễ dàng truy cập tài nguyên trung tâm dữ liệu và điện toán đám mây để mở rộng quy mô như cần thiết.
Phần mềm NVIDIA AI Enterprise 4.0 mới thúc đẩy triển khai AI
Để đẩy nhanh hơn nữa việc áp dụng Generative AI, NVIDIA đã công bố phiên bản mới nhất của nền tảng phần mềm doanh nghiệp của mình, NVIDIA AI Enterprise 4.0 . Nó cung cấp cho các doanh nghiệp các công cụ cần thiết để áp dụng Generative AI, đồng thời cung cấp tính bảo mật và tính ổn định của API cần thiết để triển khai một cách đáng tin cậy ở cấp độ sản xuất.
Phần mềm và công cụ mới được hỗ trợ trong NVIDIA AI Enterprise giúp chuẩn hóa việc triển khai Generative AI bao gồm:
- NVIDIA NeMo, một khung dựa trên đám mây để xây dựng, tùy chỉnh và triển khai các mô hình ngôn ngữ lớn. Với NeMo, NVIDIA AI Enterprise cung cấp hỗ trợ toàn diện để tạo và tùy chỉnh các ứng dụng LLM.
- NVIDIA Triton Management Service, giúp tự động hóa và tối ưu hóa việc triển khai cấp độ production. Nó cho phép các doanh nghiệp tự động triển khai nhiều phiên bản máy chủ suy luận NVIDIA Triton trong Kubernetes với sự phối hợp mô hình để vận hành hiệu quả AI quy mô lớn.
- NVIDIA Base Command Manager Essentials, phần mềm quản lý cụm, giúp doanh nghiệp tối đa hóa hiệu suất và sử dụng máy chủ AI trên môi trường trung tâm dữ liệu, nhiều đám mây và đám mây lai.
Phần mềm NVIDIA AI Enterprise — cho phép người dùng xây dựng và chạy các giải pháp hỗ trợ AI của NVIDIA trên đám mây, trung tâm dữ liệu và biên — được chứng nhận để chạy trên các hệ thống NVIDIA-Certified Systems, NVIDIA DGX chính thống, tất cả các nền tảng đám mây chính và NVIDIA RTX mới được công bố máy trạm.
Các công ty phần mềm hàng đầu ServiceNow và Snowflake , cũng như nhà cung cấp cơ sở hạ tầng Dell Technologies, nơi cung cấp Giải pháp AI Sáng tạo của Dell , gần đây đã thông báo rằng họ đang hợp tác với NVIDIA để kích hoạt các dịch vụ và giải pháp AI tổng hợp mới trên nền tảng của họ. Việc tích hợp NVIDIA AI Enterprise 4.0 và NVIDIA NeMo cung cấp nền tảng cho AI tổng hợp sẵn sàng sản xuất cho khách hàng.
NVIDIA AI Enterprise 4.0 sẽ được tích hợp vào các thị trường đối tác, bao gồm AWS Marketplace, Google Cloud và Microsoft Azure, cũng như thông qua Oracle Cloud Infrastructure, một cloud partner của NVIDIA.
Ngoài ra, các nhà cung cấp MLOps, bao gồm Azure Machine Learning, ClearML, Domino Data Lab, Run:AI và Weights & Biases, đang bổ sung khả năng tích hợp liền mạch với nền tảng NVIDIA AI để đơn giản hóa việc phát triển mô hình AI tổng quát cấp sản xuất.
Hỗ trợ đối tác rộng rãi
“Dell Technologies và NVIDIA cam kết hỗ trợ các doanh nghiệp xây dựng các mô hình AI chuyên dụng để tiếp cận cơ hội to lớn của AI tổng hợp. Với NVIDIA AI Workbench, các nhà phát triển có thể tận dụng toàn bộ danh mục Giải pháp AI Sáng tạo của Dell để tùy chỉnh các mô hình trên PC, máy trạm và cơ sở hạ tầng trung tâm dữ liệu.” — Meghana Patwardhan, phó chủ tịch sản phẩm khách hàng thương mại tại Dell Technologies
“Hầu hết các doanh nghiệp không có chuyên môn, ngân sách và tài nguyên trung tâm dữ liệu để quản lý độ phức tạp cao của phần mềm và hệ thống AI. Chúng tôi mong đợi tiềm năng của NVIDIA AI Workbench trong việc đơn giản hóa việc tạo dự án AI tổng quát bằng đào tạo và triển khai chỉ bằng một cú nhấp chuột trên nền tảng edge-to-cloud của HPE GreenLake.” — Evan Sparks, giám đốc sản phẩm AI tại HPE
“Là công ty dẫn đầu thị trường máy trạm cung cấp hiệu suất và hiệu quả cần thiết cho các mô hình AI và khoa học dữ liệu đòi hỏi khắt khe nhất, chúng tôi có lịch sử hợp tác lâu dài với NVIDIA. HP đang sử dụng thế hệ hệ thống hiệu suất cao tiếp theo, kết hợp với GPU NVIDIA RTX Ada Generation và NVIDIA AI Workbench, đồng thời mang sức mạnh của AI tổng hợp đến các khách hàng doanh nghiệp của chúng tôi, đồng thời giúp di chuyển khối lượng công việc AI giữa đám mây và cục bộ.” — Jim Nottingham, phó chủ tịch cấp cao về các giải pháp điện toán tiên tiến tại HP Inc.
“Lenovo và NVIDIA đang giúp khách hàng khắc phục sự phức tạp trong triển khai và triển khai AI tổng quát dễ dàng hơn để cung cấp các dịch vụ và sản phẩm biến đổi cho thị trường. NVIDIA AI Workbench và danh mục đầu tư sẵn sàng cho AI của Lenovo cho phép các nhà phát triển tận dụng sức mạnh của các thiết bị thông minh của họ và mở rộng quy mô trên cơ sở hạ tầng edge-to-cloud.” — Rob Herman, phó chủ tịch kiêm tổng giám đốc của Lenovo Workstation & Client AI
“Mối quan hệ đối tác lâu dài giữa VMware và NVIDIA đã giúp mở khóa sức mạnh của AI cho mọi doanh nghiệp bằng cách cung cấp một nền tảng doanh nghiệp đầu cuối được tối ưu hóa cho khối lượng công việc AI. Cùng nhau, chúng tôi đang làm cho AI tổng quát trở nên dễ tiếp cận hơn và dễ triển khai hơn trong doanh nghiệp. Với AI Workbench, NVIDIA mang đến cho các nhà phát triển một bộ công cụ mạnh mẽ để giúp các doanh nghiệp đẩy nhanh việc áp dụng gen AI. Với NVIDIA AI Workbench mới, các nhóm phát triển có thể chuyển khối lượng công việc AI từ máy tính để bàn sang sản xuất một cách liền mạch.” — Chris Wolf, phó chủ tịch của VMware AI Labs
Xem bài phát biểu quan trọng về SIGGRAPH của người sáng lập kiêm Giám đốc điều hành NVIDIA Jensen Huang theo yêu cầu để tìm hiểu thêm về NVIDIA AI Workbench và NVIDIA AI Enterprise 4.0.
AI Workbench sắp ra mắt trong giai đoạn truy cập sớm. Đăng ký để nhận được thông báo khi nó có sẵn.
Theo NVIDIA
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- Siêu máy tính Colossus của tỉ phú Elon Musk chính thức hoạt động
- Intel trình làng chip Core Ultra với khả năng xử lý PC AI
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson