Google Cloud và NVIDIA đưa sự hợp tác lên một tầm cao mới

Khi AI tạo sinh (Generative AI) và các Mô hình ngôn ngữ lớn (LLMs) tiếp tục thúc đẩy sự đổi mới, các yêu cầu điện toán cho hoạt động đào tạo (training) và suy luận (inference) đã tăng lên với tốc độ đáng kinh ngạc.

Để đáp ứng nhu cầu đó, Google Cloud hôm nay đã công bố sự sẵn có rộng rãi của các A3 instance mới (VMs), được hỗ trợ bởi NVIDIA H100 Tensor Core GPU. Những GPU này mang lại hiệu suất chưa từng có cho tất cả các loại ứng dụng AI với Transformer Engine của chúng – được thiết kế nhằm mục đích tăng tốc các LLM.

Sự sẵn có của A3 instance xuất hiện ngay sau khi NVIDIA được vinh danh là Google Cloud’s Generative AI Partner of the Year – một giải thưởng ghi nhận sự hợp tác sâu sắc và liên tục của hai công ty nhằm tăng tốc Generative AI trên Google Cloud.

Nỗ lực chung này được thực hiện dưới nhiều hình thức, từ thiết kế hạ tầng đến hỗ trợ phần mềm mở rộng, nhằm giúp việc xây dựng và triển khai các ứng dụng AI trên nền tảng Google Cloud trở nên dễ dàng hơn.

Tại hội nghị Google Cloud Next, NVIDIA founder và CEO – Jensen Huang đã cùng với Google Cloud CEO – Thomas Kurian tham gia bài phát biểu quan trọng của sự kiện nhằm kỷ niệm sự sẵn có rộng rãi của các A3 instance với hỗ trợ của NVIDIA H100 GPU và nói về cách Google đang sử dụng NVIDIA H100 và A100 GPU cho nghiên cứu nội bộ và suy luận trong DeepMind và các bộ phận khác.

Trong cuộc thảo luận, Huang đã chỉ ra các mức độ cộng tác sâu hơn cho phép sự tăng tốc của NVIDIA GPU đối với framework PaxML để tạo ra các LLM lớn. Framework Học máy dựa trên Jax này được xây dựng nhằm mục đích đào tạo các mô hình quy mô lớn, cho phép thử nghiệm và song song hóa nâng cao và có thể cấu hình đầy đủ.

PaxML đã được Google sử dụng để xây dựng các mô hình nội bộ, bao gồm DeepMind cũng như các dự án nghiên cứu và sẽ sử dụng các NVIDIA GPU. Các công ty cũng thông báo rằng PaxML hiện có sẵn trên NVIDIA NGC container registry.

Có rất nhiều công ty khởi nghiệp Generative AI

Hiện nay, có hơn một nghìn công ty khởi nghiệp Generative AI đang xây dựng các ứng dụng thế hệ tiếp theo, nhiều công ty sử dụng công nghệ NVIDIA trên Google Cloud. Một số đáng chú ý bao gồm Writer và Runway.

Writer sử dụng các LLM dựa trên Transformer để cho phép nhóm marketing nhanh chóng tạo bản sao cho các trang web, blog, quảng cáo,… Để làm được điều này, công ty khai thác NVIDIA NeMo, một framework ứng dụng của NVIDIA AI Enterprise giúp các công ty quản lý bộ dữ liệu đào tạo của họ, xây dựng và tùy chỉnh các LLM cũng như chạy chúng trong sản xuất theo quy mô.

Bằng việc sử dụng tính tối ưu hoá của NeMo, các developer Writer đã chuyển từ làm việc với các mô hình có hàng trăm triệu tham số sang các mô hình có 40 tỷ tham số. Danh sách khách hàng của startup này bao gồm những cái tên quen thuộc như Deloitte, L’Oreal, Intuit, Uber và nhiều công ty Fortune 500 khác.

Runway sử dụng AI để tạo video theo mọi phong cách. Mô hình AI bắt chước các phong cách cụ thể được nhắc nhở bởi các hình ảnh (images) nhất định hoặc thông qua lời nhắc văn bản. Người dùng cũng có thể sử dụng mô hình này để tạo nội dung video mới bằng cách sử dụng các cảnh quay (footage) hiện có. Tính linh hoạt này cho phép các nhà làm phim và nhà sáng tạo nội dung khám phá và thiết kế video theo một cách hoàn toàn mới.

Google Cloud là CSP đầu tiên đưa các NVIDIA L4 GPU lên cloud. Ngoài ra, các công ty đã hợp tác để cho phép dịch vụ Dataproc của Google tận dụng RAPIDS Accelerator for Apache Spark nhằm tăng cường hiệu suất đáng kể cho ETL, hiện có sẵn với Dataproc trên Google Computer Engine và sắp có đối với Serverless Dataproc.

Các công ty cũng đã cung cấp NVIDIA AI Enterprise trên Google Cloud Marketplace và tích hợp phần mềm tăng tốc NVIDIA vào môi trường phát triển Vertex AI.

Tìm hiểu thêm thông tin về NVIDIA GPU instances trên Google Cloud và cách NVIDIA đang hỗ trợ Generative AI, đồng thời xem cách các tổ chức đang chạy các ứng dụng doanh nghiệp tối quan trọng của họ với NVIDIA NeMo trên Google Cloud được tăng tốc GPU.

Đăng ký nhận tin tức về Generative AI để cập nhật những đột phá, sự phát triển và công nghệ mới nhất.

Theo NVIDIA

____
Bài viết liên quan
Góp ý / Liên hệ tác giả