Google Cloud đã tích hợp GPU L4 mới ra mắt của NVIDIA vào Vertex AI để hỗ trợ các công ty đang phát triển các ứng dụng AI tổng quát. Đây là lần đầu tiên mà Google Cloud cung cấp GPU L4 Tensor Core của NVIDIA.
GPU L4 sẽ có sẵn với sự hỗ trợ tối ưu trên Vertex AI, giúp các nhà phát triển tiếp cận công nghệ tiên tiến nhất hiện có để thiết lập và chạy các ứng dụng mới nhanh chóng và tiết kiệm chi phí. GPU L4 là GPU phổ quát cho mọi khối lượng công việc, với khả năng video AI nâng cao có thể mang lại hiệu suất video do AI hỗ trợ cao hơn 120 lần so với CPU, kết hợp với hiệu suất năng lượng tốt hơn 99%.
Theo Jensen Huang, người sáng lập kiêm Giám đốc điều hành của NVIDIA, mối quan tâm đối với AI tổng quát đang truyền cảm hứng cho làn sóng các công ty chuyển sang điện toán đám mây để hỗ trợ các mô hình kinh doanh của họ. Google Cloud cung cấp cơ sở hạ tầng cho nhiều tổ chức cung cấp các ứng dụng AI tổng quát, nhiều ứng dụng trong số đó được thiết kế để giúp các chuyên gia thực hiện công việc của họ tốt hơn và nhanh hơn.


Google Cloud tự hào cung cấp GPU L4 mới nhất của NVIDIA như một phần trong danh mục Công cụ Điện toán được tối ưu hóa cho khối lượng công việc của chúng tôi. Amin Vahdat, phó chủ tịch Cơ sở hạ tầng hệ thống & dịch vụ tại Google Cloud cho biết: “AI sáng tạo đại diện cho một kỷ nguyên điện toán mới — một kỷ nguyên đòi hỏi tốc độ, khả năng mở rộng và độ tin cậy mà chúng tôi cung cấp trên Google Cloud.”


→ GPU NVIDIA L4 có sẵn trong bản xem trước riêng tư trên Google Cloud, truy cập để biết thêm chi tiết.
→ Xem Huang thảo luận về việc tích hợp nền tảng suy luận của NVIDIA dành cho trí tuệ nhân tạo tổng quát vào Google Cloud trong bài phát biểu quan trọng về GTC.
Bài viết liên quan
- Hướng dẫn triển khai máy chủ GPU tại chỗ trong các phòng máy
- NVIDIA ConnectX-8 SuperNIC: Đột phá kiến trúc hạ tầng AI với PCIe Gen6
- Hướng dẫn chi tiết sử dụng mô hình GPT-OSS-20B trên máy tính của bạn
- Tăng tốc các mô hình mở mới của OpenAI ngay trên GPU NVIDIA GeForce RTX và RTX PRO
- Dòng GPU RTX PRO 6000 Blackwell Server Edition sắp được tích hợp vào các máy chủ phổ biến
- OpenAI lần đầu phát hành miễn phí mô hình ngôn ngữ mới với tên gọi là GPT-OSS