Các GPU chuyên xử lý AI của NVIDIA có thể gặp phải tình trạng thiếu hụt do nhu cầu ngày càng tăng từ những gã khổng lồ về AI sử dụng ChatGPT và các công cụ tạo AI khác.
ChatGPT và các công cụ tạo ngôn ngữ/hình ảnh/video khác chủ yếu dựa vào khả năng xử lý của AI và đó chính là nơi mà NVIDIA cho thấy thế mạnh của mình. Đây cũng là lý do tại sao các công ty công nghệ lớn muốn khai thác ChatGPT đang sử dụng GPU của NVIDIA để đáp ứng các yêu cầu AI gia tăng của họ. Có vẻ như sức mạnh của NVIDIA trong ngành này có thể gây ra sự thiếu hụt GPU AI của công ty trong những tháng tới.
Theo một báo cáo của FierceElectronics, ChatGPT (phiên bản Beta từ Open.AI ) đã được đào tạo trên 10.000 GPU của NVIDIA. Nhưng kể từ khi được công chúng chú ý, hệ thống đã bị quá tải và không thể đáp ứng nhu cầu của một lượng lớn người dùng. Đây là lý do tại sao công ty đã công bố gói đăng ký ChatGPT Plus mới, gói đăng ký này không chỉ cung cấp quyền truy cập chung vào máy chủ ngay cả trong thời gian cao điểm mà còn mang lại thời gian phản hồi nhanh hơn và quyền truy cập ưu tiên vào các tính năng & cải tiến mới. Bạn có thể đăng ký ChatGPT Plus với giá $20 mỗi tháng, tại đây.
“Có thể ChatGPT hoặc các mô hình học sâu khác có thể được đào tạo hoặc chạy trên GPU từ các nhà cung cấp khác trong tương lai. Tuy nhiên, hiện tại, GPU NVIDIA đang được sử dụng rộng rãi trong cộng đồng học sâu do hiệu suất cao và hỗ trợ CUDA. CUDA là một mô hình lập trình và nền tảng tính toán song song do NVIDIA phát triển, cho phép thực hiện các phép toán hiệu quả trên GPU NVIDIA. Nhiều thư viện và framework học sâu, chẳng hạn như TensorFlow và PyTorch, có hỗ trợ tích hợp cho CUDA và được tối ưu hóa cho GPU NVIDIA” – Theo FierceElectronics
Những gã khổng lồ công nghệ lớn như Microsoft và Google cũng đang có kế hoạch tích hợp các mô hình ngôn ngữ lớn (LLM) giống như ChatGPT vào các công cụ tìm kiếm của họ, theo thông tin từ Forbes. Để Google tích hợp điều này trong mọi truy vấn tìm kiếm, nó sẽ yêu cầu 512.820 máy chủ HGX A100 với tổng số 4.102.568 GPU A100, sẽ tiêu tốn khoảng 100 tỷ đô la Mỹ cho riêng chi phí máy chủ và mạng.
“Việc triển khai ChatGPT hiện tại vào mọi tìm kiếm do Google thực hiện sẽ yêu cầu 512.820,51 máy chủ A100 HGX với tổng số 4.102.568 GPU A100. Tổng chi phí của các máy chủ và kết nối mạng này vượt quá 100 tỷ đô la chỉ tính riêng CapEx (chi phí đầu tư), trong đó Nvidia sẽ nhận được một phần lớn. Tất nhiên, điều này sẽ không bao giờ xảy ra, nhưng đó là một ví dụ thú vị nếu chúng ta cho rằng không có cải tiến phần mềm hoặc phần cứng nào được thực hiện” – Theo Dylan Patel tại Semianalysis.
Investing.com cũng dẫn thông tin cho rằng các nhà phân tích đã dự đoán rằng mô hình ChatGPT hiện tại đang được đào tạo trên khoảng 25.000 GPU NVIDIA hoặc hơn so với 10.000 GPU NVIDIA đã được BETA sử dụng.
“Chúng tôi nghĩ rằng GPT 5 hiện đang được đào tạo trên 25 nghìn GPU – phần cứng của NVIDIA trị giá 225 triệu USD hoặc cao hơn – và chi phí suy luận có thể thấp hơn nhiều so với một số con số mà chúng tôi được biết. Hơn nữa, việc giảm chi phí suy luận sẽ rất quan trọng trong việc giải quyết cuộc tranh luận về ‘chi phí tìm kiếm’ từ những gã khổng lồ trên đám mây.” – Theo Investing.com
Đây có thể là một tin vui cho NVIDIA nhưng lại không mấy khả quan với người tiêu dùng, đặc biệt là các game thủ. Nếu NVIDIA nhìn thấy cơ hội trong lĩnh vực kinh doanh GPU AI của mình, họ có thể ưu tiên cho việc cung cấp các GPU đó thay vì GPU cho gaming. GPU chơi game đã được báo cáo là có nguồn cung hạn chế trong quý này do dịp nghỉ cuối năm và trong khi hàng vẫn còn, điều này có thể gây ra vấn đề đối với GPU cao cấp vốn đã khan hiếm. Hơn nữa, GPU cao cấp cũng cung cấp khả năng AI cao hơn do các bộ phận máy chủ có giá thấp hơn nhiều và chúng có thể trở thành một lựa chọn sinh lợi, tiếp tục làm giảm nguồn cung từ các game thủ.
Vẫn còn phải xem NVIDIA đáp ứng nhu cầu khổng lồ này ở phân khúc AI như thế nào. Gã khổng lồ GPU dự kiến sẽ công bố báo cáo lợi nhuận của mình cho Q4 FY23 vào ngày 22 tháng 2 năm 2023.
Bài viết liên quan
- Nvidia ‘đang chuẩn bị cho thời kỳ AI không dùng GPU’
- NVIDIA World Foundation Model: Chìa khóa để thúc đẩy trí tuệ nhân tạo vật lý – Physical AI
- Có gì mới với NVIDIA tại sự kiện CES 2025?
- Cải thiện khả năng làm mát GPU trong hạ tầng AI
- Các chuyên gia AI của NVIDIA dự báo gì cho năm 2025
- Sovereign AI là gì?