OpenAI và NVIDIA đẩy nhanh tiến bộ AI trong cộng đồng với các mô hình open-weight mới

Hai mô hình suy luận AI open-weight mới được OpenAI phát hành ngày hôm nay mang công nghệ phát triển AI tiên tiến trực tiếp đến tay các nhà phát triển, những người đam mê, các doanh nghiệp, công ty khởi nghiệp và chính phủ trên khắp mọi nơi — trên mọi ngành và ở mọi quy mô.

Sự hợp tác của NVIDIA với OpenAI về các mô hình mở này — gpt-oss-120b và gpt-oss-20b — là minh chứng cho sức mạnh của sự đổi mới do cộng đồng thúc đẩy và làm nổi bật vai trò nền tảng của NVIDIA trong việc giúp AI dễ tiếp cận hơn trên toàn thế giới.

Bất kỳ ai cũng có thể sử dụng các mô hình để phát triển các ứng dụng đột phá trong AI tạo sinh, suy luận và vật lý, y tế và sản xuất — hoặc thậm chí mở ra các ngành công nghiệp mới khi cuộc cách mạng công nghiệp tiếp theo do AI thúc đẩy tiếp tục diễn ra.

Các mô hình ngôn ngữ lớn ( LLM ) suy luận văn bản mở và linh hoạt mới nhất của OpenAI được đào tạo trên GPU NVIDIA H100 và chạy suy luận tốt nhất trên hàng trăm triệu GPU cùng với nền tảng NVIDIA CUDA trên toàn cầu.

Các mô hình hiện có sẵn dưới dạng các dịch vụ (microservice) của NVIDIA NIM, cung cấp khả năng triển khai dễ dàng trên bất kỳ hạ tầng tăng tốc GPU nào với tính linh hoạt, quyền riêng tư dữ liệu và bảo mật cấp doanh nghiệp.

Với khả năng tối ưu hóa phần mềm cho nền tảng NVIDIA Blackwell, các mô hình này cung cấp khả năng suy luận tối ưu trên hệ thống NVIDIA GB200 NVL72, đạt 1,5 triệu token mỗi giây — mang lại hiệu suất suy luận rất cao.

“OpenAI đã cho thế giới thấy những gì có thể được xây dựng trên NVIDIA AI — và giờ đây họ đang thúc đẩy đổi mới với phần mềm nguồn mở”, Jensen Huang, nhà sáng lập kiêm CEO của NVIDIA, cho biết. “Các mô hình gpt-oss cho phép các nhà phát triển ở khắp mọi nơi xây dựng trên nền tảng nguồn mở tiên tiến đó, củng cố vị thế dẫn đầu công nghệ của Hoa Kỳ trong lĩnh vực AI — tất cả đều dựa trên hạ tầng điện toán AI lớn nhất thế giới”.

NVIDIA Blackwell mang đến khả năng suy luận tiên tiến

Khi các mô hình suy luận tiên tiến như gpt-oss tạo ra số lượng token tăng theo cấp số nhân, nhu cầu về hạ tầng tính toán cũng tăng lên đáng kể. Để đáp ứng nhu cầu này, cần có các nhà máy AI chuyên dụng được hỗ trợ bởi NVIDIA Blackwell, một kiến trúc được thiết kế để mang lại quy mô, hiệu quả và lợi tức đầu tư cần thiết để chạy suy luận ở cấp độ cao nhất.

NVIDIA Blackwell bao gồm các cải tiến như độ chính xác 4 bit NVFP4, cho phép suy luận siêu hiệu quả, độ chính xác cao đồng thời giảm đáng kể yêu cầu về điện năng và bộ nhớ. Điều này cho phép triển khai các LLM hàng nghìn tỷ tham số theo thời gian thực, mang lại giá trị hàng tỷ đô la cho các tổ chức.

Phát triển mở cho hàng triệu nhà phát triển AI trên toàn thế giới

NVIDIA CUDA là hạ tầng điện toán phổ biến nhất thế giới, cho phép người dùng triển khai và chạy các mô hình AI ở mọi nơi, từ nền tảng NVIDIA DGX Cloud mạnh mẽ đến PC và máy trạm chạy NVIDIA GeForce RTX – và NVIDIA RTX PRO.

Tính đến nay đã có hơn 450 triệu lượt tải xuống NVIDIA CUDA và bắt đầu từ hôm nay, cộng đồng lớn các nhà phát triển CUDA sẽ có quyền truy cập vào các mô hình mới nhất này, được tối ưu hóa để chạy trên nền tảng công nghệ NVIDIA mà họ đang sử dụng.

Để thể hiện cam kết của mình đối với phần mềm nguồn mở, OpenAI và NVIDIA đã hợp tác với các nhà cung cấp nền tảng mở hàng đầu để cung cấp các tối ưu hóa mô hình cho FlashInfer, Hugging Face, llama.cpp, Ollama và vLLM, ngoài NVIDIA Tensor-RT LLM và các thư viện khác, để các nhà phát triển có thể xây dựng với nền tảng họ lựa chọn.

Lịch sử hợp tác, xây dựng trên nền tảng nguồn mở

Các mô hình phát hành ngày hôm nay nhấn mạnh cách tiếp cận toàn diện của NVIDIA giúp đưa các dự án AI đầy tham vọng nhất thế giới đến với lượng người dùng rộng nhất có thể.

Đây là câu chuyện bắt đầu từ những ngày đầu hợp tác giữa NVIDIA và OpenAI, bắt đầu vào năm 2016 khi Huang đích thân trao siêu máy tính AI NVIDIA DGX-1 đầu tiên đến trụ sở chính của OpenAI tại San Francisco.

Kể từ đó, các công ty đã hợp tác với nhau để mở rộng ranh giới khả năng của AI, cung cấp các công nghệ cốt lõi và chuyên môn cần thiết cho các đợt đào tạo quy mô lớn.

Và bằng cách tối ưu hóa các mô hình gpt-oss của OpenAI cho GPU NVIDIA Blackwell và RTX, cùng với bộ phần mềm mở rộng của NVIDIA, NVIDIA đang cho phép các tiến bộ trong AI được đẩy đi nhanh hơn, tiết kiệm chi phí hơn cho 6,5 triệu nhà phát triển trên 250 quốc gia bằng cách sử dụng hơn 900 bộ công cụ phát triển phần mềm và mô hình AI của NVIDIA — và con số này vẫn đang tiếp tục tăng.

Nhất Tiến Chung (NTC) hiện là nhà cung cấp các giải pháp hạ tầng CNTT, điện toán hiệu năng cao (HPC) và lưu trữ cho AI. Chúng tôi là đối tác NPN cấp Elite của NVIDIA cho các hệ thống DGX và hệ thống cụm siêu máy tính DGX SuperPOD với sức mạnh lưu trữ song song của DDN và kết nối mạng tốc độ cao từ hãng Mellanox (thuộc NVIDIA).

Với vai trò là đối tác NPN chính thức của NVIDIA, chúng tôi có thể giúp bạn có được các sản phẩm GPU cao cấp nhất của NVIDIA như L4, L40S, H200, H200 NVL, B200,…, đặc biệt là với thực trạng khan hiếm GPU do các hạn chế thương mại về nhập khẩu GPU như hiện nay.

Bạn muốn trở thành đối tác bán hàng NVIDIA của NTC?

Đăng ký ngay

____
Bài viết liên quan

NVIDIA Blackwell mang đến khả năng suy luận tiên tiến

Phát triển mở cho hàng triệu nhà phát triển AI trên toàn thế giới

Lịch sử hợp tác, xây dựng trên nền tảng nguồn mở

Bạn muốn trở thành đối tác bán hàng NVIDIA của NTC?

Gửi yêu cầu