Trong bài viết trước, chúng ta đã cùng phân tích tổng quan về GPT-OSS – bộ mô hình ngôn ngữ mở trọng số (open-weight) do OpenAI phát hành, bao gồm hai biến thể chủ lực: GPT-OSS-20B và GPT-OSS-120B. Chúng ta đã tìm hiểu về kiến trúc, nguyên lý và tiềm năng ứng dụng của nó. Tiếp nối dòng mạch đó, bài viết hôm nay sẽ đi vào phần thực hành, trình bày chi tiết cách cài đặt và vận hành GPT-OSS trực tiếp trên máy tính cá nhân (local environment), từ bước lựa chọn công cụ, cấu hình phần cứng, đến khởi chạy mô hình và tối ưu quá trình sử dụng. Mục tiêu là giúp người đọc, dù là nhà nghiên cứu, lập trình viên hay người dùng phổ thông, đều có thể tự mình triển khai và tận dụng sức mạnh của GPT-OSS cho các dự án riêng.
Trước tiên, việc lựa chọn công cụ triển khai đóng vai trò quyết định đến trải nghiệm ban đầu. Hiện nay, có nhiều lựa chọn phổ biến, trong đó Ollama được xem là phương án tối ưu cho khởi đầu nhanh gọn nhờ tính đơn giản, hỗ trợ đa hệ điều hành và thao tác thông qua vài lệnh cơ bản. Sau khi cài đặt Ollama từ trang chủ, bạn chỉ cần mở terminal và chỉ cần gõ một vài dòng lệnh là đã có thể triển khai nhanh chóng .
Trong bài viết này mình sẽ hướng dẫn với hệ điều hành Ubuntu 24.04 nhé.
Hãy chắc chắn máy bạn có ít nhất 16GB VRAM để có thể chạy mô hình GPT-OSS-20B. Nếu bạn đã từng đọc qua bài viết của mình về NIM ( mình sẽ để đường link bài viết ở đây cho bạn nào muốn đọc: NVIDIA NIM: Biến ý tưởng ứng dụng AI thành hiện thực trong tầm tay ) thì việc sử dụng Ollama cũng giống như vậy.
Đầu tiên các bạn hãy tải Ollama:
curl -fsSL https://ollama.com/install.sh | sh
Sau khi tải xong các bạn có thể kiểm tra thông qua lệnh:
ollama --version
Nếu hiển thị như ảnh dưới đây thì bạn đã tải thành công:
Tiếp theo là tải mô hình GPT-OSS-20B:
ollama pull gpt-oss:20b
Vì mình đã tải rồi nên sau khi tải xong các bạn có thể xem bằng lệnh:
ollama list
Kết quả trả về bạn sẽ thấy mô hình của bạn:
Sau khi đã tải xong việc đơn giản còn lại chỉ là khởi chạy mô hình của bạn:
ollama run gpt-oss:20b
Khi nó hiển thị như ảnh thì bạn đã thành công:
Và bây giờ bạn đã có thể sử dụng mô hình mô hình GPT-OSS-20B như một chat bot hỗ trợ ngay trên máy của bạn. Ví dụ: ( ấn vào để phóng to)
Đấy, rất dễ đúng không nào. Bài viết của mình đến đây cũng đã hết rồi. Chúc các bạn thành công khi sử dụng mô hình GPT-OSS-20B nhé.
Mọi thắc mắc có thể liên hệ mình thông qua email: anldb@nhattienchung.vn