NVIDIA TAO Toolkit là gì?
NVIDIA TAO Toolkit (Train, Adapt, Optimize) là một bộ công cụ AI no-code / low-code được phát triển bởi NVIDIA, được xây dựng dựa trên nền tảng TensorFlow và PyTorch. Mục tiêu của TAO là hỗ trợ đơn giản hóa và tăng tốc quá trình huấn luyện, tùy biến và tối ưu mô hình học sâu bằng cách trừu tượng hóa sự phức tạp của các kiến trúc mạng và các framework học sâu truyền thống.
TAO Toolkit cung cấp đầy đủ các công cụ cần thiết để bạn có thể huấn luyện mô hình AI một cách nhanh chóng và hiệu quả. Ngoài ra, TAO còn cung cấp hơn 100 mô hình thị giác máy tính đã được huấn luyện sẵn và lưu trữ trên NGC (NVIDIA GPU Cloud). Bạn hoàn toàn có thể chọn và triển khai một mô hình phù hợp, tùy chỉnh lại trên bộ dữ liệu riêng, xuất mô hình tối ưu và triển khai inference với chỉ vài dòng lệnh — hoặc thậm chí không cần viết dòng code nào.
Vậy NVIDIA TAO Toolkit tiện lợi như vậy thì làm sao để tải và cài đặt?
Tương tự như NVIDIA Container Toolkit (nếu bạn chưa biết có thể tham khảo bài viết: Hướng dẫn cài đặt NVIDIA Container Toolkit tích hợp với Docker), TAO Toolkit được NVIDIA đóng gói sẵn trong các Docker container và phát hành trên NGC. Người dùng có thể lựa chọn tải về và sử dụng trực tiếp container từ NGC, hoặc cài đặt công cụ launcher để sử dụng thuận tiện hơn.
Nếu bạn chỉ muốn dùng TAO Toolkit để chạy nhanh một tác vụ để test thử, thì việc “pull” container từ NGC là một lựa chọn hợp lý. Tuy nhiên, nếu bạn có nhu cầu sử dụng lâu dài, cần tùy biến nhiều, triển khai lên hệ thống thực tế thì mình khuyên bạn nên cài đặt launcher trực tiếp vào máy. Việc này sẽ giúp bạn chủ động hơn trong việc chọn phiên bản phù hợp với môi trường hiện có, đồng thời dễ dàng tích hợp với hệ thống khi cần gắn các thư mục dữ liệu, mount từ host, làm việc với Streamlit hoặc các ứng dụng khác.
Nói đơn giản cho dễ hiểu thì có 2 cách để cài đặt và sử dụng TAO:
- Cài đặt bằng cách pull container từ NGC về: cách này dùng để test nhanh mô hình và không cần cấu hình gì
- Cài đặt TAO Launcher về máy: cách này có thể hỗ trợ bạn tùy biến quy trình huấn luyện, gắn thư mục dữ liệu từ host (mounts volumes) và tích hợp với các ứng dụng như Streamlit,…
Vậy nếu bạn đang thắc mắc làm sao để tải và sử dụng TAO Toolkit thì dưới đây là hướng dẫn chi tiết về cách cài đặt TAO Launcher để bạn có thể bắt đầu.
Cài đặt NVIDIA TAO Toolkit
Trước khi vào phần cài đặt hãy kiểm tra xem hệ thống của bạn đã đáp ứng đủ yêu cầu về hệ thống chưa nhé:
Về phần cứng:
- Tối thiểu:
– CPU: 8 nhân
– RAM: 8 GB
– SSD: >= 100 GB
– NVIDIA GPU: ít nhất là 1 GPU ví dụ các dòng RTX 10/20 series từ 1060 đổ lên có khả năng tính toán >= 6.1
– GPU RAM: 4 GB - Đề xuất:
– CPU: 8 nhân
– RAM: 32 GB
– SSD: >= 100 GB
– NVIDIA GPU: ít nhất là 1 GPU ví dụ các dòng A100, V100, RTX 30/40 series
– GPU RAM: 32 GB
Về phần mềm:
- Hệ điều hành: Ubuntu 18.04 LTS hoặc 20.04 (Ubuntu 22.04 cũng tương thích với FTMS bare-metal)
- Python: ≥ 3.6.9 (thường Python 3.12 trong container)
- Docker CE: phiên bản > 19.03.5
- Docker API: 1.40
- NVIDIA Container Toolkit: >1.3.0‑1
- Driver NVIDIA: phiên bản >465 (khuyến nghị ≥520–550 hoặc mới hơn khi dùng FTMS)
- Python-pip: >21.06 và python-dev nếu cần build gói C/C++
Nếu bạn đã đáp ứng đủ yêu cầu về hệ thống thì chúng ta cùng bắt đầu tải và cài đặt NVIDIA TAO Toolkit nào.
- Đầu tiên các bạn phải tải và cài đặt xong Docker + NVIDIA Container Toolkit. Nếu như đây là lần đầu bạn có thể xem các bài viết dưới đây:
– NVIDIA NIM: Biến ý tưởng ứng dụng AI thành hiện thực trong tầm tay
– Hướng dẫn cài đặt NVIDIA Container Toolkit tích hợp với Docker
Ngoài ra bạn hãy đăng nhập vào NGC bằng tài khoản của bạn, nếu bạn chưa có hãy tạo cho mình 1 tài khoản, đăng nhập vào và tạo API Key của riêng bạn, nếu bạn không biết làm như nào hãy xem trong bài viết về NVIDIA NIM ở trên. - Sau khi bạn có API Key, mở Terminal Ubuntu của bạn và đăng nhập vào NGC Docker Registry (nvcr.io) bằng lệnh:
docker login nvcr.io
Nó sẽ hỏi bạn về username và password.
Username: $oauthtoken Password: <NGC_API_KEY_CUA_BAN>
Nếu bạn đăng nhập thành công sẽ có 1 dòng thông báo:
” Login Succeeded “ - Tiếp theo là cài môi trường ảo vì TAO Launcher là một gói Python nên việc cài đặt nó trong một môi trường ảo sẽ tránh bị xung đột với thư viện của hệ thống.
Cài đặt Python, pip, và venv (nếu bạn chưa cài môi trường ảo bao giờ)sudo apt update sudo apt install -y python3 python3-pip python3-venv
Sau khi cài đặt xong, bạn có thể tạo thư mục để lưu hoặc cứ để ngoài thư mục gốc tùy bạn nhưng mình khuyên là nên tạo thư mục để dễ quản lý hơn. Nếu bạn không tạo thư mục có thể bỏ qua bước này.
mkdir ~/tao #Sau khi tạo hãy di chuyển đến thư mục tao để tiếp tục cài đặt cd ~/tao
- Tạo môi trường ảo
#tao_env là tên môi trường ảo của bạn #Bạn có thể đặt tùy ý miễn sao bạn nhớ nó là môi trường ảo là được :> python3 -m venv tao_env
Sau khi tạo xong bạn hãy kích hoạt nó bằng lệnh:
source tao_env/bin/activate
* Lưu ý là bạn phải di chuyển đến thư mục chứa môi trường ảo của bạn ở đây mình ví dụ là home/tao thì sau lệnh này, bạn sẽ thấy dấu nhắc lệnh của bạn thay đổi kiểu:
(tao_env) user@tencuaban:~/tao$
Sau khi sử dụng xong bạn muốn ngắt thì sử dụng lệnh:
deactivate
- Cài đặt TAO Launcher
pip install nvidia-tao
Lệnh này sẽ cài đặt TAO Launcher vào thẳng môi trường ảo của bạn
Sau khi cài xong bạn có thể sử dụng lệnh dưới đây để kiểm tra bạn đã cài đặt thành công hay chưa:tao --help #hoặc tao info
Nếu khi chạy mà trả về là:
usage: tao [-h] {list,stop,info,dataset,deploy,model} ... Launcher for TAO Toolkit. optional arguments: -h, --help show this help message and exit task_groups: {list,stop,info,dataset,deploy,model}
Là kết quả của “tao –help” hoặc khi chạy ” tao info ” sẽ là:
Configuration of the TAO Toolkit Instance task_group: ['model', 'dataset', 'deploy'] format_version: 3.0 toolkit_version: 5.0.0 published_date: 07/14/2023
Nếu khi chạy một trong 2 lệnh trên mà được kết quả như thế thì xin chúc mừng, bạn đã cài đặt thành công NVIDIA TAO Toolkit!
Bài viết liên quan
- NVIDIA H100 vs H200: Cuộc chiến hiệu năng trên nền tảng Hopper và bước đệm tới kỷ nguyên Blackwell
- So sánh hiệu năng hai cấu hình máy chủ MSI MGX 8x GPU L40s và AsRock Rack MGX 8x GPU RTX Pro 6000
- Hướng dẫn cài đặt NVIDIA Container Toolkit tích hợp với Docker
- NVIDIA RTX PRO Blackwell Series: Bước nhảy vượt cấp về hiệu hăng GPU
- NVIDIA: Công nghệ Silicon Photonics và Co-Packaged Optics – Thay đổi cuộc chơi trong kỷ nguyên AI và HPC