Thế giới Trí tuệ Nhân tạo (AI), đặc biệt là lĩnh vực AI Tạo sinh (Generative AI) và các Mô hình Ngôn ngữ Lớn (LLM), đang đòi hỏi sức mạnh tính toán vượt ra ngoài giới hạn vật lý hiện tại. NVIDIA Blackwell không chỉ là một kiến trúc GPU mới; nó là một nền tảng…
Tag: NVIDIA
Huấn luyện mô hình hàng trăm tỷ tham số ngay tại bàn với MSI EdgeXpert
Mẫu máy tính trí tuệ nhân tạo (AI PC) MSI EdgeXpert được thiết kế như một siêu máy tính AI để bàn nhỏ gọn, giúp các nhà phát triển, nhà nghiên cứu và nhà khoa học dữ liệu có thể khai thác sức mạnh tính toán hiệu năng cao ngay tại bàn làm việc. Bạn…
Đánh giá chi tiết NVIDIA RTX Pro 6000 Blackwell Workstation: GPU máy trạm với 96GB GDDR7
Chuẩn mực mới cho AI và Đồ họa Chuyên nghiệp NVIDIA đã chính thức mang kiến trúc Blackwell đột phá lên thị trường máy trạm (Workstation) với mẫu GPU siêu cấp RTX Pro 6000 Workstation Edition. Đây không chỉ là một bản nâng cấp, mà là một bước nhảy vọt so với thế hệ Ada Lovelace tiền nhiệm,…
NVIDIA Merlin: Tổng quan về toolkit cho hệ thống gợi ý quy mô lớn
Hệ thống gợi ý (recommendation system) là thành phần quan trọng trong nhiều ứng dụng hiện đại như thương mại điện tử, mạng xã hội, dịch vụ phát nhạc và video. Khi quy mô dữ liệu và số lượng người dùng tăng lên hàng triệu hoặc hàng tỷ, việc huấn luyện và triển khai các…
NVIDIA NVLink Fusion: Tương lai của Trung tâm Dữ liệu AI
1. Giới thiệu: Cuộc cách mạng kết nối trong Điện toán Hiệu năng cao 1.1. Bối cảnh: Điểm nghẽn PCIe và Nhu cầu Bùng nổ của AI/HPC Sự bùng nổ của trí tuệ nhân tạo (AI) và điện toán hiệu năng cao (HPC) đã thúc đẩy nhu cầu về khả năng xử lý và truyền…
Hướng dẫn cập nhật firmware cho NVIDIA DGX H100/H200
Việc cập nhật firmware cho hệ thống NVIDIA DGX H100 và H200 là một quy trình quan trọng để đảm bảo hiệu suất, tính ổn định và bảo mật cao nhất. Quá trình này bao gồm việc cập nhật firmware cho nhiều thành phần khác nhau của hệ thống, bao gồm BMC (Baseboard Management Controller),…
NVIDIA ConnectX-8 SuperNIC – Nền tảng switch siêu tốc cho các máy chủ MGX có 8x GPU PCIe
Giới thiệu Tại Computex 2025 vào tháng 5 vừa qua, NVIDIA đã cho ra mắt một công nghệ rất thú vị dành cho kiến trúc máy chủ GPU PCIe truyền thống. CEO Jensen Huang của NVIDIA đã giới thiệu về thế hệ server rack NVIDIA RTX PRO™ với công nghệ mà họ gọi là NVIDIA…
NVIDIA ConnectX-8 SuperNIC: Đột phá kiến trúc hạ tầng AI với PCIe Gen6
Sự bùng nổ của trí tuệ nhân tạo (AI), đặc biệt là các mô hình ngôn ngữ lớn (LLM), đã tạo ra một nhu cầu chưa từng có về hiệu suất tính toán và băng thông dữ liệu. Các “nhà máy AI” (AI factories) hiện đại được xây dựng để xử lý các mô hình…
Hướng dẫn chi tiết sử dụng mô hình GPT-OSS-20B trên máy tính của bạn
Trong bài viết trước, chúng ta đã cùng phân tích tổng quan về GPT-OSS – bộ mô hình ngôn ngữ mở trọng số (open-weight) do OpenAI phát hành, bao gồm hai biến thể chủ lực: GPT-OSS-20B và GPT-OSS-120B. Chúng ta đã tìm hiểu về kiến trúc, nguyên lý và tiềm năng ứng dụng của nó….
Tăng tốc các mô hình mở mới của OpenAI ngay trên GPU NVIDIA GeForce RTX và RTX PRO
Hợp tác với OpenAI, NVIDIA đã tối ưu hóa các mô hình mở gpt-oss mới của công ty cho GPU NVIDIA, mang lại khả năng suy luận hiệu quả và nhanh chóng, từ đám mây đến cả các PC tại bàn làm việc. Các mô hình suy luận mới này cho phép các ứng dụng AI như tìm kiếm…