Tạo chatbot trên dữ liệu của riêng bạn với NVIDIA ChatRTX

ChatRTX là gì? ChatRTX là một ứng dụng demo cho phép bạn cá nhân hóa mô hình ngôn ngữ lớn GPT (LLM) được kết nối với nội dung của riêng bạn — tài liệu, ghi chú, hình ảnh hoặc các dữ liệu khác. Tận dụng công nghệ Retrieval-Augmented Generation (RAG), TensorRT-LLM và RTX, bạn có thể truy vấn…

Máy chủ Supermicro X14: Hiệu suất mạnh mẽ, hiệu quả tối đa cho AI, Cloud, Storage, 5G/Edge

Tại Intel Vision 2024, Supermicro, một nhà cung cấp giải pháp IT toàn diện cho Cloud, AI/ML, Lưu trữ và 5G/Edge đã công bố danh mục máy chủ X14 với sự hỗ trợ trong tương lai cho bộ xử lý Intel® Xeon® 6. Sự kết hợp giữa Kiến trúc khối xây dựng của Supermicro, các giải…

Hướng dẫn build một cụm GPU cho AI

GPU Cluster là gì? GPU Cluster (cụm các máy chủ GPU) là một nhóm máy tính được trang bị GPU trên từng node. Nhiều GPU cung cấp sức mạnh điện toán tăng tốc cho các tác vụ tính toán cụ thể, chẳng hạn như xử lý hình ảnh và video cũng như đào tạo mạng lưới thần…

GDDR6 vs HBM – Định nghĩa các loại bộ nhớ GPU

Kiến thức cơ bản về bộ nhớ GPU Khi nói đến bộ xử lý đồ họa (GPU), đặc biệt là đối với các tải xử lý nhạy cảm về độ trễ, chủng loại bộ nhớ có tác động đáng kể đến hiệu suất của hệ thống. Bộ nhớ GPU thường được gọi là VRAM, Video…