Tạo chatbot trên dữ liệu của riêng bạn với NVIDIA ChatRTX

ChatRTX là gì? ChatRTX là một ứng dụng demo cho phép bạn cá nhân hóa mô hình ngôn ngữ lớn GPT (LLM) được kết nối với nội dung của riêng bạn — tài liệu, ghi chú, hình ảnh hoặc các dữ liệu khác. Tận dụng công nghệ Retrieval-Augmented Generation (RAG), TensorRT-LLM và RTX, bạn có thể truy vấn…

Hướng dẫn build một cụm GPU cho AI

GPU Cluster là gì? GPU Cluster (cụm các máy chủ GPU) là một nhóm máy tính được trang bị GPU trên từng node. Nhiều GPU cung cấp sức mạnh điện toán tăng tốc cho các tác vụ tính toán cụ thể, chẳng hạn như xử lý hình ảnh và video cũng như đào tạo mạng lưới thần…

Đưa dữ liệu cần bảo vệ từ môi trường on-premise lên public cloud với giải pháp Storware

NGUYÊN TẮC Đảm bảo tăng cường độ an toàn của dữ liệu Sao lưu dữ liệu (Backup) Dữ liệu sao lưu được lưu ở những địa điểm khác với địa điểm đang đặt các máy chủ lưu trữ dữ liệu trong hệ thống Quản trị dữ liệu (QTDL) hoặc trên các máy chủ Ứng dụng…

GDDR6 vs HBM – Định nghĩa các loại bộ nhớ GPU

Kiến thức cơ bản về bộ nhớ GPU Khi nói đến bộ xử lý đồ họa (GPU), đặc biệt là đối với các tải xử lý nhạy cảm về độ trễ, chủng loại bộ nhớ có tác động đáng kể đến hiệu suất của hệ thống. Bộ nhớ GPU thường được gọi là VRAM, Video…

Tóm tắt buổi Keynote của NVIDIA GTC 2024

Phiên Keynote của GTC 2024 do CEO NVIDIA Jensen Huang trình bày vừa diễn ra vào lúc 3:00 AM ngày 19/3/2024, giờ Việt Nam. Đây sẽ là một năm quan trọng đối với NVIDIA khi các sản phẩm thế hệ Hopper và Ampere hiện tại của họ ngày càng cũ hơn trên thị trường và…