Bắt tay vào hành trình Generative AI (GenAI), sự kết hợp mang tính đột phá giữa Trí tuệ nhân tạo và dữ liệu phi cấu trúc (unstructured data) đòi hỏi một kiến trúc lưu trữ mạnh mẽ có khả năng điều hướng sự phức tạp và mở rộng quy mô đi cùng với sự đổi…
Hướng dẫn build một cụm GPU cho AI
GPU Cluster là gì? GPU Cluster (cụm các máy chủ GPU) là một nhóm máy tính được trang bị GPU trên từng node. Nhiều GPU cung cấp sức mạnh điện toán tăng tốc cho các tác vụ tính toán cụ thể, chẳng hạn như xử lý hình ảnh và video cũng như đào tạo mạng lưới thần…
Đưa dữ liệu cần bảo vệ từ môi trường on-premise lên public cloud với giải pháp Storware
NGUYÊN TẮC Đảm bảo tăng cường độ an toàn của dữ liệu Sao lưu dữ liệu (Backup) Dữ liệu sao lưu được lưu ở những địa điểm khác với địa điểm đang đặt các máy chủ lưu trữ dữ liệu trong hệ thống Quản trị dữ liệu (QTDL) hoặc trên các máy chủ Ứng dụng…
Suy luận AI trên các máy chủ thông dụng của HPE, Dell và Supermicro
Inference (suy luận) là workload quan trọng trong các ứng dụng của Trí tuệ Nhân tạo. Inference giúp xử lý các tác vụ phân loại, nhận dạng và dự đoán trong thời gian thực trên dữ liệu đầu vào. Nó là một tập hợp các giải pháp công nghệ phần cứng và phần mềm, bao…
NVIDIA Hopper tiếp tục dẫn đầu hiệu suất Generative AI trong MLPerf
Các bài test tiêu chuẩn ngành cho thấy các hệ thống dựa trên NVIDIA Hopper chạy phần mềm TensorRT-LLM sẽ cung cấp nền tảng mạnh mẽ nhất thế giới đối với Generative AI. NVIDIA đã cung cấp nền tảng nhanh nhất thế giới trong các bài test tiêu chuẩn ngành về khả năng suy luận…
GDDR6 vs HBM – Định nghĩa các loại bộ nhớ GPU
Kiến thức cơ bản về bộ nhớ GPU Khi nói đến bộ xử lý đồ họa (GPU), đặc biệt là đối với các tải xử lý nhạy cảm về độ trễ, chủng loại bộ nhớ có tác động đáng kể đến hiệu suất của hệ thống. Bộ nhớ GPU thường được gọi là VRAM, Video…
NVIDIA hỗ trợ hành trình hướng tới Generative AI thuận lợi hơn cho các doanh nghiệp
NVIDIA AI Enterprise 5.0 bao gồm các cloud API dành cho suy luận (inference) và những dịch vụ khác, mở đường cho các ứng dụng được AI hỗ trợ. Nền tảng AI của NVIDIA sẵn có cho mọi doanh nghiệp có tư duy tiến bộ – và nó dễ sử dụng hơn bao giờ hết….
NVIDIA Omniverse ft Apple Vision Pro: Mở rộng thế giới quan với VR/AR
Một trong những tin tức đáng chú ý tại hội nghị AI toàn cầu GTC 24, NVIDIA vừa giới thiệu bộ công cụ phần mềm mới cho phép các nhà phát triển dễ dàng tích hợp mô hình kỹ thuật số song song thực tế (digital twin) công nghiệp dựa trên OpenUSD vào Apple Vision…
NVIDIA NIM: Vi dịch vụ suy luận tối ưu hóa cho triển khai mô hình AI quy mô lớn
Sự gia tăng trong việc ứng dụng AI tạo sinh (Generative AI) là rất đáng chú ý trong thời gian gần đây. Được kích hoạt bởi sự ra mắt ChatGPT của OpenAI vào năm 2022, công nghệ mới này đã thu hút hơn 100 triệu người dùng trong vòng vài tháng và thúc đẩy các hoạt động phát…
NVIDIA HGX AI Supercomputer: Nền tảng điện toán AI hàng đầu thế giới
Trong thế giới của Trí tuệ Nhân tạo (AI), mô phỏng phức tạp và các tập dữ liệu lớn đòi hỏi nhiều GPU với kết nối nhanh chóng và một bộ cài đặt phần mềm được tối ưu hoàn toàn. Nền tảng siêu máy tính AI NVIDIA HGX™ kết hợp sức mạnh đầy đủ của…