AI, học máy (ML) và điện toán hiệu năng cao (HPC) đang được đẩy mạnh để cách mạng hóa toàn bộ lĩnh vực của nền kinh tế và xã hội. Từ nghiên cứu và phát triển, y tế và khoa học đời sống cũng như phương tiện tự hành – đến chatbot dịch vụ khách…
AI – HPC
Nền tảng NVIDIA Blackwell vượt qua ranh giới của điện toán khoa học
Các bộ tăng tốc và kết nối mạng mới nhất cải thiện hiệu suất cho các mô phỏng nâng cao, AI, điện toán lượng tử, phân tích dữ liệu… Điện toán lượng tử, Nghiên cứu chế tạo thuốc, Năng lượng dung hợp, Điện toán khoa học và Mô phỏng dựa trên vật lý sẵn sàng…
Tạo chatbot trên dữ liệu của riêng bạn với NVIDIA ChatRTX
ChatRTX là gì? ChatRTX là một ứng dụng demo cho phép bạn cá nhân hóa mô hình ngôn ngữ lớn GPT (LLM) được kết nối với nội dung của riêng bạn — tài liệu, ghi chú, hình ảnh hoặc các dữ liệu khác. Tận dụng công nghệ Retrieval-Augmented Generation (RAG), TensorRT-LLM và RTX, bạn có thể truy vấn…
Làm cách nào lựa chọn GPU phù hợp cho các công cụ AI tạo sinh?
Để chọn đúng GPU cho các công cụ AI tạo sinh (Generative AI), bạn cần xem xét một số yếu tố như thuật toán cụ thể bạn sẽ sử dụng, kích thước của các mô hình bạn sẽ làm việc, và giới hạn về ngân sách. Dưới đây là một số bước bạn có thể…
GPU NVIDIA RTX A400 và A1000 mới giúp nâng cao hiệu quả quy trình thiết kế được hỗ trợ bởi AI
Được xây dựng trên kiến trúc NVIDIA Ampere, GPU mới cung cấp khả năng dò tia theo thời gian thực và hỗ trợ các công cụ AI tạo sinh (Generative AI) cho mọi máy trạm. Tích hợp AI trên các ứng dụng thiết kế và năng suất đang trở thành tiêu chuẩn mới, thúc đẩy…
Giới thiệu giải pháp Training AI trên các máy chủ thông dụng
Training AI (Huấn luyện AI) là quá trình cung cấp dữ liệu cho một mô hình AI để nó có thể học cách thực hiện một nhiệm vụ cụ thể. Dữ liệu này có thể bao gồm văn bản, hình ảnh, âm thanh, video hoặc bất kỳ loại dữ liệu nào khác có liên quan…
Máy chủ Supermicro X14: Hiệu suất mạnh mẽ, hiệu quả tối đa cho AI, Cloud, Storage, 5G/Edge
Tại Intel Vision 2024, Supermicro, một nhà cung cấp giải pháp IT toàn diện cho Cloud, AI/ML, Lưu trữ và 5G/Edge đã công bố danh mục máy chủ X14 với sự hỗ trợ trong tương lai cho bộ xử lý Intel® Xeon® 6. Sự kết hợp giữa Kiến trúc khối xây dựng của Supermicro, các giải…
PowerScale: Nền tảng kiến trúc cho các tác vụ Generative AI
Bắt tay vào hành trình Generative AI (GenAI), sự kết hợp mang tính đột phá giữa Trí tuệ nhân tạo và dữ liệu phi cấu trúc (unstructured data) đòi hỏi một kiến trúc lưu trữ mạnh mẽ có khả năng điều hướng sự phức tạp và mở rộng quy mô đi cùng với sự đổi…
Hướng dẫn build một cụm GPU cho AI
GPU Cluster là gì? GPU Cluster (cụm các máy chủ GPU) là một nhóm máy tính được trang bị GPU trên từng node. Nhiều GPU cung cấp sức mạnh điện toán tăng tốc cho các tác vụ tính toán cụ thể, chẳng hạn như xử lý hình ảnh và video cũng như đào tạo mạng lưới thần…
Suy luận AI trên các máy chủ thông dụng của HPE, Dell và Supermicro
Inference (suy luận) là workload quan trọng trong các ứng dụng của Trí tuệ Nhân tạo. Inference giúp xử lý các tác vụ phân loại, nhận dạng và dự đoán trong thời gian thực trên dữ liệu đầu vào. Nó là một tập hợp các giải pháp công nghệ phần cứng và phần mềm, bao…