Để chọn đúng GPU cho các công cụ AI tạo sinh (Generative AI), bạn cần xem xét một số yếu tố như thuật toán cụ thể bạn sẽ sử dụng, kích thước của các mô hình bạn sẽ làm việc, và giới hạn về ngân sách. Dưới đây là một số bước bạn có thể…
Tổng hợp
NVIDIA với ý tưởng về “Premium AI PC” được hỗ trợ bởi GPU GeForce
Đây có thể là một nội dung hé lộ về những gì Jensen đang chuẩn bị cho bài phát biểu trước thềm Computex vào tháng tới. Cuộc cách mạng AI, như nhiều công ty phần cứng PC kỳ vọng, đã bắt đầu với sự phổ biến ngày càng tăng của các chatbot AI và…
Tính năng Encryption của ổ cứng SSD bảo vệ dữ liệu doanh nghiệp như thế nào?
Việc ổ cứng SSD chứa dữ liệu rơi vào tay kẻ xấu là điều rất dễ xảy ra. Cơ chế mã hóa phổ biến trong SSD là một công cụ mạnh mẽ để bảo vệ dữ liệu quan trọng của doanh nghiệp hay cá nhân. Các loại ổ cứng SSD được mã hóa đã tồn…
Máy chủ Supermicro X14: Hiệu suất mạnh mẽ, hiệu quả tối đa cho AI, Cloud, Storage, 5G/Edge
Tại Intel Vision 2024, Supermicro, một nhà cung cấp giải pháp IT toàn diện cho Cloud, AI/ML, Lưu trữ và 5G/Edge đã công bố danh mục máy chủ X14 với sự hỗ trợ trong tương lai cho bộ xử lý Intel® Xeon® 6. Sự kết hợp giữa Kiến trúc khối xây dựng của Supermicro, các giải…
Đưa dữ liệu cần bảo vệ từ môi trường on-premise lên public cloud với giải pháp Storware
NGUYÊN TẮC Đảm bảo tăng cường độ an toàn của dữ liệu Sao lưu dữ liệu (Backup) Dữ liệu sao lưu được lưu ở những địa điểm khác với địa điểm đang đặt các máy chủ lưu trữ dữ liệu trong hệ thống Quản trị dữ liệu (QTDL) hoặc trên các máy chủ Ứng dụng…
Suy luận AI trên các máy chủ thông dụng của HPE, Dell và Supermicro
Inference (suy luận) là workload quan trọng trong các ứng dụng của Trí tuệ Nhân tạo. Inference giúp xử lý các tác vụ phân loại, nhận dạng và dự đoán trong thời gian thực trên dữ liệu đầu vào. Nó là một tập hợp các giải pháp công nghệ phần cứng và phần mềm, bao…
NVIDIA Hopper tiếp tục dẫn đầu hiệu suất Generative AI trong MLPerf
Các bài test tiêu chuẩn ngành cho thấy các hệ thống dựa trên NVIDIA Hopper chạy phần mềm TensorRT-LLM sẽ cung cấp nền tảng mạnh mẽ nhất thế giới đối với Generative AI. NVIDIA đã cung cấp nền tảng nhanh nhất thế giới trong các bài test tiêu chuẩn ngành về khả năng suy luận…
NVIDIA Omniverse ft Apple Vision Pro: Mở rộng thế giới quan với VR/AR
Một trong những tin tức đáng chú ý tại hội nghị AI toàn cầu GTC 24, NVIDIA vừa giới thiệu bộ công cụ phần mềm mới cho phép các nhà phát triển dễ dàng tích hợp mô hình kỹ thuật số song song thực tế (digital twin) công nghiệp dựa trên OpenUSD vào Apple Vision…
NVIDIA HGX AI Supercomputer: Nền tảng điện toán AI hàng đầu thế giới
Trong thế giới của Trí tuệ Nhân tạo (AI), mô phỏng phức tạp và các tập dữ liệu lớn đòi hỏi nhiều GPU với kết nối nhanh chóng và một bộ cài đặt phần mềm được tối ưu hoàn toàn. Nền tảng siêu máy tính AI NVIDIA HGX™ kết hợp sức mạnh đầy đủ của…
Đơn giản hóa phát triển Generative AI tuỳ chỉnh với NVIDIA NeMo Microservices
Trên toàn cầu, các doanh nghiệp đang dần nhận ra những lợi ích của các mô hình Generative AI (GenAI). Họ đang chạy đua để áp dụng những mô hình này vào nhiều ứng dụng khác nhau, chẳng hạn như chatbot, trợ lý ảo hay các coding copilot,… Mặc dù các mô hình có mục đích chung (general-purpose)…