Kubernetes là một nền tảng mã nguồn mở để tự động hóa việc điều phối các triển khai container, mở rộng quy mô và quản lý các ứng dụng bên trong container. Kubernetes là gì? Kubernetes cung cấp một framework cho việc triển khai, quản lý, co dãn quy mô và chuyển đổi dự phòng của…
Tất cả bạn cần là chỉ một GPU: Đánh giá hiệu suất inference cho Stable Diffusion
Những gì tôi cần để chạy các mô hình text-to-image mới nhất? Liệu có thể dùng các card gaming để thực hiện công việc này? Hay phải cần đến một chiếc GPU A100 cao cấp? Nếu hệ thống chỉ có một CPU thì sao? Đây là những câu hỏi thường xuyên gặp phải khi khách…
Cấu hình tối ưu cho tải xử lý hiệu năng cao trên các máy chủ GPU PCIe Supermicro
Các máy chủ GPU mang lại lợi ích rất lớn về hiệu suất đối với các ứng dụng Trí tuệ nhân tạo (AI) và điện toán hiệu năng cao (HPC) so với máy chủ truyền thống chỉ có CPU. Rất nhiều các ứng dụng khác nhau có thể được thực thi trên những hệ thống…
Giải pháp mạng tốc độ cao NDR 400G/800G của NVIDIA Networking
Trí tuệ nhân tạo (AI), một lĩnh vực đã có từ rất lâu, đã thực sự trải qua một cuộc cách mạng mang tính đột phá trong thời gian gần đây. Trong số các công nghệ AI nổi bật, đặc biệt như ChatGPT, đã bắt đầu tạo ra sự thay đổi to lớn trong cách…
Cách triển khai chatbot GPT trên K8s với giao diện Gradio
Các mô hình ngôn ngữ lớn (LLM) đang chen sâu vào cuộc sống của chúng ta. Ý tôi không phải là theo nghĩa đen (ít nhất là trong thời điểm hiện tại), mà đúng hơn là có vẻ như mỗi ngày đều có vô số mô hình và ứng dụng mới xuất hiện. Sự khởi đầu tưởng chừng…
NVIDIA RAPIDS: Khoa học dữ liệu ở hiệu suất cao
Khai thác sức mạnh của GPU để dễ dàng tăng tốc các quy trình làm việc Khoa học dữ liệu (data science), Học máy (machine learning) và AI của bạn. Thực thi toàn bộ quy trình làm việc Khoa học dữ liệu với sự hỗ trợ xử lý của GPU tốc độ cao, nạp dữ…
Supermicro server thế hệ H13: Sức mạnh tối ưu cho hạ tầng Cloud và HPC
San Jose, California, Supermicro, nhà cung cấp Giải pháp Tổng thể về Công nghệ Thông tin cho Điện toán đám mây, Trí tuệ Nhân tạo/Học máy, Lưu trữ, và 5G/Edge, tiết lộ rằng toàn bộ dòng sản phẩm H13 dựa trên AMD của họ hiện đã hỗ trợ bộ vi xử lý AMD EPYC thế…
QNAP ra mắt hệ điều hành QuTS Hero h5.1.0: tối ưu hiệu suất lưu trữ dựa trên ZFS
QNAP vừa cho phát hành phiên bản QuTS hero h5.1.0, là hệ điều hành NAS (Network Attached Storage) dựa trên ZFS mới nhất của QNAP. Các tính năng và cập nhật mới trong phiên bản này tăng cường hiệu suất hệ thống tổng thể, cải thiện khả năng lưu trữ dữ liệu lớn cũng như…
AI đang hỗ trợ cho tương lai của năng lượng sạch như thế nào?
Video mới “I AM AI” nêu bật cách NVIDIA và các đối tác giúp quản lý năng lượng tái tạo trên quy mô lớn bằng việc sử dụng các công nghệ mới nhất. Trí tuệ nhân tạo (AI) đang cải thiện các cách cung cấp năng lượng cho thế giới bằng việc khai thác từ…
Cần bao nhiêu bộ thu phát quang cho một GPU?
Trên thị trường, có các phiên bản khác nhau về tỷ lệ của bộ thu phát quang so với số lượng GPU và số liệu của các phiên bản khác nhau không nhất quán chủ yếu do số lượng mô-đun quang học cần thiết trong các kiến trúc mạng khác nhau là không giống nhau….
