Hãng công nghệ hàng đầu Hewlett Packard Enterprise (HPE) đã thực hiện những bước đầu tiên trong làn sóng AI Cloud bằng việc ra mắt HPE GreenLake for Large Language Models (LLMs). Dịch vụ cloud tiên tiến này nhằm mục đích cung cấp các khả năng triển khai, tinh chỉnh và đào tạo mô hình AI…
AI – HPC
Những GPU nào tốt nhất cho suy luận AI?
Không có câu trả lời rạch ròi nào cho việc chọn GPU nào là tốt nhất để suy luận AI (inference), vì các GPU khác nhau có thể có những ưu điểm và nhược điểm khác nhau tùy thuộc vào loại, kích thước và độ phức tạp của mô hình bạn muốn chạy. Tuy nhiên,…
Dell và NVIDIA mang Generative AI đến gần hơn với doanh nghiệp
Sự gia tăng mạnh mẽ về mức độ phổ biến xung quanh ChatGPT và Generative AI (hay GenAI) đang đạt đến đỉnh cao về lợi ích của khách hàng và doanh nghiệp. Các doanh nghiệp nhận thấy tiềm năng gia tăng năng suất thực tiễn với GenAI, mở khóa giá trị dữ liệu giúp tăng tốc…
NVIDIA Spectrum-X: Tăng tốc mạnh mẽ hiệu suất AI và năng lượng trong Trung tâm Dữ liệu
Nền tảng mạng NVIDIA Spectrum™-X là nền tảng Ethernet đầu tiên được thiết kế đặc biệt để cải thiện hiệu suất và hiệu quả của đám mây trí tuệ nhân tạo dựa trên Ethernet. Công nghệ đột phá này đạt được hiệu suất tổng thể của AI tốt hơn 1.7 lần và hiệu suất năng…
NVIDIA công bố DGX GH200: Hệ thống có bộ nhớ GPU 100 Terabyte đầu tiên
NVIDIA vừa công bố hệ thống DGX GH200 tại COMPUTEX 2023, đánh dấu một bước đột phá khác trong điện toán tăng tốc qua GPU nhằm cung cấp sức mạnh cho các hệ thống AI cực lớn có đòi hỏi khắt khe nhất. Bài viết này sẽ mô tả các khía cạnh quan trọng của kiến trúc…
COMPUTEX 2023: Giám đốc điều hành NVIDIA tiết lộ nền tảng AI thế hệ mới cho mọi lĩnh vực
Bài phát biểu chính của vị CEO NVIDIA từ COMPUTEX đã giới thiệu các hệ thống, phần mềm và dịch vụ mới – nhiều hệ thống được cung cấp bởi các siêu chip Grace Hopper – để khai thác Generative AI, công nghệ mang tính biến đổi nhất của thời đại chúng ta. Trong bài…
Nền tảng tăng tốc Ethernet của NVIDIA dành cho Generative AI cấp độ hyperscale
Nền tảng mạng hiệu suất cao NVIDIA Spectrum-X mới kết hợp NVIDIA Spectrum-4, BlueField-3 DPU và phần mềm tăng tốc được NVIDIA công bố; Các nhà cung cấp dịch vụ cloud hàng đầu thế giới áp dụng nền tảng tăng tốc này để mở rộng các dịch vụ Generative AI. Tại COMPUTEX 2023, NVIDIA đã…
NVIDIA MGX – Kiến trúc điện toán tăng tốc module hóa dành cho các nhà sản xuất máy chủ
QCT và Supermicro là một trong số những hãng đầu tiên sử dụng đặc tả kỹ thuật máy chủ NVIDIA MGX, cho phép hơn 100 cấu hình hệ thống chuyên dụng cho việc tăng tốc các tải xử lý AI, HPC và Omniverse. Để đáp ứng nhu cầu điện toán tăng tốc đa dạng của…
SXM vs PCIe: GPU tốt nhất dành cho đào tạo LLM như GPT-4
NLP và LLM là gì? Xử lý ngôn ngữ tự nhiên (NLP) là một nhánh của Trí tuệ nhân tạo (AI) cho phép máy móc hiểu và diễn giải ngôn ngữ của con người. Những tiến bộ gần đây trong Học sâu đã dẫn đến sự xuất hiện của các Mô hình ngôn ngữ lớn (LLM),…
H100 – GPU đầu bảng của NVIDIA có thể làm được gì?
GPU H100, được xây dựng trên kiến trúc NVIDIA Hopper tiên tiến, là lựa chọn lý tưởng cho các ứng dụng chuyên sâu yêu cầu tốc độ xử lý cao. Với Tensor Core thế hệ thứ tư, H100 cung cấp khả năng đào tạo AI nhanh hơn đến 5 lần và tốc độ suy luận AI nhanh…