Trí tuệ nhân tạo (AI) ngày càng phổ biến, nhanh chóng trở thành một công nghệ thiết yếu được sử dụng trong nhiều ngành công nghiệp khác nhau và các nhà phát triển, khoa học sẽ rất cần các hạ tầng AI tiên tiến để thực thi và phát triển các ứng dụng mới. Với SYS-751GE-TNRT-NV1, nền…
AI – HPC
NVIDIA H100 đặt tiêu chuẩn cho Generative AI với điểm benchmark MLPerf
Người dùng chuyên sâu và các chuẩn benchmark đầu ngành đều cho thấy: Các GPU NVIDIA H100 Tensor Core mang lại hiệu suất AI tốt nhất, đặc biệt là trên các mô hình ngôn ngữ lớn (LLM) – thứ cung cấp sức mạnh cho AI tạo sinh (Generative AI). GPU NVIDIA H100 đã thiết lập những…
HPE GreenLake for Large Language Models: Mang AI đến với nhiều tổ chức hơn
Hãng công nghệ hàng đầu Hewlett Packard Enterprise (HPE) đã thực hiện những bước đầu tiên trong làn sóng AI Cloud bằng việc ra mắt HPE GreenLake for Large Language Models (LLMs). Dịch vụ cloud tiên tiến này nhằm mục đích cung cấp các khả năng triển khai, tinh chỉnh và đào tạo mô hình AI…
Những GPU nào tốt nhất cho suy luận AI?
Không có câu trả lời rạch ròi nào cho việc chọn GPU nào là tốt nhất để suy luận AI (inference), vì các GPU khác nhau có thể có những ưu điểm và nhược điểm khác nhau tùy thuộc vào loại, kích thước và độ phức tạp của mô hình bạn muốn chạy. Tuy nhiên,…
Dell và NVIDIA mang Generative AI đến gần hơn với doanh nghiệp
Sự gia tăng mạnh mẽ về mức độ phổ biến xung quanh ChatGPT và Generative AI (hay GenAI) đang đạt đến đỉnh cao về lợi ích của khách hàng và doanh nghiệp. Các doanh nghiệp nhận thấy tiềm năng gia tăng năng suất thực tiễn với GenAI, mở khóa giá trị dữ liệu giúp tăng tốc…
NVIDIA Spectrum-X: Tăng tốc mạnh mẽ hiệu suất AI và năng lượng trong Trung tâm Dữ liệu
Nền tảng mạng NVIDIA Spectrum™-X là nền tảng Ethernet đầu tiên được thiết kế đặc biệt để cải thiện hiệu suất và hiệu quả của đám mây trí tuệ nhân tạo dựa trên Ethernet. Công nghệ đột phá này đạt được hiệu suất tổng thể của AI tốt hơn 1.7 lần và hiệu suất năng…
NVIDIA công bố DGX GH200: Hệ thống có bộ nhớ GPU 100 Terabyte đầu tiên
NVIDIA vừa công bố hệ thống DGX GH200 tại COMPUTEX 2023, đánh dấu một bước đột phá khác trong điện toán tăng tốc qua GPU nhằm cung cấp sức mạnh cho các hệ thống AI cực lớn có đòi hỏi khắt khe nhất. Bài viết này sẽ mô tả các khía cạnh quan trọng của kiến trúc…
COMPUTEX 2023: Giám đốc điều hành NVIDIA tiết lộ nền tảng AI thế hệ mới cho mọi lĩnh vực
Bài phát biểu chính của vị CEO NVIDIA từ COMPUTEX đã giới thiệu các hệ thống, phần mềm và dịch vụ mới – nhiều hệ thống được cung cấp bởi các siêu chip Grace Hopper – để khai thác Generative AI, công nghệ mang tính biến đổi nhất của thời đại chúng ta. Trong bài…
Nền tảng tăng tốc Ethernet của NVIDIA dành cho Generative AI cấp độ hyperscale
Nền tảng mạng hiệu suất cao NVIDIA Spectrum-X mới kết hợp NVIDIA Spectrum-4, BlueField-3 DPU và phần mềm tăng tốc được NVIDIA công bố; Các nhà cung cấp dịch vụ cloud hàng đầu thế giới áp dụng nền tảng tăng tốc này để mở rộng các dịch vụ Generative AI. Tại COMPUTEX 2023, NVIDIA đã…
NVIDIA MGX – Kiến trúc điện toán tăng tốc module hóa dành cho các nhà sản xuất máy chủ
NVIDIA MGX là gì? NVIDIA MGX là một kiến trúc máy chủ mô-đun (modular server architecture) được NVIDIA tạo ra để giúp các nhà sản xuất hệ thống xây dựng các máy chủ hiệu suất cao cho trí tuệ nhân tạo (AI), điện toán hiệu năng cao (HPC) và các tác vụ đám mây một…
