Giới thiệu Hạ tầng AI, với vai trò là trục xương sống của những tiến bộ công nghệ hiện đại, đã phát triển đáng kể từ các triển khai tại chỗ truyền thống để tiến tới các giải pháp tiên tiến như điện toán đám mây và điện toán biên. Tuy nhiên, khi AI ngày…
AI – HPC
Cải thiện khả năng làm mát GPU trong hạ tầng AI
Làm mát GPU là một khía cạnh quan trọng của thiết kế hạ tầng AI thường bị bỏ qua. Các yêu cầu về công suất và năng lực giải nhiệt khắt khe của hệ thống HPC và AI đóng vai trò quan trọng trong việc xác định hiệu suất và tuổi thọ của hệ thống….
Triển khai giải pháp Generative AI image-to-text tại biên
Khi trí tuệ nhân tạo tiếp tục phát triển lên những cột mốc mới, việc kết hợp phân tích dữ liệu hình ảnh với xử lý ngôn ngữ tự nhiên đã trở thành một bước tiến “mang tính chuyển đổi” cho các doanh nghiệp ứng dụng sớm công nghệ AI. Một giải pháp trong lĩnh…
Các chuyên gia AI của NVIDIA dự báo gì cho năm 2025
Từ các phòng họp cho đến phòng giải lao, AI đang tạo ra cơn sốt trong năm nay, tiếp tục khuấy động các cuộc thảo luận trên khắp các ngành về cách khai thác tốt nhất công nghệ này nhằm tăng cường đổi mới và sáng tạo, cải thiện dịch vụ khách hàng, chuyển đổi…
AI Agent là gì?
Các AI Agent (nhân viên AI) được cho là sẽ là “điều lớn lao tiếp theo” trong AI, nhưng hiện vẫn chưa có định nghĩa chính xác về chúng. Cho đến thời điểm này, mọi người vẫn chưa thể thống nhất về những gì cấu thành nên một nhân viên AI. Nói một cách đơn…
Trí tuệ Nhân tạo: Hiện trạng và xu hướng việc làm tiềm năng trong năm 2025
Trí tuệ nhân tạo (AI) là một trong những công nghệ mang tính đột phá nhất của thế kỷ 21. Từ chỗ chỉ xuất hiện trong các phòng thí nghiệm và tiểu thuyết khoa học viễn tưởng, AI đã thâm nhập vào hầu hết mọi khía cạnh của cuộc sống hiện đại. Từ trợ lý…
Sovereign AI là gì?
Nhiều quốc gia từ lâu đã đầu tư vào hạ tầng trong nước để phát triển nền kinh tế, kiểm soát dữ liệu của riêng họ và tận dụng các cơ hội từ công nghệ trong các lĩnh vực như giao thông vận tải, truyền thông, thương mại, giải trí và y tế. AI, công…
CPU, GPU, TPU và sự khác biệt giữa chúng
Trí tuệ nhân tạo và công nghệ học máy đã và đang thúc đẩy sự tiến bộ của các ứng dụng thông minh. Để đối phó với các ứng dụng ngày càng phức tạp, các công ty bán dẫn liên tục phát triển bộ xử lý và bộ tăng tốc, bao gồm CPU, GPU và…
Infortrend GS 5000U: Một lựa chọn lưu trữ tối ưu cho đào tạo mô hình AI
Tải xử lý AI có hai giai đoạn quan trọng: • Đào tạo/huấn luyện mô hình (AI model training), trong đó các thuật toán được đào tạo từ các tập dữ liệu lớn để nhận dạng các mẫu hình (pattern), • Suy luận (Inferencing), trong đó các mô hình đã được đào tạo vận dụng các mẫu…
GPUDirect RDMA là gì?
NVIDIA GPUDirect RDMA là gì? NVIDIA GPUDirect RDMA (Remote Direct Memory Access) là một thành phần của giải pháp công nghệ NVIDIA Magnum IO, cho phép truyền dữ liệu nhanh chóng giữa GPU và các thiết bị khác mà không cần đến khả năng xử lý của CPU hay bộ nhớ chính. Trong cách thức truyền…