Trong thế giới điện toán hiệu năng cao (HPC) và Trí tuệ nhân tạo (AI), cuộc đua không chỉ dừng lại ở sức mạnh xử lý của từng GPU riêng lẻ. Nút thắt cổ chai thực sự, hay “uzkoye mesto” như các kỹ sư thường gọi, nằm ở khả năng giao tiếp và trao đổi…
Author: Vanito Hoang
Agentic AI: Từ ‘cơn sốt’ đến giá trị thực tế – Hướng dẫn triển khai cho doanh nghiệp
AI tác nhân (Agentic AI) đang là làn sóng công nghệ mới nhất, hứa hẹn phá vỡ mọi giới hạn về những gì AI có thể làm. Vượt xa các bot tự động hóa dựa trên kịch bản hay trợ lý ảo, các AI agent có khả năng tự chủ thực hiện các tác vụ…
AI và Network: Hai mặt của đồng xu định hình hạ tầng tương lai
Trong thế giới công nghệ, AI và hệ thống mạng (network) giống như hai mặt của một đồng xu: không thể tách rời và cùng nhau định hình nên tương lai của hạ tầng số. AI đang được dùng để tự động hóa và tối ưu hóa hệ thống mạng, nhưng ngược lại, chính sự…
SLM và AI tại biên: Bình minh của một kỷ nguyên mới hay chỉ là cơn sốt nhất thời?
Các mô hình ngôn ngữ lớn (LLM) như ChatGPT đã tạo nên một cơn địa chấn trong làng công nghệ, nhưng những người anh em “nhỏ con” hơn, các mô hình ngôn ngữ nhỏ – Small Language Model (SLM), đang âm thầm trỗi dậy. Liệu SLM có phải là lời giải cho bài toán chi…
Lựa chọn hạ tầng lưu trữ cho AI: NAS, SAN, hay Object Storage – Đâu là nền tảng tối ưu?
Trí tuệ nhân tạo (AI) và học máy (Machine Learning) không còn là khái niệm tương lai mà đã trở thành động lực cốt lõi cho sự đổi mới trong mọi ngành công nghiệp. Tuy nhiên, để các mô hình AI có thể hoạt động hiệu quả, chúng đòi hỏi một tài nguyên cực kỳ…
AMD ra mắt EPYC 4005 Series: Đưa sức mạnh doanh nghiệp đến với SMB
Phân khúc doanh nghiệp vừa và nhỏ (SMB) và các nhà cung cấp dịch vụ lưu trữ (hosting provider) vừa có thêm một lựa chọn hấp dẫn khi AMD chính thức trình làng dòng CPU máy chủ EPYC 4005 Series. Với kiến trúc “Zen 5” tiên tiến và mức giá phải chăng, AMD đang cho…
AIC tại Computex 2025: Định hình tương lai AI với hạ tầng điện toán và lưu trữ hiệu suất cao
Computex 2025 một lần nữa khẳng định vai trò là sự kiện hàng đầu của ngành công nghệ toàn cầu, nơi các xu hướng điện toán định hình tương lai được trình làng. Giữa vô số những đổi mới, AIC (Advanced Industrial Computer), một nhà cung cấp kỳ cựu các giải pháp máy chủ, lưu…
So sánh sự khác biệt giữa NVIDIA H200 NVL và NVIDIA H200 HGX
NVIDIA HGX™ H200 mang lại hiệu suất tối đa cho môi trường AI và HPC, trong khi H200 NVL cung cấp giải pháp làm mát bằng không khí, tiêu thụ điện năng thấp hơn với 1, 2, 4 hoặc 8 GPU PCIe được kết nối bằng NVIDIA® NVLink®, mang lại tính linh hoạt cho các…
Computex 2025: Supermicro phô diễn hạ tầng AI và Cloud
Tại sự kiện Computex 2025 vừa qua, đội ngũ của Nhất Tiến Chung đã có dịp ghé thăm gian hàng của Supermicro. “Gã khổng lồ” đang lớn mạnh trong lĩnh vực hạ tầng AI hiệu suất cao này đã mang đến một danh mục sản phẩm toàn diện, từ các hệ thống GPU tối ưu…
Mở rộng quy mô cho hạ tầng GenAI on-premise
Nhu cầu GPU của AI tạo sinh AI đã trở thành một thành phần quan trọng của chiến lược kinh doanh hiện đại. Cho dù đó là đào tạo và tinh chỉnh các mô hình cá nhân của riêng bạn hay sử dụng suy luận AI để chuyển đổi hoạt động kinh doanh, AI là…