QNAP QAI-h1290FX – Máy chủ Edge AI All-Flash cho LLM riêng, RAG và AI tạo sinh

QNAP® Systems, Inc., nhà tiên phong trong lĩnh vực giải pháp điện toán, mạng và lưu trữ, vừa chính thức giới thiệu QAI-h1290FX – máy chủ lưu trữ Edge AI thế hệ mới được thiết kế cho các doanh nghiệp muốn triển khai mô hình ngôn ngữ lớn riêng tư (Private LLM), công cụ tìm kiếm Retrieval-Augmented Generation (RAG) và các ứng dụng AI tạo sinh ngay tại hạ tầng nội bộ.

Trong bối cảnh doanh nghiệp ngày càng quan tâm đến bảo mật dữ liệu, độ trễ thấp và khả năng kiểm soát toàn bộ quy trình AI, QAI-h1290FX mang đến một nền tảng hội tụ giữa lưu trữ all-flash tốc độ cao, điện toán máy chủtăng tốc GPU NVIDIA® RTX™. Thiết bị được trang bị bộ xử lý AMD EPYC™, hỗ trợ GPU NVIDIA RTX PRO™ Blackwell, cùng 12 khay SSD U.2 NVMe/SATA, đáp ứng nhu cầu xử lý suy luận AI, tìm kiếm tri thức nội bộ, ảo hóa và các workload tính toán chuyên sâu.

Vận hành trên hệ điều hành QuTS hero dựa trên ZFS, QAI-h1290FX cung cấp khả năng bảo toàn dữ liệu cấp doanh nghiệp, snapshot gần như không giới hạn, inline deduplication và các cơ chế bảo vệ dữ liệu quan trọng. Bên cạnh đó, thiết bị hỗ trợ truy cập GPU trực tiếp trong container thông qua Container Station và GPU passthrough cho máy ảo thông qua Virtualization Station, giúp đội ngũ IT, lập trình viên và nhóm nghiên cứu triển khai môi trường AI linh hoạt hơn.

QAI-h1290FX đáp ứng nhu cầu ngày càng tăng về hạ tầng AI tại chỗ,” ông Oliver Lam, Quản lý Sản phẩm tại QNAP cho biết. “Chúng tôi muốn loại bỏ những rào cản trong việc xây dựng workstation GPU, cài đặt công cụ và cấu hình môi trường phức tạp. Với QAI-h1290FX, người dùng có thể triển khai và chạy các mô hình AI ngay lập tức—kiểm soát hoàn toàn dữ liệu của mình và không phụ thuộc vào đám mây.”

Tính năng nổi bật của QAI-h1290FX

  • Lưu trữ All-Flash tốc độ cao: QAI-h1290FX được trang bị 12 khe SSD U.2 NVMe/SATA, đáp ứng nhu cầu I/O lớn cho các tác vụ AI, chạy mô hình thường xuyên và truyền tải dữ liệu tốc độ cao.
  • CPU AMD EPYC™ 7302P 16 nhân: Bộ xử lý máy chủ AMD EPYC™ 7302P với 32 luồng, phù hợp cho suy luận AI, ảo hóa và các tác vụ xử lý song song.
  • Sẵn sàng cho GPU NVIDIA RTX PRO™: Thiết bị hỗ trợ tùy chọn GPU NVIDIA RTX PRO™ 6000 Blackwell Max-Q Workstation, bộ nhớ GPU lên đến 96GB, hỗ trợ CUDA®, TensorRT™ và Transformer Engine, giúp tăng tốc LLM, tạo ảnh AI và deep learning.
  • Môi trường AI dạng container: Hỗ trợ Docker, LXD và phân bổ GPU trực quan, cho phép người dùng khởi chạy nhanh các công cụ AI mà không cần cấu hình dòng lệnh phức tạp.
  • Triển khai AI tại chỗ, không phụ thuộc cloud: Doanh nghiệp có thể chạy chatbot AI, công cụ tìm kiếm tài liệu hoặc cơ sở tri thức nội bộ ngay tại chỗ, giúp giữ dữ liệu nhạy cảm trong hệ thống riêng.
  • Kết nối mạng tốc độ cao, dễ mở rộng: QAI-h1290FX tích hợp 2 cổng 25GbE và 2 cổng 2.5GbE, hỗ trợ nâng cấp 100GbE qua PCIe và mở rộng dung lượng với JBOD QNAP.

Ứng dụng tiêu biểu

  • Trợ lý AI nội bộ: Triển khai giao diện chat AI phục vụ tra cứu kiến thức, đào tạo nhân viên và hỏi đáp chính sách trong phạm vi doanh nghiệp.
  • Tìm kiếm RAG doanh nghiệp: Xây dựng pipeline RAG riêng tư để tìm kiếm nhanh theo ngữ cảnh trên hợp đồng, báo cáo và tài liệu nội bộ.
  • Tạo hình ảnh bằng AI: Hỗ trợ chạy Stable Diffusion hoặc ComfyUI cho đội ngũ thiết kế, marketing và sáng tạo nội dung.
  • Tự động hóa CNTT với AI: Sử dụng n8n để tự động hóa các tác vụ suy luận, tạo nội dung, cảnh báo và tích hợp AI vào quy trình vận hành.

 

Sản phẩm QNAP QAI-h1290FX sẽ được bảo hành 5 năm.

Để có thể đặt hàng, truy cập ngay QAI-h1290FX

____
Bài viết liên quan
Góp ý / Liên hệ tác giả