Công ty nền tảng dữ liệu AI VAST Data vừa qua đã công bố VAST InsightEngine with NVIDIA, công ty cho biết đây là giải pháp đầu tiên có thể thu thập, xử lý và truy xuất an toàn mọi loại dữ liệu doanh nghiệp (file, object, table và stream) theo thời gian thực.
Là quy trình ứng dụng đầu tiên chạy trên VAST Data Platform, sản phẩm mới được thiết kế để thu thập, nhúng và truy xuất luồng dữ liệu theo thời gian thực, “giúp dữ liệu doanh nghiệp có thể sử dụng ngay lập tức để đưa ra quyết định dựa trên AI”, VAST cho biết.
VAST cũng công bố Cosmos, một cộng đồng những người thực hành AI – các nhà nghiên cứu, đối tác công nghệ, nhà cung cấp dịch vụ và nhà tích hợp giải pháp. VAST cho biết Cosmos hướng đến mục tiêu chuẩn hóa việc áp dụng AI cho các thành viên của mình bằng cách cung cấp một hệ sinh thái tạo điều kiện cho cuộc hội thoại, chia sẻ các ứng dụng và cung cấp các cơ hội học tập thông qua các phòng thí nghiệm, các buổi giới thiệu nhà cung cấp và tin tức nghiên cứu AI nói chung.
Những cái tên tham gia đầu tiên của Cosmos bao gồm NVIDIA, xAI, Supermicro, Deloitte, WWT, Cisco, CoreWeave, Core42, NEA, Impetus, Run:AI và Dremio, cùng với VAST.
Với việc triển khai ngày càng nhiều các mô hình LLM được hỗ trợ bởi Retrieval-augmented Generation (RAG), các tổ chức phải đối mặt với những thách thức lớn và phức tạp về hạ tầng dữ liệu trong việc mở rộng quy mô AI để xử lý và trích xuất thông tin chi tiết hiệu quả từ các tập dữ liệu khổng lồ. Trong khi hàng trăm công ty tập trung vào việc đào tạo LLM, hàng chục nghìn công ty sẽ triển khai RAG. Điều này tạo ra các yêu cầu mới cho hạ tầng có thể phân loại và tìm kiếm trên các tập dữ liệu có cấu trúc và không có cấu trúc cũng như các phương pháp tiếp cận ngữ nghĩa mới, chẳng hạn như biểu đồ vectơ và kiến thức, với nhu cầu về tốc độ, quy mô, tính đơn giản và bảo mật chưa từng có.
VAST InsightEngine with NVIDIA giới thiệu hệ thống hợp nhất đầu tiên có thể xử lý tất cả các chức năng dữ liệu gốc để đơn giản hóa và cung cấp thông tin chi tiết theo thời gian thực được hỗ trợ bởi AI ở quy mô lớn. Nó sẽ có sẵn rộng rãi vào đầu năm 2025.
Sản phẩm mới vận hành các microservices NVIDIA NIM, một phần của nền tảng NVIDIA AI Enterprise, nằm trong VAST Data Platform, nhúng ý nghĩa ngữ nghĩa của dữ liệu đi đến bằng các mô hình tiên tiến được hỗ trợ bởi điện toán tăng tốc NVIDIA. Sau đó, các nhúng vectơ và đồ thị được lưu trữ trong VAST DataBase trong vòng vài mili giây sau khi dữ liệu được thu thập để đảm bảo rằng bất kỳ file, object, table hoặc dữ liệu live streaming mới nào cũng sẵn sàng ngay lập tức cho các hoạt động truy xuất và suy luận AI tiên tiến.
Jeff Denworth, Đồng sáng lập tại VAST Data cho biết: “Với kiến trúc độc đáo của VAST Data Platform, được tích hợp với NVIDIA NIM, chúng tôi giúp các tổ chức dễ dàng trích xuất thông tin chi tiết từ dữ liệu của họ theo thời gian thực” . “Bằng cách hợp nhất tất cả các yếu tố của pipeline truy xuất AI thành một nền tảng dữ liệu doanh nghiệp, VAST Data InsightEngine with NVIDIA là giải pháp đầu tiên trong ngành cung cấp chế độ xem toàn diện về tất cả dữ liệu có cấu trúc và không có cấu trúc của doanh nghiệp để đạt được khả năng ra quyết định tiên tiến hỗ trợ bởi AI”.
“AI tạo sinh với khả năng RAG đã biến đổi cách các doanh nghiệp có thể sử dụng dữ liệu của họ”, Justin Boitano, Phó chủ tịch, AI doanh nghiệp tại NVIDIA cho biết. “Việc tích hợp NVIDIA NIM vào VAST InsightEngine with NVIDIA giúp các doanh nghiệp truy cập dữ liệu an toàn và hiệu quả hơn ở mọi quy mô để nhanh chóng chuyển đổi dữ liệu thành thông tin chi tiết có thể hành động”.
VAST InsightEngine với các tính năng của NVIDIA bao gồm:
- Tích hợp với NVIDIA NIM: Bằng cách khai thác các microservices NVIDIA NIM được tích hợp trong VAST Data Platform, các tổ chức có thể nhúng ý nghĩa ngữ nghĩa từ dữ liệu đến bằng các mô hình chạy trên điện toán tăng tốc NVIDIA. Các bộ nhúng được lưu trữ trong VAST Database trong vòng vài mili giây, giúp tăng tốc thông tin chi tiết và đơn giản hóa các hoạt động của data pipeline bằng cách tự động hóa quy trình làm việc dữ liệu.
- Xử lý dữ liệu theo thời gian thực: InsightEngine sử dụng DataEngine của VAST để kích hoạt tác nhân nhúng NVIDIA NIM ngay khi dữ liệu mới được ghi vào hệ thống, cho phép tạo nhúng vector hoặc mối quan hệ đồ thị theo thời gian thực từ dữ liệu phi cấu trúc và bỏ qua độ trễ xử lý hàng loạt truyền thống – cho phép khả dụng gần như ngay lập tức cho các tác vụ AI. Do đó, dữ liệu mới được thu thập có thể tìm kiếm ngay lập tức và sẵn sàng cho các hoạt động AI.
- Cơ sở dữ liệu ngữ nghĩa có thể mở rộng: Được xây dựng trên kiến trúc VAST DASE mang tính cách mạng, nền tảng này hỗ trợ lưu trữ hàng nghìn tỷ thành phần nhúng, thu thập dữ liệu theo thời gian thực và tìm kiếm sự tương đồng theo thời gian thực trên các không gian vectơ lớn và đồ thị kiến thức. Được thiết kế để xử lý hàng exabyte dữ liệu doanh nghiệp có cấu trúc và không có cấu trúc trong một namespace thống nhất, quy mô vượt bậc của VAST DataBase đảm bảo rằng các doanh nghiệp có thể duy trì biểu diễn dữ liệu liền mạch, cập nhật mà không ảnh hưởng đến hiệu suất hoặc bảo mật.
- Kiến trúc dữ liệu thống nhất: InsightEngine điều phối các luồng công việc ứng dụng tích hợp lưu trữ dữ liệu, xử lý và truy xuất tất cả các loại dữ liệu vào một nền tảng duy nhất, trong đó tất cả dữ liệu được lập chỉ mục tại nguồn dữ liệu. Kiến trúc này loại bỏ nhu cầu về các hồ dữ liệu riêng biệt và nền tảng SaaS bên ngoài, giảm chi phí và sự phức tạp liên quan đến quản lý dữ liệu và các quy trình trích xuất, chuyển đổi và tải (ETL).
- Tính nhất quán và bảo mật dữ liệu: Nền tảng này đảm bảo rằng mọi bản cập nhật dữ liệu lưu trữ đối tượng hoặc hệ thống file đều được đồng bộ hóa nguyên tử với cơ sở dữ liệu vector và các chỉ mục của nó, cung cấp khả năng quản lý truy cập dữ liệu toàn diện, an toàn và nguồn gốc dữ liệu toàn cầu để đảm bảo tính nhất quán của dữ liệu trên nhiều môi trường thuê bao.
Bài viết liên quan
- NVIDIA GPUDirect Storage (GDS): Câu chuyện của VAST Data
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- 7 lý do tại sao doanh nghiệp cần một nền tảng dữ liệu hiện đại
- VAST Data Platform – Nền tảng dữ liệu doanh nghiệp toàn diện
- Data Platform là gì? Thế nào là một nền tảng dữ liệu doanh nghiệp?