Vượt qua vực thẳm và đạt đến “thời điểm iPhone” của nó, Generative AI (AI tạo sinh) cần phải được mở rộng quy mô để đáp ứng nhu cầu ngày càng tăng theo cấp số nhân. Độ tin cậy và thời gian hoạt động là rất quan trọng để xây dựng AI tạo sinh ở cấp doanh nghiệp, đặc biệt khi AI là cốt lõi để tiến hành các hoạt động kinh doanh. NVIDIA đang đầu tư chất xám của họ vào việc xây dựng giải pháp cho những doanh nghiệp sẵn sàng thực hiện một “bước nhảy vọt” ngay thời điểm này.

Giới thiệu NVIDIA AI Enterprise 4.0

Phiên bản mới nhất của NVIDIA AI Enterprise tăng tốc độ phát triển thông qua nhiều khía cạnh với khả năng hỗ trợ, khả năng quản lý, bảo mật và độ tin cậy sẵn sàng cho cấp độ sản xuất cho các doanh nghiệp đang đổi mới với AI tạo sinh.

Nhanh chóng đào tạo, tùy chỉnh và triển khai LLM trên quy mô lớn với NVIDIA NeMo

Các mô hình AI tạo sinh có hàng tỷ tham số và yêu cầu quy trình đào tạo dữ liệu hiệu quả. Sự phức tạp của các mô hình đào tạo, khả năng tùy chỉnh cho các nhiệm vụ theo lĩnh vực cụ thể và việc triển khai các mô hình trên quy mô lớn đòi hỏi chuyên môn và tài nguyên điện toán.

NVIDIA AI Enterprise 4.0 hiện tại đã tích hợp NVIDIA NeMo, một framework toàn diện, thuần đám mây để quản lý dữ liệu trên quy mô lớn, đào tạo nhanh và tùy chỉnh các mô hình ngôn ngữ lớn (LLM) cũng như suy luận được tối ưu hóa trên các nền tảng được người dùng ưa thích. Từ đám mây đến máy trạm để bàn, NVIDIA NeMo cung cấp các công thức dễ sử dụng và hiệu suất được tối ưu hóa với hạ tầng được tăng tốc, giúp giảm đáng kể thời gian đưa ra giải pháp và tăng ROI.

Xây dựng các ứng dụng AI tạo sinh nhanh hơn với quy trình làm việc AI

NVIDIA AI Enterprise 4.0 giới thiệu hai quy trình làm việc AI mới để xây dựng các ứng dụng AI tạo sinh: chatbot AI với thế hệ tăng cường truy xuất và phát hiện lừa đảo trực tuyến.

Quy trình làm việc AI tạo sinh của chatbot kiến thức cơ sở, khai thác Retrieval Augmented Generation, đẩy nhanh quá trình phát triển và triển khai các chatbot AI tạo sinh được điều chỉnh trên dữ liệu của bạn. Các chatbot này trả lời chính xác các câu hỏi theo từng lĩnh vực cụ thể, lấy thông tin từ cơ sở kiến thức của công ty và tạo ra phản hồi theo thời gian thực bằng ngôn ngữ tự nhiên. Nó sử dụng LLM đã được đào tạo trước, NeMo, Máy chủ suy luận NVIDIA Triton, cùng với các công cụ của bên thứ ba bao gồm Langchain và cơ sở dữ liệu vectơ, để đào tạo và triển khai hệ thống trả lời câu hỏi cơ sở kiến thức.

Quy trình làm việc AI của hệ thống phát hiện lừa đảo trực tuyến sử dụng NVIDIA Morpheus và AI tạo sinh với NVIDIA NeMo để đào tạo một mô hình có thể phát hiện tới 90% email lừa đảo trực tuyến trước khi chúng gửi đến hộp thư đến của bạn.

Bảo vệ chống lại các email lừa đảo trực tuyến là một thách thức lớn. Email lừa đảo trực tuyến không thể phân biệt được với email lành tính, với sự khác biệt duy nhất giữa email lừa đảo và email hợp pháp là mục đích của người gửi. Đây là lý do tại sao các cơ chế truyền thống để phát hiện lừa đảo trực tuyến lại không hiệu quả.

Phát triển AI ở mọi nơi

Việc áp dụng AI cho doanh nghiệp có thể yêu cầu thêm các nhà phát triển AI và nhà khoa học dữ liệu có tay nghề cao. Các tổ chức sẽ cần một hạ tầng linh hoạt, hiệu suất cao bao gồm phần cứng và phần mềm được tối ưu hóa để tối đa hóa năng suất và tăng tốc phát triển AI. Cùng với GPU NVIDIA RTX 6000 Ada Generation dành cho máy trạm, NVIDIA AI Enterprise 4.0 cung cấp cho các nhà phát triển AI một nền tảng duy nhất để phát triển các ứng dụng AI và triển khai chúng trong giai đoạn sản xuất.

Ngoài máy tính để bàn, NVIDIA còn cung cấp danh mục hạ tầng hoàn chỉnh cho tải xử lý AI bao gồm GPU NVIDIA H100, L40S, L4 và mạng tốc độ cao với các đơn vị xử lý dữ liệu NVIDIA BlueField. Với HPE Machine Learning Data Management, HPE Machine Learning Development Environment, Ubuntu KVM và Nutanix AHV, các tổ chức có thể sử dụng hạ tầng tại chỗ để hỗ trợ tải xử lý AI.

Quản lý tải xử lý và hạ tầng AI

Dịch vụ quản lý NVIDIA Triton, một phần bổ sung độc quyền cho NVIDIA AI Enterprise 4.0, tự động hóa việc triển khai nhiều Máy chủ suy luận Triton trong Kubernetes với khả năng điều phối mô hình tiết kiệm tài nguyên GPU. Nó đơn giản hóa việc triển khai bằng cách tải các mô hình từ nhiều nguồn và phân bổ tài nguyên điện toán. Dịch vụ quản lý Triton có sẵn để trải nghiệm trong phòng thí nghiệm trên NVIDIA LaunchPad .

NVIDIA AI Enterprise 4.0 cũng bao gồm phần mềm quản lý cụm, NVIDIA Base Command Manager Essentials, để chuẩn hóa việc cung cấp cụm, quản lý tải xử lý, giám sát hạ tầng và báo cáo sử dụng. Nó tạo điều kiện thuận lợi cho việc triển khai quản lý tải xử lý AI với quy mô linh hoạt và phân bổ tài nguyên dựa trên chính sách, mang lại tính toàn vẹn của cụm.

Phần mềm, công cụ AI mới và mô hình nền tảng được đào tạo trước

NVIDIA AI Enterprise 4.0 mang đến nhiều framework và công cụ hơn để thúc đẩy quá trình phát triển AI. NVIDIA Modulus là một framework để xây dựng, đào tạo và tinh chỉnh các mô hình vật lý – học máy với giao diện Python đơn giản.

Sử dụng Modulus, người dùng có thể củng cố các mô phỏng kỹ thuật bằng AI và xây dựng mô hình cho các ứng dụng song sinh kỹ thuật số quy mô doanh nghiệp trên nhiều lĩnh vực vật lý, từ CFD và Kết cấu đến Điện từ. Container chứa Deep Graph Library được thiết kế để triển khai và huấn luyện Mạng thần kinh đồ thị có thể giúp các nhà khoa học nghiên cứu cấu trúc đồ thị của các phân tử hoặc dịch vụ tài chính nhằm phát hiện gian lận.

Cuối cùng, ba mô hình nền tảng được đào tạo trước độc quyền, một phần của NVIDIA TAO, giúp tăng tốc thời gian sản xuất cho các ứng dụng trong ngành như Vision AI, phát hiện lỗi và ngăn ngừa tổn thất trong bán lẻ.

NVIDIA AI Enterprise 4.0 là bản nâng cấp toàn diện nhất cho nền tảng này cho đến nay. Với tính bảo mật, ổn định, khả năng quản lý và hỗ trợ cấp doanh nghiệp, doanh nghiệp có thể mong đợi thời gian hoạt động AI đáng tin cậy và sự xuất sắc của AI không bị gián đoạn.

Bắt đầu với NVIDIA AI Enterprise

Ba cách để tăng tốc với NVIDIA AI Enterprise:

Đăng ký chương trình NVIDIA LaunchPad để có ‌quyền truy cập ngắn hạn vào các hands-on lab.
Đăng ký để nhận bản evaluation miễn phí trong 90 ngày đối với hạ tầng tại chỗ hoặc đám mây hiện có.
Mua bản quyền thông qua mạng lưới NVIDIA Partner Network hoặc các nhà cung cấp dịch vụ đám mây lớn như AWS, Microsoft Azure và Google Cloud.

Nhất Tiến Chung (NTC) hiện là nhà cung cấp các giải pháp hạ tầng CNTT, điện toán hiệu năng cao (HPC) và lưu trữ cho AI. Chúng tôi là đối tác NPN cấp Elite của NVIDIA cho các hệ thống DGX và hệ thống cụm siêu máy tính DGX SuperPOD với sức mạnh lưu trữ song song của DDN và kết nối mạng tốc độ cao từ hãng Mellanox (thuộc NVIDIA).

Với vai trò là đối tác NPN chính thức của NVIDIA, chúng tôi có thể giúp bạn có được các sản phẩm GPU cao cấp nhất của NVIDIA như L4, L40S, H200, H200 NVL, B200,…, đặc biệt là với thực trạng khan hiếm GPU do các hạn chế thương mại về nhập khẩu GPU như hiện nay.

Bạn muốn trở thành đối tác bán hàng NVIDIA của NTC?

Đăng ký ngay

____
Bài viết liên quan