Pretrained AI Model là gì?

Hãy tưởng tượng bạn đang cố gắng giải thích cho một đứa trẻ biết con kỳ lân là gì thì cách tốt nhất để bắt đầu là cho trẻ xem hình ảnh của sinh vật đó và mô tả các đặc điểm độc đáo của nó.

Mô hình AI được đào tạo trước (pretrained AI model) là một mô hình học sâu – một thể hiện của thuật toán thần kinh giống như bộ não người giúp tìm các hình mẫu hoặc đưa ra dự đoán dựa trên dữ liệu – được đào tạo trên các tập dữ liệu lớn để hoàn thành một nhiệm vụ cụ thể. Nó có thể được sử dụng nguyên trạng hoặc được tinh chỉnh thêm để phù hợp với nhu cầu cụ thể của ứng dụng.

Tại sao các pretrained AI model được sử dụng đến?

Thay vì xây dựng một mô hình AI từ đầu, các nhà phát triển có thể sử dụng các pretrained model và tùy chỉnh chúng để đáp ứng yêu cầu của họ.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

Để xây dựng một ứng dụng AI, trước tiên các nhà phát triển cần một mô hình AI có thể hoàn thành một nhiệm vụ cụ thể, cho dù đó là nhận diện hình ảnh con kỳ lân, phát hiện mối nguy hiểm an toàn cho xe tự hành hay chẩn đoán ung thư dựa trên hình ảnh y khoa. Mô hình này cần rất nhiều dữ liệu mang tính đại diện để học từ đó.

Quá trình học tập này đòi hỏi phải trải qua một số lớp dữ liệu được cung cấp (incomming data) và nhấn mạnh các đặc điểm liên quan đến mục tiêu ở mỗi lớp.

Ví dụ, để tạo một mô hình có thể nhận ra một con kỳ lân, trước tiên người ta có thể cung cấp cho nó hình ảnh của kỳ lân, ngựa, mèo, hổ và các động vật khác. Đây là dữ liệu đến.

Sau đó, các lớp đặc điểm dữ liệu đại diện được xây dựng, bắt đầu bằng những đặc điểm đơn giản – như đường nét và màu sắc – và tiến tới các đặc điểm cấu trúc phức tạp. Các đặc điểm này được chỉ định mức độ liên quan khác nhau bằng cách tính toán các xác suất.

Trái ngược với mèo hay hổ, một sinh vật càng giống ngựa thì khả năng đó là kỳ lân càng cao. Các giá trị xác suất như vậy được lưu trữ ở mỗi lớp mạng thần kinh trong mô hình AI và khi các lớp được thêm vào sẽ cải thiện hiểu biết đại diện của nó.

Để tạo một mô hình như vậy từ đầu, các nhà phát triển yêu cầu những bộ dữ liệu khổng lồ, thường có hàng tỷ dòng dữ liệu. Những thứ này có thể tốn kém và khó đạt được cũng như việc ảnh hưởng đến dữ liệu có thể dẫn đến hiệu suất kém của mô hình.

Đại diện xác suất được tính toán trước – được gọi là trọng số – tiết kiệm thời gian, tiền bạc và công sức. Một pretrained model đã được xây dựng và đào tạo với các trọng số này.

Việc sử dụng một pretrained model chất lượng cao với số lượng lớn trọng số đại diện chính xác sẽ mang lại cơ hội thành công cao hơn cho việc triển khai AI. Các trọng số có thể được sửa đổi và có thể bổ sung nhiều dữ liệu hơn vào mô hình để tùy chỉnh hoặc tinh chỉnh nó.

Các nhà phát triển dựa trên các pretrained model có thể tạo các ứng dụng AI nhanh hơn mà không phải lo lắng về việc xử lý hàng núi dữ liệu đầu vào hoặc xác suất tính toán cho các lớp dày đặc.

Nói cách khác, sử dụng pretrained AI model giống như lấy một chiếc váy hoặc chiếc áo rồi may nó cho vừa với nhu cầu của bạn, thay vì bắt đầu với vải, chỉ và kim.

Các pretrained AI model thường được sử dụng để học chuyển giao (transfer learning) và có thể dựa trên một số loại kiến ​​trúc mô hình. Một loại kiến ​​trúc phổ biến là mô hình transformer, một mạng thần kinh học ngữ cảnh và ý nghĩa bằng cách theo dõi các mối quan hệ trong dữ liệu tuần tự.

Theo Alfredo Ramos, Phó chủ tịch cấp cao về nền tảng tại công ty AI Clarifai – một đối tác hàng đầu trong chương trình NVIDIA Inception dành cho các công ty khởi nghiệp – các pretrained model có thể cắt giảm thời gian phát triển ứng dụng AI tới một năm và giúp tiết kiệm chi phí hàng trăm nghìn đô la.

Các pretrained model thúc đẩy AI như thế nào?

Vì chúng giúp đơn giản hóa và tăng tốc quá trình phát triển AI, nên nhiều nhà phát triển và công ty sử dụng chúng để đẩy nhanh các trường hợp sử dụng AI khác nhau.

Các lĩnh vực hàng đầu mà các pretrained model đang thúc đẩy AI bao gồm:

  • Xử lý ngôn ngữ tự nhiên: Các pretrained model được sử dụng cho dịch thuậtchatbot và các ứng dụng xử lý ngôn ngữ tự nhiên khác. Các mô hình ngôn ngữ lớn (Large Language Model), thường dựa trên kiến ​​trúc mô hình transformer, là một phần mở rộng của các mô hình được đào tạo trước. Một ví dụ về LLM được đào tạo trước là NVIDIA NeMo Megatron, một trong những mô hình AI lớn nhất thế giới.
  • Speech AI: Các pretrained model có thể giúp các ứng dụng speech AI sử dụng được ngay trên các ngôn ngữ khác nhau. Các trường hợp sử dụng bao gồm call center automationtrợ lý AI và công nghệ nhận dạng giọng nói.
  • Thị giác máy tính: Giống như trong ví dụ về kỳ lân ở trên, các pretrained model có thể giúp AI nhanh chóng nhận ra các sinh vật – hoặc đồ vật, địa điểm và con người. Bằng cách này, các pretrained model tăng tốc thị giác máy tính, mang đến cho các ứng dụng khả năng thị giác giống như con người trong các môn thể thaothành phố thông minh và hơn thế nữa.
  • Chăm sóc sức khỏe: Đối với các ứng dụng chăm sóc sức khỏe, các pretrained AI model như MegaMolBART – một phần của NVIDIA BioNeMo dịch vụ và framework – có thể hiểu ngôn ngữ của hóa học và tìm hiểu mối quan hệ giữa các nguyên tử trong các phân tử trong thế giới thực, mang lại cho cộng đồng khoa học một công cụ mạnh mẽ để phát triển thuốc nhanh hơn.
  • An ninh mạng: Pretrained model cung cấp một điểm khởi đầu để triển khai các giải pháp an ninh mạng dựa trên AI và mở rộng khả năng của các nhà phân tích bảo mật con người nhằm phát hiện các mối đe dọa nhanh hơn. Các ví dụ bao gồm lấy dấu vân tay kỹ thuật số của con người và máy móc, đồng thời phát hiện sự bất thường, thông tin nhạy cảm và lừa đảo.
  • Quy trình làm việc nghệ thuật và sáng tạo: Thúc đẩy làn sóng nghệ thuật AI gần đây, các pretrained model có thể giúp tăng tốc quy trình làm việc sáng tạo thông qua các công cụ như GauGAN và NVIDIA Canvas.

Các mô hình AI được đào tạo trước cũng có thể được áp dụng trong các ngành bên ngoài những ngành này, vì sự tùy chỉnh và tinh chỉnh của chúng có thể dẫn đến những khả năng vô tận cho các trường hợp sử dụng.

Nơi có thể tìm thấy các pretrained AI model

Các công ty như Google, Meta, Microsoft và NVIDIA đang phát minh ra các framework và kiến ​​trúc mô hình tiên tiến để xây dựng các mô hình AI.

Đôi khi chúng được phát hành trên các model hub hoặc dưới dạng nguồn mở, cho phép các nhà phát triển tinh chỉnh các mô hình AI được đào tạo trước, cải thiện độ chính xác của chúng và mở rộng kho lưu trữ mô hình.

NVIDIA NGC – một hub dành cho phần mềm AI được tối ưu hóa cho GPU, các mô hình và ví dụ của Jupyter Notebook – bao gồm các pretrained model cũng như điểm chuẩn AI và công thức đào tạo được tối ưu hóa để sử dụng với nền tảng AI của NVIDIA.

NVIDIA AI Enterprise, một bộ phần mềm AI và phân tích dữ liệu cloud-native, được quản lý đầy đủ, an toàn, bao gồm các mô hình được đào tạo trước mà không có mã hóa. Điều này cho phép các nhà phát triển và doanh nghiệp muốn tích hợp các mô hình được NVIDIA đào tạo trước vào các ứng dụng AI tùy chỉnh của họ để xem trọng số và độ lệch của mô hình, cải thiện khả năng giải thích và gỡ lỗi dễ dàng.

Hàng ngàn mô hình nguồn mở cũng có sẵn trên các hub như GitHubHugging Face và một số khác.

Điều quan trọng là các pretrained model được đào tạo bằng cách sử dụng dữ liệu đạo đức minh bạch và có thể giải thích được, tuân thủ quyền riêng tư và nhận được sự tán thành mà không có sự thiên vị.

NVIDIA Pretrained AI Models

Để giúp nhiều nhà phát triển hơn chuyển AI từ nguyên mẫu sang sản xuất, NVIDIA cung cấp một số mô hình được đào tạo trước có thể được triển khai ngay lập tức, bao gồm:

  • NVIDIA SegFormer, một mô hình transformer để phân đoạn ngữ nghĩa đơn giản, hiệu quả và mạnh mẽ – có sẵn trên GitHub.
  • Các mô hình thị giác máy tính được xây dựng có mục đích của NVIDIA, được đào tạo trên hàng triệu hình ảnh cho các thành phố thông minh, quản lý bãi đậu xe và các ứng dụng khác.
  • NVIDIA NeMo Megatron, mô hình ngôn ngữ có thể tùy chỉnh lớn nhất thế giới, là một phần của NVIDIA NeMo, một framework nguồn mở để xây dựng các ứng dụng linh hoạt và hiệu suất cao cho AI đàm thoại, speech AI và sinh học.
  • NVIDIA StyleGAN, một trình tạo kiến trúc theo style dành cho các mạng sáng tạo đối nghịch (generative adversarial networks). Nó sử dụng học chuyển giao để tạo ra các bức tranh vô hạn theo nhiều phong cách khác nhau.

Ngoài ra, NVIDIA Riva, một bộ công cụ phát triển phần mềm được tăng tốc bởi GPU để xây dựng và triển khai các ứng dụng speech AI, bao gồm các pretrained model bằng mười ngôn ngữ.

Và MONAI, một framework AI nguồn mở dành cho nghiên cứu chăm sóc sức khỏe do NVIDIA và King’s College London phát triển, bao gồm các pretrained model dành cho hình ảnh y khoa.

Tìm hiểu thêm về các NVIDIA pretrained AI model.

____
Bài viết liên quan

Góp ý / Liên hệ tác giả