Các kỹ sư bán dẫn cho thấy cách một ngành chuyên biệt có thể tùy chỉnh các mô hình ngôn ngữ lớn (LLMs) để đạt được lợi thế khi sử dụng NVIDIA NeMo.
Một bài nghiên cứu được phát hành hôm nay mô tả những cách mà Generative AI (GenAI) có thể hỗ trợ một trong những nỗ lực kỹ thuật phức tạp nhất: thiết kế chất bán dẫn.
Công việc này chứng minh cách các công ty trong các lĩnh vực chuyên môn cao có thể đào tạo các LLM trên dữ liệu nội bộ của họ để xây dựng các ‘trợ thủ’ giúp tăng năng suất.
Rất ít việc theo đuổi có tính thử thách như thiết kế chất bán dẫn. Dưới kính hiển vi, một con chip hiện đại như NVIDIA H100 Tensor Core GPU (hình ở trên) trông giống như một đô thị được quy hoạch bài bản, được xây dựng với hàng chục tỷ transistor, được kết nối trên những con phố mỏng hơn 10.000 lần so với sợi tóc người.
Nhiều nhóm kỹ thuật phối hợp trong vòng hai năm để xây dựng một trong những siêu đô thị kỹ thuật số này.
Một số nhóm xác định kiến trúc tổng thể của con chip, một số chế tạo và đặt nhiều loại mạch siêu nhỏ, trong khi những nhóm khác thử nghiệm công việc của họ. Mỗi công việc đều yêu cầu những phương pháp, chương trình phần mềm và ngôn ngữ máy tính chuyên biệt.
Tầm nhìn rộng lớn đối với LLM
Mark Ren, giám đốc NVIDIA Research và tác giả chính của bài nghiên cứu cho biết: “Tôi tin rằng theo thời gian, các mô hình ngôn ngữ lớn sẽ hỗ trợ tất cả các quy trình, trên diện rộng.”
Bill Dally, nhà khoa học trưởng của NVIDIA đã công bố bài nghiên cứu này trong bài phát biểu quan trọng tại Hội nghị quốc tế về Thiết kế hỗ trợ máy tính (Computer-Aided Design), một cuộc hội họp thường niên của hàng trăm kỹ sư làm việc trong lĩnh vực được gọi là tự động hóa thiết kế điện tử, hay EDA.
Dally cho biết tại sự kiện ở San Francisco: “Nỗ lực này đánh dấu bước quan trọng đầu tiên trong việc áp dụng các LLM vào công việc phức tạp là thiết kế chất bán dẫn”. “Nó cho thấy ngay cả các lĩnh vực có chuyên môn cao cũng có thể sử dụng dữ liệu nội bộ của họ để đào tạo các mô hình GenAI hữu ích.”
ChipNeMo
Bài nghiên cứu mô tả chi tiết cách các kỹ sư NVIDIA tạo ra một LLM tùy chỉnh để sử dụng nội bộ, được gọi là ChipNeMo, được đào tạo dựa trên dữ liệu nội bộ của công ty để tạo và tối ưu hóa phần mềm cũng như hỗ trợ các nhà thiết kế con người.
Về lâu dài, các kỹ sư hy vọng có thể áp dụng GenAI vào từng giai đoạn thiết kế chip, có khả năng đạt được mức tăng đáng kể về năng suất tổng thể – Ren, người có sự nghiệp kéo dài hơn 20 năm trong lĩnh vực EDA, cho biết.
Sau khi khảo sát các kỹ sư NVIDIA về các use case có thể xảy ra, nhóm nghiên cứu đã chọn 3 trường hợp để bắt đầu: chatbot, trình tạo mã (code generator) và công cụ phân tích.
Các use case ban đầu
Cái thứ hai – một tool tự động hóa các tác vụ tốn thời gian trong việc duy trì các mô tả cập nhật về các lỗi đã biết – là công cụ được đón nhận nồng nhiệt nhất cho đến nay.
Một chatbot nguyên mẫu trả lời các câu hỏi về kiến trúc và thiết kế GPU đã giúp nhiều kỹ sư nhanh chóng tìm thấy tài liệu kỹ thuật trong các thử nghiệm ban đầu.
Trình tạo mã sẽ giúp các nhà thiết kế viết phần mềm cho thiết kế chip.
Một trình tạo mã đang được phát triển (như minh họa ở trên) đã tạo các đoạn mã gồm khoảng 10-20 dòng phần mềm bằng hai ngôn ngữ chuyên dụng mà các nhà thiết kế chip sử dụng. Nó sẽ được tích hợp với các công cụ hiện có, vì vậy các kỹ sư có một trợ lý hữu ích cho các thiết kế đang được thực hiện.
Tùy chỉnh các mô hình AI với NVIDIA NeMo
Bài nghiên cứu chủ yếu tập trung vào công việc của nhóm, thu thập dữ liệu thiết kế và sử dụng dữ liệu đó để tạo ra một mô hình GenAI chuyên biệt, một quy trình có thể áp dụng cho bất kỳ ngành nào.
Khi bắt đầu, nhóm đã chọn một mô hình nền tảng (foundation model) và tùy chỉnh nó bằng NVIDIA NeMo, một framework để xây dựng, tùy chỉnh và triển khai các mô hình GenAI – được bao gồm trong nền tảng phần mềm NVIDIA AI Enterprise. Mô hình NeMo được chọn có 43 tỷ tham số, thước đo khả năng hiểu các mẫu (patterns) của nó. Nó được đào tạo bằng cách sử dụng hơn một nghìn tỷ token, các từ và ký hiệu trong văn bản và phần mềm.
ChipNeMo cung cấp một ví dụ về cách một nhóm kỹ thuật chuyên sâu đã tinh chỉnh một mô hình được đào tạo trước bằng dữ liệu của chính họ.
Nhóm sau đó đã tinh chỉnh mô hình trong hai vòng đào tạo, vòng đầu tiên sử dụng dữ liệu thiết kế nội bộ trị giá khoảng 24 tỷ token và vòng thứ hai là sự kết hợp của khoảng 130.000 ví dụ thiết kế và hội thoại.
Công việc này là một trong số những ví dụ về nghiên cứu và POC của GenAI trong ngành bán dẫn, mới bắt đầu xuất hiện từ phòng thí nghiệm.
Chia sẻ bài học kinh nghiệm
Một trong những bài học quan trọng nhất mà nhóm của Ren đã học được là giá trị của việc tùy chỉnh LLM.
Trong các nhiệm vụ thiết kế chip, các mô hình ChipNeMo tùy chỉnh có ít nhất 13 tỷ tham số phù hợp hoặc vượt quá hiệu suất của các LLM đa năng thậm chí còn lớn hơn nhiều như LLaMA2 với 70 tỷ tham số. Trong một số use case, các mô hình ChipNeMo tốt hơn đáng kể.
Đồng thời, người dùng cần phải quan tâm đến những dữ liệu họ thu thập và cách họ làm sạch dữ liệu đó để sử dụng trong đào tạo, ông nói thêm.
Cuối cùng, Ren khuyên người dùng nên cập nhật các công cụ mới nhất có thể tăng tốc và đơn giản hóa công việc.
NVIDIA Research có hàng trăm nhà khoa học và kỹ sư trên toàn thế giới tập trung vào các chủ đề như AI, đồ họa máy tính, thị giác máy tính, xe tự lái và robot. Các dự án khác gần đây về chất bán dẫn bao gồm sử dụng AI để thiết kế các mạch nhỏ hơn, nhanh hơn và tối ưu hóa vị trí của các block lớn.
Các doanh nghiệp muốn xây dựng LLM tùy chỉnh của riêng mình có thể bắt đầu ngay hôm nay bằng cách sử dụng framework NeMo có sẵn từ GitHub và NVIDIA NGC catalog.
Bài viết liên quan
- Sovereign AI là gì?
- LLM: Lịch sử và tương lai của các mô hình ngôn ngữ lớn
- Hướng đến tương lai: Generative AI dành cho các giám đốc điều hành
- Xây dựng mô hình ngôn ngữ lớn (LLM) riêng tư, an toàn trên mạng 5G riêng
- HPE và NVIDIA công bố ‘NVIDIA AI Computing by HPE’ để thúc đẩy cuộc cách mạng AI tạo sinh
- Giải mã hiệu suất AI trên PC và Workstation RTX AI