CUTLASS – CUDA Templates for Linear Algebra Subroutines: Là một tập hợp các template và lớp abstract của CUDA trên C++ để thực hiện các phép tính GEMM hiệu năng cao ở tất cả các cấp và quy mô bên trong CUDA kernel. Không giống như các thư viện GPU dạng template cho đại số tuyến tính mật độ cao khác (ví dụ, thư viện MAGMA), mục đích của CUTLASS là phân tích “các phần chuyển động” của GEMM thành các thành phần cơ bản được trừu tượng hóa bởi các template class trong C++, cho phép các lập trình viên dễ dàng tùy chỉnh và chuyên dụng hóa chúng trong CUDA kernel. CUTLASS là thư viện mã nguồn mở và được NVidia phát hành trên GitHub như một bản giới thiệu ban đầu về các kỹ thuật GEMM CUDA, được dự định sẽ phát triển thành một thư viện API mẫu.
Bài viết liên quan
- Tăng tốc các mô hình mở mới của OpenAI ngay trên GPU NVIDIA GeForce RTX và RTX PRO
- Dòng GPU RTX PRO 6000 Blackwell Server Edition sắp được tích hợp vào các máy chủ phổ biến
- OpenAI lần đầu phát hành miễn phí mô hình ngôn ngữ mới với tên gọi là GPT-OSS
- Nhận diện khuôn mặt với NVIDIA FaceDetect: Cài đặt và huấn luyện mô hình bằng TAO Toolkit
- OpenAI và NVIDIA đẩy nhanh tiến bộ AI trong cộng đồng với các mô hình open-weight mới
- Các quy định và cách thức đặt hàng các dòng GPU AI hiệu suất cao của NVIDIA