CUTLASS – CUDA Templates for Linear Algebra Subroutines: Là một tập hợp các template và lớp abstract của CUDA trên C++ để thực hiện các phép tính GEMM hiệu năng cao ở tất cả các cấp và quy mô bên trong CUDA kernel. Không giống như các thư viện GPU dạng template cho đại số tuyến tính mật độ cao khác (ví dụ, thư viện MAGMA), mục đích của CUTLASS là phân tích “các phần chuyển động” của GEMM thành các thành phần cơ bản được trừu tượng hóa bởi các template class trong C++, cho phép các lập trình viên dễ dàng tùy chỉnh và chuyên dụng hóa chúng trong CUDA kernel. CUTLASS là thư viện mã nguồn mở và được NVidia phát hành trên GitHub như một bản giới thiệu ban đầu về các kỹ thuật GEMM CUDA, được dự định sẽ phát triển thành một thư viện API mẫu.
Bài viết liên quan
- 5 điều bạn cần biết về NVIDIA DGX Spark – Chiếc máy tính mơ ước của các nhà phát triển AI
- NVIDIA NVLink Thế hệ thứ 5: Bước nhảy vọt về băng thông cho kỷ nguyên AI nghìn tỷ tham số
- SLM và AI tại biên: Bình minh của một kỷ nguyên mới hay chỉ là cơn sốt nhất thời?
- So sánh sự khác biệt giữa NVIDIA H200 NVL và NVIDIA H200 HGX
- Mở rộng quy mô cho hạ tầng GenAI on-premise
- CPU NVIDIA Grace C1 được hỗ trợ rộng rãi cho điện toán biên, ngành viễn thông và các hệ thống lưu trữ