Sáu tháng sau khi tuyên bố mua lại ARM, NVIDIA đã tiết lộ các bộ vi xử lý và quan hệ đối tác mới để tăng tốc các nền tảng sử dụng CPU dựa trên ARM từ Amazon Web Services, Ampere Computing, MediaTek và Marvell.
Hệ sinh thái ARM đã nhận được một loạt các tiến bộ từ NVIDIA tại GTC lần này.
NVIDIA đã bắt tay vào việc với các nhà cung cấp phần cứng, phần mềm và dịch vụ dựa trên ARM, cho thấy tiềm năng của các nền tảng và ứng dụng được tăng tốc, tiết kiệm năng lượng trên cả client, đám mây, HPC và điện toán biên.
NVIDIA cũng đã công bố ba bộ vi xử lý mới được xây dựng xung quanh ARM IP, bao gồm “Grace”, CPU trung tâm dữ liệu đầu tiên của hãng, đưa AI, Cloud và HPC lên một tầm cao mới.
Đặc biệt, Bộ xử lý Dữ liệu BlueField-3 (DPU) mới có nhiều lõi ARM hơn, mở ra cánh cửa cho các ứng dụng mới mạnh mẽ hơn trong mạng trung tâm dữ liệu.
Và NVIDIA DRIVE Atlan trở thành bộ xử lý đầu tiên của công ty dành cho xe tự hành đóng gói DPU hỗ trợ ARM, cho thấy tiềm năng về mạng hiệu suất cao trong các mẫu xe năm 2025 của các nhà sản xuất ô tô.
Tầm nhìn về những gì có thể xảy ra
Trong bài phát biểu GTC của mình, Giám đốc điều hành NVIDIA Jensen Huang đã chia sẻ tầm nhìn của mình về AI, HPC, khoa học dữ liệu, đồ họa… Ông cũng tái khẳng định cam kết mở rộng hệ sinh thái ARM như một phần của thỏa thuận mua lại ARM mà NVIDIA công bố vào tháng 9 năm 2020.
Trên con đường biến tầm nhìn đó thành hiện thực, NVIDIA đã mô tả một loạt nỗ lực để tăng tốc CPU từ bốn đối tác chính của ARM với GPU NVIDIA, DPU và phần mềm, nâng cao ứng dụng từ các nhà phát triển ARM.
GPU tăng tốc các Graviton2 instance trên AWS
Trên đám mây, NVIDIA thông báo sẽ cung cấp khả năng tăng tốc GPU cho Amazon Web Services Graviton2, bộ xử lý dựa trên ARM của nhà cung cấp dịch vụ đám mây. Các Graviton2 instance được tăng tốc sẽ cung cấp trải nghiệm phát trực tuyến trò chơi phong phú và giảm chi phí cho khả năng suy luận mạnh mẽ của AI.
Ví dụ: các nhà phát triển trò chơi sẽ sử dụng các AWS instance để phát trực tuyến trò chơi Android và các dịch vụ khác kết hợp hiệu quả của Graviton2 với công nghệ đồ họa NVIDIA RTX như Ray-Tracing và DLSS.
Trong lĩnh vực điện toán hiệu suất cao, Bộ công cụ dành cho nhà phát triển NVIDIA ARM HPC mới cung cấp nền tảng hiệu suất cao, tiết kiệm năng lượng cho các siêu máy tính kết hợp Altra của Ampere Computing – một CPU đóng gói 80 lõi ARM chạy tối đa 3,3 GHz – với GPU và DPU NVIDIA mới nhất.
Bộ phát triển chạy một bộ trình biên dịch NVIDIA, thư viện và công cụ cho AI và HPC để các nhà phát triển có thể tăng tốc các hệ thống dựa trên ARM cho khoa học và máy tính kỹ thuật. Các nhà nghiên cứu hàng đầu bao gồm Phòng thí nghiệm quốc gia Oak Ridge và Los Alamos ở Mỹ cũng như các phòng thí nghiệm quốc gia ở Hàn Quốc và Đài Loan sẽ là những người sử dụng đầu tiên.
Thúc đẩy khách hàng, các nền tảng điện toán biên
Đối với PC, NVIDIA đang làm việc với MediaTek, nhà cung cấp chip điện thoại thông minh lớn nhất thế giới, để tạo ra một loại máy tính xách tay mới được hỗ trợ bởi CPU dựa trên ARM cùng với GPU NVIDIA RTX.
Máy tính xách tay sẽ sử dụng lõi ARM và đồ họa NVIDIA để cung cấp cho người tiêu dùng các thiết bị di động tiết kiệm năng lượng với khả năng truyền thông không ảnh hưởng dựa trên nền tảng tham chiếu hỗ trợ Chromium, Linux và NVIDIA SDK.
Và trong lĩnh vực điện toán biên, NVIDIA đang hợp tác với Marvell Semiconductor để kết hợp các bộ vi xử lý dựa trên OCTEON ARM của mình với GPU của NVIDIA. Họ sẽ cùng nhau tăng tốc khối lượng công việc AI để tối ưu hóa và bảo mật mạng.
Hệ thống AI hàng đầu tham gia vào nền tảng ARM
Hai siêu máy tính AI mạnh mẽ sẽ vận hành vào năm tới.
Trung tâm Siêu máy tính Quốc gia Thụy Sĩ đang xây dựng một hệ thống với 20 exaflop hiệu suất AI. Và tại Mỹ, Phòng thí nghiệm Quốc gia Los Alamos sẽ bật một siêu máy tính AI mới cho các nhà nghiên cứu của mình.
Cả hai sẽ được cung cấp sức mạnh bởi CPU trung tâm dữ liệu đầu tiên của NVIDIA, “Grace”, một bộ xử lý dựa trên ARM sẽ mang lại hiệu suất gấp 10 lần so với các máy chủ nhanh nhất hiện nay trên các khối lượng công việc phức tạp nhất của AI và HPC.
Được đặt theo tên nhà khoa học máy tính tiên phong Grace Hopper, CPU này có hệ thống truyền dẫn cần thiết cho kỷ nguyên của AI theo hướng dữ liệu. Nó có các kết nối thông suốt chạy ở tốc độ 900 GB/s với GPU NVIDIA, nhờ vào NVLink thế hệ thứ tư – với băng thông gấp 14 lần so với các máy chủ hiện nay.
Thêm nhiều lõi ARM cho Network
Mạng NVIDIA Mellanox đang giảm hơn gấp đôi khoản đầu tư vào ARM. BlueField-3 DPU được công bố hôm nay đóng gói các liên kết 400-Gbps và gấp 5 lần sức mạnh tính toán của ARM của DPU hiện tại, BlueField-2 có sẵn ngày hôm nay.
Phép toán đơn giản cho thấy lý do tại sao việc tăng tốc trên ARM lại có ý nghĩa: One BlueField-3 DPU cung cấp các dịch vụ trung tâm dữ liệu tương đương có thể tiêu thụ tới 300 lõi CPU x86.
Tiến bộ này mang đến cho các nhà phát triển ARM một loạt cơ hội mở rộng để xây dựng mạng trung tâm dữ liệu nhanh, hiệu quả và thông minh.
Ngày nay DPU giảm tải các nhiệm vụ liên lạc, lưu trữ, bảo mật và quản lý hệ thống. Điều đó cho phép các lớp hệ thống hoàn toàn mới như siêu máy tính gốc đám mây NVIDIA được công bố hôm nay.
NVIDIA và ARM sau Tay lái
Các lõi ARM sẽ ra mắt trong các phương tiện tự hành được AI hỗ trợ thế hệ tiếp theo với trung tâm là nền tảng NVIDIA DRIVE Atlan, bước nhảy vọt tiếp theo trong lộ trình của NVIDIA.
DRIVE Atlan sẽ tạo ra một cú đấm mạnh mẽ, tạo ra hơn 1.000 nghìn tỷ hoạt động mỗi giây. Atlan đánh dấu lần đầu tiên nền tảng DRIVE tích hợp một DPU, mang các lõi ARM sẽ giúp nó đóng gói mạng trung tâm dữ liệu tương đương vào các phương tiện tự hành.
DPU ở Atlan cung cấp nền tảng cho các nhà phát triển ARM tạo ra các ứng dụng sáng tạo trong bảo mật, lưu trữ, mạng.
Điều tốt nhất vẫn chưa đến
Việc mở rộng các sản phẩm và quan hệ đối tác đánh dấu sự tiến bộ trong ý định của chúng tôi được công bố vào tháng 10 nhằm mang đến cho hệ sinh thái ARM bốn bộ tăng tốc:
- NVIDIA AI – tiêu chuẩn công nghiệp để tăng tốc đào tạo và suy luận về AI
- RAPIDS – một bộ thư viện phần mềm mã nguồn mở được NVIDIA duy trì để chạy khoa học dữ liệu và phân tích trên GPU
- NVIDIA HPC SDK – trình biên dịch, thư viện và công cụ phần mềm để tính toán hiệu suất cao
- NVIDIA RTX – trình điều khiển đồ họa cung cấp khả năng dò tia và AI
Và chúng tôi chỉ mới bắt đầu. Còn nhiều điều phải nói và còn nhiều điều để nói.
Tìm hiểu về các cơ hội mới kết hợp NVIDIA và ARM tại GTC21 . Đăng ký là miễn phí.
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson
- Phát triển ứng dụng AI tại biên với NVIDIA Jetson AGX Orin & Developer Kit
- HPE và NVIDIA công bố ‘NVIDIA AI Computing by HPE’ để thúc đẩy cuộc cách mạng AI tạo sinh