Mở rộng nghiên cứu và triển khai HPC với DPU NVIDIA BlueField thế hệ mới

Các trung tâm siêu máy tính trên hế giới đang đưa điện toán tăng tốc hiệu suất cao (HPC) lên một cấp độ mới với NVIDIA BlueField DPU trên hạ tầng mạng newtowrk NVIDIA Quantum InfiniBand.

Ở châu Âu và Hoa Kỳ, các nhà phát triển HPC đang tăng cường siêu máy tính với sức mạnh của lõi xử lý Arm và bộ tăng tốc NVIDIA BlueField-2 DPU .

Tại Phòng thí nghiệm Quốc gia Los Alamos (LANL), công việc này là một phần của sự hợp tác sâu rộng trong nhiều năm với NVIDIA nhằm mục tiêu tăng tốc độ gấp 30 lần trong các ứng dụng xử lý đa vật lý.

Các nhà nghiên cứu của LANL dự đoán hiệu suất tăng lên đáng kể khi sử dụng các đơn vị xử lý dữ liệu (DPU) chạy trên mạng NVIDIA Quantum InfiniBand. Họ sẽ tiên phong trong các kỹ thuật lưu trữ cho xử lý, đối sánh mẫu và hơn thế nữa bằng cách sử dụng BlueField và phần mềm NVIDIA DOCA.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

OpenAPI cho DPU

Những nỗ lực cũng sẽ giúp xác định rõ hơn OpenSNAPI , một giao diện ứng dụng mà bất kỳ ai cũng có thể sử dụng để khai thác các DPU. Đó là một dự án của Unified Communication Framework, một tập đoàn cho phép tính toán không đồng nhất về các ứng dụng HPC, có các thành viên bao gồm Arm, IBM, NVIDIA, phòng thí nghiệm quốc gia Hoa Kỳ và các trường đại học Hoa Kỳ.

LANL đã cảm nhận được sức mạnh của tính toán trong mạng nhờ vào hệ thống lưu trữ hỗ trợ DPU mà nó đã tạo ra.

Accelerated Box of Flash (ABoF) kết hợp bộ lưu trữ trạng thái rắn với các trình tăng tốc DPU và InfiniBand để tăng tốc các phần quan trọng về hiệu suất của hệ thống tệp Linux. Nó nhanh hơn tới 30 lần so với các hệ thống lưu trữ tương tự và được thiết lập để trở thành một thành phần quan trọng trong cơ sở hạ tầng của LANL.

ABoF đặt máy tính gần nơi lưu trữ để giảm thiểu sự di chuyển dữ liệu và cải thiện hiệu quả của cả mô phỏng và đường ống phân tích dữ liệu, một nhà nghiên cứu cho biết trong một blog về LANL gần đây .

Trung tâm Máy tính Nâng cao Texas (TACC) là trung tâm mới nhất áp dụng BlueField-2 trong các máy chủ Dell PowerEdge. Nó sẽ sử dụng các DPU trên mạng InfiniBand để biến hệ thống Lonestar6 của mình trở thành nền tảng phát triển cho siêu máy tính cho đám mây.

Lonestar6 của TACC phục vụ nhiều nhà phát triển HPC tại Đại học Texas A&M, Đại học Công nghệ Texas và Đại học Bắc Texas, cũng như một số trung tâm nghiên cứu và giảng viên.

DPU trong Trung tâm HPC, Đám mây

Mức tăng hai chữ số là rất lớn đối với các siêu máy tính chạy mô phỏng HPC như khám phá, nghiên cứu về thuốc, ma túy hoặc thiết kế máy bay. Và các dịch vụ đám mây có thể sử dụng những lợi ích đó để tăng năng suất cho khách hàng của họ, Panda cho biết, người đã nhận được yêu cầu từ nhiều trung tâm HPC cho mã của mình.

Mạng Quantum InfiniBand với các tính năng như NVIDIA SHARP giúp công việc của anh ấy trở nên khả thi.

“Những người khác đang nói về điện toán trong mạng, nhưng InfiniBand ngày nay hỗ trợ nó,” ông nói.

DPU ở Cambridge, Munich

Các nhà nghiên cứu ở Cambridge, London và Munich cũng đang sử dụng DPU.

Về phần mình, University College London đang khám phá cách lập lịch trình các nhiệm vụ cho hệ thống máy chủ trên BlueField-2 DPUs. Đó là một khả năng có thể được sử dụng, chẳng hạn, để di chuyển dữ liệu giữa các bộ xử lý máy chủ để nó có mặt khi họ cần.

BlueField DPU bên trong máy chủ Dell PowerEdge trong Dịch vụ Cambridge dành cho khám phá theo hướng dữ liệu giảm tải các chính sách bảo mật, khung lưu trữ và các công việc khác từ CPU chủ, tối đa hóa hiệu suất của hệ thống.

Trong khi đó, các nhà nghiên cứu trong nhóm kiến ​​trúc máy tính và hệ thống song song tại Đại học Kỹ thuật Munich đang tìm cách giảm tải các tác vụ của cả MPI và hệ điều hành với DPU như một phần của dự án EuroHPC.

Trở lại Mỹ, các nhà nghiên cứu tại Georgia Tech đang cộng tác với Phòng thí nghiệm Quốc gia Sandia để tăng tốc độ nghiên cứu động lực học phân tử bằng cách sử dụng BlueField-2 DPU. Một bài báo mô tả công việc của họ cho đến nay cho thấy các thuật toán có thể được tăng tốc lên đến 20% mà không làm giảm độ chính xác của các mô phỏng.

Mạng mở rộng

Thời gian gần đây, các nhà nghiên cứu ở Nhật Bản đã công bố một hệ thống sử dụng GPU NVIDIA H100 Tensor Core mới nhất trên mạng nhanh nhất và thông minh nhất, nền tảng NVIDIA Quantum-2 InfiniBand.

NEC sẽ chế tạo khoảng 6 siêu máy tính dựa trên PFLOPS, H100 cho Trung tâm Khoa học Tính toán tại Đại học Tsukuba. Các nhà nghiên cứu sẽ sử dụng nó cho khí hậu học, vật lý thiên văn, dữ liệu lớn, AI và hơn thế nữa.

Trong khi đó, các nhà nghiên cứu như Panda đang suy nghĩ về cách họ sẽ sử dụng các lõi trong BlueField-3 DPU.

“Nó sẽ giống như việc thuê trợ lý điều hành có bằng đại học thay vì những người có bằng trung học, vì vậy tôi hy vọng ngày càng có nhiều công việc giảm tải sẽ được thực hiện,” ông Panda nói.

____
Bài viết liên quan

Góp ý / Liên hệ tác giả