NVIDIA công bố bộ khung cho việc xây dựng các trung tâm dữ liệu thế hệ tiếp theo

Phiên bản số Omniverse được hỗ trợ bởi Ansys, Cadence, PATCH MANAGER, Schneider Electric, Vertiv, v.v., đã thiết lập nên nền tảng cho hạ tầng AI hiệu quả cao.

Việc thiết kế, mô phỏng và vận hành các trung tâm dữ liệu hiện đại cực kỳ phức tạp, liên quan đến nhiều yếu tố cần cân nhắc như hiệu suất, hiệu quả sử dụng năng lượng và khả năng mở rộng.

Nó cũng đòi hỏi phải tập hợp một đội ngũ kỹ sư có chuyên môn cao về thiết kế mạng và máy tính, mô hình hóa thiết kế qua sự hỗ trợ của máy tính (CAD) và thiết kế cơ khí, điện và nhiệt.

NVIDIA xây dựng các siêu máy tính AI tiên tiến nhất thế giới và tại GTC họ đã công bố sản phẩm mới nhất của mình – một cụm máy tính lớn dựa trên hệ thống làm mát bằng chất lỏng NVIDIA GB200 NVL72. Nó bao gồm hai rack, mỗi rack chứa 18 CPU NVIDIA Grace và 36 GPU NVIDIA Blackwell, được kết nối bằng các switch NVIDIA NVLink thế hệ thứ tư.

Trên sân khấu GTC, NVIDIA giới thiệu trung tâm dữ liệu hoạt động đầy đủ này như một phiên bản số trong NVIDIA Omniverse, một nền tảng để kết nối và xây dựng các quy trình, công cụ, ứng dụng và dịch vụ 3D hỗ trợ AI tạo sinh.

Để xây dựng các trung tâm dữ liệu mới nhanh nhất có thể, NVIDIA lần đầu tiên xây dựng phiên bản số (digital twin) của mình bằng các công cụ phần mềm được kết nối bởi Omniverse. Các kỹ sư đã hợp nhất và trực quan hóa nhiều bộ dữ liệu CAD với độ chính xác vật lý và tính chân thực hoàn toàn trong Universal Scene Description (OpenUSD) bằng cách sử dụng nền tảng phiên bản số Cadence Reality, được hỗ trợ bởi API NVIDIA Omniverse.

Thiết kế, mô phỏng và tối ưu hóa với hiệu quả và độ chính xác cao

Cụm GB200 mới đang thay thế cụm hiện có ở một trong các trung tâm dữ liệu cũ của NVIDIA. Để bắt đầu xây dựng phiên bản số, công ty công nghệ Kinetic Vision đã quét toàn bộ cơ sở bằng máy quét lidar NavVis VLX nhằm tạo ra dữ liệu đám mây của các điểm (point cloud) và ảnh toàn cảnh có độ chính xác cao.

Sau đó, phần mềm Prevu3D được sử dụng để loại bỏ các cụm hiện có và chuyển đổi point cloud thành lưới 3D. Việc này cung cấp một mô hình 3D chính xác về mặt vật lý của cơ sở, trong đó phiên bản số của trung tâm dữ liệu mới có thể được mô phỏng.

Các kỹ sư đã kết hợp và trực quan hóa nhiều bộ dữ liệu CAD với độ chính xác và tính chân thực được nâng cao bằng cách sử dụng nền tảng Cadence Reality. Sự tích hợp của nền tảng với Omniverse đã cung cấp một nền tảng điện toán mạnh mẽ cho phép các nhóm phát triển các công cụ, quy trình làm việc và ứng dụng 3D dựa trên OpenUSD.

API của Omniverse Cloud cũng bổ sung khả năng tương tác với nhiều công cụ hơn, bao gồm PATCH MANAGER và NVIDIA Air. Với PATCH MANAGER, nhóm đã thiết kế bố cục vật lý của cụm và hạ tầng mạng của họ, đảm bảo rằng độ dài cáp chính xác và thành phần định tuyến được cấu hình đúng cách.

Nhóm đã sử dụng bộ giải Reality Digital Twin của Cadence, được tăng tốc bởi API NVIDIA Modulus và NVIDIA Grace Hopper, để mô phỏng luồng khí cũng như hiệu suất của hệ thống làm mát bằng chất lỏng mới từ các đối tác như Vertiv và Schneider Electric. Hệ thống làm mát tích hợp trong khay GB200 được mô phỏng và tối ưu hóa bằng các giải pháp của Ansys, đưa dữ liệu mô phỏng vào phiên bản số hóa.

Bản demo cho thấy phiên bản số có thể cho phép người dùng kiểm tra, tối ưu hóa và xác thực đầy đủ các thiết kế trung tâm dữ liệu trước khi sản xuất một hệ thống vật lý. Bằng cách trực quan hóa hiệu suất của trung tâm dữ liệu trong bản song sinh kỹ thuật số, các nhóm có thể tối ưu hóa tốt hơn thiết kế của mình và lập kế hoạch cho các tình huống giả định.

Người dùng cũng có thể nâng cao thiết kế trung tâm dữ liệu và cụm bằng cách cân bằng các nhóm điều kiện giới hạn khác nhau, chẳng hạn như độ dài cáp, nguồn, làm mát và không gian, theo cách tích hợp – cho phép các kỹ sư và nhóm thiết kế đưa các cụm lên trực tuyến nhanh hơn nhiều, hiệu quả và tối ưu hóa hơn so với trước đây.

Tìm hiểu thêm về NVIDIA Omniverse và NVIDIA Blackwell.

____
Bài viết liên quan
Góp ý / Liên hệ tác giả