Trong danh mục máy chủ của Supermicro hiện có rất nhiều sản phẩm chuyên dùng cho điện toán hiệu năng cao dựa trên GPU. Tất cả các sản phẩm này được thiết kế với mục tiêu rất rõ ràng là đáp ứng việc vận hành và kết hợp nhiều GPU chạy cùng lúc một cách ổn định, đảm bảo vấn đề về tản nhiệt, trao đổi dữ liệu tốc độ cao bên trong lẫn với bên ngoài, cùng với đó là giải pháp lưu trữ hiệu quả với các hỗ trợ cho NVMe.
Sản phẩm tiêu biểu là model máy chủ GPU Supermuicro SYS-4029GP-TRT, với hỗ trợ gắn đến 8 GPU chuẩn double-wide; Hỗ trợ chạy trên nền tảng CPU Intel Xeon Scalable thế hệ 1 và 2.
HPC – Điện toán hiệu năng cao là gì?
Điện toán hiệu năng cao là giải pháp điện toán được tối ưu cho khả năng xử lý dữ liệu song song bằng cách chuyển các phép xử đến các GPU có hiệu quả xử lý song song cao.
Với khả năng giải quyết cùng lúc lượng lớn dữ liệu này, HPC được ứng dụng cho các hệ thống trí tuệ nhân tạo (deep learning, phân tích dữ liệu lớn), các hệ thống thị giác máy tính, phân tích hình ảnh.
Xem thêm: Thuật ngữ HPC
Tổng quan về phần cứng của Supermicro SYS-4029GP-TRT
Supermicro SuperServer 4029GP-TRT Key Features:
1. Dual Socket P (LGA 3647) support 2nd Gen. Intel® Xeon® Scalable processors (Cascade Lake/Skylake)‡
2. 24 DIMMs; up to 6TB 3DS ECC DDR4-2933MHz† RDIMM/LRDIMM, Supports Intel® Optane™ DCPMM††
3. 8 PCI-E 3.0 x16 slots (support up to 8 double width GPU), 2 PCI-E 3.0 x8, 1 PCI-E 3.0 x4
4. Up to 24 Hot-swap 2.5″ drive bays; 8x 2.5″ SATA drives supported with included H/W, 2x 2.5″ NVMe drives supported with included H/W, 1 NVMe based M.2 SSD
5. 2x 10GBase-T LAN ports via Intel C622
6. 8 Hot-swap 92mm RPM cooling fans
7. 2000W (2+2) Redundant Power Supplies Titanium Level (96%+)
Đây là dòng máy chủ dạng nằm với kích thước tiêu chuẩn 4U Rackmonut, với những thiết kế riêng biệt của hãng Supermicro. Ở thiết kế mặt trước, máy có 24 khe cắm ổ cứng dạng 2.5 inch, có thể sử dụng ổ cứng chuẩn SATA/SAS/NVMe cho cả ổ SSD hay HDD, mang lại hiệu năng cao, tốc độ nhanh chóng mà lại có độ trễ cực thấp. Đặc biệt với 24 ổ cứng, máy còn có khả năng lưu trữ lên đến khoảng hơn 190TB, giúp doanh nghiệp có một vùng lưu trữ “Bigdata”, phục vụ cho công việc Training, Suy luận, Triển khai các mô hình AI; DL; hay ML của mình. Ngoài ra, với khả năng rút nóng các ổ cứng, nó còn giúp cho người dùng thuận tiện và dễ dàng hơn trong việc bảo hành; bảo trì hệ thống, tránh làm gián đoạn hoạt động của hệ thống máy chủ.
Bên cạnh các khe cắm ổ cứng thì máy còn có các đèn LED hiển thị trạng thái hoạt động; hai nút Power và Reset phục vụ cho việc quản trị hệ thống, giúp người dùng có thể theo dõi hiện trạng hoạt động của máy tốt hơn.
Phía sau của máy có thiết kế khá tiêu chuẩn với 4 bộ cấp nguồn (PSU), có thể rút nóng và hoạt động theo chế độ redundant (hỏng 1 nguồn máy vẫn vận hành) theo 2 cặp( 2+2) cung cấp công suất mạnh mẽ và ổn định cho hệ thống, đặc biệt khi sử dụng với các card GPUs có hiệu năng và công suất tiêu thụ lớn. Các bộ nguồn cũng cho phép rút nóng, dễ dàng trong việc tháo lắp và thay thế linh kiện Kế đến là cổng VGA và 4 cổng USB giúp kết nối đến các thiết bị ngoại vi.
Về các kết nối mạng, ta có thể thấy có 3 cổng kết nối. Một cổng LAN đơn độc ở phía trên các cổng USB 2.0 là cổng quản lý, giúp kết nối từ xa để quản trị, cấu hình hệ thống máy chủ thông qua phần mềm IPMI 2.0. Đối với kết nối mạng tiêu chuẩn, có hai cổng dựa trên bộ điều khiển mạng Intel C622 với tốc độ cao 10Gbps, giúp hệ thống mạng nội bộ hoạt động ổn định và hiêu quả với tốc độ cao.
Ở phía trên của mặt sau, chúng ta có thể thấy các khe tản nhiệt, giúp hệ thống xả các lưu lượng nhiệt tỏa ra trong qua trình hoạt động của các card GPU, giúp máy có thể đc tối ưu hơn trong quá trình hoạt động cũng như chế độ làm mát cho các linh kiện bên trong, đặc biệt là các GPUs dạng Passive.
Trái tim của máy chủ là bo mạch chủ Supermicro X11DPG-OT-CPU, là trung tâm giúp liên kết và điều khiển tất cả linh kiện thiết yếu như CPU, RAM, các khe cắm PCIe và ổ cứng lưu trữ với nhau thành một khối thống nhất, mang lại hiệu quả hoạt động rất tốt cho hệ thống máy chủ.
Hiệu năng hoạt động của hệ thống được tối ưu bằng việc hỗ trợ sử dụng CPU hiệu suất cao Intel Xeon Scalable thế hệ 1 & 2 với các dòng cao cấp như Silver; Gold hay Platinum. Với hiệu năng tối đa cho mỗi CPU lên đến 28 nhân 58 luồng, mang lại hiệu quả hoạt động và tốc độ truy xuất dữ liệu cực kỳ nhanh chóng, rất lý tưởng cho các hệ thống AI; ML; DL….Và với cấu hình sử dụng 2 CPU hiệu năng cao thì chắc chắn sẽ mang lại hiệu quả hoạt động; hiệu quả công việc rất tuyệt vời cho các doanh nghiệp.
Song song với CPU Intel Xeon Scalable hiệu năng cao chính là bộ nhớ RAM DDR4 Enterprise, dòng chuyên dụng dành cho các máy chủ hiệu năng cao. Máy chủ này hỗ trợ gắn tối đa 24 khe cắm RAM DDR4 với các dung lượng tùy chọn từ 16-128GB cho mỗi thanh, như vậy với 24 khe cắm, chúng ta có dung lượng bộ nhớ tối đa lên đến 6TB với tốc độ cao 2933 Mhz. Với bộ nhớ có dung lượng và tốc độ cao, đặc biệt với dòng RAM giảm tải LRDIMM, đây là một sự kết hợp hoàn hảo dành cho các mô hình Trí Tuệ Nhân Tạo, Deep Learning….mang lại khả năng hoạt động tốt nhất cho các mô hình này, giúp cho việc nghiên cứu, đào tạo….ứng dụng trí thông minh vào hoạt động kinh doanh, công việc của các doanh nghiệp tốt hơn và hiệu quả hơn.
Một thành phần không kém phần quan trọng, góp phần làm nên sức mạnh cho bộ máy GPU server chính là các card GPU hiệu năng cao. Máy chủ 4029GP-TRT hỗ trợ gắn được 8 card GPU dạng double-wide hiệu năng cao của hãng NVIDIA, tiêu biểu là dòng Tesla với các model cao cấp như T4; P4; P40; P100 và đặc biệt là dòng Tesla V100. Với sự hỗ trợ của tối đa 8 GPUs Tesla hiệu năng cao này, giúp cho các mô hình cấp cao của doanh nghiệp được triển khai, hoạt động với tốc độ và tính chính xác cực cao với sự hỗ trợ tối đa của NVIDIA khi họ tích hợp rất nhiều các thuật toán vào các GPU Tesla, tiêu biểu nhất là dòng V100, với hiệu năng và khả năng tính toán, suy luận rất cao thì đây là dòng GPU tốt nhất dành cho AI ở thời điểm hiện tại.
Dòng card GPU hiệu năng cao chuyên dùng cho Deep Learning
Các GPUs này sẽ được cấp nguồn từ các chân cắm nguồn 8 pin gắn trực tiếp từ Mainboard, và được kết nối trực tiếp qua các khe cắm PCIe hổ trợ trên Backplane X9DRG-O-PCIE với 8 khe PCI-E 3.0 x16, 2 khe PCI-E 3.0 x8 và 1 PCI-E 3.0 x4. Với sự đa dạng về các chuẩn PCIe như vậy, nó sẽ giúp cho người dùng có thể lắp đặp thêm các card mở rộng khác như card Network, card RAID controller hay card HBA….tùy thuộc vào các nhu cầu sử dụng khác nhau của doanh nghiệp, tối ưu hóa hiệu quả hoạt động cho các mô hình ẠI, DL, ML của doanh nghiệp.
Và với các yêu cầu hệ hệ thống ảo hóa máy trạm VDI, HPC hay 3D Rendering Farm thì GPU Server 4029GP-TRT cũng là một lựa chọn lý tưởng với khả năng kết nối, sử dụng dòng card Quadro RTX của NVIDIA thế hệ mới với các công nghệ mới của kiến trúc Turing vừa được hãng họ ra mắt trong năm nay, tiêu biểu là các dòng Quadro RTX 5000; RTX 6000 và cao cấp nhất là RTX 8000. Hỗ trợ các công nghệ mới như Real-Time Ray Tracing; Deep Learning Super Sampling, mang lại khả năng tính toán đồ họa, hiển thị hinh ảnh sắc nét, chất lượng cao và chân thực nhất nhưng lại không chiếm dụng nhiều tài nguyên phần cứng của hệ thống. Đây có thể xem là bước đột phá trong công nghệ mà hãng NVIDA họ mang lại, tối ưu cho các hệ thống cần khả năng xử lý mạnh mẽ về mặt đồ họa, Render 3D hạng nặng. Đặc biệt với dòng card Quadro RTX 8000 hỗ trợ bộ nhớ RAM lên đến 48GB( tối đa 96GB với NVlink) mang lại khả năng ảo họa cực tốt dành cho các hệ thống VDI hiện nay, người dùng có thể tạo ra nhiều vGPU để phục vụ cho nhiều nhu cầu khác nhau của doanh nghiệp, từ xử lý hình ảnh, phòng lap nghiên cứu, suy luận, đào tạo…với tốc độ và hiệu quả rất tốt.
Với hiệu năng hoạt động mạnh mẽ: CPU 56 nhân 112 luồng, bộ nhớ RAM 6TB tốc độ 2933 Mhz; ổ cứng 2.5 inch HDD/SSD tốc độ truy xuất nhanh chóng và đặc biệt là khả năng kết nối lên đến 8 GPUs cao cấp, Server GPU System 4029GP-TRT là một lựa chọn lý tưởng, phục vụ cho các mô hình Trí Tuệ Nhân Tạo, Deep Learning, Machine Learning; Tính Toán Hiệu Năng Cao HPC hay VDI…Bên cạnh đó, với thiết kế dạng nằm kích thước tiêu chuẩn 4U, các doanh nghiệp có thể dễ dàng lắp đặt máy ở trên Data Center giúp tối ưu về chi phí cho cơ sở hạ tầng mà vẫn đảm bảo hệ thống máy chủ của mình hoạt động ổn định và hiệu quả.
Thông tin sản phẩm:
→ Máy Chủ SuperServer SYS-4029GP-TRT
Bài viết liên quan
- Hyperscale computing: Làm cách nào để đạt được năng lực điện toán quy mô lớn tốt hơn
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Cluster Computing – Thế nào là điện toán cụm?
- Tìm hiểu tại sao triển khai on-premises có thể giúp vượt qua 6 thách thức quan trọng của AI
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform