Máy chủ GPU SuperWorkstation 7049GP-TRT là một thiết kế riêng biệt của hãng Supermicro, nó là dạng máy chủ tower nhưng có hỗ trợ chuyển đổi sang dạng rackmount để đáp ứng về vấn đề lắp đặt ở các Data Center khi doanh nghiệp cần. Đây là dòng máy được thiết kế với khả năng hỗ trợ sử dụng 4 card GPU NVidia Tesla chuẩn double-width, nằm gọn trong khung máy dạng tháp 4U và hoạt động trên nền tảng Intel Xeon Scalable Gen 1 hoặc 2. Ngoài khả năng đảm nhiệm vai trò máy chủ, thiết kế này hoàn toàn có thể sử dụng để làm một trạm làm việc cho các ứng dụng render đồ họa hoặc dành cho các chuyên gia phân tích dữ liệu, AI training khai thác sức mạnh xử lý từ GPU.
Tổng quan về phần cứng của Supermicro SYS-7049GP-TRT:
1. Dual Socket P (LGA 3647) support 2nd Gen. Intel® Xeon® Scalable processors (Cascade Lake/Skylake)‡
2. 16 DIMMs; up to 4TB 3DS ECC DDR4-2933MHz† RDIMM/LRDIMM, Supports Intel® Optane™ DCPMM††
3. PCI-E 3.0 x16 (double-width) slots,
2 PCI-E 3.0 x16 (single-width) slots,
1 PCI-E 3.0 x4 (in x8) slot
4. 8 Hot-swap 3.5″ drive bays
5. 1 SIOM for flexible Networking
6. 2x 10GBase-T LAN ports
7. 4 Heavy duty fans, 4 exhaust fans, and 2 active heatsink with optimal fan speed control
8. 2200W Redundant Power Supplies Titanium Level (96%)
Hiệu năng
Đây là dòng máy chủ dạng đứng với thiết kế riêng biệt của Supermicro, giúp cho các doanh nghiệp có thể dễ dàng lắp đặt máy ngày tại văn phòng làm việc, tối ưu hóa cho việc quản lý và vận hành hệ thống. Server này là một trong những hệ thống GPU Server có hiệu năng tốt nhất ở thời điểm hiện nay. Hỗ trợ tối đa 2 CPU Intel Xeon Scalable với 28 nhân 56 luồng trên mỗi 1 CPU, TDP từ 70 – 205W. Hỗ trợ cả Intel Xeon Scalable Gen 1 và Gen 2, và với Gen 2 thì hệ thống sẽ được hỗ trợ nhiều dung lượng bộ nhớ hơn, tốc độ truy xuất nhanh hơn. Với số lượng làn PCIe lớn của thế hệ Xeon Scalable mới, hệ thống máy chủ này có thể kết nối đa dạng nhiều loại GPUs khác nhau phục vụ cho nhiều mục đích sử dụng khác nhau.
Bộ nhớ RAM
Ở máy chủ này, chúng ta có 8 khe cắm RAM được quản lý bởi 1 CPU và với hệ thống chạy 2 CPU thì có thể gắn tối đa 16 thanh RAM DDR4. Có thể tùy chọn sử dụng loại RAM RDIMM; LRDIMM hay bộ nhớ liên tục Intel Optane (DCCPM), cung cấp dung lượng cho bộ nhớ lên đến 4TB ở xung nhịp 2933 Mhz, tối ưu cho các ứng dụng đa nhiệm, phân tích dữ liệu hoặc Deep Learning.
Lưu trữ
Là một thiết kế phù hợp với các hệ thống đòi hỏi cao về tốc độ truy xuất dữ liệu nhanh chóng, máy chủ 7049GP-TRT hỗ trợ 8 khe cắm ổ cứng dạng 3.5 inch, có thể sử dụng ổ cứng chuẩn SATA, SAS để đạt hiệu năng cao với tốc độ đọc ghi nhanh và mật độ lưu trữ rất lớn với 8 ổ cứng, máy có khả năng lưu trữ lên đến khoảng hơn 128TB, giúp doanh nghiệp có một vùng lưu trữ “Bigdata”, phục vụ cho công việc Training, Suy luận, Triển khai các mô hình AI; DL; hay ML của mình. Với sự kết hợp tuyệt vời giữa SSD tốc độ cao cho Hệ điều hành và HDD SAS 12Gbps hỗ trợ lưu trữ hiệu năng cao, đây được xem là một lựa chọn lý tưởng cho các hệ thống triển khai phân tích dữ liệu và tính toán hiệu suất cao. Bên cạnh đó, với khả năng rút nóng các ổ cứng, nó còn giúp cho người dùng thuận tiện và dễ dàng hơn trong việc bảo hành; bảo trì hệ thống, tránh làm gián đoạn hoạt động của cả hệ thống.
Khả năng mở rộng
Máy chủ 7049 này cung cấp khả năng kết nối và mở rộng tối đa khi hỗ trợ đến 4 khe cắm mở rộng PCI-E 3.0 x16 (double-width); 2 khe PCI-E 3.0 x16 (single-width) và 1 khe cắm PCIe 3.0 x4. Với các khe x16 này, hệ thống có thể lắp đến 4 card GPU Tesla hay Quadro của NVIDIA chuẩn double-wide. Tiêu biểu là model dòng Tesla như T4; P4; P40; P100 và đặc biệt là dòng Tesla V100 (PCIe). Với hỗ trợ đến 4 GPUs Tesla hiệu năng cao này, doanh nghiệp có thể khai thác năng lực xử lý song song mạnh mẽ từ các GPU và các phép toán được NVidia đưa vào các GPU Tesla. Tiêu biểu nhất là dòng V100 với số nhân CUDA cao nhất thì đây là dòng GPU tốt nhất dành cho AI ở thời điểm hiện tại, đang được các cơ quan ứng dụng AI lớn khai thác ở cấp data center.
Với các yêu cầu hệ hệ thống ảo hóa máy trạm VDI, tính toán hiệu năng cao HPC thì GPU Server 7049GP-TRT cũng là một lựa chọn lý tưởng với khả năng kết nối, sử dụng dòng card Quadro RTX của NVIDIA thế hệ mới với các công nghệ mới của kiến trúc Turing vừa được hãng họ ra mắt trong năm nay, tiêu biểu là các dòng Quadro RTX 5000; RTX 6000 và cao cấp nhất là RTX 8000. Hỗ trợ các công nghệ mới như Real-Time Ray Tracing; Deep Learning Super Sampling, mang lại khả năng tính toán đồ họa, hiển thị hinh ảnh sắc nét, chất lượng cao và chân thực nhất nhưng lại không chiếm dụng nhiều tài nguyên phần cứng của hệ thống. Đây có thể xem là bước đột phá trong công nghệ mà hãng NVIDA họ mang lại, tối ưu cho các hệ thống cần khả năng xử lý mạnh mẽ về mặt đồ họa, Render 3D hạng nặng. Đặc biệt với dòng card Quadro RTX 8000 hỗ trợ bộ nhớ RAM lên đến 48GB( tối đa 96GB với NVlink) mang lại khả năng ảo họa cực tốt dành cho các hệ thống VDI hiện nay, người dùng có thể tạo ra nhiều vGPU để phục vụ cho nhiều nhu cầu khác nhau của doanh nghiệp, từ xử lý hình ảnh, phòng lap nghiên cứu, suy luận, đào tạo…với tốc độ và hiệu quả rất tốt.
Bên cạnh đó, hãng Supermicro cũng đã thiết kế 4 quạt làm mát tốc độ cao và 4 quạt hút hiệu suất lớn, được gắn ở các vị trí thuận lợi ở bên trong máy chủ để làm mát cho CPU, RAM và đặc biệt là các GPU với mức sinh nhiệt rất cao. Với sự hỗ trợ của hệ thống tản nhiệt công suất cao này, máy chủ 7049GP-TRT cho phép hệ thống vận hành ổn định ở trạng thái tối ưu và hiệu suất cao nhất trong thời gian liên tục.
Để đảm bảo hiệu quả hoạt động của cả hệ thống máy chủ, ở đây chúng ta có 2 bộ cấp nguồn (PSU), có thể rút nóng và hoạt động theo chế độ redundant (hỏng 1 nguồn máy vẫn vận hành) với công suất 2200W, hoạt động mạnh mẽ và ổn định cho hệ thống, đảm bảo khả năng cung cấp nguồn điện hoạt động cho các card GPUs có hiệu năng và công suất tiêu thụ lớn. Bên cạnh nguồn điện cung cấp thì máy còn hỗ trợ 4 cổng USB 3.0 để kết nối đến các thiết bị ngoại vi( bàn phím, chuột, USB…); 1 cổng VGA để xuất và hiển thị hình ảnh. Về kết nối mạng, chúng ta có 1 cổng Ethernet được đặt riêng nằm trên các nút USB dùng cho phần mềm quản trị từ xa IPMI giúp người dùng có thể quản lý, thiết lập hệ thống máy chủ từ xa, thuận tiện và dễ sử dụng hơn. Kế đến là hai cổng kết nối mạng RJ45 với tốc độ lên đến 10GbE mang lại tốc độ truy cập mạng nội bộ cao và ổn định cho hệ thống và được hỗ trợ thông qua chíp Intel X550.
Giao diện quản lý
Việc quản lý hệ thống thông qua giao diện IPMI (Intelligent Platform Management Interface) tận dụng bộ điều khiển ASPEED AST 2500 cung cấp khả năng quản lý từ xa của máy chủ, giúp người dùng có thể dễ dàng quản lý, thiết lập cấu hình hệ thống từ xa dễ dàng và thuận tiện hơn. Bên cạnh đó, với phần mềm Super Doctor 5 cung cấp giao diện người dùng trực quan và dễ dàng cho việc giám sát, hiển thị trạng thái sức khỏe hoạt động của tài nguyên phần cứng, từ đó giúp cho hệ thống được quản lý, theo dõi chặt chẽ, tránh các rủi ro đáng tiếc.
Tóm lược
Với hiệu năng hoạt động mạnh mẽ: CPU 56 nhân 112 luồng, bộ nhớ RAM 4TB tốc độ 2933 Mhz, ổ cứng 3.5 inch HDD tốc độ truy xuất nhanh, khả năng lắp đến 4 GPUs NVIDIA Tesla cao cấp. Server GPU System 7049GP-TRT là một lựa chọn lý tưởng, phục vụ cho dự án Deep Learning, HPC, hay VDI… Bên cạnh đó, với thiết kế có thể chuyển đổi giữa Tower và Rackmount (option thêm rail-kit), các doanh nghiệp vừa có thể lắp đặt máy ở văn phòng làm việc của mình để tối ưu về chi phí đầu tư cơ sở hạ tầng và cũng có thể dễ dàng lắp đặt máy ở trên Data Center khi chuyển đổi sang dạng rack giúp tối ưu về chi phí cho cơ sở hạ tầng mà vẫn đảm bảo hệ thống máy chủ của mình hoạt động ổn định và hiệu quả.
Bài viết liên quan
- Tìm hiểu tại sao triển khai on-premises có thể giúp vượt qua 6 thách thức quan trọng của AI
- Máy chủ Supermicro với bộ vi xử lý AMD EPYC 4004 mới: Hiệu quả cao, chi phí tối ưu
- Máy chủ Supermicro X14: Hiệu suất mạnh mẽ, hiệu quả tối đa cho AI, Cloud, Storage, 5G/Edge
- Suy luận AI trên các máy chủ thông dụng của HPE, Dell và Supermicro
- GPU NVIDIA RTX 2000 Ada – Hiệu suất vượt trội cho kỷ nguyên thiết kế và đồ họa bằng AI
- Supermicro AI Data Pipelines: Kiến trúc lưu trữ hiệu suất cao để tăng tốc AI và ML