Đánh giá GPU máy trạm: Nvidia RTX 6000 Ada Generation

Không thể phủ nhận hiệu suất ngoạn mục của GPU máy trạm hàng đầu mới của Nvidia và tiềm năng của nó trong việc biến đổi hoàn toàn quy trình làm việc, nhưng mức giá rất cao của nó sẽ khiến nhiều người nản lòng.

Các kiến trúc GPU mới của Nvidia được đưa ra với nhiều cấp độ từ cao đến thấp. Và Nvidia RTX 6000 Ada Generation mới thực sự là đỉnh cao trong phân khúc. Với mức giá 7.150 bảng Anh (chưa bao gồm VAT), GPU chuyên nghiệp 48 GB này dành riêng cho những chuyên gia thực sự coi trọng hình ảnh thiết kế, mô phỏng hoặc AI.

Điều đầu tiên cần nói đến là tên của GPU máy trạm mới này. Nó được xây dựng trên kiến trúc Ada Lovelace của Nvidia, đặt theo tên của nhà toán học người Anh, người được công nhận là lập trình viên máy tính đầu tiên.

Gần đây, Nvidia đã sử dụng một tiền tố chữ cái duy nhất cho GPU chuyên nghiệp của mình — P cho Pascal, T cho Turing, A cho Ampere, v.v.Vì ‘A’ đã được sử dụng, nên ban đầu Nvidia gọi GPU Ada Lovelace là Nvidia RTX 6000, nhưng ngay sau đó đã gắn cái tên ‘Ada Generation’ vào cuối, có lẽ là để tránh nhầm lẫn với Nvidia Quadro RTX 6000 dựa trên Turing ra mắt năm 2018.

Chúng tôi không biết tại sao Nvidia không sử dụng tiền tố ‘L’ như đã làm với GPU trung tâm dữ liệu ‘Ada Lovelace’ (Nvidia L4 và L40), nhưng đây là thứ chúng ta đang bàn đến. Nvidia RTX 6000 Ada Generation có thể hơi khó hiểu, nhưng ít nhất nó có một bản sắc rõ ràng.

Dòng GPU máy trạm

Nvidia RTX 6000 Ada Generation là GPU máy trạm PCIe 4.0 khe cắm kép, chiều cao đầy đủ (dual-slot, full-height), có bốn đầu nối DisplayPort 1.4a. Nó trông gần như giống hệt với model tiền nhiệm của nó, Nvidia RTX A6000, và có thiết kế góc cạnh tối giản màu đen và vàng. Quạt kiểu hướng tâm thổi khí nóng trực tiếp ra khỏi mặt sau của máy trạm thông qua lưới tản nhiệt trên rack.

Tổng công suất của bo mạch là 300W, ít hơn so với các sản phẩm dành cho phân khúc consumer ‘Ada Lovelace’ ba khe cắm — Nvidia GeForce RTX 4090 và GeForce RTX 4080. Nguồn điện được cung cấp thông qua một đầu nối PCIe CEM5 16 chân duy nhất.

Card có số lượng bộ xử lý cực lớn: 142 RT Core thế hệ thứ 3 cho tính năng dò tia (cung cấp 211 TFLOP), 568 Tensor Core thế hệ thứ 4 cho tính toán AI (cung cấp 1.457 TFLOPs) và 18.176 CUDA cores thế hệ tiếp theo cho các hoạt động mục đích chung, và có đến 91 TFLOP hiệu suất độ chính xác đơn. Đây là một bước nhảy vọt đáng kể so với mẫu card Nvidia RTX A6000 mà nó thay thế, mang lại hiệu suất RT Core là 76 TFLOPs, hiệu suất Tensor là 310 TFLOP và hiệu suất độ chính xác đơn là 39 TFLOPS.

Nvidia RTX 6000 Ada đi kèm với 48 GB bộ nhớ GDDR6, đủ cho hầu hết các quy trình làm việc tập trung vào hình ảnh. Tuy nhiên, không giống như thế hệ trước, RTX 6000 Ada Generation không hỗ trợ NVLink, do đó không thể kết nối hai GPU với nhau bằng bộ điều hợp để tạo nhóm bộ nhớ 96 GB. Mặc dù điều này không quan trọng đối với hầu hết người dùng, nhưng nó có thể là rào cản đối với những người làm việc với các mô hình có số lượng đa giác cực cao/kết cấu có độ phân giải cao. Nó cũng có thể hạn chế việc sử dụng trong mô phỏng kỹ thuật, bao gồm Động lực học chất lưu tính toán (CFD).

48 GB vẫn gấp đôi so với card dành cho consumer cao cấp Nvidia GeForce RTX 40-Series. RTX 6000 Ada cũng khác biệt so với card dành cho consumer của Nvidia ở một số điểm khác, bao gồm trình điều khiển chuyên nghiệp, chứng nhận phần mềm chuyên nghiệp, hỗ trợ bộ nhớ có mã sửa lỗi (ECC) và một số tính năng chuyên biệt cho pro viz, bao gồm stereo và Frame Lock cho cụm viz.

Nó cũng hỗ trợ phần mềm GPU ảo Nvidia (vGPU), cho phép một máy trạm được tái sử dụng thành nhiều phiên bản máy trạm ảo được tăng tốc bằng GPU. Với các nhà cung cấp máy trạm, đặc biệt là Lenovo và HP, đang tích cực làm cho các máy trạm để bàn ‘Sapphire Rapids’ mới của họ thân thiện với rack, tính năng này có thể trở nên quan trọng hơn bao giờ hết.

Cuối cùng, sản phẩm này có hiệu suất mã hóa video gấp 3 lần so với Nvidia RTX A6000, để live streaming nhiều phiên XR đồng thời bằng Nvidia CloudXR.

Nvidia RTX 6000 Ada Generation xử lý dễ dàng các mô hình trực quan thời gian thực mở rộng, chẳng hạn như tòa nhà phức hợp Enscape 3.0 này

Tối ưu hóa cho đồ họa

Nvidia RTX 6000 Ada cung cấp tất cả các nâng cấp của thế hệ mà bạn mong đợi từ một kiến trúc GPU mới, nhưng cũng có những thay đổi đáng kể trong cách GPU thực hiện các phép tính để tăng hiệu suất trong các quy trình làm việc tập trung vào hình ảnh. Deep Learning Super Sampling 3 (DLSS) và Shader Execution Reordering (SER) là hai công nghệ nổi bật. Nvidia DLSS đã ra mắt trong nhiều năm và với Nvidia RTX 6000 Ada mới, hiện nó đã ở thế hệ thứ ba. Nó sử dụng AI Tensor Core của GPU để tăng hiệu suất.

Với GPU ‘Ampere’ thế hệ trước của Nvidia, DLSS 2 đã sử dụng khung hình hiện tại độ phân giải thấp và khung hình trước có độ phân giải cao để dự đoán (theo từng pixel) khung hình hiện tại độ phân giải cao sẽ trông như thế nào.

Với DLSS 3, Tensor Core tạo ra các khung hình hoàn toàn mới thay vì chỉ các pixel. Nó xử lý khung hình mới và khung hình trước đó để khám phá cách cảnh vật thay đổi, sau đó tạo ra các khung hình hoàn toàn mới mà không cần phải xử lý luồng đồ họa.

Cho đến nay, chúng ta chỉ thấy DLSS 3 được triển khai trong Nvidia Omniverse, nhưng chúng tôi hy vọng những sản phẩm khác cũng sẽ đi theo. Ví dụ, Enscape và Autodesk VRED đều hỗ trợ DLSS 2.

Với vai trò là lớp nền cho Shader Execution Reordering (SER), Nvidia giải thích rằng GPU hiệu quả nhất khi xử lý các công việc tương tự cùng lúc. Tuy nhiên, với ray tracing, các tia phản xạ theo các hướng khác nhau và giao nhau với các bề mặt có nhiều loại khác nhau. Điều này có thể dẫn đến các luồng khác nhau xử lý các shader khác nhau hoặc truy cập bộ nhớ khó hợp nhất hoặc lưu trữ đệm.

Với SER, Nvidia RTX 6000 Ada Generation có thể sắp xếp lại tải xử lý của mình một cách cơ động, do đó các shader tương tự được xử lý cùng nhau. Theo Nvidia, SER có thể tăng tốc độ ray tracing lên gấp hai đến ba lần và tốc độ khung hình tăng lên tới 25%. Nhưng đây có lẽ là những con số hơi quá đà. Ví dụ, đối với path tracing ngoại tuyến trong Unreal Engine 5.1, Nvidia trích dẫn tốc độ cải thiện là 40% trở lên.

Mô phỏng kỹ thuật

Trong khi đồ họa là ứng dụng chính của Nvidia RTX 6000 Ada, GPU cũng có thể được sử dụng để mô phỏng kỹ thuật.

Khi ra mắt, Nvidia đã nhấn mạnh việc sử dụng phần mềm Ansys, bao gồm Ansys Discovery và Ansys Fluent cho tính toán động lực học chất lỏng (CFD).

So với RTX A6000, RTX 6000 Ada không chỉ có nhiều nhân hơn và lõi nhanh hơn mà còn có bộ nhớ đệm L2 lớn hơn đáng kể (96 MB so với 6 MB) và băng thông bộ nhớ tăng lên (960 GB/giây so với 768 GB/giây). Theo Ansys, điều này dẫn đến ‘hiệu suất gia tăng ấn tượng’ cho danh mục ứng dụng Ansys rộng lớn.

Tuy nhiên, Nvidia RTX 6000 Ada không phù hợp với tất cả các công cụ mô phỏng. Một số trình mô phỏng yêu cầu độ chính xác kép và với hiệu suất FP64 tương đối kém (ở mức 1.423 GFLOPS là 1/64 hiệu suất FP32 của nó), RTX 6000 Ada khó có thể hoạt động tốt trong những trình xử lý có độ chính xác kép. Trên thực tế, đối với các trình xử lý độ chính xác kép, ngay cả Nvidia Quadro GP100 năm 2016 cũng tự hào có hiệu suất FP64 tốt hơn là 5,17 TFLOP.

Ansys Discovery chạy trên Nvidia RTX 6000 Ada Generation

Test Nvidia RTX 6000 Thế hệ Ada

Chúng tôi đã đưa Nvidia RTX 6000 Ada Generation qua một loạt các bài test benchmark trên ứng dụng thực tế, bao gồm cả kết xuất bằng GPU và trực quan hóa theo thời gian thực.

GPU dường như là quá mức cần thiết đối với phần mềm CAD và BIM thế hệ hiện tại, vì vậy chúng tôi không thực hiện bất kỳ thử nghiệm nào về vấn đề đó. Tuy nhiên, điều quan trọng cần lưu ý là nó vẫn sẽ được chứng nhận cho các phần mềm như Revit và Archicad, điều đó rất hữu ích nếu bạn có kế hoạch sử dụng các loại ứng dụng cốt lõi đó cùng với các công cụ tập trung nhiều hơn vào thiết kế như Enscape, V-Ray, Twinmotion và Lumion.

Thông số kỹ thuật đầy đủ của máy tính thử nghiệm AMD Ryzen Threadripper Pro của chúng tôi, Scan 3XS GWP-ME A1128T có thể tham khảo bên dưới.

Scan 3XS GWP-ME A1128T

Bộ xử lý AMD Ryzen Threadripper Pro 5995WX (2,7 GHz, tăng tốc 4,5 GHz) (64 nhân, 128 luồng)
Bộ nhớ DDR4 3200MHz 256 GB (8 x 32GB) được Samsung ECC đăng ký
Ổ cứng SSD Samsung 990 Pro NVMe PCIe 4.0 2TB
8TB RAID Array (4 ổ SSD Samsung 990 Pro NVMe PCIe 4.0 2TB)
Bo mạch chủ Asus Pro WS WRX80E Sage SE WiFi
Corsair H150i Elite Cappelix RGB với quạt Noctua
Corsair HXi 1.500W, 80PLUS Platinum
Microsoft Windows 11 Pro

Để so sánh, chúng tôi cũng đã thử nghiệm GPU Nvidia RTX A6000 bên trong cùng một máy. Trình điều khiển 528.24 pro của Nvidia đã được sử dụng cho cả hai GPU.

Quét 3XS GWP-ME A1128T với GPU Nvidia RTX 6000 Ada Generation

3D thời gian thực

Hình ảnh 3D thời gian thực với các ứng dụng sử dụng API đồ họa OpenGL, DirectX hoặc Vulkan vẫn tiếp tục là một phần rất quan trọng của hình ảnh kiến trúc. Các ứng dụng chính bao gồm TwinMotion, Lumion, Enscape và Unreal Engine.

Chúng tôi đã ghi lại tốc độ khung hình (Khung hình trên giây) trong Enscape, Unreal Engine, Nvidia Omniverse và Autodesk VRED Professional, một ứng dụng trực quan thường được sử dụng trong thiết kế ô tô.

Chúng tôi chỉ thử nghiệm ở độ phân giải 4K (3.840 x 2.160). Ở độ phân giải FHD (1.920 x 1.080), có thể khẳng định rằng Nvidia RTX 6000 Ada Generation có thể mang lại hiệu suất đủ dùng.

Trong Enscape, chúng tôi đã thử nghiệm với năm mô hình khác nhau. Nhìn chung, trải nghiệm của chúng tôi cực kỳ mượt mà, ngay cả với bản dựng phức tạp Enscape 3.0 hỗ trợ RTX lớn sử dụng bộ nhớ GPU 11 GB (xem hình trên).

Tuy nhiên, mô hình chuẩn mực ưa thích của chúng tôi, một cảnh đô thị từ Enscape 3.1, phản hồi không được tốt, đôi khi mất vài giây để phản hồi với chuyển động của chuột hoặc bàn phím. Chúng tôi không biết tại sao lại như vậy, nhưng có thể là do nó bao gồm các tài nguyên và kết cấu tùy biến và có một số xung đột. Tuy nhiên, khi nó bắt đầu, chúng tôi đã ghi lại được 124,95 FPS, nhanh hơn 63% so với Nvidia RTX A6000.

Trong Unreal Engine 4.26, mức tăng theo từng thế hệ nhỏ hơn. Mức tăng lớn nhất là khi tính năng dò tia được bật trên mẫu thử nghiệm Audi của chúng tôi, với RTX 6000 Ada Generation cung cấp FPS cao hơn RTX A6000 gấp 1,5 lần.

Trong Autodesk VRED Professional 2023, hiệu suất tăng từ 1,63 đến 1,89. Hiệu suất tăng lớn nhất khi tắt chức năng khử răng cưa.

Trong Nvidia Omniverse Create 2022.3.3, chúng tôi đã thử nghiệm với mô hình mẫu xây dựng Brownstone. Ở chế độ RTX – Thời gian thực với DLSS được bật, RTX 6000 Ada nhanh hơn RTX A6000 tới 3,62 lần. Tuy nhiên, có một trường hợp so sánh táo với lê ở đây vì RTX 6000 Ada sử dụng DLSS 3 trong khi RTX A6000 sử dụng DLSS 2 (xem trước đó). Khi nói như vậy, chúng tôi không thấy sự khác biệt về mặt hình ảnh giữa hai chế độ. Ở chế độ RTX – tương tác (theo dõi đường dẫn), RTX 6000 Ada nhanh hơn 2,16 lần.

Render với Ray Tracing

Chúng tôi đã thử nghiệm với một loạt trình render dò tia được tăng tốc bằng GPU, bao gồm V-Ray GPU, KeyShot, Solidworks Visualize, Nvidia Omniverse và Blender.

Với các chuẩn V-Ray, KeyShot và blender, RTX 6000 Ada Generation đã vượt lên dẫn trước, vượt trội hơn RTX A6000 lần lượt là 1,93, 2,05 và 2,17. Chúng tôi đã thấy những cải thiện tương tự trong Nvidia Omniverse, với RTX 6000 Ada mất ít hơn một nửa thời gian so với RTX A6000 để dựng cảnh tòa nhà đá nâu.

Tuy nhiên, trong một số thử nghiệm ứng dụng thực tế của chúng tôi, mức tăng không lớn như vậy. Trong Solidworks Visualize 2023, kết xuất cảnh thử nghiệm Camaro 1969 bằng Nvidia Iray và công cụ chiếu sáng toàn cầu 3DS Stellar Physically Correct mới, cho thấy RTX 6000 Ada nhanh hơn RTX A6000 từ 32% đến 40%.

Trong KeyShot 2023, RTX 6000 Ada Generation đã dựng mô hình xe máy của chúng tôi nhanh hơn từ 33% đến 41% trong một loạt ảnh tĩnh và hoạt ảnh quay đĩa. Với cảnh máy bay không người lái mẫu của KeyShot, tốc độ giảm xuống còn 23%-25%.

Kết luận

Nvidia RTX 6000 Ada Generation là một GPU cực kỳ mạnh mẽ. Trong một số quy trình đồ họa, nó mang lại hiệu suất cao gấp đôi so với Nvidia RTX A6000 thế hệ trước. Và khi Nvidia kiểm soát hoàn toàn cả phần mềm và phần cứng, và Tensor Core thế hệ thứ tư của GPU hoạt động với DLSS 3, hiệu suất tăng theo thời gian thực (dường như không ảnh hưởng đến trải nghiệm của người dùng cuối) thực sự rất ngoạn mục. Với mức hiệu suất tăng cường của GPU này, nó có thể giúp bạn tiết kiệm được nhiều giờ trong ngày làm việc. Ví dụ, khi kết xuất hoạt ảnh 4K 600 khung hình trong KeyShot 2023, thời gian kết xuất đã giảm từ 6 giờ 26 phút xuống còn 4 giờ 50 phút.

NVIDIA RTX6000 ADA PCIe

→ Mua GPU NVIDIA RTX6000 48GB Ada tại đây.

Tuy vậy, cũng có một số nhược điểm đối với mẫu GPU mới. Đầu tiên, nó không hỗ trợ NVLink. Điều này có thể gây thất vọng cho những người thực sự muốn vượt qua ranh giới của sự phức tạp. Thứ hai, nó khá ngốn điện, tiêu thụ 300W ở mức cao nhất. Và cuối cùng, tất nhiên là về giá cả.

7.150 bảng Anh (chưa bao gồm VAT) là một số tiền đáng kể để trả cho một card đồ họa duy nhất và cao hơn đáng kể so với mức giá mà Nvidia đã tính cho các GPU máy trạm cao cấp trước đây. Ví dụ, Nvidia RTX A6000 chỉ có giá 3.730 bảng Anh (chưa bao gồm VAT) vào tháng 2 năm 2021.

Trong khi một số người coi 7.150 bảng Anh là mức giá xứng đáng để trả cho tác động mang tính biến đổi mà nó có thể mang lại cho quy trình làm việc của họ, những người khác có thể tìm kiếm giá trị tốt hơn ở đâu đó khác.

AMD Radeon Pro W7900 (48 GB) mới là một trong những lựa chọn như vậy, mặc dù nó không cung cấp cùng phạm vi hỗ trợ phần mềm. Có lẽ Nvidia đang phải đối mặt với sự cạnh tranh lớn nhất từ bên trong hơn bao giờ hết. GeForce RTX 4090 ‘Ada Generation’ tập trung vào người tiêu dùng có giá khoảng 1.500 bảng Anh, nhưng bạn sẽ bỏ lỡ một số tính năng chuyên nghiệp, chất lượng xây dựng vượt trội và quyền truy cập vào bộ nhớ 48 GB, gấp đôi so với 4090. Và đối với một số chuyên gia hình ảnh thì đó là một vấn đề lớn. 48 GB cho phép bạn làm việc với các tập dữ liệu phức tạp hơn và hiển thị chúng ở độ phân giải cao hơn. Trong mô phỏng, các kỹ sư có thể tăng độ trung thực của trình ứng dụng để có kết quả chính xác hơn.

Bộ nhớ bổ sung sẽ không chỉ mang lại lợi ích tiềm năng cho quy trình làm việc của một ứng dụng. Ngày nay, nhiều chuyên gia đồ họa sử dụng nhiều ứng dụng cùng lúc – ví dụ như render trong V-Ray trong khi làm việc trên các trải nghiệm thời gian thực trong Unreal Engine. Và RTX 6000 Ada Generation có nhiều khả năng cho phép họ làm điều này mà không phải thỏa hiệp với quy trình làm việc của họ.

Theo AEC Mag

____
Bài viết liên quan