Đánh giá hiệu năng GPU Nvidia RTX A4000 / RTX A5000

Dòng GPU chuyên nghiệp dựa trên kiến trúc Ampere của Nvidia, Nvidia RTX A4000RTX A5000, là một bước tiến lớn so với dòng Quadro RTX trước đó dựa trên Turing. Với bộ nhớ lớn hơn và khả năng xử lý được cải thiện đáng kể, chúng được đánh giá là xử lý dễ dàng các nhiệm vụ dò tia theo thời gian thực, GPU rendering và quy trình làm việc VR có yêu cầu cao.

Trước đây, chúng tôi từng có bài đánh giá về Nvidia RTX A6000 , mẫu GPU dành cho desktop chuyên nghiệp đầu tiên dựa trên kiến ​​trúc Ampere của Nvidia. Với bộ nhớ 48 GB và nhiều sức mạnh xử lý bên trong, mẫu card GPU dual-slot công suất 300W này được thiết kế cho các quy trình đồ họa có yêu cầu cao nhất – hãy nghĩ đến các bản sao chép số hóa có quy mô cấp thành phố, hoặc hình ảnh mô hình hóa sản phẩm bằng cách sử dụng texture có độ trung thực rất cao, được chụp từ các bản scan thực tế.

Tất nhiên, Nvidia RTX A6000 là quá cần thiết để hầu hết các kiến ​​trúc sư hoặc nhà thiết kế sản phẩm chỉ cần có một GPU có khả năng mô hình hóa theo thời gian thực, GPU rendering hoặc VR. Và đây chính là lúc mà 2 mẫu GPU Nvidia RTX A4000 và Nvidia RTX A5000 mới phát huy tác dụng.

Khi 2 mẫu GPU PCIe Gen 4 dựa trên Ampere Nvidia RTX A4000 và Nvidia RTX A5000 ra mắt, chúng là sản phẩm thay thế cho phiên bản PCIe Gen 3 ‘Turing’ – Nvidia Quadro RTX 4000 và Quadro RTX 5000 – ra mắt vào năm 2019.

RTX A4000 và A5000 là GPU ‘Quadro’ tầm trung về mọi mặt, ngoại trừ cái tên. Thương hiệu máy trạm Quadro lâu đời của Nvidia có thể sẽ được khai tử nhưng các đặc điểm của nó sẽ vẫn được giữ nguyên.

Cả hai card đều cung cấp nhiều bộ nhớ hơn so với các card GeForce dành riêng cho người dùng phổ thông, là trang thiết bị tiêu chuẩn trong các máy trạm của Dell, HP và Lenovo, đồng thời đi kèm driver chuyên nghiệp có chứng chỉ ISV cho nhiều ứng dụng CAD/BIM.

Với giá bán lẻ tham khảo là 1.000 đô la cho Nvidia RTX A4000 và 2.250 đô la cho Nvidia RTX A5000, chúng có giá dễ chịu hơn nhiều so với Nvidia RTX A6000 có giá đến 4.650 đô la.

Nvidia RTX (Ampere) / Quadro RTX (Turing) comparison

Nvidia RTX A4000 Nvidia RTX A5000 Nvidia RTX A6000 Quadro RTX 4000 Quadro RTX 5000 Quadro RTX 6000
Architecture Ampere Ampere Ampere Turing Turing Turing
GPU memory 16 GB GDDR6 24 GB GDDR6 48 GB GDDR6 8 GB GDDR6 16 GB GDDR6 24 GB GDDR6
ECC memory Yes Yes Yes No Yes Yes
CUDA cores 6,144 8,192 10,752 2304 3,072 4,608
Tensor Cores 192 256 336 288 384 576
RT Cores 48 64 84 36 48 72
SP perf 19.2 TFLOPS 27.8 TFLOPS 38.7 TFLOPS 7.1 TFLOPS 11.2 TFLOPS 16.3 TFLOPS
RT Core perf 37.4 TFLOPS 54.2 TFLOPS 75.6 TFLOPS N/A N/A N/A
Tensor perf 153.4 TFLOPS 222.2 TFLOPS 309.7 TFLOPS 57.0 TFLOPS 89.2 TFLOPS 130.5 TFLOPS
Max Power 140W 230W 300W 160W 265W 295W
Graphic bus PCI-E 4.0 x16 PCI-E 4.0 x16 PCI-E 4.0 x16 PCI-E 3.0 x16 PCI-E 3.0 x16 PCI-E 3.0 x16
Connectors DP 1.4 (4) DP 1.4 (4) DP 1.4 (4) DP 1.4 (3), USB-C DP 1.4 (4), USB-C DP 1.4 (4), USB-C
Form Factor Single slot Dual Slot Dual Slot Single slot Dual Slot Dual Slot
vGPU Software N/A NVIDIA RTX vWS NVIDIA RTX vWS N/A N/A NVIDIA RTX vWS
Nvlink N/A 2x RTX A5000 2x RTX A6000 N/A 2x RTX 5000 2x RTX 6000
Power Connector 1x 6-pin PCIe 1x 8-pin PCIe 1x 8-pin CPU 1x 6-pin PCIe 1x 8-pin PCIe 2x 8-pin PCIe

Nvidia RTX A4000 (16 GB)

Với bộ nhớ GDDR6 ECC 16 GB, Nvidia RTX A4000 cung cấp một bước tiến lớn so với Quadro RTX 4000  8 GB. 8 GB là đủ cho các quy trình làm việc chính, nhưng đối với các dự án phức tạp hơn thì nó có thể bị hạn chế, vì vậy việc cung cấp 16 GB trong GPU chuyên nghiệp dưới 1.000 đô la là một bước nhảy lớn. Trước đây, 16 GB chỉ được sử dụng trên dòng Quadro RTX 5000 dựa trên ‘Turing’.

Như bạn có thể mong đợi về kiến ​​trúc mới ‘Ampere’ của Nvidia, Nvidia RTX A4000 cũng cung cấp một cải tiến đáng kể về khả năng xử lý. Điều này có thể được tìm thấy ở mọi khu vực của GPU với nhiều lõi CUDA hơn để xử lý chung, Tensor Core thế hệ thứ ba cho các hoạt động AI và RT Core thế hệ thứ hai để dò tia (ray tracing) dựa trên phần cứng. Nó dẫn đến sự tăng cường cân xứng trong nhiều ứng dụng khác nhau.

Hơn nữa, vì Nvidia RTX A4000 là GPU 1-socket với điện năng tiêu thụ tối đa là 140W được cung cấp thông tin qua một đầu nối PCIe 6-pin duy nhất nên nó có sẵn trong nhiều máy trạm để bàn. Bao gồm các dòng tower nhỏ gọn như HP Z2 Tower G8 và Dell Precision 3650.

HP Z2 Compact Tower có thể lắp GPU Nvidia RTX A4000 hoặc Nvidia RTX A5000

Bo mạch có bốn cổng DisplayPort 1.4a và có thể kết nối tối đa đến 4 màn hình ở độ phân giải 5K. Nó được làm mát bằng 1 chếc quạt thổi, hút không khí mát từ phía trên và phía dưới của card, đưa qua phần tản nhiệt và sau đó thổi trực tiếp ra phía sau khung máy. Điều này trái ngược với GPU GeForce dành cho consumer sử dụng quạt hướng trục để tuần hoàn không khí bên trong máy.

Mỗi thiết kế đều có ưu và nhược điểm, nhưng sử dụng quạt nghĩa là bạn có thể sắp xếp các card trong chassis mà không cần phải chừa một khoảng trống giữa chúng. Điều này cũng có nghĩa là bạn có thể có GPU mật độ rất tốt bên trong một máy tính có kích thước cỡ vừa.

Ví dụ, với Lenovo ThinkStation P620 dựa trên AMD Threadripper Pro, bạn có thể có bốn Nvidia RTX A4000 liên tiếp, đây có thể là một chủ đề rất hay đối với việc xây dựng cấu hình GPU. Mặc dù RTX A4000 không hỗ trợ NVlink (do không có GPU memory pooling) nhưng 16 GB vẫn đủ nhiều và với hai, ba hoặc bốn RTX A4000 có thể hoạt động rất tốt xét về mặt giá cả/hiệu suất so với RTX A5000 hoặc A6000 mạnh hơn.

Một ứng dụng tiềm năng khác đối với hệ thống multi-GPU mật độ cao là ảo hóa máy trạm sử dụng tính năng ‘GPU passthrough’, trong đó mỗi người dùng có một GPU dành riêng. Một lần nữa, quy trình làm việc này có vẻ phù hợp với Lenovo ThinkStation P620, có thể được cấu hình với CPU tối đa 64 core và bộ nhớ 2TB.

Các tính năng đặc biệt khác bao gồm hỗ trợ 3D Stereo, Nvidia Mosaic cho các giải pháp đa màn hình chuyên nghiệp và Quadro Sync II, một add-in card có thể đồng bộ hóa màn hình và đầu ra hình ảnh từ nhiều GPU trong một hệ thống đơn hoặc trên cụm nhiều máy.

Card GPU single-slot Nvidia RTX A4000 có quạt hút gió từ cả hai phía.

Nvidia RTX A5000 hỗ trợ NVlink để gộp bộ nhớ trong nhiều cấu hình GPU

Nvidia RTX A5000 (24GB)

Với bộ nhớ GDDR6 ECC 24 GB, Nvidia RTX A5000 cung cấp bộ nhớ chỉ cao hơn 50% so với Quadro RTX 5000 mà nó thay thế.

Giống như Nvidia RTX A4000, sản phẩm này mang đến sự nâng cấp đáng kể ở mọi khía cạnh xử lý – CUDA, Tensor và RT cores.

Đây là card có chiều cao gấp đôi, với mức tiêu thụ điện tối đa là 230W được lấy từ PSU thông qua đầu nối PCIe 8 chân, loại vẫn có hỗ trợ trong máy tower nhỏ gọn.

Card này cũng có bốn cổng DisplayPort 1.4a và được làm mát bằng một quạt thổi nhưng chỉ hút khí làm mát từ một phía của card.

Nvidia RTX A5000 hỗ trợ tất cả các tính năng tương tự như Nvidia RTX A4000 nhưng khác ở hai điểm chính.

Thứ nhất, nó hỗ trợ Nvidia NVLink, vì thế bộ nhớ GPU có thể mở rộng lên đến 48 GB bằng cách kết nối hai GPU 24 GB với nhau.

Thứ hai, nó hỗ trợ Nvidia RTX vWS (phần mềm ảo hóa máy trạm) để có thể cung cấp nhiều ‘instance’ máy ảo hiệu suất cao, cho phép nhiều người dùng từ xa chia sẻ tài nguyên. Ví dụ: trong Lenovo ThinkStation P620, bạn có thể thiết lập số lượng lớn người dùng CAD/BIM, những người chỉ cần hiệu suất RTX cao nhất theo thời gian.

Test với Nvidia RTX A4000 / RTX A5000

Chúng tôi đã đưa Nvidia RTX A4000 và Nvidia RTX A5000 qua một loạt ứng dụng benchmark thực tế, các bài test về GPU rendering, mô hình hóa thời gian thực và CAD 3D.

Tất cả các thử nghiệm đều được thực hiện bằng mẫu máy trạm Scan 3XS GWP-ME A132R dựa trên AMD Ryzen ở độ phân giải 4K (3.840 x 2.160) bằng driver Nvidia 462.59 mới nhất.

Bạn có thể xem đầy đủ các thông số kỹ thuật bên dưới.

Scan 3XS GWP-ME A132R

  • CPU AMD Ryzen 5950X (3,4 GHz đến 4,9 GHz) (16 nhân)
  • Bộ nhớ Corsair Vengeance DDR4 3200MHz 64 GB (2 x 32 GB)
  • Ổ đĩa hệ thống SSD Samsung 980 Pro NVMe PCIe 4.0 2 TB
  • Ổ lưu trữ SSD SATA Samsung 870 Evo 4 TB
  • Bo mạch chủ Asus Pro WS X570-ACE
  • Air cooler: Noctua NH-D15
  • Nguồn Corsair RMX 750W, chuẩn 80PLUS Gold
  • Card mạng NIC 1GbE
  • Máy trạm 3XS có khung kính cường lực
  • Microsoft Windows 10 Professional 64-bit
  • Bảo hành 3 năm – Năm đầu tiên onsite, RTB năm thứ 2 và năm thứ 3 (Linh kiện và Nhân công)
  • Giá (có Nvidia RTX A4000) 3.333 bảng Anh (chưa bao gồm VAT) (chưa có sẵn).
  • Giá (có Nvidia RTX A5000) 4.166 bảng Anh (Chưa bao gồm VAT)

Để so sánh, chúng tôi đã sử dụng 2 GPU Nvidia pro ‘4000’ mới nhất –   Nvidia Quadro RTX 4000 ‘Turing’ 8 GB (từ năm 2019) và Nvidia Quadro P4000  ‘Pascal’ 8 GB (từ năm 2017). Ba đến bốn năm là một kiểu nâng cấp khá điển hình trong các máy trạm, vì mục tiêu ở đây là ý tưởng tốt về khả năng tăng hiệu suất mà người ta có thể mong đợi từ một máy cũ hơn.

Chúng tôi cũng thêm một số kết quả của Nvidia RTX A6000 vào. Những con số này được thực hiện trên hai máy trạm khác nhau với Threadripper Pro 3970X 32 core và CPU Intel Xeon W-2125 lõi tứ. Mặc dù cả hai CPU đều có tần số và instructions per clock (IPC) thấp hơn, nhưng kết quả vẫn có thể cung cấp ý tưởng khác về hiệu suất so sánh, đặc biệt là trong phần mềm GPU rendering.

Dò tia dựa trên phần cứng với Nvidia RTX A4000 / A5000

Đã hơn hai năm kể từ khi Nvidia giới thiệu Nvidia Quadro RTX ‘Turing’, GPU chuyên nghiệp đầu tiên có công nghệ dò tia phần cứng RTX.

Trong một lần ra mắt điển hình, có rất ít ứng dụng hỗ trợ RTX vào thời điểm đó, nhưng giờ đây điều này đã thay đổi. Đối với các ứng dụng thiết kế, có Chaos V-Ray, Chaos Vantage, Enscape, Unreal Engine, Unity, D5 render, Nvidia Omniverse, Autodesk VRED, KeyShot, Siemens NX Ray Traced Studio, Solidworks Visualize, Catia Live render và các ứng dụng khác.

Nvidia RTX đã mang đến bước khởi đầu mạnh mẽ cho GPU rendering và trong khi có sự cạnh tranh ngày càng tăng từ các CPU cực kỳ mạnh mẽ như AMD Threadripper [Pro] 64 nhân, chúng tôi đang chứng kiến cường độ sâu hơn với các công cụ GPU rendering, đặc biệt là trong quy trình làm việc thân thiện với kiến ​​trúc sư / kỹ sư / nhà thiết kế sản phẩm.

Nvidia RTX đang được sử dụng để tăng tốc độ cho các công cụ render dò tia cổ điển như V-Ray, KeyShot và Solidworks Visualize, mà chúng tôi sẽ thử nghiệm bên dưới. Tuy nhiên, một số nhà phát triển thú vị hơn đến từ lĩnh vực AEC trong các công cụ như Enscape, Chaos Vantage và Unreal Engine, thực sự giúp ray tracing ‘thời gian thực’. Ví dụ: Vantage được xây dựng từ đầu để thực hiện dò tìm theo thời gian nên có thể tối đa hóa công việc bằng cách sử dụng cốt RT Core trong GPU mới.

Chaos Group V-Ray

V-Ray là một trong những công cụ xây dựng dựa trên nền tảng phổ biến nhất, đặc biệt là trong hình ảnh kiến ​​trúc. Chúng tôi đã thử nghiệm các card mới bằng cách sử dụng tiêu chuẩn V-Ray 5 có thể tải xuống miễn phí, có các bài kiểm tra chuyên môn cho GPU Nvidia CUDA, GPU Nvidia RTX cũng như CPU.

Kết quả thực sự ấn tượng. Trong bài kiểm tra CUDA, Nvidia RTX A4000 nhanh hơn 1,62 lần so với Nvidia Quadro RTX 4000 thế hệ trước và nhanh hơn 1,70 lần trong bài kiểm tra RTX. Quadro P4000 dựa trên Pascal không có gì khác ngoài sự vượt trội – nhanh hơn 3,53 lần trong bài kiểm tra CUDA. Vì P4000 không có RT Core riêng nên không thể chạy bài kiểm tra RTX.

Nâng cấp lên Nvidia RTX A5000 sẽ giúp bạn tăng tốc độ nhanh hơn. Như vậy với Nvidia RTX A4000 thì nó nhanh hơn từ 1,27 đến 1,37 lần.

Điều thú vị là RTX A5000 không quá xa so với RTX A6000, vốn có giá cao hơn gấp đôi.

Luxion Keyshot

KeyShot, một công cụ CPU rendering, là một công cụ mới trong thế giới GPU rendering. Nhưng đây là một trong những phát triển mượt mà nhất mà chúng tôi từng thấy, cho phép người dùng chuyển đổi giữa kết nối CPU và GPU chỉ bằng một nút nhấn.

Trong chuẩn Keyshot 10, một phần miễn phí của KeyShot Viewer, hiệu suất tăng cường thậm chí đáng kể hơn so với V-Ray. Nvidia RTX A4000 và Nvidia RTX A5000 vượt trội hơn Quadro RTX 4000 lần lượt là 1,89 và 2,51. Và RTX A5000 chỉ chậm hơn RTX A6000 20%.

DS Solidworks Visualize 2021 SP3

Cái tên của công kết xuất dựa trên vật lý được tăng tốc bằng GPU này có thể gây ra một số nhầm lẫn vì nó hoạt động với nhiều ứng dụng hơn so với cùng tên CAD của ứng dụng. Nó có thể nhập vào các mô hình từ Creo, Solid Edge, Catia và Inventor, cũng như một số định dạng trung lập.

Kể từ phiên bản phát hành năm 2020, phần mềm đã hỗ trợ Nvidia RT Core và Tensor Core để cải thiện hiệu suất render cho GPU Nvidia RTX. Người dùng có thể chọn render với có hoặc không tắt khử nhiễu.

Khử nhiễu là một kỹ thuật xử lý hậu kỳ dựa trên học máy giúp lọc nhiễu từ hình ảnh chưa hoàn thiện/có nhiễu và là nền tảng cho nhiều ứng dụng tăng tốc bằng RTX. Điều này có nghĩa là bạn có thể có được bản render đẹp hơn với số lần xuất ra ít đi đáng kể.

DS Solidworks tính toán rằng nếu một cảnh thường xuyên cần xử lý 500 lần mà không cần bộ khử nhiễu, thì bạn có thể đạt được kết quả đầu ra chất lượng tương tự với bộ xử lý 50 lần khi kích hoạt bộ khử nhiễu.

Chúng tôi đã thử nghiệm mẫu xe Camaro 1969 tiêu chuẩn ở độ phân giải 4K với 1.000 lần quét (tắt khử nhiễu) và 100 lần quét (bật khử nhiễu) được thiết lập ở chất lượng chính xác. Cả hai thiết lập đều tạo ra kết quả hình ảnh tuyệt vời.

RTX A4000 và RTX A5000 đã xuất hiện 100 lần trong 22 giây và 14 giây tương ứng. Đây không phải là cảnh phức tạp nhất nhưng có khả năng kết xuất ở tốc độ rất đáng ngạc nhiên và có thể có tác động sâu sắc đến quy trình làm việc. Để so sánh, GPU Quadro P4000 mất 105 giây, vì vậy bạn có thể tìm thấy mọi thứ đã tiến triển như thế nào trong bốn năm.

Real-time 3D với Nvidia RTX A4000 / A5000

Trong khi GPU rendering là một tính năng chính của Nvidia RTX A4000 và Nvidia RTX A5000, real-time 3D sử dụng OpenGL, DirectX và (trong tương lai) Vulkan vẫn tiếp tục là một phần rất quan trọng trong mô hình hóa kiến ​​trúc, với các ứng dụng bao gồm TwinMotion, Lumion, Enscape, Unreal Engine, LumenRT và nhiều ứng dụng khác.

Tất nhiên, ranh giới giữa 3D thời gian thực và dò tia tiếp tục mờ nhạt. Trên thực tế, trong danh sách chỉ có Lumion và Twinmotion vẫn chưa được hỗ trợ RTX, mặc dù nó sẽ sớm có trên Twinmotion.

Để kiểm tra tốc độ khung hình, chúng tôi đã sử dụng các phần mềm giám sát hợp nhất nhất bao gồm FRAPS, Xbox Game Bar và MSI Afterburner. Chúng tôi chỉ thử nghiệm ở độ phân giải 4K (3.840 x 2.160). Ở độ phân giải FHD (1.920 x 1.080), loại GPU này đơn giản là không đủ sức chịu đựng.

Enscape 2.6

Enscape là một công cụ VR và trực quan thời gian thực dành cho các kiến ​​trúc sư sử dụng OpenGL và cung cấp đồ họa chất lượng rất cao trong chế độ xem. Enscape đã sử dụng các yếu tố dò tia trong phần mềm của mình trong một thời gian. Phiên bản 3.0 hỗ trợ RTX, có thể bật và tắt đầy đủ tính năng dò tia. Phiên bản sau sẽ sử dụng API Vulkan hiện đại hơn và hỗ trợ ray tracing trên cả GPU Nvidia và AMD.

Đối với các thử nghiệm của mình, chúng tôi đã sử dụng kiến ​​trúc cảnh quan của một bảo tàng và khu vực xung quanh trong Enscape 2.6 (không phải RTX). Ở mức 7,5 GB, mô hình này yêu cầu GPU bộ nhớ tương thích GPU, nhưng Enscape các mô hình có thể lớn hơn nhiều.

Về hiệu suất, Nvidia RTX A4000 và A5000 mang lại trải nghiệm rất mượt mà với lần lượt là 30 và 40 FPS. Tốc độ này nhanh gấp đôi Nvidia Quadro RTX 4000 và nhanh hơn Nvidia Quadro P4000 từ ba đến bốn lần.

Autodesk VRED Professional 2022

Autodesk VRED Professional là công cụ trực quan hóa 3D, tạo prototype ảo tập trung vào ô tô. Công cụ này sử dụng OpenGL và cung cấp hình ảnh chất lượng rất cao trong khung nhìn. Công cụ này cung cấp nhiều cấp độ khử răng cưa thời gian thực (AA), rất quan trọng đối với kiểu dáng ô tô vì nó làm các cạnh của tấm ốp thân xe. Tuy nhiên, AA cho phép sử dụng nhiều tài nguyên GPU, cả về xử lý thiết bị và bộ nhớ. Chúng tôi đã thử nghiệm mô hình ô tô của mình với AA được đặt thành ‘off’ và ‘ultra-high’.

Xem xét rằng ứng dụng mô hình hóa chuyên nghiệp này trước đây chỉ thực sự chạy hiệu quả trên GPU chuyên nghiệp siêu cao cấp của Nvidia, thật đáng kinh ngạc khi Nvidia RTX A4000 – một card dưới 1.000 đô la – cung cấp hơn 30 FPS ở độ phân giải 4K với khử răng cưa trung bình. Khi nói như vậy, những sản phẩm thực sự đẩy cáo ranh giới của mô hình hóa ô tô vẫn có thể cần đến Nvidia RTX A6000 ở mức độ cao nhất, đặc biệt là quy trình làm việc VR có độ phân giải cao.

Unreal Engine 4.26

Trong vài năm qua, Unreal Engine đã khẳng định mình là một công cụ rất nổi bật về thiết kế viz, đặc biệt là về kiến ​​trúc và ô tô. Đây là một trong những ứng dụng đầu tiên sử dụng công nghệ dò tia thời gian thực tăng tốc bằng GPU thực sự, công nghệ này thực hiện thông qua Microsoft DirectX Ray tracing (DXR).

Chúng tôi đã sử dụng hai bộ dữ liệu để thử nghiệm, cả hai đều có sẵn miễn phí từ Epic Games: một mô hình kiến trúc của một căn hộ nhỏ và Automotive Configurator, trong đó có chiếc xe mui trần Audi A5. Cả hai cảnh đều được thử nghiệm với các tính năng được bật (DirectX Ray tracing (DXR)) và không bật (Rasterisation DirectX 12).

Kết quả tương tự như mong đợi về khả năng mở rộng tốt giữa tất cả các GPU có rasterization DirectX 12. Khi bật tính năng tìm kiếm thời gian thực, hiệu suất tự động được ảnh hưởng nói chung, nhưng Quadro P4000 thực sự là hình ảnh bị ảnh hưởng khi không có bất kỳ RT Core nào.

VRMark

Chúng tôi cũng đã thử nghiệm với VRMark, một tiêu chuẩn ảo thực tế chuyên nghiệp sử dụng cả DirectX 11 và DirectX 12. Nó thiên về các trò chơi 3D nên không hoàn hảo theo yêu cầu của chúng tôi, nhưng có thể cung cấp chỉ báo tốt về hiệu suất mà người ta có thể mong đợi ở các công cụ ‘game engine’.

CAD và BIM với Nvidia RTX A4000 / A5000

Hầu hết các công cụ CAD và BIM 3D đều có xu hướng bị giới hạn bởi CPU, do đó hiệu suất hoạt động được giới hạn ở tần số tần số (GHz) của CPU. Do đó, Nvidia RTX A4000 và Nvidia RTX A5000 thực sự cần thiết để hầu hết các ứng dụng CAD và BIM. Chúng khó có thể mang lại cho bạn hiệu suất 3D tốt hơn đáng kể so với các GPU phổ biến hơn như Nvidia Quadro P1000 hoặc P2200.

Tuy nhiên, các ứng dụng CAD đang thay đổi và trong tương lai, sẽ có thể tận dụng tốt hơn nhiều sức mạnh dồi dào của các GPU cao cấp hơn như RTX A4000 và A5000. Cả Autodesk với One Graphics System mới  và Dassault Systèmes hiện đang hoạt động trên các công cụ đồ họa mới sử dụng API đồ họa hiện đại hơn – Vulkan. Điều này không chỉ cải thiện hiệu suất nói chung của 3D mà còn giúp tính năng dò tia thời gian thực có sẵn trực tiếp trong chế độ xem. Vì vậy, mặc dù RTX A4000 / A5000 có thể không mang lại lợi ích hiệu suất đáng kể trong CAD ngay bây giờ, nhưng chúng chắc chắn có thể làm như vậy trong tương lai.

Ngoài ra, điều quan trọng cần lưu ý là cả hai GPU đều được chứng nhận cho nhiều ứng dụng CAD/BIM chuyên nghiệp, điều này rất quan trọng đối với một số công ty. Điều này đặc biệt đúng đối với các doanh nghiệp mua hàng trăm hoặc hàng trạm từ các OEM lớn như HP, Dell và Lenovo và muốn đảm bảo rằng GPU sẽ ổn định và được nhà phát triển phần mềm hỗ trợ phù hợp.

Việc chứng nhận là lý do nhiều hãng lựa chọn công nghệ GPU RTX chuyên nghiệp của Nvidia thay vì các sản phẩm ‘GeForce tiêu dùng’ để họ có thể tự tin sử dụng các ứng dụng như Revit, Solidworks, PTC Creo và Siemens NX Tương tự với các công cụ tập trung hơn vào hình ảnh như Chaos V-Ray, Enscape, Luxion KeyShot và Solidworks Visualize.

Solidworks 2021

Trong khi hầu hết các ứng dụng CAD sẽ không được hưởng lợi từ bất kỳ GPU nào ngoài Nvidia Quadro P1000 hoặc P2200, Solidworks 2021 là một ngoại lệ. Bằng cách sử dụng OpenGL 4.5, phiên bản hiện đại hơn của API phổ đồ họa, nhiều thuật toán hơn có thể được đưa vào GPU, điều đó mang lại lợi ích cho hiệu suất GPU cao hơn.

Mặc dù vậy, ứng dụng này vẫn bị giới hạn ở một mức độ nào đó về CPU, do đó, mang lại lợi ích về hiệu suất mà các thẻ mới mang lại cho bạn không được hưởng lợi ích mà bạn nhận được từ một công cụ trực tuyến tiếp theo chuyên môn hóa thời gian thực sự.

Tương tự như hầu hết các công cụ CAD, cách phổ biến nhất để xem các màn hình trong Solidworks là ở chế độ shaed edge. Sử dụng SPCapc chuẩn cho SolidWorks 2021, chúng tôi đã tìm thấy một cải tiến nhỏ, qua từng thế hệ với kiểu hiển thị này. Nvidia RTX A4000 nhanh hơn Quadro RTX 4000 1,10 lần và nhanh hơn Quadro P4000 ‘Pascal’ 1,44 lần.

Solidworks cũng có nhiều kiểu hiển thị thực tế hơn để xem mô hình theo thời gian thực. SolidWorks RealView, được hỗ trợ chỉ bởi GPU chuyên nghiệp, vật liệu thực tế bổ sung hỗ trợ phản xạ môi trường và đổ bóng trên sàn. Trong khi đó, tính năng ‘ambient occlusion’ bổ sung đổ bóng thực tế hơn và giúp làm nổi các chi tiết.

Cả hai kiểu view đều sử dụng nhiều GPU hơn, do đó hiệu suất ít bị giới hạn bởi tần số của CPU. Trong các thử nghiệm của chúng tôi, chúng tôi nhận được nhiều lợi ích hơn so với các GPU cũ. Với RealView, Shadows và Ambient Occlusion được bật, Nvidia RTX A4000 nhanh hơn Quadro RTX 4000 1,16 lần và nhanh hơn Quadro P4000 1,57 lần.

Chúng tôi không thể test với Nvidia RTX A5000 vì Solidworks 2021 SP3 không nhận được card. Chúng tôi hy vọng lỗi này sẽ sớm được khắc phục trong SP4.

Phần kết luận

Với Nvidia RTX A4000 và A5000 mới, Nvidia đã tạo ra kiến ​​trúc GPU ‘Ampere’ của mình một cách dễ dàng tiếp cận hơn nhiều với nhiều đối tượng hơn. Đặc biệt, chúng tôi đã tìm thấy Nvidia RTX A4000 dưới 1.000 đô la đạt đến điểm tuyệt vời cho các nhà thiết kế, kỹ sư hoặc kiến ​​trúc sư muốn có khả năng chuyên nghiệp trong quy trình làm việc của họ.

Sự nhảy vọt về hiệu suất từ ​​​​​​’Turing’ lên ‘Ampere’ (Quadro RTX 4000 lên RTX A4000) thực sự là điểm gây ấn tượng. Trong 3D thời gian thực, khả năng tăng 45% lên 60%, qua từng thế hệ, có vẻ bình thường, với tốc độ thậm chí còn lớn hơn từ tính năng dò tia thời gian thực khi RT Core và Tensor Core được cải thiện. Sự nhảy vọt từ dòng ‘Pascal’ Quadro P4000 bốn năm tuổi thực sự là sự thật phi thường, đặc biệt là đối với hoạt động GPU rendering.

Việc trang bị RTX A4000 với bộ nhớ 16 GB là rất quan trọng. Trong khi chúng tôi thường thấy các mô hình/cảnh vượt quá 8 GB (dung lượng của Quadro RTX 4000 thế hệ trước) thì các cảnh có dung lượng 16 GB sẽ trở nên chắc chắn ít phổ biến hơn và dành riêng cho các chuyên gia viz hơn là hầu hết các kiến ​​trúc sư hoặc nhà thiết kế sản phẩm sử dụng vật liệu và asset tiêu chuẩn.

Trong khi chúng tôi đang chờ AMD cung cấp phiên bản Pro của GPU ‘Big Navi’ Radeon RX 6000 với công nghệ dò tia phần cứng thì đối thủ cạnh tranh lớn nhất của Nvidia trong lĩnh vực đồ họa chuyên nghiệp hiện tại là chính họ!

Ví dụ, GeForce RTX 3080 Ti 12 GB ‘dành cho comsumer’ mới có thể có một nửa bộ nhớ của Nvidia RTX A5000, nhưng cung cấp hiệu suất cao hơn lý thuyết ở một nửa mức giá. Nvidia thậm chí còn có GeForce Studio control cho các ứng dụng bao gồm Enscape, Unreal Engine và V-Ray.

Mặc dù GPU tiêu dùng của Nvidia có sức hấp dẫn rõ ràng, các mẫu ‘A’ của Nvidia vẫn sẽ tiếp tục được công ty và doanh nghiệp thu lợi nhuận khi mua với số lượng lớn, mong muốn có nhiều bộ nhớ hơn, nguồn cũng ổn định, các tính năng chuyên nghiệp hoặc bằng chứng xác thực. Ngoài ra còn có vấn đề về nguồn cung cấp. Khi tình trạng thiếu chip toàn cầu tiếp tục diễn ra, Nvidia có thể ưu tiên sản xuất GPU chuyên nghiệp có biên lợi nhuận cao hơn, làm cho GeForce trở nên khó tiếp cận hơn.

Nvidia vẫn còn nhiều việc phải làm để hoàn thiện dòng Ampere của mình. Trong khi các máy trạm di động đã có GPU RTX A2000 và A3000 ở cấp độ thấp thì không có GPU tương thích cho máy tính để bàn.

 

Theo AEC Mag

Góp ý / Liên hệ tác giả