Tổng hợp các GPU card của NVIDIA chuyên dùng cho AI / Deep Learning
Danh sách những “trái tim” của NVIDIA đem đến sức mạnh xử lý cho các tác vụ AI / Deep Learning.
NVIDIA Tesla V100 32GB CoWoS HBM2 PCIe 3.0
NVIDIA® Tesla® V100 là GPU dành cho trung tâm dữ liệu tiên tiến nhất thế giới được chế tạo để tăng tốc AI, HPC và đồ họa. Được cung cấp bởi NVIDIA Volta, kiến trúc GPU mới nhất, Tesla V100 cung cấp hiệu năng tương đương với 100 CPU trong một GPU duy nhất, cho phép các nhà nghiên cứu, nhà khoa học dữ liệu và các kỹ sư giải quyết các thách thức mà trước đây không thể nghĩ tới.
GPU Architecture | NVIDIA Volta |
NVIDIA Tensor Cores | 640 |
NVIDIA CUDA® Cores | 5,120 |
Double-Precision Performance | 7 TFLOPS |
Single-Precision Performance | 14 TFLOPS |
Tensor Performance | 112 TFLOPS |
GPU Memory | 32GB HBM2 |
Memory Bandwidth | 900GB/sec |
ECC | Yes |
Interconnect Bandwidth | 32GB/sec |
System Interface | PCIe Gen3 |
Form Factor | PCIe Full Height/Length |
Max Power Comsumption | 250 W |
Thermal Solution | Passive |
Compute APIs | CUDA, Direct Compute,OpenCL™, OpenACC |
NVIDIA Tesla T4 16GB GDDR6 PCIe 3.0
GPU NVIDIA T4 thuộc dòng enterprise-level, hỗ trợ các máy chủ mainstream đáng tin cậy nhất thế giới, dễ dàng phù hợp với cơ sở hạ tầng trung tâm dữ liệu tiêu chuẩn. Với thiết kế low-profile có công suất 70 watt (W) được cung cấp bởi NVIDIA Turing™ Tensor Cores, cung cấp hiệu suất multi-precision mang tính cách mạng để tăng tốc hàng loạt các ứng dụng hiện đại, bao gồm Machine Learning, Deep Learning và máy tính để bàn ảo (Virtual Desktops). GPU tiên tiến này được đóng gói trong 70W, small PCIe form factor, tiết kiệm năng lượng, được tối ưu hóa cho tiện ích tối đa trong các trung tâm dữ liệu doanh nghiệp và cloud.
GPU Architecture | NVIDIA Turing |
NVIDIA Turing TensorCores | 320 |
NVIDIA CUDA® Cores | 2,560 |
Single-Precision | 8.1 TFLOPS |
Mixed-Precision(FP16/FP32) | 65 TFLOPS |
INT8 | 130 TOPS |
INT4 | 260 TOPS |
GPU Memory | 16 GB GDDR6 300 GB/sec |
ECC | Yes |
Interconnect Bandwidth | 32 GB/sec |
System Interface | x16 PCIe Gen3 |
Form Factor | Low-Profile PCIe |
Thermal Solution | Passive |
Compute APIs | CUDA, NVIDIA TensorRT™, ONNX |
NVIDIA Tesla P4 8GB GDDR5 PCIe 3.0
NVIDIA Tesla P4 được cung cấp bởi kiến trúc NVIDIA Pascal™ mang tính cách mạng và được xây dựng nhằm mục đích tăng hiệu quả cho các máy chủ scale-out chạy các workloads Deep Learning, cho phép các dịch vụ đáp ứng thông minh dựa trên AI. Nó cắt giảm độ trễ suy luận 15 lần trong cơ sở hạ tầng bất kỳ và cung cấp hiệu quả năng lượng tốt hơn 60 lần so với CPU. Điều này mở ra một làn sóng dịch vụ AI mới trước đây không thể có do giới hạn về độ trễ.
GPU Architecture | NVIDIA Pascal™ |
Single-Precision Performance | 5.5 TeraFLOPS* |
Integer Operations (INT8) | 22 TOPS* (Tera Operations per Second) |
GPU Memory | 8 GB |
Memory Bandwidth | 192 GB/s |
System Interface | Low-Profile PCI Express Form Factor |
Max Power | 50W/75W |
Enhanced Programmability with Page Migration Engine | Yes |
ECC Protection | Yes |
Server-Optimized for Data Center Deployment | Yes |
Hardware-Accelerated Video Engine | 1x Decode Engine, 2x Encode Engine |
CUDA Cores | 2560 |
Giới thiệu về NVIDIA
NVIDIA với xuất phát điểm từ hãng sản xuất card tăng tốc đồ họa từ năm 1993, đến nay, hãng đã chuyển mình thành công ty chuyên cung cấp giải pháp điện toán Data Center hiệu năng cao, siêu máy tính cho AI và phân tích dữ liệu.
Nhất Tiến Chung (NTC) là nhà cung cấp các giải pháp hạ tầng CNTT, Điện toán Hiệu năng cao (HPC) cho AI với kinh nghiệm kinh doanh phần cứng từ năm 2005. Chúng tôi là nhà phân phối chính thức của NVIDIA cho các hệ thống điện toán hiệu năng cao dựa trên GPU bao gồm DGX A100, DGX Station A100 và hệ thống cụm siêu máy tính DGX SuperPOD với sức mạnh lưu trữ song song của DDN và mạng tốc độ cao từ Mellanox.