Dưới đây là phần tóm tắt cho bài phát biểu quan trọng của NVIDIA GTC Fall 2022, một sự kiện chuyên sâu về AI và công nghệ GPU do NVIDIA tổ chức, diễn ra trực tuyến từ ngày 19 – 22 tháng 9 năm 2022.
Bài viết được ghi lại theo trình tự trực tiếp từ sự kiện.
NVIDIA GTC Fall 2022 Keynote
Trong bản tóm tắt này, chúng ta kỳ vọng sẽ được nghe về các GPU mới và các ứng dụng mới của RTX, AI và Omniverse. Có thể có thông tin về chip mới và các dịch vụ đám mây.
NVIDIA RTX 4000 Ada Lovelace
NVIDIA Ada Lovelace là nền tảng RTX thế hệ thứ 3. GPU mới được xây dựng trên TSMC 4N 76B và 18000 nhân CUDA, nhiều hơn 70% so với thế hệ RTX 3000.
NVIDIA Ada Lovelace Slide 1
Các shader (trình tạo bóng) mới có năng lực lên đến 90 TFLOPS. Một bộ xử lý streaming mới có Shader Execution Reodering (SER) mà NVIDIA ví như bộ thực thi out-of-order cho CPU.
Các lõi RT thế hệ thứ 3 mới nhanh hơn với 200 RT TFLOPS. Ngoài ra còn có các lõi tensor thế hệ thứ 4 với năng lực lên đến 1400 Tensor TFLOPS và bộ tăng tốc luồng quang học để giúp khung hình mượt mà.
NVIDIA cũng có một số phát minh để giúp tính năng Ray Tracing trở nên phổ biến hơn.
Những đổi mới ở NVIDIA Ada Lovelace RTX
Với DLSS 3, bạn có thể làm được nhiều việc hơn mà không cần sử dụng GPU rendering chính hoặc thậm chí cả CPU pipelines.
Một thứ mà NVIDIA đang thúc đẩy gần đây là Omniverse. Nó đã tìm ra một cách thông minh để đưa mọi người đến với nền tảng này. Nó có RTX Remix cho phép bạn tải game, sao chụp lại game bằng USD (Universal Scene Description), sau đó trong Omniverse, bộ công cụ RTX Remix có thể chỉnh sửa các texture và giúp người sửa đổi tạo vật liệu thông qua AI.
NVIDIA RTX Remix
Tiếp theo, người ta có thể xuất ra bản mod và chơi nó. Điều này thực sự khôn khéo vì nó là một gateway để thu hút các nhà phát triển và nghệ sĩ trên Omniverse.
Ảnh chụp màn hình NVIDIA RTX Remix
Dưới đây là các khu vực hiệu suất mà NVIDIA mong đợi sẽ đạt được và mức tiêu thụ điện năng.
Hiệu suất và sức mạnh NVIDIA Ada Lovelace
Bây giờ đã đến lúc dành cho GPU.
Jensen với NVIDIA GeForce RTX 4090 trong tay
Đây là GeForce RTX 4090:
Tổng quan về NVIDIA RTX 4090
Có vẻ như không có thêm bộ nhớ ở thế hệ này.
Đây là GeForce RTX 4080:
Tổng quan về NVIDIA GeForce RTX 4080
Vì NVIDIA đang bắt đầu làm mới với các phiên bản cao cấp hơn, đây là sơ bộ GeForce RTX mới:
NVIDIA GeForce RTX Q4 2022
Sau thông báo này, NVIDIA đã trình bày nhiều hơn về Omniverse. Đó là một chủ đề lớn cho công ty trong thời gian sắp tới.
NVIDIA Omniverse
NVIDIA Omniverse là nền tảng của công ty dành cho thế giới kỹ thuật số mà công ty hy vọng sẽ mở rộng mọi thứ từ các “digital twins” (phiên bản số hóa), đến gaming, mô phỏng và hơn thế nữa.
NVIDIA GTC Fall 2022 Keynote – Omniverse
Trong suốt bài keynote, họ đã công bố các tính năng mới cho nền tảng này, bao gồm hỗ trợ cho GPU Ada Lovelace.
NVIDIA GTC 2022 Fall Keynote – Các cập nhật mới của Omniverse
Cuối cùng, Omniverse cần một thành phần đám mây để cộng tác.
NVIDIA GTC 2022 Fall Keynote – Omniverse Cloud Computer
Và chúng ở đây.
NVIDIA GTC 2022 Fall Keynote – Omniverse Cloud
Đây là công bố đầu tiên trong số nhiều thông tin về cloud mà NVIDIA sẽ đưa ra hôm nay và trong tương lai gần.
Cập nhật mới NVIDIA Drive với Thor
Trước đây, NVIDIA đã lên lịch ra mắt cho nền tảng Atlan vào năm 2024. Nhưng bây giờ không còn thấy nữa và được thay thế bằng Thor, với hiệu suất gấp đôi Atlan trong cùng mốc thời gian.
NVIDIA GTC Fall 2022 Keynote – Thor thay thế Atlan
Điều này sẽ mang GPU thế hệ tiếp theo, cùng với các lõi được tăng cường sức mạnh Grace Neoverse V2 mới, tiến lên nền tảng robot thế hệ tiếp theo, trước đây là Orin, là nền tảng hiện nay.
NVIDIA GTC Fall 2022 Keynote – NVIDIA Drive Thor
Một phần ý tưởng ở đây là nền tảng mới có thể được sử dụng để cung cấp sức mạnh cho lĩnh vực thông tin giải trí cũng như các tính năng hỗ trợ lái xe. Nó cũng có khả năng xử lý multi-domain để nó có thể chạy chẳng hạn như Linux, QNX và Android, cùng một lúc.
Ngày nay, có rất nhiều máy tính khác nhau trên ô tô.
NVIDIA GTC Fall 2022 Keynote – Các máy tính khác nhau ngày nay trên ô tô
Trong tương lai, NVIDIA cho rằng Thor có thể thay thế phần lớn, nếu không muốn nói là tất cả. Điều đó có nghĩa là tiêu thụ điện năng thấp hơn và yêu cầu về trọng lượng / kích thước đối với máy tính cũng như hệ thống dây điện cũng thấp hơn.
NVIDIA GTC Fall 2022 Keynote – Thor thay thế nhiều máy tính
NVIDIA nói rằng NVLink C2C giúp kết nối nhiều chip Thor cho các ứng dụng cần nhiều sức mạnh xử lý hơn.
NVIDIA cho biết NVIDIA Drive Orin thế hệ hiện tại của họ đã có hơn 40 chiến thắng về thiết kế cho đến thời điểm này.
NVIDIA GTC Fall 2022 Keynote – NVIDIA Drive Orin
Orin đang ở trong Máy chủ Metropolis Edge AI Orin.
NVIDIA GTC 2022 Fall Keynote – Metropolis Edge AI Server
Nó cũng là trung tâm của NVIDIA IGX Orin. Đây là nền tảng mATX kết hợp hai cổng ConnectX-7 (400Gbps) và sẽ được sử dụng trong một số ứng dụng mới, bao gồm cả y tế.
NVIDIA GTC Fall 2022 Keynote – NVIDIA IGX Orin
IGX Orin này có lẽ là nền tảng thú vị nhất tại GTC 2022, bên cạnh dòng RTX 4000.
Mô phỏng NVIDIA Isaac cho robot cũng có sẵn dưới dạng dịch vụ đám mây.
Hệ thống điện toán tăng tốc của NVIDIA trong Datacenter Stack
Đây là slide thiết lập cho phần tiếp theo.
NVIDIA GTC Fall 2022 Keynote – NVIDIA Scaling
NVIDIA RAPIDS có thể được sử dụng trên Windows WSL. Nó cũng hỗ trợ máy chủ Arm. Công ty cho biết RAPIDS cũng sẽ đến với Apache Spark.
Máy chủ suy luận NVIDIA Triton đang được mở rộng với 50 tính năng mới. Nó bao gồm suy luận mô hình ngôn ngữ lớn.
NVIDIA GTC Fall 2022 Keynote – Triton
NVIDIA đưa ra các phần mềm và các công ty sử dụng phần mềm của NVIDIA. Chúng ta sẽ bỏ qua các phân đoạn này.
Một trong những thông báo lớn hơn được gắn với các mô hình ngôn ngữ lớn khi chúng phát triển về mức độ phức tạp và quy mô.
NVIDIA GTC Fall 2022 Keynote – Các mô hình ngôn ngữ lớn đang phát triển
NVIDIA sẽ cung cấp một dịch vụ có thể sử dụng các mô hình ngôn ngữ lớn và tùy chỉnh chúng với số lượng ít nhất là 500 cặp đầu vào.
NVIDIA GTC Fall 2022 Keynote – Tùy chỉnh các mô hình ngôn ngữ lớn
Sau đó, nó sẽ cung cấp đầu ra dưới dạng dịch vụ API. Lợi thế cho một công ty là họ có thể đào tạo các mô hình mà không cần có các cụm GPU lớn. Đối với NVIDIA, đây có thể là một ngành kinh doanh có tỷ suất lợi nhuận cực cao vì khách hàng dựa vào nó để lưu trữ các mô hình AI ở trung tâm của các chức năng kinh doanh.
NVIDIA GTC 2022 Fall Keynote – NeMo LLM Service
NVIDIA sẽ có một phiên bản khác cho y tế và những thứ như khám phá thuốc. Đó sẽ là BioNeMo. Cả hai dịch vụ NeMo sẽ được chạy thử trên NVIDIA SuperPod vào tháng 10 năm 2022. NVIDIA cho biết H100 nhanh hơn ~ 5 lần so với A100 đối với các mô hình ngôn ngữ lớn do các transformer engine.
NVIDIA H100 trong Bản cập nhật production
Về NVIDIA H100, nó đang được sản xuất. Nó sẽ được bán ra vào tháng 10 thông qua các phiên bản PCIe.
NVIDIA GTC Fall 2022 Keynote – NVIDIA H100 đang được sản xuất
Các nền tảng dựa trên HGX với mô-đun SXM sẽ nằm trong Q1, do đó sẽ bao gồm các máy như DGX H100.
NVIDIA H100 tại văn phòng NVIDIA tháng 4 năm 2022
Tiếp theo với NVIDIA Grace.
Chi tiết về NVIDIA Grace
NVIDIA cho biết Grace Hopper sắp ra mắt của họ sẽ lý tưởng cho các hệ thống đề xuất có nhu cầu về bộ nhớ có tốc độ nhanh, hơn là về dung lượng.
NVIDIA GTC 2022 Fall Keynote – Grace Hopper
Đây là chip Grace Hopper mới với các lõi Arm Neoverse V2:
NVIDIA GTC 2022 Fall Keynote – Grace Hopper với các đột phá
Nhiều thông số kỹ thuật chúng tôi đã có. NVIDIA thông báo rằng các hệ thống với Grace Hopper sẽ có sẵn trong nửa đầu năm 2023. Chúng tôi coi điều đó có nghĩa là vào quý 2 năm 2023.
NVIDIA GTC 2022 – Grace Hopper systems vào 1H 2023
Rất thú vị với Grace và Grace Hopper.
GPU NVIDIA L40 cho Omniverse
Đối với Omniverse, có một GPU L40 mới với 48GB bộ nhớ.
NVIDIA GTC Fall 2022 Keynote – GPU NVIDIA L40
Đây là card PCIe mà NVIDIA cho biết đang được sản xuất chính thức. Chúng tôi đã từng hỏi NVIDIA về điều này vài tuần trước, và cuối cùng họ cũng thừa nhận rằng đó sẽ là dòng GPU mới sẽ ra mắt.
Lời cuối cùng
NVIDIA RTX 4000 series và L40 dựa trên Ada Lovelace là những cải tiến lớn so với các thế hệ trước. Ngoài ra, Orin IGX cũng rất thú vị. Có lẽ tác động lớn hơn là NVIDIA đang tập trung vào việc cung cấp các dịch vụ đám mây. Cuối cùng, NVIDIA sẽ sử dụng các dịch vụ đám mây như NeMo và Omniverse để tạo ra sự kết dính lớn vào hệ sinh thái NVIDIA và cả các cơ hội có tỷ suất lợi nhuận cao hơn. Cuối cùng, NVIDIA sẽ xem xét lợi nhuận khổng lồ mà các nhà cung cấp dịch vụ đám mây và nhà cung cấp phần mềm có được và nhận ra rằng họ có thể kiếm tiền tốt hơn từ nhiều hàm xử lý (function) được tăng tốc bởi GPU bằng cách chỉ cần “host” các function đó. Đó là những gì chúng ta đang bắt đầu thấy ngày hôm nay.
Xem toàn bộ video bài phát biểu:
Nguồn STH
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson
- Phát triển ứng dụng AI tại biên với NVIDIA Jetson AGX Orin & Developer Kit
- HPE và NVIDIA công bố ‘NVIDIA AI Computing by HPE’ để thúc đẩy cuộc cách mạng AI tạo sinh