Sự kiện NVIDIA GTC 2023 có gì mới: Tóm tắt bài phát biểu chính

Tóm tắt bài phát biểu chính của sự kiện GTC 2023 từ chủ tịch kiêm CEO NVIDIA Jensen Huang vào lúc 22:00 tối hôm qua, giờ Việt Nam.

10:57 AM EDT – Chào mừng bạn đến với bài phát biểu quan trọng của sự kiện NVIDIA GTC Spring 2023

10:58 AM EDT – Phần mở đầu truyền thống của chương trình – dù là thực tế hay ảo – Bài phát biểu quan trọng hàng năm của GTC sẽ giới thiệu tầm nhìn của NVIDIA trong 12 đến 24 tháng tới trên tất cả các phân khúc của họ, từ đồ họa đến AI đến ô tô. Cùng với hàng loạt công bố về các sản phẩm mới, bài thuyết trình của CEO Jensen Huang luôn ẩn chứa một vài điều bất ngờ

10:58 AM EDT – Nhìn vào kho sản phẩm khá lớn của NVIDIA, NVIDIA sắp cho ra mắt kiến ​​trúc GPU Hopper và Ada Lovelace mới tương ứng cho máy chủ và máy trạm. Nhưng có rất nhiều chỗ cho các sản phẩm riêng lẻ vẫn chưa được lấp đầy

10:59 AM EDT – Tại thời điểm này, chúng tôi chỉ đang chờ bài phát biểu quan trọng sẽ bắt đầu, sẽ diễn ra ngay lúc 11:00 AM EDT.

11:00 AM EDT – Hội nghị GTC của NVIDIA, vượt qua các xu hướng, vẫn là một sự kiện ảo trong năm nay

11:01 AM EDT – Và chúng ta bắt đầu

11:01 AM EDT – Jensen ngay lập tức đi sâu vào các chủ đề về điện toán tăng tốc và AI

11:02 AM EDT – Những tiến bộ mới trong toàn bộ dịch vụ của NVIDIA

11:02 AM EDT – “Chào mừng đến với GTC”

11:02 AM EDT – Chào mừng hơn 250.000 người đến với hội nghị ảo năm nay

11:02 AM EDT – 4 năm trước, hội nghị trực tiếp lần gần nhất có 8 nghìn người tham dự

11:03 AM EDT – “650 cuộc nói chuyện tuyệt vời”

11:04 AM EDT – Và nhanh chóng đưa ra danh sách các chủ đề được đề cập trong các cuộc nói chuyện năm nay

11:05 AM EDT – “Mục đích của GTC là truyền cảm hứng cho thế giới về nghệ thuật của những gì có thể thực hiện với điện toán tăng tốc”

11:05 AM EDT – Bắt đầu phát ra đoạn video “I am AI” mới nhất của NVIDIA

11:08 AM EDT – Và, tất nhiên, NVIDIA đã sử dụng AI để ghép các phần của video này lại với nhau (như họ đã làm trong vài năm nay)

11:08 AM EDT – “Điện toán tăng tốc không dễ dàng gì”

11:09 AM EDT – Các ứng dụng được tăng tốc có thể đẩy nhanh tốc độ và mở rộng quy mô trên nhiều hệ thống

11:09 AM EDT – Mang lại hiệu suất tăng gấp 1 triệu lần trong thập kỷ qua trong một số nhiệm vụ nhất định

11:10 AM EDT – So sánh AlexNet và GPT-3 trước đây và bây giờ về mặt số lượng phép toán FP cần thiết để huấn luyện các mạng thần kinh tương ứng

11:10 AM EDT – Và tất nhiên, GPT hiện đang là cơn cuồng phong

11:11 AM EDT – “Vài nghìn ứng dụng hiện đang được NVIDIA tăng tốc”

11:11 AM EDT – Và NVIDIA đã thiết lập một vòng tròn khép kín của người dùng, ứng dụng và nhà phát triển để tạo nên một hệ sinh thái rất năng động

11:12 AM EDT – Một phần quan trọng trong việc đặt nền tảng này là NVIDIA cung cấp rất nhiều thư viện cho các tác vụ khác nhau

11:12 AM EDT – Jensen hiện đang xem qua một số thư viện đó

11:13 AM EDT – NVIDIA đang tiếp tục công việc của họ với điện toán lượng tử và thư viện cuQuantum của họ

11:13 AM EDT – Đang được sử dụng để giúp mô phỏng máy tính lượng tử

11:14 AM EDT – Hôm nay NVIDIA công bố liên kết điều khiển lượng tử cho phép kết nối GPU NVIDIA với máy tính lượng tử để sửa lỗi (của máy tính lượng tử)

11:15 AM EDT – Bây giờ là Spark RAPIDS và cơ sở dữ liệu vector

11:15 AM EDT – Giới thiệu thư viện mới: RAFT

11:16 AM EDT – Để tăng tốc hơn nữa cơ sở dữ liệu vectơ

11:17 AM EDT – (Xin nhắc lại chung rằng, NVIDIA có nhiều kỹ sư phần mềm hơn kỹ sư phần cứng. Vì vậy, phần mềm mới là một phần quan trọng trong toàn bộ công việc của họ. Điều đó cũng có nghĩa là phần mềm là một phần quan trọng trong các bài thuyết trình của GTC ngày nay)

11:18 AM EDT – Jensen nhấn mạnh mối quan hệ hợp tác của NVIDIA với AT&T, công ty đang sử dụng công nghệ NV cho mọi thứ, từ lập kế hoạch 5G đến Riva để tổng hợp giọng nói

11:18 AM EDT – Bây giờ nói về nền tảng suy luận của NVIDIA, tóm tắt lại về TensorRT, Triton và TMS

11:19 AM EDT – Các tính năng mới bao gồm suy luận đa GPU, đa nút cho các mô hình ngôn ngữ lớn GPT

11:20 AM EDT – Bây giờ là xử lý video GPU. CV-CUDA và VPF

11:20 AM EDT – Microsoft, Tencent và nhiều hãng khác đang sử dụng các thư viện này để xử lý hàng trăm nghìn video mỗi ngày

11:21 AM EDT – Do đó, quá trình xử lý video là một ứng dụng xử lý chính. Làm cho nó trở thành một mục tiêu tốt để tối ưu hóa và tăng tốc

11:21 AM EDT – Tiếp theo: Bộ gen

11:21 AM EDT – Bao gồm NVIDIA Parabricks

11:21 AM EDT – Công bố Parabricks 4.1 hôm nay

11:22 AM EDT – Và Holoscan, thư viện của NV để xử lý hình ảnh y tế theo thời gian thực

11:22 AM EDT – Và NVIDIA đang hợp tác với Medtronic để phát triển một nền tảng AI chung

11:23 AM EDT – Bây giờ là nói về việc sản xuất chip

11:23 AM EDT – Jensen đang nói về quy mô cực nhỏ của kỹ thuật in thạch bản (lithography) silicon ngày nay

11:23 AM EDT – Litho là một vấn đề hình ảnh ở rìa của vật lý

11:24 AM EDT – Tóm tắt cách thức hoạt động của EUV litho. Và nó có giá bao nhiêu? – hơn 250 triệu đô la!

11:24 AM EDT – Cũng như cách các mẫu giao thoa trong ánh sáng EUV được sử dụng để tạo ra các pattern nhỏ hơn ánh sáng

11:24 AM EDT – Computational lithography

11:25 AM EDT – Mô phỏng phương trình Maxwell để phát triển và tinh chỉnh mặt nạ thạch bản (litho masks)

11:25 AM EDT – Computational lithography đang phát triển nhanh chóng

11:26 AM EDT – Thư viện mới: cuLitho, để tăng tốc độ cho Computational lithography hơn 40 lần

11:26 AM EDT – Một ô kẻ ô hiện mất 2 tuần để xử lý. cuLitho có thể làm trong ca 8 tiếng

11:26 AM EDT – cuLitho cũng có thể giảm mức tiêu thụ điện năng bằng cách giảm số lượng hệ thống cần thiết

11:27 AM EDT – TSMC sẽ đủ điều kiện sản xuất CuLitho bắt đầu từ tháng 6

11:27 AM EDT – Bây giờ là điện toán đám mây

11:28 AM EDT – Nhu cầu điện toán ngày càng tăng đang bị giới hạn bởi giới hạn năng lượng vật lý của trung tâm dữ liệu, chưa kể đến mong muốn cắt giảm mức tiêu thụ điện năng vì lý do môi trường

11:28 AM EDT – Có vẻ như đây sẽ là về CPU Grace của NV

11:28 AM EDT – Grace vượt trội ở những chỗ GPU không thể – xử lý nối tiếp theo luồng đơn

11:28 AM EDT – 72 Lõi Arm với kết nối 3,2TB/giây

11:29 AM EDT – Siêu chip Grace là 2 CPU Grace trên một bảng mạch

11:29 AM EDT – Mô-đun siêu chip Grace

11:29 AM EDT – 5 x 8 inch

11:30 AM EDT – 2 mô-đun Grace Superchip có thể nằm gọn trong một máy chủ rack 1U làm mát bằng không khí

11:30 AM EDT – Hiệu suất gấp đôi ở iso-power

11:31 AM EDT – Grace hiện đang được lấy mẫu

11:31 AM EDT – Và các đối tác của NVIDIA đang làm việc để lắp ráp vào hệ thống của họ

11:31 AM EDT – Bây giờ là mảng kinh doanh phần cứng mạng của NVIDIA

11:31 AM EDT – BlueField-3 đang được sản xuất

11:32 AM EDT – Đó là DPU thế hệ mới nhất của NVIDIA

11:32 AM EDT – Bây giờ là NVIDIA DGX

11:32 AM EDT – Một nửa trong số 100 công ty của Fortune đã cài đặt DGX

11:33 AM EDT – Tóm tắt cấu trúc và các tính năng của DGX

11:33 AM EDT – DGX H100 hiện đã được sản xuất đầy đủ (hiện tại Intel cuối cùng cũng đã bán ra Sapphire Rapids với số lượng lớn)

11:34 AM EDT – Và các nhà cung cấp đám mây công cộng, bao gồm Azure của Microsoft, đang nhanh chóng áp dụng DGX cho các dịch vụ của họ

11:34 AM EDT – “Siêu máy tính DGX là nhà máy AI hiện đại”

11:34 AM EDT – “AI sáng tạo đã tạo ra cảm giác cấp bách để phát triển các chiến lược AI”

11:34 AM EDT – Công bố NVIDIA DGX Cloud

11:35 AM EDT – Đây là công bố về dịch vụ đám mây lớn của NVIDIA

11:35 AM EDT – Hệ sinh thái của NVIDIA có sẵn thông qua các hệ thống DGX sẽ host các Cloud Instance tại các nhà cung cấp dịch vụ đám mây công cộng

11:35 AM EDT – “Mô hình kinh doanh đám mây mở rộng của chúng tôi”

11:36 AM EDT – Cơ sở hạ tầng đám mây của Oracle sẽ là dịch vụ đám mây công cộng DGX đầu tiên

11:36 AM EDT – 50 khách hàng truy cập sớm trong một số ngành

11:36 AM EDT – Bây giờ là AI tạo sinh (Generative AI) và sự bùng nổ gần đây của nó

11:37 AM EDT – (GPT sẽ bán một số lượng lớn H100 với tốc độ này…)

11:38 AM EDT – Jensen đang tóm tắt lại các mô hình ngôn ngữ lớn và nhiều thứ có thể thực hiện với GPT và các LLM khác, chẳng hạn như tạo văn bản và hình ảnh

11:38 AM EDT – “AI thế hệ mới là một loại máy tính mới, chúng tôi lập trình bằng ngôn ngữ của con người”

11:38 AM EDT – “Bây giờ, mọi người đều là lập trình viên”

11:39 AM EDT – Có thể so sánh Generative AI với các nền tảng như PC

11:39 AM EDT – Bây giờ hãy nhanh chóng nói về nhiều dịch vụ sử dụng Generative AI dưới hình thức này hay hình thức khác

11:39 AM EDT – Thậm chí là việc tăng tốc thiết kế thuốc

11:40 AM EDT – “Ngành công nghiệp cần một xưởng đúc. Một TSMC cho các mô hình ngôn ngữ lớn”

11:40 AM EDT – Công bố NVIDIA AI Foundations

11:40 AM EDT – Dịch vụ tạo mô hình ngôn ngữ, hình ảnh và sinh học

11:41 AM EDT – Lần lượt sử dụng NVIDIA NeMo, Picasso và BioNeMo

11:41 AM EDT – Khách hàng có thể tạo mô hình của riêng mình hoặc bắt đầu với một trong các mô hình được NVIDIA đào tạo trước và tùy chỉnh từ đó

11:42 AM EDT – Hiện đang phát một video về AI Foundations và cách thức hoạt động của nó

11:42 AM EDT – (Đoạn này diễn ra quá nhanh để có thể tóm tắt lại tất cả)

11:43 AM EDT – Học tăng cường (Reinforcement learning) được sử dụng trong NeMo để cải thiện hơn nữa hiệu suất và độ chính xác của nó

11:43 AM EDT – “Mô hình AI được cá nhân hóa mà bạn điều khiển”

11:43 AM EDT – Đó là một video trên NeMo. Bây giờ chúng ta đang xem video về Picasso

11:44 AM EDT – Picasso là dịch vụ tạo hình ảnh, video và mô hình

11:45 AM EDT – Getty Images sẽ sử dụng dịch vụ Picasso, được đào tạo bằng thư viện hình ảnh có bản quyền hợp pháp của họ

11:45 AM EDT – Shutterstock sẽ làm điều gì đó tương tự

11:46 AM EDT – Thông báo mở rộng đáng kể quan hệ đối tác với Adobe để xây dựng một bộ tính năng AI thế hệ tiếp theo vào phần mềm của Adobe

11:46 AM EDT – Adobe Generative Images

11:47 AM EDT – Và Sáng kiến ​​xác thực nội dung của Adobe

11:47 AM EDT – Bây giờ là BioNeMo – AI tổng hợp cho sinh học

11:48 AM EDT – BioNeMo cung cấp các mô hình khám phá thuốc

11:48 AM EDT – Gấp protien, tạo phân tử, v.v.

11:49 AM EDT – Dự đoán chính xác cấu trúc của protein trong vài giây

11:50 AM EDT – Và đó là NVIDIA AI Foundations

11:50 AM EDT – Bây giờ chuyển sang lĩnh vực ô tô

11:51 AM EDT – Không, lỗi của tôi. Bây giờ nói về việc xây dựng trung tâm dữ liệu

11:51 AM EDT – “Không có bộ tăng tốc nào có thể xử lý tối ưu” nhiều loại mô hình khác nhau

11:51 AM EDT – Nền tảng suy luận mới: 4 cấu hình, 1 kiến ​​trúc, 1 stack phần mềm

11:51 AM EDT – Sản phẩm mới: Card tăng tốc L4. Thay thế T4

11:52 AM EDT – Muốn sử dụng L4 để thay thế máy chủ CPU để xử lý video AI

11:52 AM EDT – Google đang cung cấp L4 trên Google Cloud

11:53 AM EDT – Google GCP hiện là đám mây NVIDIA AI đầu tiên

11:53 AM EDT – Thông tin thêm về nó sẽ được cập nhật sau

11:54 AM EDT – Card tăng tốc L40. Đây là một tóm tắt, vì sản phẩm đã được phát hành vào năm ngoái

11:54 AM EDT – L Series là tên gọi của NVIDIA dành cho card máy chủ dựa trên kiến ​​trúc Ada Lovelace

11:55 AM EDT – L40 hướng đến xử lý/tạo hình ảnh nhiều hơn và là trục xương sống của phần cứng Omniverse/OVX của NVIDIA

11:55 AM EDT – Các mô hình ngôn ngữ lớn phù hợp với tên gọi. GPT có thể cực kỳ lớn

11:55 AM EDT – Công bố H100 NVL

11:56 AM EDT – Sản phẩm PCIe 2-card/4-slot. 2 chiếc GH100 với bộ nhớ 94GB mỗi chiếc

11:56 AM EDT – Và sau đó là Grace Hopper

11:57 AM EDT – Grace CPU + Hopper GPU trên một bo mạch duy nhất, dành cho các tác vụ cần cả hai loại xử lý

11:57 AM EDT – Giao diện CPU/GPU nhanh hơn 7 lần so với PCIe

11:58 AM EDT – Có một chút chờ đợi vào lúc này, vì Grace Hopper vẫn chưa được bán ra

11:58 AM EDT – Và đó là phần cứng AI của NVIDIA

11:59 AM EDT – Bây giờ là Omniverse

11:59 AM EDT – Phát video về cách cánh tay robot của Amazon đang sử dụng Omniverse

12:00 PM EDT – Sử dụng Isaac Sim để phát triển công nghệ

12:01 PM EDT – Và sử dụng mô phỏng để đào tạo mô hình của họ nhanh hơn

12:02 PM EDT – Một lần nữa quảng cáo Omniverse và việc sử dụng định dạng file USD

12:02 PM EDT – NV đã thực hiện các cập nhật quan trọng cho Omniverse ở mọi khu vực

12:02 PM EDT – Hiện đang phát video nổi bật

12:03 PM EDT – DRIVE Sim, Replicator, PhysX Flow, Warp, hỗ trợ đa GPU/đa nút, Isaac Sim, SimReady Assets, Replicator, Audio2Face, Neural Materials, v.v.

12:04 PM EDT – “Gần 300 nghìn người sáng tạo và nhà thiết kế đã tải xuống Omniverse”

12:05 PM EDT – Xuất hiện nhiều ứng dụng CAD/CAM mới hiện đã được tích hợp vào Omniverse

12:07 PM EDT – Và liệt kê nhiều công ty sử dụng Omniverse theo một số cách và cách họ sử dụng nó. Rất nhiều nhà sản xuất!

12:07 PM EDT – BMW đang xây dựng một nhà máy ảo trước, 2 năm trước khi họ xây dựng nhà máy thực tế

12:09 PM EDT – Trình diễn cái cách một phiên lập kế hoạch ảo diễn ra

12:09 PM EDT – Sử dụng Microsoft Teams và Omniverse

12:10 PM EDT – Công bố 3 hệ thống chạy Omniverse

12:11 PM EDT – Thế hệ máy trạm mới được trang bị sức  mạnh

12:11 PM EDT – Máy chủ OVX 3.0 mới

12:11 PM EDT – Và #3: NVIDIA Omniverse Cloud

12:12 PM EDT – Omniverse chạy trên các dịch vụ đám mây

12:13 PM EDT – Dịch vụ đám mây được quản lý chặt chẽ. Hợp tác với Microsoft, được lưu trữ trên Azure

12:14 PM EDT – Kết nối Omniverse Cloud với các dịch vụ 365 của Microsoft

12:14 PM EDT – Đưa Omniverse đến với hàng triệu người dùng 365 và Azure

12:15 PM EDT – Bây giờ tóm tắt lại bài phát biểu

12:15 PM EDT – Phần cứng mới, thư viện mới, v.v.

12:16 PM EDT – Mở rộng mô hình kinh doanh với NVIDIA DGX Cloud

12:16 PM EDT – Điều tốt nhất của NVIDIA là với các CSP hàng đầu thế giới

12:17 PM EDT – Và NVIDIA AI Foundations cho các dịch vụ tạo mô hình

12:17 PM EDT – Cùng với nhiều nâng cấp Omniverse và dịch vụ đám mây Omniverse

12:18 PM EDT – Jensen cảm ơn các đối tác và nhân viên của NVIDIA

12:18 PM EDT – Và như vậy là đã hết! Vui lòng chờ xem các bài riêng lẻ về các công bố phần cứng mới của NVIDIA

____
Bài viết liên quan
Góp ý / Liên hệ tác giả