Tóm tắt bài phát biểu chính của sự kiện GTC 2023 từ chủ tịch kiêm CEO NVIDIA Jensen Huang vào lúc 22:00 tối hôm qua, giờ Việt Nam.
10:57 AM EDT – Chào mừng bạn đến với bài phát biểu quan trọng của sự kiện NVIDIA GTC Spring 2023
10:58 AM EDT – Phần mở đầu truyền thống của chương trình – dù là thực tế hay ảo – Bài phát biểu quan trọng hàng năm của GTC sẽ giới thiệu tầm nhìn của NVIDIA trong 12 đến 24 tháng tới trên tất cả các phân khúc của họ, từ đồ họa đến AI đến ô tô. Cùng với hàng loạt công bố về các sản phẩm mới, bài thuyết trình của CEO Jensen Huang luôn ẩn chứa một vài điều bất ngờ
10:58 AM EDT – Nhìn vào kho sản phẩm khá lớn của NVIDIA, NVIDIA sắp cho ra mắt kiến trúc GPU Hopper và Ada Lovelace mới tương ứng cho máy chủ và máy trạm. Nhưng có rất nhiều chỗ cho các sản phẩm riêng lẻ vẫn chưa được lấp đầy
10:59 AM EDT – Tại thời điểm này, chúng tôi chỉ đang chờ bài phát biểu quan trọng sẽ bắt đầu, sẽ diễn ra ngay lúc 11:00 AM EDT.
11:00 AM EDT – Hội nghị GTC của NVIDIA, vượt qua các xu hướng, vẫn là một sự kiện ảo trong năm nay
11:01 AM EDT – Và chúng ta bắt đầu
11:01 AM EDT – Jensen ngay lập tức đi sâu vào các chủ đề về điện toán tăng tốc và AI
11:02 AM EDT – Những tiến bộ mới trong toàn bộ dịch vụ của NVIDIA
11:02 AM EDT – “Chào mừng đến với GTC”
11:02 AM EDT – Chào mừng hơn 250.000 người đến với hội nghị ảo năm nay
11:02 AM EDT – 4 năm trước, hội nghị trực tiếp lần gần nhất có 8 nghìn người tham dự
11:03 AM EDT – “650 cuộc nói chuyện tuyệt vời”
11:04 AM EDT – Và nhanh chóng đưa ra danh sách các chủ đề được đề cập trong các cuộc nói chuyện năm nay
11:05 AM EDT – “Mục đích của GTC là truyền cảm hứng cho thế giới về nghệ thuật của những gì có thể thực hiện với điện toán tăng tốc”
11:05 AM EDT – Bắt đầu phát ra đoạn video “I am AI” mới nhất của NVIDIA
11:08 AM EDT – Và, tất nhiên, NVIDIA đã sử dụng AI để ghép các phần của video này lại với nhau (như họ đã làm trong vài năm nay)
11:08 AM EDT – “Điện toán tăng tốc không dễ dàng gì”
11:09 AM EDT – Các ứng dụng được tăng tốc có thể đẩy nhanh tốc độ và mở rộng quy mô trên nhiều hệ thống
11:09 AM EDT – Mang lại hiệu suất tăng gấp 1 triệu lần trong thập kỷ qua trong một số nhiệm vụ nhất định
11:10 AM EDT – So sánh AlexNet và GPT-3 trước đây và bây giờ về mặt số lượng phép toán FP cần thiết để huấn luyện các mạng thần kinh tương ứng
11:10 AM EDT – Và tất nhiên, GPT hiện đang là cơn cuồng phong
11:11 AM EDT – “Vài nghìn ứng dụng hiện đang được NVIDIA tăng tốc”
11:11 AM EDT – Và NVIDIA đã thiết lập một vòng tròn khép kín của người dùng, ứng dụng và nhà phát triển để tạo nên một hệ sinh thái rất năng động
11:12 AM EDT – Một phần quan trọng trong việc đặt nền tảng này là NVIDIA cung cấp rất nhiều thư viện cho các tác vụ khác nhau
11:12 AM EDT – Jensen hiện đang xem qua một số thư viện đó
11:13 AM EDT – NVIDIA đang tiếp tục công việc của họ với điện toán lượng tử và thư viện cuQuantum của họ
11:13 AM EDT – Đang được sử dụng để giúp mô phỏng máy tính lượng tử
11:14 AM EDT – Hôm nay NVIDIA công bố liên kết điều khiển lượng tử cho phép kết nối GPU NVIDIA với máy tính lượng tử để sửa lỗi (của máy tính lượng tử)
11:15 AM EDT – Bây giờ là Spark RAPIDS và cơ sở dữ liệu vector
11:15 AM EDT – Giới thiệu thư viện mới: RAFT
11:16 AM EDT – Để tăng tốc hơn nữa cơ sở dữ liệu vectơ
11:17 AM EDT – (Xin nhắc lại chung rằng, NVIDIA có nhiều kỹ sư phần mềm hơn kỹ sư phần cứng. Vì vậy, phần mềm mới là một phần quan trọng trong toàn bộ công việc của họ. Điều đó cũng có nghĩa là phần mềm là một phần quan trọng trong các bài thuyết trình của GTC ngày nay)
11:18 AM EDT – Jensen nhấn mạnh mối quan hệ hợp tác của NVIDIA với AT&T, công ty đang sử dụng công nghệ NV cho mọi thứ, từ lập kế hoạch 5G đến Riva để tổng hợp giọng nói
11:18 AM EDT – Bây giờ nói về nền tảng suy luận của NVIDIA, tóm tắt lại về TensorRT, Triton và TMS
11:19 AM EDT – Các tính năng mới bao gồm suy luận đa GPU, đa nút cho các mô hình ngôn ngữ lớn GPT
11:20 AM EDT – Bây giờ là xử lý video GPU. CV-CUDA và VPF
11:20 AM EDT – Microsoft, Tencent và nhiều hãng khác đang sử dụng các thư viện này để xử lý hàng trăm nghìn video mỗi ngày
11:21 AM EDT – Do đó, quá trình xử lý video là một ứng dụng xử lý chính. Làm cho nó trở thành một mục tiêu tốt để tối ưu hóa và tăng tốc
11:21 AM EDT – Tiếp theo: Bộ gen
11:21 AM EDT – Bao gồm NVIDIA Parabricks
11:21 AM EDT – Công bố Parabricks 4.1 hôm nay
11:22 AM EDT – Và Holoscan, thư viện của NV để xử lý hình ảnh y tế theo thời gian thực
11:22 AM EDT – Và NVIDIA đang hợp tác với Medtronic để phát triển một nền tảng AI chung
11:23 AM EDT – Bây giờ là nói về việc sản xuất chip
11:23 AM EDT – Jensen đang nói về quy mô cực nhỏ của kỹ thuật in thạch bản (lithography) silicon ngày nay
11:23 AM EDT – Litho là một vấn đề hình ảnh ở rìa của vật lý
11:24 AM EDT – Tóm tắt cách thức hoạt động của EUV litho. Và nó có giá bao nhiêu? – hơn 250 triệu đô la!
11:24 AM EDT – Cũng như cách các mẫu giao thoa trong ánh sáng EUV được sử dụng để tạo ra các pattern nhỏ hơn ánh sáng
11:24 AM EDT – Computational lithography
11:25 AM EDT – Mô phỏng phương trình Maxwell để phát triển và tinh chỉnh mặt nạ thạch bản (litho masks)
11:25 AM EDT – Computational lithography đang phát triển nhanh chóng
11:26 AM EDT – Thư viện mới: cuLitho, để tăng tốc độ cho Computational lithography hơn 40 lần
11:26 AM EDT – Một ô kẻ ô hiện mất 2 tuần để xử lý. cuLitho có thể làm trong ca 8 tiếng
11:26 AM EDT – cuLitho cũng có thể giảm mức tiêu thụ điện năng bằng cách giảm số lượng hệ thống cần thiết
11:27 AM EDT – TSMC sẽ đủ điều kiện sản xuất CuLitho bắt đầu từ tháng 6
11:27 AM EDT – Bây giờ là điện toán đám mây
11:28 AM EDT – Nhu cầu điện toán ngày càng tăng đang bị giới hạn bởi giới hạn năng lượng vật lý của trung tâm dữ liệu, chưa kể đến mong muốn cắt giảm mức tiêu thụ điện năng vì lý do môi trường
11:28 AM EDT – Có vẻ như đây sẽ là về CPU Grace của NV
11:28 AM EDT – Grace vượt trội ở những chỗ GPU không thể – xử lý nối tiếp theo luồng đơn
11:28 AM EDT – 72 Lõi Arm với kết nối 3,2TB/giây
11:29 AM EDT – Siêu chip Grace là 2 CPU Grace trên một bảng mạch
11:29 AM EDT – Mô-đun siêu chip Grace
11:29 AM EDT – 5 x 8 inch
11:30 AM EDT – 2 mô-đun Grace Superchip có thể nằm gọn trong một máy chủ rack 1U làm mát bằng không khí
11:30 AM EDT – Hiệu suất gấp đôi ở iso-power
11:31 AM EDT – Grace hiện đang được lấy mẫu
11:31 AM EDT – Và các đối tác của NVIDIA đang làm việc để lắp ráp vào hệ thống của họ
11:31 AM EDT – Bây giờ là mảng kinh doanh phần cứng mạng của NVIDIA
11:31 AM EDT – BlueField-3 đang được sản xuất
11:32 AM EDT – Đó là DPU thế hệ mới nhất của NVIDIA
11:32 AM EDT – Bây giờ là NVIDIA DGX
11:32 AM EDT – Một nửa trong số 100 công ty của Fortune đã cài đặt DGX
11:33 AM EDT – Tóm tắt cấu trúc và các tính năng của DGX
11:33 AM EDT – DGX H100 hiện đã được sản xuất đầy đủ (hiện tại Intel cuối cùng cũng đã bán ra Sapphire Rapids với số lượng lớn)
11:34 AM EDT – Và các nhà cung cấp đám mây công cộng, bao gồm Azure của Microsoft, đang nhanh chóng áp dụng DGX cho các dịch vụ của họ
11:34 AM EDT – “Siêu máy tính DGX là nhà máy AI hiện đại”
11:34 AM EDT – “AI sáng tạo đã tạo ra cảm giác cấp bách để phát triển các chiến lược AI”
11:34 AM EDT – Công bố NVIDIA DGX Cloud
11:35 AM EDT – Đây là công bố về dịch vụ đám mây lớn của NVIDIA
11:35 AM EDT – Hệ sinh thái của NVIDIA có sẵn thông qua các hệ thống DGX sẽ host các Cloud Instance tại các nhà cung cấp dịch vụ đám mây công cộng
11:35 AM EDT – “Mô hình kinh doanh đám mây mở rộng của chúng tôi”
11:36 AM EDT – Cơ sở hạ tầng đám mây của Oracle sẽ là dịch vụ đám mây công cộng DGX đầu tiên
11:36 AM EDT – 50 khách hàng truy cập sớm trong một số ngành
11:36 AM EDT – Bây giờ là AI tạo sinh (Generative AI) và sự bùng nổ gần đây của nó
11:37 AM EDT – (GPT sẽ bán một số lượng lớn H100 với tốc độ này…)
11:38 AM EDT – Jensen đang tóm tắt lại các mô hình ngôn ngữ lớn và nhiều thứ có thể thực hiện với GPT và các LLM khác, chẳng hạn như tạo văn bản và hình ảnh
11:38 AM EDT – “AI thế hệ mới là một loại máy tính mới, chúng tôi lập trình bằng ngôn ngữ của con người”
11:38 AM EDT – “Bây giờ, mọi người đều là lập trình viên”
11:39 AM EDT – Có thể so sánh Generative AI với các nền tảng như PC
11:39 AM EDT – Bây giờ hãy nhanh chóng nói về nhiều dịch vụ sử dụng Generative AI dưới hình thức này hay hình thức khác
11:39 AM EDT – Thậm chí là việc tăng tốc thiết kế thuốc
11:40 AM EDT – “Ngành công nghiệp cần một xưởng đúc. Một TSMC cho các mô hình ngôn ngữ lớn”
11:40 AM EDT – Công bố NVIDIA AI Foundations
11:40 AM EDT – Dịch vụ tạo mô hình ngôn ngữ, hình ảnh và sinh học
11:41 AM EDT – Lần lượt sử dụng NVIDIA NeMo, Picasso và BioNeMo
11:41 AM EDT – Khách hàng có thể tạo mô hình của riêng mình hoặc bắt đầu với một trong các mô hình được NVIDIA đào tạo trước và tùy chỉnh từ đó
11:42 AM EDT – Hiện đang phát một video về AI Foundations và cách thức hoạt động của nó
11:42 AM EDT – (Đoạn này diễn ra quá nhanh để có thể tóm tắt lại tất cả)
11:43 AM EDT – Học tăng cường (Reinforcement learning) được sử dụng trong NeMo để cải thiện hơn nữa hiệu suất và độ chính xác của nó
11:43 AM EDT – “Mô hình AI được cá nhân hóa mà bạn điều khiển”
11:43 AM EDT – Đó là một video trên NeMo. Bây giờ chúng ta đang xem video về Picasso
11:44 AM EDT – Picasso là dịch vụ tạo hình ảnh, video và mô hình
11:45 AM EDT – Getty Images sẽ sử dụng dịch vụ Picasso, được đào tạo bằng thư viện hình ảnh có bản quyền hợp pháp của họ
11:45 AM EDT – Shutterstock sẽ làm điều gì đó tương tự
11:46 AM EDT – Thông báo mở rộng đáng kể quan hệ đối tác với Adobe để xây dựng một bộ tính năng AI thế hệ tiếp theo vào phần mềm của Adobe
11:46 AM EDT – Adobe Generative Images
11:47 AM EDT – Và Sáng kiến xác thực nội dung của Adobe
11:47 AM EDT – Bây giờ là BioNeMo – AI tổng hợp cho sinh học
11:48 AM EDT – BioNeMo cung cấp các mô hình khám phá thuốc
11:48 AM EDT – Gấp protien, tạo phân tử, v.v.
11:49 AM EDT – Dự đoán chính xác cấu trúc của protein trong vài giây
11:50 AM EDT – Và đó là NVIDIA AI Foundations
11:50 AM EDT – Bây giờ chuyển sang lĩnh vực ô tô
11:51 AM EDT – Không, lỗi của tôi. Bây giờ nói về việc xây dựng trung tâm dữ liệu
11:51 AM EDT – “Không có bộ tăng tốc nào có thể xử lý tối ưu” nhiều loại mô hình khác nhau
11:51 AM EDT – Nền tảng suy luận mới: 4 cấu hình, 1 kiến trúc, 1 stack phần mềm
11:51 AM EDT – Sản phẩm mới: Card tăng tốc L4. Thay thế T4
11:52 AM EDT – Muốn sử dụng L4 để thay thế máy chủ CPU để xử lý video AI
11:52 AM EDT – Google đang cung cấp L4 trên Google Cloud
11:53 AM EDT – Google GCP hiện là đám mây NVIDIA AI đầu tiên
11:53 AM EDT – Thông tin thêm về nó sẽ được cập nhật sau
11:54 AM EDT – Card tăng tốc L40. Đây là một tóm tắt, vì sản phẩm đã được phát hành vào năm ngoái
11:54 AM EDT – L Series là tên gọi của NVIDIA dành cho card máy chủ dựa trên kiến trúc Ada Lovelace
11:55 AM EDT – L40 hướng đến xử lý/tạo hình ảnh nhiều hơn và là trục xương sống của phần cứng Omniverse/OVX của NVIDIA
11:55 AM EDT – Các mô hình ngôn ngữ lớn phù hợp với tên gọi. GPT có thể cực kỳ lớn
11:55 AM EDT – Công bố H100 NVL
11:56 AM EDT – Sản phẩm PCIe 2-card/4-slot. 2 chiếc GH100 với bộ nhớ 94GB mỗi chiếc
11:56 AM EDT – Và sau đó là Grace Hopper
11:57 AM EDT – Grace CPU + Hopper GPU trên một bo mạch duy nhất, dành cho các tác vụ cần cả hai loại xử lý
11:57 AM EDT – Giao diện CPU/GPU nhanh hơn 7 lần so với PCIe
11:58 AM EDT – Có một chút chờ đợi vào lúc này, vì Grace Hopper vẫn chưa được bán ra
11:58 AM EDT – Và đó là phần cứng AI của NVIDIA
11:59 AM EDT – Bây giờ là Omniverse
11:59 AM EDT – Phát video về cách cánh tay robot của Amazon đang sử dụng Omniverse
12:00 PM EDT – Sử dụng Isaac Sim để phát triển công nghệ
12:01 PM EDT – Và sử dụng mô phỏng để đào tạo mô hình của họ nhanh hơn
12:02 PM EDT – Một lần nữa quảng cáo Omniverse và việc sử dụng định dạng file USD
12:02 PM EDT – NV đã thực hiện các cập nhật quan trọng cho Omniverse ở mọi khu vực
12:02 PM EDT – Hiện đang phát video nổi bật
12:03 PM EDT – DRIVE Sim, Replicator, PhysX Flow, Warp, hỗ trợ đa GPU/đa nút, Isaac Sim, SimReady Assets, Replicator, Audio2Face, Neural Materials, v.v.
12:04 PM EDT – “Gần 300 nghìn người sáng tạo và nhà thiết kế đã tải xuống Omniverse”
12:05 PM EDT – Xuất hiện nhiều ứng dụng CAD/CAM mới hiện đã được tích hợp vào Omniverse
12:07 PM EDT – Và liệt kê nhiều công ty sử dụng Omniverse theo một số cách và cách họ sử dụng nó. Rất nhiều nhà sản xuất!
12:07 PM EDT – BMW đang xây dựng một nhà máy ảo trước, 2 năm trước khi họ xây dựng nhà máy thực tế
12:09 PM EDT – Trình diễn cái cách một phiên lập kế hoạch ảo diễn ra
12:09 PM EDT – Sử dụng Microsoft Teams và Omniverse
12:10 PM EDT – Công bố 3 hệ thống chạy Omniverse
12:11 PM EDT – Thế hệ máy trạm mới được trang bị sức mạnh
12:11 PM EDT – Máy chủ OVX 3.0 mới
12:11 PM EDT – Và #3: NVIDIA Omniverse Cloud
12:12 PM EDT – Omniverse chạy trên các dịch vụ đám mây
12:13 PM EDT – Dịch vụ đám mây được quản lý chặt chẽ. Hợp tác với Microsoft, được lưu trữ trên Azure
12:14 PM EDT – Kết nối Omniverse Cloud với các dịch vụ 365 của Microsoft
12:14 PM EDT – Đưa Omniverse đến với hàng triệu người dùng 365 và Azure
12:15 PM EDT – Bây giờ tóm tắt lại bài phát biểu
12:15 PM EDT – Phần cứng mới, thư viện mới, v.v.
12:16 PM EDT – Mở rộng mô hình kinh doanh với NVIDIA DGX Cloud
12:16 PM EDT – Điều tốt nhất của NVIDIA là với các CSP hàng đầu thế giới
12:17 PM EDT – Và NVIDIA AI Foundations cho các dịch vụ tạo mô hình
12:17 PM EDT – Cùng với nhiều nâng cấp Omniverse và dịch vụ đám mây Omniverse
12:18 PM EDT – Jensen cảm ơn các đối tác và nhân viên của NVIDIA
12:18 PM EDT – Và như vậy là đã hết! Vui lòng chờ xem các bài riêng lẻ về các công bố phần cứng mới của NVIDIA
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100
- NVIDIA giới thiệu nền tảng microservice Metropolis để chạy ứng dụng Edge AI trên Jetson
- Phát triển ứng dụng AI tại biên với NVIDIA Jetson AGX Orin & Developer Kit
- HPE và NVIDIA công bố ‘NVIDIA AI Computing by HPE’ để thúc đẩy cuộc cách mạng AI tạo sinh