Tóm tắt bài phát biểu khai mạc GTC21 của CEO NVIDIA Jensen Huang

Tối qua vào lúc 22:30 PM giờ Việt Nam, CEO NVIDIA Jensen Huang đã có một bài phát biểu tuyệt vời kéo dài trong gần 2 giờ, mở đầu cho sự kiện GTC21.

Xem toàn bộ clip bài phát biểu:

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

→ Download các slides chính trong bài phát biểu

Dưới đây là tóm tắt các nội dung chính:

11:27 AM EDT – Cảm ơn bạn đã tham gia cùng chúng tôi một năm nữa của bài phát biểu trực tiếp chính của NVIDIA GTC

11:28 AM EDT – Dù là vật lý hay ảo, GTC chắc chắn là một chuỗi rất nhiều tin tức trong một khoảng thời gian ngắn

11:29 AM EDT – Doanh thu của NVIDIA đã tăng gấp đôi trong vòng chưa đầy nửa thập kỷ và cùng với đó là số lượng hoạt động kinh doanh của chúng tôi

11:29 AM EDT – Đồ họa, AI, ô tô, HPC và gần đây nhất là Networking

11:30 AM EDT – Vì vậy, rất nhiều cho Giám đốc điều hành Jensen Huang để đi hết (lý tưởng) chỉ với chưa đầy 2 tiếng

11:30 AM EDT – Năm nay cũng không ngoại lệ. Với cả năm để chuẩn bị, NVIDIA đang khai thác trên tất cả các nỗ lực trước thềm triển lãm

11:30 AM EDT – Và chúng ta bắt đầu

11:32 AM EDT – Với chương trình được tổ chức trực tuyến, bài phát biểu của năm nay đã được ghi trước. Vì vậy, nó nên giữ một tốc độ chặt chẽ. Tuy nhiên, theo YouTube, chúng tôi đang có bản ghi âm dài 1 giờ 48 phút

11:33 AM EDT – Mở video giới thiệu. “TÔI LÀ AI”

11:33 AM EDT – Và đây là Jensen

11:34 AM EDT – Bắt đầu ngay từ khi nói về AI

11:34 AM EDT – “AI và 5G là thành phần để khởi động cuộc cách mạng công nghiệp lần thứ 4”

11:35 AM EDT – Cuộc nói chuyện của Jensen sẽ nằm trong 4 yếu tố: Đồ họa và Omniverse, AI trong trung tâm dữ liệu và phần cứng máy chủ, Edge AI và EGX 5G, và lĩnh vực ô tô / DRIVE

11:37 AM EDT – “Chỉ với GeForce, mọi sinh viên đều có thể có một siêu máy tính”

11:38 AM EDT – Bây giờ tóm tắt lại một số điều mà khách hàng của NVIDIA đã và đang làm với phần cứng của họ

11:38 AM EDT – Theo số lượng đầu người, NVIDIA chủ yếu là một công ty phần mềm (một cách nghiêm túc), và không thiếu các nhà nghiên cứu khoa học máy tính lớn sẽ nói chuyện tại triển lãm năm nay

11:39 AM EDT – “Hãy bắt đầu từ nơi NVIDIA bắt đầu: đồ họa máy tính”

11:40 AM EDT – Tóm tắt việc giới thiệu phần cứng RTX (Ampere) thế hệ thứ hai vào năm ngoái

11:40 AM EDT – Giới thiệu một số video về một số trò chơi được phát hành gần đây và các trò chơi trong tương lai đang được phát triển

11:42 AM EDT – Chỉ có thể nói rằng chất lượng đồ họa của trò chơi chỉ tiếp tục tốt hơn trong những năm qua

11:42 AM EDT – Và NVIDIA muốn Ray-Tracing để thúc đẩy điều đó xa hơn

11:42 AM EDT – Nhưng trò chơi không phải là tất cả. NVIDIA cũng tập trung vào năng suất sử dụng đồ họa

11:42 AM EDT – Công nghệ Omniverse của NVIDIA

11:43 AM EDT – Được công bố lần đầu tiên cách đây vài năm và đi vào thử nghiệm beta vào cuối năm ngoái

11:43 AM EDT – Omniverse về cơ bản là một gói phần mềm đồ họa và mô phỏng nhóm được chia sẻ

11:44 AM EDT – Omniverse được lưu trữ trên máy chủ và bất kỳ ứng dụng khách RTX nào cũng có thể cắm vào để xem. Hoặc thậm chí sử dụng tính năng phát trực tuyến cho những thiết bị không thể hiển thị cục bộ

11:46 AM EDT – Nói cách khác, cộng tác và thiết kế được chia sẻ trong một dự án 3D duy nhất. Tất cả đều tập trung vào vật lý và kết xuất chất lượng cao

11:47 AM EDT – Một trọng tâm đặc biệt của Omniverse là “cặp song sinh kỹ thuật số”; tạo một bản sao ảo của một dự án / vị trí trong thế giới thực

11:48 AM EDT – Đây là một trong những điểm thu hút lớn của NVIDIA đối với các khách hàng đồ họa chuyên nghiệp truyền thống của mình, đặc biệt là trong ngành sản xuất phim và truyền hình

11:48 AM EDT – Nhưng cũng có người máy, R & D và khá nhiều trường hợp sử dụng khác mà bạn có thể nghĩ về nơi giao diện thời gian thực được chia sẻ cho một mô hình có thể hữu ích

11:49 AM EDT – (Ồ tốt, ai đó đã nhớ ra ấm trà. Không phải là đồ họa mà không có ấm trà Utah!)

11:50 AM EDT – Nền tảng robot Isaac của NVIDIA cũng có thể giao tiếp với Omniverse

11:50 AM EDT – Trong số những thứ khác, có thể được sử dụng để đào tạo robot bằng cách sử dụng bộ đôi kỹ thuật số của một nhà máy trong Omniverse

11:51 AM EDT – NVIDIA thậm chí đã tạo ra một bộ đôi kỹ thuật số của một nhà máy BMW

11:52 AM EDT – BMW đang sử dụng điều này như một phần của quy trình lập kế hoạch của họ

11:53 AM EDT – Thảo luận về một ví dụ về việc sử dụng mô hình để tối ưu hóa dây chuyền lắp ráp cho năng suất và an toàn bằng cách nhanh chóng điều chỉnh dây chuyền và di dời các công cụ / trạm khác nhau

11:53 AM EDT – BMW cũng đang triển khai robot hậu cần sử dụng isaac

11:55 AM EDT – Tất cả đều có vẻ ấn tượng. Mặc dù tôi rất tò mò về khoản đầu tư cần thiết đối với nghệ thuật. Ai đó phải tạo ra tất cả các mô hình, mặt hàng và kết cấu bề mặt của chúng

11:56 AM EDT – SDK kết nối đa dạng từ các gói phần mềm chính hiện đã có sẵn, với nhiều hơn thế nữa đang được triển khai

11:56 AM EDT – Omniverse sẽ có sẵn để sử dụng thương mại vào mùa hè này theo giấy phép doanh nghiệp

11:56 AM EDT – Hiện đã đến trung tâm dữ liệu

11:57 AM EDT – Hiện đang thảo luận về ảo hóa và tác động của việc này đối với CPU

11:58 AM EDT – GPU tạo ra rất nhiều lưu lượng truy cập trung tâm dữ liệu chéo. Học sâu thậm chí còn bổ sung nhiều hơn nữa cho điều đó

11:58 AM EDT – Và do đó, bộ xử lý mạng của NVIDIA, Bộ xử lý dữ liệu (DPU)

11:59 AM EDT – Dòng DPU Bluefield được kế thừa từ Mellanox và hiện là một phần cốt lõi trong các dịch vụ của NVIDIA

12:00 PM EDT – Bluefield được thiết kế để giảm tải một phần chính của các chức năng mạng, bao gồm tất cả các quá trình xử lý đi kèm với chúng, chẳng hạn như SSL và phân tích bảo mật

12:00 CH EDT – Hôm nay NVIDIA công bố Bluefield 3

12:00 PM EDT – Bộ xử lý mạng 400Gbps với 22 tỷ bóng bán dẫn

12:01 CH EDT – Và NVIDIA đang làm việc trên Bluefield 4 cho năm 2024, sẽ có bóng bán dẫn 64B và kết hợp công nghệ tăng tốc AI của NVIDIA

12:01 PM EDT – “Phần mềm sẽ được viết bởi phần mềm chạy trên máy tính AI”

12:02 CH EDT – Hiện đang xâm nhập vào phần cứng máy chủ DGX của NVIDIA

12:03 CH EDT – Dòng DGX A100 bao gồm một hộp DGX Station giống như máy trạm, thông qua các máy chủ DGX A100 và DGX SuperPods bao gồm nhiều máy chủ A100

12:03 CH EDT – Công bố DGX Station 320G

12:04 CH EDT – 2,5 PFLOPS, 320GB VRAM và tất cả trong 1500W

12:04 PM EDT – Đây thực chất là chiếc hộp mạnh mẽ nhất mà NVIDIA có thể chế tạo để có thể cắm một cách an toàn vào mạch 115V / 15A tiêu chuẩn của Bắc Mỹ

12:05 CH EDT – (PANAMAX cho máy trạm, nếu bạn muốn)

12:05 CH EDT – NVIDIA cũng đang cập nhật DGX SuperPod

12:06 PM EDT – SuperPod thế hệ mới nhất đã thêm Bluefield 2 DPU

12:06 CH EDT – A100 80GB, được công bố lần đầu tiên vào năm ngoái, cũng là một tùy chọn

12:06 PM EDT – Giá bắt đầu từ 7 triệu đô la và quy mô đến 60 triệu tùy thuộc vào quy mô của hệ thống

12:06 CH EDT – Bây giờ chuyển sang chủ đề tiếp theo: máy biến áp

12:07 PM EDT – Mô hình học máy biến áp ngôn ngữ tự nhiên

12:07 PM EDT – “Chúng tôi hy vọng sẽ thấy các mô hình tham số hàng nghìn tỷ vào năm tới”

12:08 PM EDT – Các mẫu máy biến áp đang phát triển nhanh chóng. Mô hình càng lớn, thường thì kết quả càng tốt hơn và nhiều sắc thái hơn

12:08 PM EDT – Vì vậy, NVIDIA đã phát triển công nghệ biến áp của riêng họ: Megatorn

12:09 CH EDT – Công bố máy chủ Megatron Triton DGX

12:09 CH EDT – Có thể trả lời tối đa 16 truy vấn đồng thời ngay lập tức

12:10 PM EDT – Bây giờ đến với thư viện Clara của NVIDIA về các mô hình học máy và công nghệ cho nghiên cứu y tế

12:10 PM EDT – NVIDIA sẽ thêm 4 kiểu máy mới vào thư viện Clara Discovery

12:12 PM EDT – Trong số các nhiệm vụ khác, một trong những mô hình mới có thể được sử dụng để nhận dạng trình tự DNA

12:12 PM EDT – Trong khi đó, Jensen cũng đang quảng cáo phần cứng và phần mềm của NVIDIA để khám phá ma túy

12:13 PM EDT – Và nếu điều đó vẫn chưa đủ, thì làm thế nào về mô phỏng vật lý lượng tử chạy trên GPU? IBM đang làm điều đó

12:14 PM EDT – Ồ, xin lỗi, máy tính lượng tử, không phải vật lý lượng tử

12:15 PM EDT – NVIDIA công bố gói phần mềm mới, cuQuantum, để giúp nghiên cứu và mô phỏng máy tính lượng tử

12:15 PM EDT – cuQuantum được tối ưu hóa để chạy trên phần cứng DGX của NVIDIA

12:16 CH EDT – Jensen muốn cuQuantum làm những gì cuDNN đã làm để học sâu

12:16 PM EDT – Bây giờ là kiến trúc máy chủ trung tâm dữ liệu

12:17 PM EDT – “Xử lý lượng lớn dữ liệu vẫn là một thách thức đối với máy tính ngày nay”

12:18 PM EDT – Thảo luận về kiến trúc hiện tại của các hộp máy chủ GPU như DGX của NVIDIA: 4 GPU được kết nối với một CPU duy nhất qua PCI Express

12:18 PM EDT – PCI Express là điểm nghẽn

12:18 CH EDT – NVIDIA có NVLink, nhưng không có CPU x86 nào có NVLink

12:18 CH EDT – Vì vậy, NVIDIA đang sản xuất CPU trung tâm dữ liệu của riêng họ: Grace

12:18 CH EDT – Được đặt theo tên của Grace Hopper

12:19 PM EDT – Grace là một CPU dựa trên Arm, chuyên lưu trữ GPU của NVIDIA vì lý do băng thông và thông lượng AI

12:20 PM EDT – “Sự gia tăng đáng kinh ngạc trong băng thông bộ nhớ và hệ thống”

12:20 PM EDT – Và chúng tôi hiện đang giải mã nhà bếp của Jensen …

12:20 CH EDT – Duyên dáng trong da thịt được hình dung bởi một nghệ sĩ

12:21 PM EDT – NVIDIA đã sắp xếp một khách hàng cho Grace: CSCS, người đang chế tạo siêu máy tính Alps của họ

12:21 CH EDT – Chuẩn bị trực tuyến vào năm 2023

12:21 PM EDT – NVIDIA hiện là công ty CPU, GPU và DPU

12:22 PM EDT – Mỗi kiến trúc chip sẽ có nhịp điệu 2 năm, có khả năng là một người khởi xướng ở giữa

12:22 CH EDT – NVIDIA sẽ không ngừng hỗ trợ x86

12:22 CH EDT – Thay vào đó, họ sẽ hỗ trợ cả Arm và x86

12:24 PM EDT – Nói về Arm, NVIDIA đang phát triển Arm SDK, hợp tác với Ampere (công ty)

12:24 PM EDT – Và nhảy chủ thể một lần nữa, lần này để vượt qua AI

12:27 PM EDT – Tóm tắt các bộ công cụ và thư viện AI khác nhau của NVIDIA

12:27 CH EDT – NVIDIA gọi đơn giản là “NVIDIA AI”

12:27 PM EDT – Từ PC và máy tính xách tay đến máy trạm và siêu máy tính

12:28 PM EDT – Nhưng một phân khúc thị trường mà NVIDIA không tập trung cho đến bây giờ là điện toán doanh nghiệp

12:28 PM EDT – Vì vậy, NVIDIA sẽ công bố nền tảng doanh nghiệp EGX của họ

12:28 PM EDT – NVIDIA AI chạy trên VMware

12:29 PM EDT – Vì vậy, NVIDIA AI có sẵn trong môi trường ảo hóa

12:29 CH EDT – “Liên kết bị thiếu là 5G”

12:30 PM EDT – NVIDIA đang kết hợp một nền tảng phần cứng mới khác, mà họ gọi là Aerial A100

12:30 PM EDT – GPU A100 và bộ xử lý Bluefield 2 trên một thẻ PCIe duy nhất

12:30 PM EDT – Để sử dụng trong các cơ sở 5G

12:30 CH EDT – Phần mềm được xác định, với khả năng tăng tốc PHY, tiền điện tử, xử lý gói và hơn thế nữa

12:31 PM EDT – Sẽ được cung cấp như một phần của gói máy chủ cạnh EGX

12:32 PM EDT – Công bố NVIDIA Morpheus: một sản phẩm bảo mật trung tâm dữ liệu

12:32 PM EDT – Đây là một sản phẩm khác tập trung vào DPU

12:32 PM EDT – Hiện đang giới thiệu một video thông tin về cách NVIDIA đang sử dụng Morpheus in-house

12:33 CH EDT – Morpheus gắn cờ khi gặp dữ liệu không được mã hóa

12:33 CH EDT – Dựa vào AI, thay vì đối sánh mẫu cụ thể

12:35 PM EDT – Và tóm tắt các dịch vụ phần cứng doanh nghiệp của NVIDIA, được hỗ trợ bởi máy chủ EGX

12:36 PM EDT – Bây giờ chuyển sang các dự án AI liên quan đến đồ họa như DLSS và variouos GAN

12:37 PM EDT – NVIDIA chứng kiến làn sóng AI tiếp theo bao gồm việc sử dụng công nghệ plug-and-play ngày càng tăng

12:37 PM EDT – Để đạt được điều đó, NVIDIA đang bổ sung thêm nhiều người mẫu được đào tạo trước vào bộ sưu tập của họ cho khách hàng

12:38 PM EDT – Công bố khung NVIDIA Tao

12:38 PM EDT – Và đội NVIDIA yêu cầu kiểm soát an toàn máy chủ AI edge

12:39 PM EDT – Giới thiệu video về một khách hàng sử dụng các sản phẩm Tao và Fleet Command của NVIDIA

12:40 CH EDT – Bắt đầu với một mô hình được đào tạo trước, sau đó sử dụng Tao để đào tạo lại mô hình đó nhằm đáp ứng tốt hơn cho vị trí công việc cụ thể

12:40 PM EDT – Tất cả các mô hình được đào tạo trong vài phút

12:40 PM EDT – Và các mô hình cập nhật được triển khai thông qua Fleet Command

12:41 PM EDT – Chọn một mô hình được đào tạo trước từ NGC, tối ưu hóa nó với Tao, sau đó triển khai nó thông qua Fleet Command

12:41 CH EDT – Bây giờ chuyển sang AI đàm thoại

12:42 PM EDT – Gói Jarvis của NVIDIA hiện đã có sẵn để sử dụng trong sản xuất

12:42 PM EDT – Jarvis có khả năng nhận dạng chính xác 90%

12:42 CH EDT – 5 ngôn ngữ được hỗ trợ hôm nay

12:43 CH EDT – “Không nói máy móc nữa”

12:43 CH EDT – Jensen đang tập trung vào các trường hợp sử dụng biên cho Jarvis và nơi nó có thể được chạy

12:44 PM EDT – Và NVIDIA đang hợp tác với Mozilla để thu thập các mẫu giọng nói nhằm đào tạo tốt hơn Jarvis và các hệ thống AI bằng giọng nói khác trong tương lai

12:44 CH EDT – “Tôi không biết mình đã nói gì, nhưng Jarvis đã nhận ra điều đó một cách hoàn hảo”

12:45 CH EDT – Và cho thấy Jarvis đang thực hiện các bản dịch từ tiếng Anh sang tiếng Nhật (chuyển giọng nói thành văn bản thành văn bản)

12:45 CH EDT – Và các tùy chọn giọng nói có thể định cấu hình, bao gồm cường độ và sự nhiệt tình

12:46 PM EDT – Bây giờ là hệ thống giới thiệu

12:46 PM EDT – (Chúng tôi đang di chuyển với tốc độ chóng mặt ở đây. NVIDIA có rất nhiều chủ đề để vượt qua)

12:46 PM EDT – Công bố NVIDIA Merlin, hệ thống khuyến nghị tăng tốc đầu cuối của NVIDIA

12:47 CH EDT – (Một hệ thống giới thiệu giống hệt như nó nghe: một hệ thống cố gắng tìm ra người dùng thích gì hơn và do đó họ nên được đề xuất những gì)

12:47 PM EDT – Và trên NVIDIA Maxine, bộ công nghệ hội nghị truyền hình của NVIDIA

12:48 PM EDT – Tích hợp tính năng dịch và nhận dạng giọng nói Jarvis

12:48 PM EDT – Cũng thể hiện một người bắt chước / chỉnh sửa giao tiếp bằng mắt

12:49 PM EDT – Rất nhiều người đang tham gia hội nghị truyền hình những ngày này, nói ít nhất là. Vì vậy, NVIDIA quan tâm đến việc thu hút khách hàng trong thị trường đó bằng các công cụ để cải thiện trải nghiệm

12:49 PM EDT – Thông báo máy chủ suy luận NVIDIA Triton

12:50 PM EDT – Triton lên lịch cho các mô hình trên phần cứng. Bất kỳ mô hình và khuôn khổ nào trên phần cứng thích hợp

12:51 CH EDT – Và xem nhanh các mô phỏng phân tử y sinh bằng Triton

12:52 CH EDT – Và bây giờ hãy nói về những gì khách hàng đã và đang làm với các công nghệ AI của NVIDIA

12:52 CH EDT – Best Buy, Spotify, T-Mobile, v.v.

12:53 CH EDT – Và bây giờ là ô tô và DRIVE AV

12:53 CH EDT – “Nhu cầu điện toán AV đang tăng vọt”

12:54 CH EDT – Các nhà sản xuất ô tô vẫn cần nhiều sức mạnh tính toán hơn

12:54 CH EDT – Khai thác SoC Orin của NVIDIA, dự kiến sẽ ra mắt vào năm sau

12:56 CH EDT – Và khả năng sử dụng một hệ thống Orin duy nhất làm máy tính trung tâm cho mọi thứ bên trong ô tô. Từ lái xe tự động đến phóng nhanh và thông tin giải trí, tất cả việc thực thi đều được tách biệt

12:56 CH EDT – Và SoC thế hệ tiếp theo của NVIDIA trước đây là Orin đã được phát triển

12:56 CH EDT – DRIVE Atlan

12:56 CH EDT – 1000 TOPS trên một chip

12:57 CH EDT – Mới kết hợp công nghệ AI và DPU của NVIDIA trên nhiều tính năng phần cứng hiện có khác

12:57 CH EDT – Đến năm 2025

12:58 PM EDT – Bây giờ đang nói về số lượng khách hàng ô tô lớn ngày càng tăng của NVIDIA và những gì họ đang làm với công nghệ của NV

12:58 CH EDT – Tất nhiên là lớn nhất: taxi robo

12:59 PM EDT – Xe tải không người lái, có ai không?

12:59 CH EDT – Và bây giờ chúng ta đang đi đến khúc cuối, và Jensen đang quay trở lại Omniverse

12:59 CH EDT – Chạy mô phỏng NVIDIA DRIVE trong Omniverse

12:59 CH EDT – Và cơ hội song sinh kỹ thuật số

01:00 PM EDT – Công cụ Drive Sim của NVIDIA sẽ có sẵn cho người dùng Omniverse

01:00 PM EDT – Hiện đang phát video

01:01 PM EDT – Hiển thị Drive Sim đang hoạt động, bên trong và bên ngoài một chiếc ô tô mô phỏng

01:02 PM EDT – Và bây giờ là phần tóm tắt

01:03 CH EDT – Omniverse

01:03 PM EDT – Hệ thống DGX và CPU Grace

01:03 CH EDT – Jarvis, Merlin và AI biên

01:04 PM EDT – NVIDIA Tao, Chỉ huy Hạm đội, và Triton

01:04 CH EDT – Và Drive, Orin và Atlan SoC mới

01:05 PM EDT – Và xin nói lời kết thúc tại đây. Cảm ơn một lần nữa vì đã tham gia cùng chúng tôi

Nhất Tiến Chung (NTC) hiện là nhà cung cấp các giải pháp hạ tầng CNTT, điện toán hiệu năng cao (HPC) và lưu trữ cho AI. Chúng tôi là đối tác NPN cấp Elite của NVIDIA cho các hệ thống DGX và hệ thống cụm siêu máy tính DGX SuperPOD với sức mạnh lưu trữ song song của DDN và kết nối mạng tốc độ cao từ hãng Mellanox (thuộc NVIDIA).

Với vai trò là đối tác NPN chính thức của NVIDIA, chúng tôi có thể giúp bạn có được các sản phẩm GPU cao cấp nhất của NVIDIA như L4, L40S, H200, H200 NVL, B200,…, đặc biệt là với thực trạng khan hiếm GPU do các hạn chế thương mại về nhập khẩu GPU như hiện nay.

Bạn muốn trở thành đối tác bán hàng NVIDIA của NTC?

Đăng ký ngay

____
Bài viết liên quan

Bạn muốn trở thành đối tác bán hàng NVIDIA của NTC?

Gửi yêu cầu