Tối qua vào lúc 22:30 PM giờ Việt Nam, CEO NVIDIA Jensen Huang đã có một bài phát biểu tuyệt vời kéo dài trong gần 2 giờ, mở đầu cho sự kiện GTC21.
Xem toàn bộ clip bài phát biểu:
→ Download các slides chính trong bài phát biểu
Dưới đây là tóm tắt các nội dung chính:
11:27 AM EDT – Cảm ơn bạn đã tham gia cùng chúng tôi một năm nữa của bài phát biểu trực tiếp chính của NVIDIA GTC
11:28 AM EDT – Dù là vật lý hay ảo, GTC chắc chắn là một chuỗi rất nhiều tin tức trong một khoảng thời gian ngắn
11:29 AM EDT – Doanh thu của NVIDIA đã tăng gấp đôi trong vòng chưa đầy nửa thập kỷ và cùng với đó là số lượng hoạt động kinh doanh của chúng tôi
11:29 AM EDT – Đồ họa, AI, ô tô, HPC và gần đây nhất là Networking
11:30 AM EDT – Vì vậy, rất nhiều cho Giám đốc điều hành Jensen Huang để đi hết (lý tưởng) chỉ với chưa đầy 2 tiếng
11:30 AM EDT – Năm nay cũng không ngoại lệ. Với cả năm để chuẩn bị, NVIDIA đang khai thác trên tất cả các nỗ lực trước thềm triển lãm
11:30 AM EDT – Và chúng ta bắt đầu
11:32 AM EDT – Với chương trình được tổ chức trực tuyến, bài phát biểu của năm nay đã được ghi trước. Vì vậy, nó nên giữ một tốc độ chặt chẽ. Tuy nhiên, theo YouTube, chúng tôi đang có bản ghi âm dài 1 giờ 48 phút
11:33 AM EDT – Mở video giới thiệu. “TÔI LÀ AI”
11:33 AM EDT – Và đây là Jensen
11:34 AM EDT – Bắt đầu ngay từ khi nói về AI
11:34 AM EDT – “AI và 5G là thành phần để khởi động cuộc cách mạng công nghiệp lần thứ 4”
11:35 AM EDT – Cuộc nói chuyện của Jensen sẽ nằm trong 4 yếu tố: Đồ họa và Omniverse, AI trong trung tâm dữ liệu và phần cứng máy chủ, Edge AI và EGX 5G, và lĩnh vực ô tô / DRIVE
11:37 AM EDT – “Chỉ với GeForce, mọi sinh viên đều có thể có một siêu máy tính”
11:38 AM EDT – Bây giờ tóm tắt lại một số điều mà khách hàng của NVIDIA đã và đang làm với phần cứng của họ
11:38 AM EDT – Theo số lượng đầu người, NVIDIA chủ yếu là một công ty phần mềm (một cách nghiêm túc), và không thiếu các nhà nghiên cứu khoa học máy tính lớn sẽ nói chuyện tại triển lãm năm nay
11:39 AM EDT – “Hãy bắt đầu từ nơi NVIDIA bắt đầu: đồ họa máy tính”
11:40 AM EDT – Tóm tắt việc giới thiệu phần cứng RTX (Ampere) thế hệ thứ hai vào năm ngoái
11:40 AM EDT – Giới thiệu một số video về một số trò chơi được phát hành gần đây và các trò chơi trong tương lai đang được phát triển
11:42 AM EDT – Chỉ có thể nói rằng chất lượng đồ họa của trò chơi chỉ tiếp tục tốt hơn trong những năm qua
11:42 AM EDT – Và NVIDIA muốn Ray-Tracing để thúc đẩy điều đó xa hơn
11:42 AM EDT – Nhưng trò chơi không phải là tất cả. NVIDIA cũng tập trung vào năng suất sử dụng đồ họa
11:42 AM EDT – Công nghệ Omniverse của NVIDIA
11:43 AM EDT – Được công bố lần đầu tiên cách đây vài năm và đi vào thử nghiệm beta vào cuối năm ngoái
11:43 AM EDT – Omniverse về cơ bản là một gói phần mềm đồ họa và mô phỏng nhóm được chia sẻ
11:44 AM EDT – Omniverse được lưu trữ trên máy chủ và bất kỳ ứng dụng khách RTX nào cũng có thể cắm vào để xem. Hoặc thậm chí sử dụng tính năng phát trực tuyến cho những thiết bị không thể hiển thị cục bộ
11:46 AM EDT – Nói cách khác, cộng tác và thiết kế được chia sẻ trong một dự án 3D duy nhất. Tất cả đều tập trung vào vật lý và kết xuất chất lượng cao
11:47 AM EDT – Một trọng tâm đặc biệt của Omniverse là “cặp song sinh kỹ thuật số”; tạo một bản sao ảo của một dự án / vị trí trong thế giới thực
11:48 AM EDT – Đây là một trong những điểm thu hút lớn của NVIDIA đối với các khách hàng đồ họa chuyên nghiệp truyền thống của mình, đặc biệt là trong ngành sản xuất phim và truyền hình
11:48 AM EDT – Nhưng cũng có người máy, R & D và khá nhiều trường hợp sử dụng khác mà bạn có thể nghĩ về nơi giao diện thời gian thực được chia sẻ cho một mô hình có thể hữu ích
11:49 AM EDT – (Ồ tốt, ai đó đã nhớ ra ấm trà. Không phải là đồ họa mà không có ấm trà Utah!)
11:50 AM EDT – Nền tảng robot Isaac của NVIDIA cũng có thể giao tiếp với Omniverse
11:50 AM EDT – Trong số những thứ khác, có thể được sử dụng để đào tạo robot bằng cách sử dụng bộ đôi kỹ thuật số của một nhà máy trong Omniverse
11:51 AM EDT – NVIDIA thậm chí đã tạo ra một bộ đôi kỹ thuật số của một nhà máy BMW
11:52 AM EDT – BMW đang sử dụng điều này như một phần của quy trình lập kế hoạch của họ
11:53 AM EDT – Thảo luận về một ví dụ về việc sử dụng mô hình để tối ưu hóa dây chuyền lắp ráp cho năng suất và an toàn bằng cách nhanh chóng điều chỉnh dây chuyền và di dời các công cụ / trạm khác nhau
11:53 AM EDT – BMW cũng đang triển khai robot hậu cần sử dụng isaac
11:55 AM EDT – Tất cả đều có vẻ ấn tượng. Mặc dù tôi rất tò mò về khoản đầu tư cần thiết đối với nghệ thuật. Ai đó phải tạo ra tất cả các mô hình, mặt hàng và kết cấu bề mặt của chúng
11:56 AM EDT – SDK kết nối đa dạng từ các gói phần mềm chính hiện đã có sẵn, với nhiều hơn thế nữa đang được triển khai
11:56 AM EDT – Omniverse sẽ có sẵn để sử dụng thương mại vào mùa hè này theo giấy phép doanh nghiệp
11:56 AM EDT – Hiện đã đến trung tâm dữ liệu
11:57 AM EDT – Hiện đang thảo luận về ảo hóa và tác động của việc này đối với CPU
11:58 AM EDT – GPU tạo ra rất nhiều lưu lượng truy cập trung tâm dữ liệu chéo. Học sâu thậm chí còn bổ sung nhiều hơn nữa cho điều đó
11:58 AM EDT – Và do đó, bộ xử lý mạng của NVIDIA, Bộ xử lý dữ liệu (DPU)
11:59 AM EDT – Dòng DPU Bluefield được kế thừa từ Mellanox và hiện là một phần cốt lõi trong các dịch vụ của NVIDIA
12:00 PM EDT – Bluefield được thiết kế để giảm tải một phần chính của các chức năng mạng, bao gồm tất cả các quá trình xử lý đi kèm với chúng, chẳng hạn như SSL và phân tích bảo mật
12:00 CH EDT – Hôm nay NVIDIA công bố Bluefield 3
12:00 PM EDT – Bộ xử lý mạng 400Gbps với 22 tỷ bóng bán dẫn
12:01 CH EDT – Và NVIDIA đang làm việc trên Bluefield 4 cho năm 2024, sẽ có bóng bán dẫn 64B và kết hợp công nghệ tăng tốc AI của NVIDIA
12:01 PM EDT – “Phần mềm sẽ được viết bởi phần mềm chạy trên máy tính AI”
12:02 CH EDT – Hiện đang xâm nhập vào phần cứng máy chủ DGX của NVIDIA
12:03 CH EDT – Dòng DGX A100 bao gồm một hộp DGX Station giống như máy trạm, thông qua các máy chủ DGX A100 và DGX SuperPods bao gồm nhiều máy chủ A100
12:03 CH EDT – Công bố DGX Station 320G
12:04 CH EDT – 2,5 PFLOPS, 320GB VRAM và tất cả trong 1500W
12:04 PM EDT – Đây thực chất là chiếc hộp mạnh mẽ nhất mà NVIDIA có thể chế tạo để có thể cắm một cách an toàn vào mạch 115V / 15A tiêu chuẩn của Bắc Mỹ
12:05 CH EDT – (PANAMAX cho máy trạm, nếu bạn muốn)
12:05 CH EDT – NVIDIA cũng đang cập nhật DGX SuperPod
12:06 PM EDT – SuperPod thế hệ mới nhất đã thêm Bluefield 2 DPU
12:06 CH EDT – A100 80GB, được công bố lần đầu tiên vào năm ngoái, cũng là một tùy chọn
12:06 PM EDT – Giá bắt đầu từ 7 triệu đô la và quy mô đến 60 triệu tùy thuộc vào quy mô của hệ thống
12:06 CH EDT – Bây giờ chuyển sang chủ đề tiếp theo: máy biến áp
12:07 PM EDT – Mô hình học máy biến áp ngôn ngữ tự nhiên
12:07 PM EDT – “Chúng tôi hy vọng sẽ thấy các mô hình tham số hàng nghìn tỷ vào năm tới”
12:08 PM EDT – Các mẫu máy biến áp đang phát triển nhanh chóng. Mô hình càng lớn, thường thì kết quả càng tốt hơn và nhiều sắc thái hơn
12:08 PM EDT – Vì vậy, NVIDIA đã phát triển công nghệ biến áp của riêng họ: Megatorn
12:09 CH EDT – Công bố máy chủ Megatron Triton DGX
12:09 CH EDT – Có thể trả lời tối đa 16 truy vấn đồng thời ngay lập tức
12:10 PM EDT – Bây giờ đến với thư viện Clara của NVIDIA về các mô hình học máy và công nghệ cho nghiên cứu y tế
12:10 PM EDT – NVIDIA sẽ thêm 4 kiểu máy mới vào thư viện Clara Discovery
12:12 PM EDT – Trong số các nhiệm vụ khác, một trong những mô hình mới có thể được sử dụng để nhận dạng trình tự DNA
12:12 PM EDT – Trong khi đó, Jensen cũng đang quảng cáo phần cứng và phần mềm của NVIDIA để khám phá ma túy
12:13 PM EDT – Và nếu điều đó vẫn chưa đủ, thì làm thế nào về mô phỏng vật lý lượng tử chạy trên GPU? IBM đang làm điều đó
12:14 PM EDT – Ồ, xin lỗi, máy tính lượng tử, không phải vật lý lượng tử
12:15 PM EDT – NVIDIA công bố gói phần mềm mới, cuQuantum, để giúp nghiên cứu và mô phỏng máy tính lượng tử
12:15 PM EDT – cuQuantum được tối ưu hóa để chạy trên phần cứng DGX của NVIDIA
12:16 CH EDT – Jensen muốn cuQuantum làm những gì cuDNN đã làm để học sâu
12:16 PM EDT – Bây giờ là kiến trúc máy chủ trung tâm dữ liệu
12:17 PM EDT – “Xử lý lượng lớn dữ liệu vẫn là một thách thức đối với máy tính ngày nay”
12:18 PM EDT – Thảo luận về kiến trúc hiện tại của các hộp máy chủ GPU như DGX của NVIDIA: 4 GPU được kết nối với một CPU duy nhất qua PCI Express
12:18 PM EDT – PCI Express là điểm nghẽn
12:18 CH EDT – NVIDIA có NVLink, nhưng không có CPU x86 nào có NVLink
12:18 CH EDT – Vì vậy, NVIDIA đang sản xuất CPU trung tâm dữ liệu của riêng họ: Grace
12:18 CH EDT – Được đặt theo tên của Grace Hopper
12:19 PM EDT – Grace là một CPU dựa trên Arm, chuyên lưu trữ GPU của NVIDIA vì lý do băng thông và thông lượng AI
12:20 PM EDT – “Sự gia tăng đáng kinh ngạc trong băng thông bộ nhớ và hệ thống”
12:20 PM EDT – Và chúng tôi hiện đang giải mã nhà bếp của Jensen …
12:20 CH EDT – Duyên dáng trong da thịt được hình dung bởi một nghệ sĩ
12:21 PM EDT – NVIDIA đã sắp xếp một khách hàng cho Grace: CSCS, người đang chế tạo siêu máy tính Alps của họ
12:21 CH EDT – Chuẩn bị trực tuyến vào năm 2023
12:21 PM EDT – NVIDIA hiện là công ty CPU, GPU và DPU
12:22 PM EDT – Mỗi kiến trúc chip sẽ có nhịp điệu 2 năm, có khả năng là một người khởi xướng ở giữa
12:22 CH EDT – NVIDIA sẽ không ngừng hỗ trợ x86
12:22 CH EDT – Thay vào đó, họ sẽ hỗ trợ cả Arm và x86
12:24 PM EDT – Nói về Arm, NVIDIA đang phát triển Arm SDK, hợp tác với Ampere (công ty)
12:24 PM EDT – Và nhảy chủ thể một lần nữa, lần này để vượt qua AI
12:27 PM EDT – Tóm tắt các bộ công cụ và thư viện AI khác nhau của NVIDIA
12:27 CH EDT – NVIDIA gọi đơn giản là “NVIDIA AI”
12:27 PM EDT – Từ PC và máy tính xách tay đến máy trạm và siêu máy tính
12:28 PM EDT – Nhưng một phân khúc thị trường mà NVIDIA không tập trung cho đến bây giờ là điện toán doanh nghiệp
12:28 PM EDT – Vì vậy, NVIDIA sẽ công bố nền tảng doanh nghiệp EGX của họ
12:28 PM EDT – NVIDIA AI chạy trên VMware
12:29 PM EDT – Vì vậy, NVIDIA AI có sẵn trong môi trường ảo hóa
12:29 CH EDT – “Liên kết bị thiếu là 5G”
12:30 PM EDT – NVIDIA đang kết hợp một nền tảng phần cứng mới khác, mà họ gọi là Aerial A100
12:30 PM EDT – GPU A100 và bộ xử lý Bluefield 2 trên một thẻ PCIe duy nhất
12:30 PM EDT – Để sử dụng trong các cơ sở 5G
12:30 CH EDT – Phần mềm được xác định, với khả năng tăng tốc PHY, tiền điện tử, xử lý gói và hơn thế nữa
12:31 PM EDT – Sẽ được cung cấp như một phần của gói máy chủ cạnh EGX
12:32 PM EDT – Công bố NVIDIA Morpheus: một sản phẩm bảo mật trung tâm dữ liệu
12:32 PM EDT – Đây là một sản phẩm khác tập trung vào DPU
12:32 PM EDT – Hiện đang giới thiệu một video thông tin về cách NVIDIA đang sử dụng Morpheus in-house
12:33 CH EDT – Morpheus gắn cờ khi gặp dữ liệu không được mã hóa
12:33 CH EDT – Dựa vào AI, thay vì đối sánh mẫu cụ thể
12:35 PM EDT – Và tóm tắt các dịch vụ phần cứng doanh nghiệp của NVIDIA, được hỗ trợ bởi máy chủ EGX
12:36 PM EDT – Bây giờ chuyển sang các dự án AI liên quan đến đồ họa như DLSS và variouos GAN
12:37 PM EDT – NVIDIA chứng kiến làn sóng AI tiếp theo bao gồm việc sử dụng công nghệ plug-and-play ngày càng tăng
12:37 PM EDT – Để đạt được điều đó, NVIDIA đang bổ sung thêm nhiều người mẫu được đào tạo trước vào bộ sưu tập của họ cho khách hàng
12:38 PM EDT – Công bố khung NVIDIA Tao
12:38 PM EDT – Và đội NVIDIA yêu cầu kiểm soát an toàn máy chủ AI edge
12:39 PM EDT – Giới thiệu video về một khách hàng sử dụng các sản phẩm Tao và Fleet Command của NVIDIA
12:40 CH EDT – Bắt đầu với một mô hình được đào tạo trước, sau đó sử dụng Tao để đào tạo lại mô hình đó nhằm đáp ứng tốt hơn cho vị trí công việc cụ thể
12:40 PM EDT – Tất cả các mô hình được đào tạo trong vài phút
12:40 PM EDT – Và các mô hình cập nhật được triển khai thông qua Fleet Command
12:41 PM EDT – Chọn một mô hình được đào tạo trước từ NGC, tối ưu hóa nó với Tao, sau đó triển khai nó thông qua Fleet Command
12:41 CH EDT – Bây giờ chuyển sang AI đàm thoại
12:42 PM EDT – Gói Jarvis của NVIDIA hiện đã có sẵn để sử dụng trong sản xuất
12:42 PM EDT – Jarvis có khả năng nhận dạng chính xác 90%
12:42 CH EDT – 5 ngôn ngữ được hỗ trợ hôm nay
12:43 CH EDT – “Không nói máy móc nữa”
12:43 CH EDT – Jensen đang tập trung vào các trường hợp sử dụng biên cho Jarvis và nơi nó có thể được chạy
12:44 PM EDT – Và NVIDIA đang hợp tác với Mozilla để thu thập các mẫu giọng nói nhằm đào tạo tốt hơn Jarvis và các hệ thống AI bằng giọng nói khác trong tương lai
12:44 CH EDT – “Tôi không biết mình đã nói gì, nhưng Jarvis đã nhận ra điều đó một cách hoàn hảo”
12:45 CH EDT – Và cho thấy Jarvis đang thực hiện các bản dịch từ tiếng Anh sang tiếng Nhật (chuyển giọng nói thành văn bản thành văn bản)
12:45 CH EDT – Và các tùy chọn giọng nói có thể định cấu hình, bao gồm cường độ và sự nhiệt tình
12:46 PM EDT – Bây giờ là hệ thống giới thiệu
12:46 PM EDT – (Chúng tôi đang di chuyển với tốc độ chóng mặt ở đây. NVIDIA có rất nhiều chủ đề để vượt qua)
12:46 PM EDT – Công bố NVIDIA Merlin, hệ thống khuyến nghị tăng tốc đầu cuối của NVIDIA
12:47 CH EDT – (Một hệ thống giới thiệu giống hệt như nó nghe: một hệ thống cố gắng tìm ra người dùng thích gì hơn và do đó họ nên được đề xuất những gì)
12:47 PM EDT – Và trên NVIDIA Maxine, bộ công nghệ hội nghị truyền hình của NVIDIA
12:48 PM EDT – Tích hợp tính năng dịch và nhận dạng giọng nói Jarvis
12:48 PM EDT – Cũng thể hiện một người bắt chước / chỉnh sửa giao tiếp bằng mắt
12:49 PM EDT – Rất nhiều người đang tham gia hội nghị truyền hình những ngày này, nói ít nhất là. Vì vậy, NVIDIA quan tâm đến việc thu hút khách hàng trong thị trường đó bằng các công cụ để cải thiện trải nghiệm
12:49 PM EDT – Thông báo máy chủ suy luận NVIDIA Triton
12:50 PM EDT – Triton lên lịch cho các mô hình trên phần cứng. Bất kỳ mô hình và khuôn khổ nào trên phần cứng thích hợp
12:51 CH EDT – Và xem nhanh các mô phỏng phân tử y sinh bằng Triton
12:52 CH EDT – Và bây giờ hãy nói về những gì khách hàng đã và đang làm với các công nghệ AI của NVIDIA
12:52 CH EDT – Best Buy, Spotify, T-Mobile, v.v.
12:53 CH EDT – Và bây giờ là ô tô và DRIVE AV
12:53 CH EDT – “Nhu cầu điện toán AV đang tăng vọt”
12:54 CH EDT – Các nhà sản xuất ô tô vẫn cần nhiều sức mạnh tính toán hơn
12:54 CH EDT – Khai thác SoC Orin của NVIDIA, dự kiến sẽ ra mắt vào năm sau
12:56 CH EDT – Và khả năng sử dụng một hệ thống Orin duy nhất làm máy tính trung tâm cho mọi thứ bên trong ô tô. Từ lái xe tự động đến phóng nhanh và thông tin giải trí, tất cả việc thực thi đều được tách biệt
12:56 CH EDT – Và SoC thế hệ tiếp theo của NVIDIA trước đây là Orin đã được phát triển
12:56 CH EDT – DRIVE Atlan
12:56 CH EDT – 1000 TOPS trên một chip
12:57 CH EDT – Mới kết hợp công nghệ AI và DPU của NVIDIA trên nhiều tính năng phần cứng hiện có khác
12:57 CH EDT – Đến năm 2025
12:58 PM EDT – Bây giờ đang nói về số lượng khách hàng ô tô lớn ngày càng tăng của NVIDIA và những gì họ đang làm với công nghệ của NV
12:58 CH EDT – Tất nhiên là lớn nhất: taxi robo
12:59 PM EDT – Xe tải không người lái, có ai không?
12:59 CH EDT – Và bây giờ chúng ta đang đi đến khúc cuối, và Jensen đang quay trở lại Omniverse
12:59 CH EDT – Chạy mô phỏng NVIDIA DRIVE trong Omniverse
12:59 CH EDT – Và cơ hội song sinh kỹ thuật số
01:00 PM EDT – Công cụ Drive Sim của NVIDIA sẽ có sẵn cho người dùng Omniverse
01:00 PM EDT – Hiện đang phát video
01:01 PM EDT – Hiển thị Drive Sim đang hoạt động, bên trong và bên ngoài một chiếc ô tô mô phỏng
01:02 PM EDT – Và bây giờ là phần tóm tắt
01:03 CH EDT – Omniverse
01:03 PM EDT – Hệ thống DGX và CPU Grace
01:03 CH EDT – Jarvis, Merlin và AI biên
01:04 PM EDT – NVIDIA Tao, Chỉ huy Hạm đội, và Triton
01:04 CH EDT – Và Drive, Orin và Atlan SoC mới
01:05 PM EDT – Và xin nói lời kết thúc tại đây. Cảm ơn một lần nữa vì đã tham gia cùng chúng tôi
Bài viết liên quan
- GPUDirect RDMA là gì?
- GPUDirect Storage là gì?
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- So sánh các GPU Tensor Core của NVIDIA: B200, B100, H200, H100, A100