NVIDIA CEO: “Chúng tôi đã tạo ra chip xử lý cho kỷ nguyên AI tạo sinh”

Generative AI hứa hẹn sẽ cách mạng hóa mọi ngành công nghiệp mà nó chạm tới – công nghệ là tất cả những gì cần thiết để đáp ứng thách thức.

NVIDIA CEO và founder Jensen Huang đã giới thiệu công nghệ đó – nền tảng điện toán Blackwell mới của công ty – khi ông chỉ ra những tiến bộ lớn mà sức mạnh điện toán tăng lên có thể mang lại cho mọi thứ, từ phần mềm đến dịch vụ, robot đến công nghệ y tế,…

“Điện toán tăng tốc (accelerated computing) đã đạt đến đỉnh điểm – điện toán cho mục đích chung (general purpose computing) đã hết hơi,” Huang đã nói với hơn 11.000 người tham dự GTC trực tiếp và hàng chục nghìn người khác trực tuyến, trong bài phát biểu chính của ông tại SAP Center, Silicon Valley.

“Chúng ta cần một cách thực hiện điện toán khác – để chúng ta có thể tiếp tục mở rộng và giảm chi phí điện toán, để chúng ta có thể tiếp tục tiêu thụ ngày càng nhiều điện toán hơn trong khi vẫn bền vững. Điện toán tăng tốc là sự tăng tốc đáng kể so với điện toán cho mục đích chung trong mọi ngành công nghiệp.”

Huang phát biểu trước những hình ảnh khổng lồ trên màn hình 8K cao 40 feet, có kích thước bằng một sân tennis trước đám đông gồm các CEO và nhà phát triển, những người đam mê AI và doanh nhân, những người đã cùng nhau đi bộ 20 phút đến nhà thi đấu từ Trung tâm Hội nghị San Jose trong một ngày xuân rực rỡ.

Mang đến một bản nâng cấp lớn cho hạ tầng AI của thế giới, Huang đã giới thiệu nền tảng NVIDIA Blackwell để giải phóng GenAI thời gian thực trên các mô hình ngôn ngữ lớn nghìn tỷ tham số.

Huang đã giới thiệu NVIDIA NIM – một tham chiếu đến các microservice suy luận của NVIDIA – một cách đóng gói và phân phối phần mềm mới giúp kết nối các nhà phát triển với hàng trăm triệu GPU để triển khai mọi loại AI tùy chỉnh.

Và đưa AI vào thế giới thực, Huang đã giới thiệu Omniverse Cloud APIs để mang lại những khả năng mô phỏng nâng cao.

Huang nhấn mạnh những thông báo quan trọng này với những bản demo mạnh mẽ, quan hệ đối tác với một số doanh nghiệp lớn nhất thế giới và hơn một loạt thông báo nêu chi tiết tầm nhìn của ông.

GTC – trong 15 năm đã phát triển từ giới hạn của một phòng khiêu vũ khách sạn địa phương thành hội nghị AI quan trọng nhất thế giới – đang quay trở lại theo cách trực tiếp lần đầu tiên sau 5 năm.

Năm nay có hơn 900 phiên – bao gồm một cuộc thảo luận nhóm về Transformer do Huang điều hành với 8 người tiên phong đầu tiên phát triển công nghệ này, hơn 300 cuộc triển lãm và hơn 20 hội thảo kỹ thuật.

Đó là một sự kiện giao thoa giữa AI và mọi thứ. Trong phần mở đầu ấn tượng của bài phát biểu chính, Refik Anadol, nghệ sĩ AI hàng đầu thế giới, đã trình diễn một tác phẩm điêu khắc dữ liệu AI thời gian thực khổng lồ với các vòng xoáy giống như sóng có màu xanh lục, xanh lam, vàng, đỏ, kiểu đổ vỡ, xoắn và tách ra trên màn hình.

Khi bắt đầu bài phát biểu của mình, Huang giải thích rằng sự nổi lên của AI đa phương thức – có thể xử lý các loại dữ liệu đa dạng đảm nhiệm bởi các mô hình khác nhau – mang lại cho AI khả năng thích ứng và sức mạnh cao hơn. Bằng cách tăng các tham số, các mô hình này có thể xử lý các phân tích phức tạp hơn.

Nhưng điều này cũng có nghĩa là nhu cầu về sức mạnh điện toán sẽ tăng lên đáng kể. Và khi các hệ thống cộng tác, đa phương thức này trở nên phức tạp hơn – với hàng nghìn tỷ tham số – thì nhu cầu về cơ sở hạ tầng điện toán tiên tiến sẽ tăng lên.

Huang nói: “Chúng ta cần những mô hình lớn hơn nữa. Chúng ta sẽ đào tạo nó bằng dữ liệu đa phương thức, không chỉ văn bản trên internet, chúng ta sẽ đào tạo nó trên văn bản và hình ảnh, đồ thị và biểu đồ”.

Thế hệ tiếp theo của Điện toán tăng tốc

Tóm lại, Huang nói “Chúng ta cần những GPU lớn hơn”. Nền tảng Blackwell được xây dựng để đáp ứng thách thức này. Huang rút một con chip Blackwell ra khỏi túi và đặt nó cạnh một con chip Hopper, khiến nó trở nên nhỏ bé hơn.

Được đặt tên theo David Harold Blackwell – một nhà toán học tại Đại học California, Berkeley chuyên về lý thuyết trò chơi và thống kê, đồng thời là học giả da màu đầu tiên được giới thiệu vào Viện Hàn lâm Khoa học Quốc gia – kiến ​​trúc mới kế thừa kiến ​​trúc NVIDIA Hopper, ra mắt hai năm trước.

Blackwell mang lại hiệu suất gấp 2,5 lần so với thế hệ tiền nhiệm trong FP8 cho training, trên mỗi chip và 5 lần với FP4 cho suy luận. Với NVLink interconnect thế hệ thứ năm nhanh gấp đôi Hopper và có khả năng mở rộng lên tới 576 GPU.

Và siêu chip NVIDIA GB200 Grace Blackwell kết nối hai Blackwell NVIDIA B200 Tensor Core GPU với NVIDIA Grace CPU qua kết nối chip-to-chip NVLink công suất cực thấp 900GB/s.

Huang giơ một bo mạch hệ thống lên và nói: “Chiếc máy tính này là chiếc máy tính đầu tiên có khả năng tính toán lớn như vậy trong một không gian nhỏ như thế này”. “Vì đây là memory corehent nên cảm giác như là một gia đình lớn hạnh phúc cùng nhau làm việc trên một ứng dụng.”

Để có hiệu suất AI cao nhất, các hệ thống hỗ trợ GB200 có thể được kết nối với các nền tảng NVIDIA Quantum-X800 InfiniBand và Spectrum-X800 Ethernet, cung cấp kết nối mạng tiên tiến với tốc độ lên tới 800Gb/s.

Huang cho biết: “Lượng năng lượng, băng thông mạng, thời gian lãng phí mà chúng ta tiết kiệm được sẽ rất lớn”. “Tương lai có tính sáng tạo… đó là lý do tại sao đây là một ngành hoàn toàn mới. Cách chúng ta tính toán về cơ bản là khác nhau. Chúng tôi đã tạo ra bộ vi xử lý cho kỷ nguyên AI tạo sinh.”

Để mở rộng quy mô Blackwell, NVIDIA đã chế tạo một con chip mới có tên NVLink Switch. Mỗi cái có thể kết nối 4 NVLink interconnect với tốc độ 1,8TB mỗi giây và loại bỏ lưu lượng truy cập bằng thực hiện in-network reduction.

NVIDIA Switch và GB200 là những thành phần chính của cái mà Huang mô tả là “một GPU khổng lồ”, NVIDIA GB200 NVL72, một hệ thống lớn, làm mát bằng chất lỏng, nhiều node, khai thác Blackwell để cung cấp khả năng tính toán siêu mạnh mẽ cho các mô hình nghìn tỷ tham số, với hiệu suất đào tạo AI là 720 petaflops và hiệu suất suy luận AI là 1,4 exaflops trong một rack đơn lẻ.

Huang nói về chiếc máy có thể đóng gói 600.000 bộ phận và nặng 3.000 pound: “Chỉ có một vài, hoặc có thể là ba chiếc máy exaflop trên hành tinh này”. “Và đây là một hệ thống AI exaflop trong một rack duy nhất. Chúng ta hãy nhìn vào mặt sau của nó.”

Thậm chí còn lớn hơn nữa, NVIDIA hôm nay cũng đã công bố siêu máy tính AI thế hệ tiếp theo của mình – NVIDIA DGX SuperPOD được hỗ trợ bởi NVIDIA GB200 Grace Blackwell Superchips – để xử lý các mô hình nghìn tỷ tham số với thời gian hoạt động liên tục cho khối lượng công việc suy luận và đào tạo AI tạo sinh siêu quy mô.

Với kiến ​​trúc rack mới, hiệu quả cao, làm mát bằng chất lỏng, DGX SuperPOD mới được xây dựng với các hệ thống NVIDIA DGX GB200 và cung cấp 11,5 exaflops của siêu máy tính AI ở độ chính xác FP4 và bộ nhớ nhanh 240TB – mở rộng lên nhiều hơn với tủ rack bổ sung.

Huang nói: “Trong tương lai, các trung tâm dữ liệu sẽ được coi… là những nhà máy AI”. “Mục tiêu trong cuộc sống của họ là tạo ra doanh thu, trong trường hợp này là trí thông minh.”

Ngành công nghiệp này đã đón nhận Blackwell.

Thông cáo báo chí công bố Blackwell bao gồm sự chứng thực từ Alphabet và Google CEO Sundar Pichai, Amazon CEO Andy Jassy, Dell CEO Michael Dell, Google DeepMind CEO Demis Hassabis, Meta CEO Mark Zuckerberg, Microsoft CEO Satya Nadella, OpenAI CEO Sam Altman, Chủ tịch Oracle Larry Ellison, Tesla và xAI CEO Elon Musk.

Blackwell đang được mọi nhà cung cấp dịch vụ đám mây lớn trên toàn cầu, các công ty AI tiên phong, nhà cung cấp hệ thống và máy chủ cũng như các nhà cung cấp dịch vụ đám mây và công ty viễn thông khu vực trên toàn thế giới áp dụng.

“Toàn bộ ngành công nghiệp đang chuẩn bị cho Blackwell,” Huang cho biết đây sẽ là lần ra mắt thành công nhất trong lịch sử công ty.

Một cách mới để tạo phần mềm

Generative AI thay đổi cách ứng dụng được viết.

Ông giải thích, thay vì viết phần mềm, các công ty sẽ lắp ráp các mô hình AI, giao cho chúng nhiệm vụ, đưa ra ví dụ về sản phẩm công việc, xem xét kế hoạch và kết quả trung gian.

Huang giải thích rằng các gói này – NVIDIA NIM – được xây dựng từ các thư viện điện toán tăng tốc và mô hình GenAI của NVIDIA.

“Làm thế nào để chúng ta xây dựng phần mềm trong tương lai? Không chắc là bạn sẽ viết nó từ đầu hoặc viết cả đống mã Python hay bất cứ thứ gì tương tự”. Huang nói. “Rất có thể bạn đang tập hợp một nhóm AI.”

Các microservice hỗ trợ API tiêu chuẩn ngành để dễ dàng kết nối, hoạt động trên cơ sở cài đặt CUDA lớn của NVIDIA, được tối ưu hóa lại cho GPU mới và được quét liên tục để tìm các lỗ hổng bảo mật và nguy cơ lộ diện.

Huang cho biết khách hàng có thể sử dụng các microservice NIM có sẵn hoặc NVIDIA có thể giúp xây dựng AI và copilot độc quyền, dạy một mô hình các kỹ năng chuyên biệt mà chỉ một công ty cụ thể mới biết để tạo ra các dịch vụ mới vô giá.

Huang nói: “Ngành IT doanh nghiệp đang ngồi trên một mỏ vàng. Họ có tất cả những công cụ (và dữ liệu) tuyệt vời đã được tạo ra trong nhiều năm. Nếu họ có thể lấy mỏ vàng đó và biến nó thành copilot, thì những copilot này có thể giúp họ làm mọi việc.”

Những người chơi công nghệ lớn đã đưa nó vào hoạt động. Huang trình bày chi tiết cách NVIDIA đã giúp Cohesity, NetApp, SAP, ServiceNow và Snowflake xây dựng các copilot và trợ lý ảo. Và các ngành công nghiệp cũng đang bước vào.

Trong lĩnh vực viễn thông, Huang đã giới thiệu NVIDIA 6G Research Cloud, một nền tảng được hỗ trợ bởi GenAI và Omniverse để thúc đẩy kỷ nguyên truyền thông tiếp theo. Nó được xây dựng với framework vô tuyến thần kinh Sionna của NVIDIA, mạng truy cập vô tuyến được tăng tốc CUDA của NVIDIA Aerial và NVIDIA Aerial Omniverse Digital Twin cho 6G.

Trong lĩnh vực thiết kế và sản xuất chất bán dẫn, Huang tuyên bố rằng, với sự hợp tác của TSMC và Synopsys, NVIDIA đang đưa nền tảng in thạch bản tính toán mang tính đột phá của mình, cuLitho, vào sản xuất. Nền tảng này sẽ tăng tốc khối lượng công việc đòi hỏi nhiều tính toán nhất trong sản xuất chất bán dẫn lên 40-60 lần.

Huang cũng đã giới thiệu NVIDIA Earth Climate Digital Twin. Nền tảng đám mây hiện đã có sẵn, cho phép mô phỏng tương tác, độ phân giải cao để tăng tốc dự báo khí hậu và thời tiết.

Huang cho biết, tác động lớn nhất của AI sẽ là trong lĩnh vực chăm sóc sức khỏe, đồng thời giải thích rằng NVIDIA đã có mặt trong các hệ thống hình ảnh, trong các công cụ giải trình tự gen và hợp tác với các công ty robot phẫu thuật hàng đầu.

NVIDIA đang tung ra một loại phần mềm sinh học mới. NVIDIA hôm nay đã ra mắt hơn 20 microservices mới cho phép các doanh nghiệp chăm sóc sức khỏe trên toàn thế giới tận dụng những tiến bộ mới nhất trong GenAI từ mọi nơi và trên bất kỳ cloud nào. Họ cung cấp hình ảnh tiên tiến, ngôn ngữ tự nhiên và nhận dạng giọng nói cũng như tạo, dự đoán và mô phỏng sinh học kỹ thuật số.

Omniverse mang AI đến với thế giới vật chất

Huang cho biết làn sóng AI tiếp theo sẽ là AI học hỏi về thế giới vật chất.

Ông nói: “Chúng ta cần một công cụ mô phỏng đại diện thế giới kỹ thuật số cho robot để robot có một ‘phòng gym’ để học cách trở thành robot. Chúng ta gọi thế giới ảo đó là Omniverse.”

Đó là lý do hôm nay NVIDIA thông báo rằng NVIDIA Omniverse Cloud sẽ có sẵn dưới dạng API, mở rộng phạm vi tiếp cận của nền tảng hàng đầu thế giới để tạo các ứng dụng digital twin công nghiệp và quy trình làm việc trên toàn bộ hệ sinh thái của các nhà sản xuất phần mềm.

5 giao diện lập trình ứng dụng Omniverse Cloud mới cho phép các nhà phát triển dễ dàng tích hợp trực tiếp các công nghệ Omniverse cốt lõi vào các ứng dụng phần mềm tự động hóa và thiết kế hiện có dành cho các digital twin hoặc quy trình mô phỏng của họ để thử nghiệm và xác thực các máy tự động như robot hoặc xe tự lái.

Để cho thấy cách thức hoạt động của tính năng này, Huang đã chia sẻ bản demo của một nhà kho rô-bốt – sử dụng nhận thức và theo dõi nhiều camera – giám sát công nhân và điều phối các xe nâng rô-bốt đang lái tự động với toàn bộ stack rô-bốt đang chạy.

Huang cũng thông báo rằng NVIDIA sẽ đưa Omniverse lên Apple Vision Pro, với các Omniverse Cloud API mới cho phép các nhà phát triển truyền những digital twin công nghiệp tương tác vào các VR headset.

Một số nhà sản xuất phần mềm công nghiệp lớn nhất thế giới đang áp dụng Omniverse Cloud APIs, bao gồm Ansys, Cadence, Dassault Systèmes cho thương hiệu 3DEXCITE, Hexagon, Microsoft, Rockwell Automation, Siemens và Trimble.

Robotics

Huang cho biết mọi thứ chuyển động sẽ là robot. Ngành công nghiệp ô tô sẽ là một phần quan trọng trong đó. Các máy tính NVIDIA đã có mặt trên ô tô, xe tải, robot giao hàng và robotaxis.

Huang thông báo rằng BYD, công ty xe tự hành lớn nhất thế giới, đã chọn máy tính thế hệ tiếp theo của NVIDIA cho AV của mình, xây dựng đội xe điện thế hệ tiếp theo trên DRIVE Thor.

Để giúp robot nhìn rõ hơn về môi trường của chúng, Huang cũng đã công bố bộ công cụ phát triển phần mềm Isaac Perceptor với phép đo hình ảnh đa camera hiện đại, tái tạo 3D và occupancy map cũng như nhận biết chiều sâu.

Và để giúp các bộ điều khiển hoặc cánh tay robot có khả năng thích ứng cao hơn, NVIDIA đang công bố Isaac Manipulator – một thư viện nhận thức, lập kế hoạch đường đi và điều khiển động học tiên tiến nhất của cánh tay robot.

Cuối cùng, Huang đã giới thiệu Dự án GR00T, một mô hình nền tảng đa năng dành cho robot hình người, được thiết kế để tiếp tục công việc của công ty nhằm thúc đẩy những đột phá trong chế tạo robot và AI.

Để ủng hộ nỗ lực đó, Huang đã tiết lộ một máy tính mới, Jetson Thor, dành cho robot hình người dựa trên hệ thống trên chip NVIDIA Thor và những nâng cấp đáng kể cho nền tảng robot NVIDIA Isaac.

Trong những phút kết thúc, Huang đã mang lên sân khấu một cặp robot nhỏ bé được hỗ trợ bởi NVIDIA của Disney Research.

“Linh hồn của NVIDIA – sự giao thoa giữa đồ họa máy tính, vật lý và Trí tuệ nhân tạo,” ông nói. “Tất cả đã xảy ra vào thời điểm này.”

Theo NVIDIA

____
Bài viết liên quan
Góp ý / Liên hệ tác giả