AI và Network: Hai mặt của đồng xu định hình hạ tầng tương lai

Trong thế giới công nghệ, AI và hệ thống mạng (network) giống như hai mặt của một đồng xu: không thể tách rời và cùng nhau định hình nên tương lai của hạ tầng số. AI đang được dùng để tự động hóa và tối ưu hóa hệ thống mạng, nhưng ngược lại, chính sự bùng nổ của AI cũng đang đặt ra những yêu cầu chưa từng có lên chính hạ tầng mạng đó.

Hãy cùng phân tích mối quan hệ cộng sinh phức tạp này.

1. AI for Networking (AI phục vụ cho Network): Kỷ nguyên của công nghệ mạng tự hành

Khó có thể tưởng tượng một hệ thống mạng hiện đại nào – từ mạng LAN văn phòng đến hạ tầng viễn thông toàn cầu – lại không thể được cải thiện bởi AI. Mục tiêu rất rõ ràng, như lời của CTO Mark Düsener từ nhà mạng Swisscom: “Mục tiêu của việc bước vào thế giới AI tạo tác (agentic AI) là để giảm thiểu tác động khi thay đổi dịch vụ, giảm rủi ro gián đoạn và chi phí, từ đó nâng cao trải nghiệm khách hàng.”

Nói cách khác, “AI for Networking” tập trung vào việc ứng dụng AI để biến các hạ tầng tĩnh thành những hệ sinh thái thông minh, có khả năng tự thích ứng.

  • Tự động hóa và Tự phục hồi: Hon Kit Lam, Phó chủ tịch tại Tata Communications, tin rằng AI đang viết lại luật chơi, giúp chuyển từ thế bị động ‘chữa cháy’ sang chủ động ‘tự phục hồi’. Các thuật toán có thể tự động cô lập nguyên nhân gốc rễ và đưa ra biện pháp khắc phục mà không cần sự can thiệp của con người.
  • Nâng cấp SD-WAN: Stephen Dodge từ Bistech nhận định rằng mạng diện rộng định nghĩa bằng phần mềm (SD-WAN) là một mảnh đất màu mỡ cho AI. “Kiến trúc quản lý trên cloud của SD-WAN là nền tảng hoàn hảo để tích hợp AI. Chúng ta sẽ thấy AI giúp đơn giản hóa cấu hình, tự động thích ứng với hành vi người dùng và các luồng traffic bất thường, đồng thời tăng cường khả năng quan sát và bảo mật.”
  • Dân chủ hóa công nghệ: AI giúp các doanh nghiệp vừa và nhỏ (SMB) tiếp cận công nghệ mạng ở cấp độ doanh nghiệp lớn, cho phép họ tập trung vào tăng trưởng thay vì vật lộn với các hạ tầng IT phức tạp.

2. Networking for AI (Mạng phục vụ cho AI): Thách thức khổng lồ từ những “cỗ máy” học

Nếu “AI for Network” là một câu chuyện màu hồng thì “Network for AI” lại là một bài toán hóc búa. Jensen Huang, CEO của Nvidia, đã tuyên bố rằng chúng ta đang ở trong kỷ nguyên AI tạo sinh (GenAI) và mọi công ty đều sẽ trở thành một “nhà sản xuất trí tuệ” (intelligence manufacturer). Nhưng để sản xuất được trí tuệ đó, chúng ta cần một “nhà máy” đủ vững chắc, và nhà máy đó chính là hạ tầng mạng.

David Hughes, Giám đốc sản phẩm của HPE Aruba Networking, đã chỉ ra sự khác biệt tinh tế nhưng cơ bản:

  • AI cho Mạng (AI for Networking): Làm thế nào để dùng AI biến các quản trị viên IT thành “siêu quản trị viên”, giúp họ xử lý khối lượng công việc ngày càng tăng.
  • Mạng cho AI (Networking for AI): Làm thế nào để xây dựng hạ tầng mạng đủ mạnh, đặc biệt là các hệ thống switch kết nối các cụm GPU (Graphics Processing Unit), và xử lý lượng dữ liệu đo lường (telemetry) khổng lồ mà các mô hình AI tạo ra.

Thực tế là các doanh nghiệp đang phải vật lộn với câu hỏi: làm thế nào để quản lý việc băng thông và dung lượng mạng tăng đột biến khi AI tạo ra văn bản, hình ảnh và video?

Bastien Aerni từ GTT cho biết: “Để đạt được ROI từ các sáng kiến AI, doanh nghiệp phải xử lý lượng dữ liệu khổng lồ một cách nhanh chóng. Kiến trúc mạng của họ phải được cấu hình để hỗ trợ loại workload này, đòi hỏi độ trễ thấp, băng thông cao và kết nối trực tiếp trên nền tảng IP Tier 1.”

3. Thách thức thực tiễn: Khi “Chậm cũng là Sập” (Slow is the new down)

Cuối năm 2023, nhà mạng BT (Anh) tiết lộ hệ thống mạng của họ đã chịu áp lực cực lớn sau khi 6 trận bóng đá Ngoại hạng Anh được phát sóng trực tuyến cùng lúc với các bản cập nhật game bom tấn. AI hứa hẹn sẽ làm “cơn đau đầu” này trở nên tồi tệ hơn.

Colin Bannon, CTO của BT Business, nhấn mạnh: “Trong thế giới AI, ‘chậm cũng là sập’.” Mạng không chỉ cần nhanh, mà còn phải cực kỳ linh hoạt và có khả năng lập trình (programmable).

Những thách thức chính mà hệ thống mạng phải đối mặt khi phục vụ AI:

  1. Yêu cầu khi Huấn luyện (Training): Việc huấn luyện mô hình AI đòi hỏi di chuyển các bộ dữ liệu khổng lồ, tạo ra các luồng dữ liệu “khổng lồ và liên tục” (elephant flows) kéo dài nhiều ngày. Bất kỳ sự thiếu nhất quán nào của mạng cũng có thể ảnh hưởng đến độ chính xác và thời gian huấn luyện.
  2. Yêu cầu khi Suy luận (Inference): Các tác vụ suy luận đòi hỏi độ trễ cực thấp. Độ trễ ở “đuôi” (tail latency) – sự chậm trễ của một vài gói tin – có thể ảnh hưởng đáng kể đến thời gian hoàn thành công việc chung.
  3. Quản lý tắc nghẽn: Mạng cần có khả năng quản lý tắc nghẽn mạnh mẽ để phát hiện các điểm nóng tiềm tàng và phân phối lại lưu lượng truy cập một cách thông minh.

Nghiên cứu của Expereo năm 2025 cho thấy một thực tế đáng lo ngại: 49% các tổ chức tại Anh báo cáo rằng hiệu suất mạng đang cản trở hoặc hạn chế khả năng hỗ trợ các dự án AI và dữ liệu lớn.

4. Hướng đi cho tương lai: Từ Cloud về Edge, từ LLM đến SLM

Để giải quyết các thách thức này, ngành công nghiệp đang hướng tới hai xu hướng chính:

  • Đẩy AI về vùng biên (Edge Computing): Thay vì gửi mọi thứ lên cloud, chúng ta sẽ xử lý AI ngay tại biên mạng. “Chúng tôi đang thấy và kỳ vọng nhiều hơn về việc tính toán AI diễn ra tại vùng biên để loại bỏ khoảng cách giữa câu lệnh (prompt) và quá trình xử lý,” Bastien Aerni (GTT) cho biết.
  • Tập trung vào các mô hình nhỏ hơn (SLM): Thay vì các mô hình ngôn ngữ lớn (LLM) đa năng, các doanh nghiệp đang phát triển các mô hình ngôn ngữ nhỏ (SLM) chuyên biệt cho từng ngành. NTT Data đã tạo ra Tsuzumi, một mô hình siêu nhẹ được thiết kế để hỗ trợ các trường hợp sử dụng tại biên, giải quyết các lo ngại về việc làm quá tải mạng, quyền riêng tư và tính bền vững.

Lời kết

Mối quan hệ giữa AI và Network đang ở một thời điểm then chốt. Stephen Dodge (Bistech) đã cảnh báo: “Ngành công nghiệp đang vội vã tung ra các giải pháp ‘sẵn sàng cho AI’, nhưng sự thật là hầu hết các hệ thống mạng vẫn chưa sẵn sàng.”

Trước khi lao vào cuộc đua AI, các doanh nghiệp cần đảm bảo nền tảng của mình đủ vững chắc. Tốc độ, Bảo mật và Sự đơn giản là ba yêu cầu cốt lõi của mạng máy tính trong kỷ nguyên AI. Việc đầu tư hiện đại hóa mạng ngay từ bây giờ sẽ quyết định doanh nghiệp nào có thể khai thác hết tiềm năng của AI trong những năm tới.

Bởi vì, chỉ đơn giản là “bật một hệ thống AI lên” và tin rằng câu trả lời sẽ tự xuất hiện là chưa đủ. Rất có thể, mạng máy tính của bạn sẽ cho bạn một câu trả lời hoàn toàn khác.

 

____
Bài viết liên quan
Góp ý / Liên hệ tác giả