Môi trường CNTT phân tán ngày càng yêu cầu hệ thống mạng tự vận hành và AIOps có thể mang đến câu trả lời cho các team vận hành mạng để giải quyết sự phức tạp ngày càng gia tăng, ngay từ bây giờ.
Môi trường CNTT hiện đại bị phân tán, với các ứng dụng được triển khai trên các trung tâm dữ liệu riêng, trên nhiều dịch vụ đám mây và các vị trí tại biên. Đồng thời, các hình thức kết hợp (hybrid) cũng đã xuất hiện, với phần lớn nhân viên truy cập các ứng dụng đó từ sự kết hợp của các địa điểm công ty, văn phòng tại nhà và trong khi đi du lịch. Do các ứng dụng và người dùng được triển khai trong môi trường phân tán cao, hệ thống mạng đã trở thành một phần không thể thiếu để đảm bảo các trải nghiệm tốt nhất.
Tuy nhiên, tính chất phân tán cao và thiếu khả năng kiểm soát trong các mạng kiểu end-to-end dẫn đến sự phức tạp đáng kể cản trở hoạt động, ảnh hưởng đến hiệu suất và mang lại trải nghiệm kém hơn đáng kể. Trên thực tế, phần lớn những người được hỏi (54%), theo khảo sát của Enterprise Strategy Group (ESG) năm 2021 “Hiện đại hóa mạng trong môi trường phân tán cao”, cho biết mạng của họ “phức tạp hơn” hoặc “phức tạp hơn đáng kể” so với hai năm trước.
Phần lớn các doanh nghiệp nhận thấy hệ thống mạng trở nên phức tạp hơn hai năm về trước.
Thực tế rõ ràng là các môi trường mạng này đang nhanh chóng trở nên quá phức tạp để quản lý thông qua các phương pháp thủ công cũ. Đồng thời, các công ty cần duy trì tính cạnh tranh trong nền kinh tế số luôn hoạt động cần đảm bảo mạng luôn sẵn sàng và được tối ưu hóa hoàn toàn. Điều này sẽ yêu cầu các bộ phận vận hành mạng cần giảm thiểu thời gian phản hồi để tìm hiểu và khắc phục sự cố.
Kết hợp những vấn đề này lại thì thực tế là thiết bị mạng hiện đại đang sinh ra nhiều thông tin hơn bao giờ hết. Nhưng cố gắng thu thập tất cả dữ liệu đó, sau đó tìm mối tương quan và giải thích nó trong một hệ thống mạng quy mô lớn, là một nhiệm vụ nặng nề vượt quá khả năng của con người. Ngoài ra, sự đổi mới trong công nghệ mạng đang diễn ra với tốc độ nhanh hơn bao giờ hết (đặc biệt là đối với các sản phẩm dựa trên đám mây). Rất khó để các nhân viên hiện tại cập nhật thông tin và thậm chí còn khó hơn để tìm được nhân viên mới với bộ kỹ năng phù hợp. Điều này không có nghĩa là các chuyên viên mạng có kinh nghiệm không thể làm được, nhưng nó đòi hỏi những hoạt động IT mang tính cống hiến của từng cá nhân, và sau đó tất cả kiến thức (của doanh nghiệp) đó sẽ bị mất khi nhân viên lành nghề rời công ty. Vì vậy, ngay cả khi ngân sách có sẵn để làm điều đó, thì việc bổ sung thêm nhiều nguồn lực lành nghề hơn chỉ để bắt kịp với công nghệ và duy trì trạng thái hoạt động của mạng không phải là một phương án bền vững.
Đến với giải pháp AIOps cho vận hành hệ thống mạng
Các doanh nghiệp, tổ chức cần tận dụng công nghệ để hoạt động hiệu quả hơn và tăng cường tài nguyên mạng hiện có. Đây là lúc công nghệ AI/ML hoặc AIOps ra đời để giúp tự động hóa việc phát hiện, xác định sự cố và – trong một số trường hợp – khắc phục chúng. Tuy nhiên, để công nghệ này có hiệu quả, nó cần học hỏi từ dữ liệu – rất nhiều dữ liệu. Để làm điều này, các nhà cung cấp mạng cần có khả năng thu thập tất cả dữ liệu mạng có sẵn, không chỉ từ mạng duy nhất của bạn mà còn từ tất cả các mạng của khách hàng của họ (tất nhiên là theo cách an toàn, ẩn danh), để họ có thể thu thập kiến thức chung từ tất cả các môi trường mạng mà chúng hỗ trợ và sử dụng nó để xây dựng các thuật toán và mô hình sẽ giúp ích cho mọi khách hàng.
Một trong những bước quan trọng để kích hoạt các kho lưu trữ thông tin mạng này là việc áp dụng các sản phẩm quản lý mạng dựa trên đám mây. Bằng cách di chuyển tất cả dữ liệu mạng sang đám mây, một bộ dữ liệu khổng lồ có thể được tận dụng để hiểu càng nhiều tình huống càng tốt và tạo ra các đánh giá thông minh giúp xác định chính xác nguyên nhân gốc rễ của sự cố. Nó thậm chí có thể cung cấp các khuyến nghị để khắc phục chúng. Tin tốt là các nhà cung cấp mạng dựa trên đám mây đã xuất hiện khoảng một thập kỷ trước và hiện tại hầu hết các nhà cung cấp mạng đã triển khai các tùy chọn quản lý dựa trên đám mây bao phủ ngày càng nhiều loại mạng (mạng Wi-Fi, có dây, mạng WAN và trung tâm dữ liệu). Vì vậy, sẽ là hợp lý khi các nhà cung cấp mạng đã hoặc đang tích cực tạo ra một cơ sở dữ liệu khá lớn để làm việc cùng nhau. Bằng cách thu thập dữ liệu trên toàn bộ môi trường mạng đầu cuối, những sản phẩm thông minh này có thể cung cấp thông tin ngữ cảnh và độ chính xác cao.
Mặc dù thuật ngữ AIOps không dành riêng cho lĩnh vực mạng, nhưng nó đang trở thành một công cụ quan trọng để quản lý và tự động hóa các mạng hiện đại hiệu quả hơn. “Khảo sát ý định chi tiêu năm 2022” của ESG nhấn mạnh rằng mục tiêu hàng đầu cho chuyển đổi số các dự án là để thúc đẩy hiệu quả hoạt động nhiều hơn. Các bộ phận vận hành mạng có thể sử dụng các sản phẩm thông minh này để hoạt động hiệu quả hơn – ngay cả khi môi trường mạng trở nên phân tán và phức tạp hơn. Các sản phẩm AIOps, hoặc bất kỳ thuật ngữ nào mà các nhà cung cấp mạng sử dụng để mô tả các sản phẩm AI/ML thông minh của họ, sẽ rất quan trọng đối với các tổ chức để đẩy nhanh việc áp dụng công nghệ mới và đảm bảo môi trường có tính sẵn sàng cao. Công nghệ được triển khai tốt sẽ học hỏi và liên tục cải thiện khi nó tiêu thụ nhiều dữ liệu hơn. Nó cũng sẽ là công cụ cho phép các nhóm vận hành mạng chuyển đổi từ chế độ phản hồi bị động sang trở nên chủ động và dễ dự đoán hơn – thường được gọi là “tự phục hồi” và “tự tối ưu hóa” – để đảm bảo tính khả dụng và hiệu suất được tối ưu hóa. Đây có thể là thời điểm tốt để nói rằng các nhà khai thác mạng sẽ đóng một vai trò quan trọng trong sự phát triển của công nghệ này.
Vì công nghệ đang trong quá trình học hỏi, hoàn thiện – VD, gửi cảnh báo về các sự cố hoặc thậm chí có thể đề xuất các giải pháp – nên bắt buộc phải có một vòng lặp phản hồi để bộ phận vận hành xác thực các cảnh báo hoặc đề xuất, hoặc nếu không đúng thì phản hồi bằng nguyên nhân gốc rễ chính xác hoặc khuyến nghị thích hợp. Bởi vì công nghệ luôn phát triển, bộ phận vận hành mạng sẽ luôn cần thiết để hỗ trợ phát triển trí thông minh mạng này.
Bài học quan trọng đối với các nhóm vận hành mạng là mặc dù “trí thông minh mạng” (network intelligence) này vẫn còn tương đối mới, nhưng nó đang tăng tốc. Các tổ chức cần nắm bắt những công nghệ này và hợp tác làm việc với các nhà cung cấp mạng của họ để đảm bảo tính chính xác và mang lại giá trị hữu ích, để các bộ phận vận hành có thể tập trung vào việc triển khai thế hệ thiết bị mạng tiếp theo mà không phải chịu quá nhiều gánh nặng khi cố gắng duy trì thế hệ trước. Ngoài việc khắc phục sự cố và tối ưu hóa, các công nghệ này cũng sẽ giúp nhận dạng tài sản, quản lý vòng đời và thậm chí có khả năng cung cấp điểm benchmark để so với các môi trường truyền thống có quy mô tương tự.
Điểm mấu chốt là, nếu bạn chưa bắt đầu làm việc với sản phẩm AIOps hoặc AI/ML thông minh, thì bây giờ là lúc để bắt đầu, để bạn và doanh nghiệp của bạn không bị tụt lại phía sau – Bob Laliberte, nhà phân tích tại ESG
Các bước triển khai AIOps dành cho bộ phận vận hành mạng
Giống như bất kỳ công nghệ mới nào được triển khai trong môi trường doanh nghiệp, các bộ phận vận hành sẽ cần thời gian để làm quen với nó. Các nhóm cần thời gian để xác thực rằng những gì sản phẩm đang báo cáo là chính xác và tin tưởng vào kết quả mà sản phẩm tạo ra. Vì sẽ mất thời gian nên các công ty nên bắt đầu làm việc với nó ngay bây giờ và thực hiện các bước sau:
- Các nhóm vận hành mạng nên bắt đầu bằng cách tận dụng chức năng cảnh báo và cung cấp phản hồi.
- Sau khi cảm thấy quen với chúng, hãy bật công cụ đề xuất để xem liệu nó có tăng tốc khắc phục sự cố hay không.
- Khi bạn đã cảm thấy quen với một số đề xuất nhất định, có lẽ đã đến lúc tự động hóa chức năng khắc phục nếu có thể.
- Một tính năng quan trọng nên có trong tất cả các sản phẩm AIOps là vòng lặp phản hồi – thứ để cho bạn biết rằng sự kiện “x” đã xảy ra và phần mềm đã áp dụng bản sửa lỗi “y”, sau đó xác thực rằng mạng đã hoạt động trở lại bình thường. Bằng cách gửi cho bạn một cảnh báo ghi lại tất cả những điều này, tính năng này sẽ cho phép ngay cả những nhóm vận hành mạng bảo thủ nhất cũng trở nên thoải mái hơn với việc sử dụng AIOps.
Bản nghiên cứu “Hiện đại hóa mạng trong môi trường phân tán cao” của ESG chỉ ra rằng phần lớn các tổ chức (59%) hiện đang tận dụng các công cụ đề xuất, nhưng việc sử dụng tự động hóa hoàn toàn vẫn còn hạn chế ở khoảng 1/5 số người trả lời khảo sát (21%).
Các tổ chức đang sử dụng các công cụ đề xuất nhưng khả năng tự động hóa hoàn toàn còn hạn chế.
Tin tốt là những sản phẩm này đang trở nên phổ biến hơn trong không gian mạng, với hầu hết các nhà cung cấp đang cung cấp một số mức độ thông minh cho ít nhất một phần của mạng. Lý tưởng nhất là các AIOps hoặc hệ thống thông minh này sẽ bao phủ toàn bộ môi trường mạng đầu cuối để hiểu đầy đủ về môi trường hoàn chỉnh và cung cấp bối cảnh, nhưng ngay cả việc triển khai một sản phẩm chỉ trong một khu vực mạng cũng có thể mang lại lợi thế đáng kể cho một tổ chức.
Hầu như tất cả các nhà cung cấp mạng mà tôi đã nói chuyện hiện đều có AI/ML, AIOps hoặc sản phẩm thông minh ở một mức độ trưởng thành nào đó. Một số nhà cung cấp đó bao gồm Arista, Aruba, Cisco, Extreme, IBM, Juniper và VMware. Điểm mấu chốt là, nếu bạn chưa bắt đầu làm việc với sản phẩm AIOps hoặc AI/ML thông minh, thì bây giờ là lúc để bắt đầu, để bạn và doanh nghiệp của bạn không bị tụt lại phía sau.
Bài viết liên quan
- Nvidia ‘đang chuẩn bị cho thời kỳ AI không dùng GPU’
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- LLM: Lịch sử và tương lai của các mô hình ngôn ngữ lớn
- Máy chủ Supermicro X14: Hiệu suất mạnh mẽ, hiệu quả tối đa cho AI, Cloud, Storage, 5G/Edge