Các AI Agent (nhân viên AI) được cho là sẽ là “điều lớn lao tiếp theo” trong AI, nhưng hiện vẫn chưa có định nghĩa chính xác về chúng. Cho đến thời điểm này, mọi người vẫn chưa thể thống nhất về những gì cấu thành nên một nhân viên AI.
Nói một cách đơn giản nhất, một nhân viên AI được mô tả là phần mềm chạy bằng AI thực hiện một loạt công việc cho bạn mà một nhân viên dịch vụ khách hàng, nhân viên HR hoặc nhân viên bộ phận trợ giúp CNTT có thể đã làm trong quá khứ, mặc dù cuối cùng nó có thể liên quan đến bất kỳ công việc nào trong doanh nghiệp. Bạn yêu cầu nó làm các việc, và nó thực hiện chúng cho bạn, có thể đi qua nhiều hệ thống và vượt xa việc chỉ trả lời các câu hỏi. Ví dụ, tháng trước, Perplexity đã phát hành một nhân viên AI giúp mọi người mua sắm trong kỳ nghỉ. Và tuần trước, Google đã công bố nhân viên AI đầu tiên của mình, có tên là Project Mariner, có thể được sử dụng để tìm chuyến bay và khách sạn, mua sắm đồ gia dụng, tìm công thức nấu ăn và các nhiệm vụ khác.
Nghe thì rất đơn giản, nhưng nó lại phức tạp vì thiếu sự rõ ràng. Ngay cả giữa những gã khổng lồ công nghệ, cũng không có sự đồng thuận. Google coi chúng là các trợ lý dựa trên nhiệm vụ tùy thuộc vào công việc: trợ giúp viết mã cho các developer; giúp các nhà tiếp thị tạo ra một bảng màu; hỗ trợ một chuyên gia CNTT theo dõi sự cố bằng cách truy vấn dữ liệu nhật ký.
Đối với Asana, một agent có thể hoạt động như một nhân viên phụ, đảm nhiệm các nhiệm vụ được giao như bất kỳ đồng nghiệp giỏi giang nào. Sierra, một công ty khởi nghiệp do cựu đồng giám đốc điều hành Salesforce Bret Taylor và cựu nhân viên Google Clay Bavor sáng lập, coi các agent là công cụ trải nghiệm khách hàng, giúp mọi người thực hiện các hành động vượt xa các chatbot của ngày xưa để giúp giải quyết các tập hợp vấn đề phức tạp hơn.
Việc thiếu một định nghĩa thống nhất này sẽ gây ra sự nhầm lẫn về chức năng chính xác của những thứ này, nhưng bất kể chúng được định nghĩa như thế nào, các agent đều có tác dụng giúp hoàn thành các nhiệm vụ một cách tự động với càng ít sự tương tác của con người càng tốt.
Rudina Seseri, nhà sáng lập và đối tác quản lý tại Glasswing Ventures, cho biết đây vẫn còn là giai đoạn đầu và điều đó có thể giải thích cho việc thiếu sự đồng thuận. “Không có định nghĩa duy nhất nào cho một ‘nhân viên AI’. Tuy nhiên, quan điểm phổ biến nhất là agent là một hệ thống phần mềm thông minh được thiết kế để nhận thức môi trường của nó, lý luận về nó, đưa ra quyết định và thực hiện hành động để đạt được các mục tiêu cụ thể một cách tự động”, Seseri nói.
Bà cho biết họ sử dụng một số công nghệ AI để thực hiện điều đó. “Những hệ thống này kết hợp nhiều kỹ thuật AI/ML như xử lý ngôn ngữ tự nhiên, học máy và thị giác máy tính để hoạt động trong các miền động, tự động hoặc cùng với các agent khác và người dùng là con người.”
Aaron Levie, đồng sáng lập kiêm giám đốc điều hành tại Box, cho biết theo thời gian, khi AI trở nên có năng lực hơn, các nhân viên AI sẽ có thể làm được nhiều việc hơn thay cho con người và hiện đã có những động lực thúc đẩy sự tiến hóa đó.
Levie đã viết trên LinkedIn gần đây rằng: “Với các nhân viên AI, có nhiều thành phần tạo nên bánh đà tự gia cố sẽ giúp cải thiện đáng kể những gì các nhân viên AI có thể đạt được trong tương lai gần và dài hạn: giá/hiệu suất GPU, hiệu quả mô hình, chất lượng và trí thông minh của mô hình, cải tiến về khuôn khổ AI và hạ tầng ” .
Đó là một quan điểm lạc quan về công nghệ cho rằng sự tăng trưởng sẽ diễn ra ở tất cả các lĩnh vực này, mặc dù điều đó không nhất thiết phải là điều hiển nhiên. Nhà tiên phong về robot của MIT, Rodney Brooks, đã chỉ ra trong một cuộc phỏng vấn gần đây rằng AI phải giải quyết những vấn đề khó khăn hơn nhiều so với hầu hết các công nghệ khác và nó sẽ không nhất thiết phát triển theo cùng một tốc độ như chip theo định luật Moore.
“Khi con người nhìn thấy một hệ thống AI thực hiện một nhiệm vụ, họ ngay lập tức khái quát hóa nó thành những thứ tương tự và ước tính năng lực của hệ thống AI; không chỉ hiệu suất của nó, mà còn là năng lực xung quanh nó,” Brooks nói trong cuộc phỏng vấn đó. “Và họ thường rất lạc quan quá mức, và đó là vì họ sử dụng mô hình về hiệu suất của một người trong một nhiệm vụ.”
Vấn đề là việc giao thoa các hệ thống rất khó khăn và điều này trở nên phức tạp hơn do một số hệ thống cũ thiếu quyền truy cập API cơ bản. Mặc dù chúng ta đang thấy những cải tiến ổn định mà Levie đã ám chỉ, nhưng việc đưa phần mềm vào nhiều hệ thống trong khi giải quyết các vấn đề mà nó có thể gặp phải trong quá trình này có thể trở nên khó khăn hơn nhiều người nghĩ.
Nếu đúng như vậy, mọi người có thể đang đánh giá quá cao những gì các nhân viên AI có thể làm được. David Cushman, một nhà nghiên cứu tại HFS Research, nhìn nhận nhóm bot hiện tại giống với Asana hơn: trợ lý giúp con người hoàn thành một số nhiệm vụ nhất định để đạt được một số mục tiêu chiến lược do người dùng xác định. Thách thức là giúp máy xử lý các tình huống bất ngờ theo cách thực sự tự động, và rõ ràng là chúng ta vẫn chưa đạt đến mức đó.
“Tôi nghĩ đó là bước tiếp theo”, ông nói. “Đó là nơi AI hoạt động độc lập và hiệu quả ở quy mô lớn. Vì vậy, đây là nơi con người đặt ra các hướng dẫn, các rào cản và áp dụng nhiều công nghệ để đưa con người ra khỏi vòng lặp — khi mọi thứ đều nhằm mục đích giữ con người trong vòng lặp với GenAI”, ông nói. Vì vậy, chìa khóa ở đây, ông nói, là để nhân viên AI tiếp quản và áp dụng tự động hóa thực sự.
Jon Turow, đối tác tại Madrona Ventures, cho biết điều này sẽ đòi hỏi phải tạo ra một hạ tầng nhân viên AI, một ngăn xếp công nghệ được thiết kế riêng để tạo ra các agent (bất kể bạn định nghĩa chúng như thế nào). Trong một bài đăng trên blog gần đây, Turow đã phác thảo các ví dụ về các nhân viên AI hiện đang hoạt động trong tự nhiên và cách chúng đang được xây dựng ngày nay.
Theo quan điểm của Turow, sự gia tăng nhanh chóng của các nhân viên AI — và ông cũng thừa nhận rằng định nghĩa này vẫn còn hơi khó nắm bắt — đòi hỏi một bộ công nghệ giống như bất kỳ công nghệ nào khác. “Tất cả những điều này có nghĩa là ngành công nghiệp của chúng tôi phải làm việc để xây dựng hạ tầng hỗ trợ các nhân viên AI và các ứng dụng dựa vào chúng”, ông viết trong bài viết.
“Theo thời gian, lý luận sẽ dần được cải thiện, các mô hình biên giới sẽ điều khiển nhiều quy trình công việc hơn và các nhà phát triển sẽ muốn tập trung vào sản phẩm và dữ liệu — những thứ tạo nên sự khác biệt của họ. Họ muốn nền tảng cơ bản ‘chỉ hoạt động’ với quy mô, hiệu suất và độ tin cậy.”
Một điều khác cần lưu ý ở đây là có lẽ sẽ cần nhiều mô hình, thay vì một LLM duy nhất, để khiến các agent hoạt động, và điều này có ý nghĩa nếu bạn nghĩ về các agent này như một tập hợp các nhiệm vụ khác nhau. “Tôi không nghĩ rằng hiện tại bất kỳ mô hình ngôn ngữ lớn nào, ít nhất là mô hình ngôn ngữ lớn đơn khối có sẵn công khai, có thể xử lý các nhiệm vụ của agent. Tôi không nghĩ rằng chúng có thể thực hiện lý luận nhiều bước thực sự khiến tôi phấn khích về tương lai của agent. Tôi nghĩ rằng chúng ta đang đến gần hơn, nhưng vẫn chưa đạt được điều đó”, Fred Havemeyer, người đứng đầu bộ phận nghiên cứu AI và phần mềm tại Macquarie US Equity Research cho biết.
“Tôi nghĩ rằng các agent hiệu quả nhất có thể sẽ là nhiều bộ sưu tập của nhiều mô hình khác nhau với một lớp định tuyến gửi yêu cầu hoặc nhắc nhở đến agent và mô hình hiệu quả nhất. Và tôi nghĩ rằng nó sẽ giống như một giám sát viên [tự động] thú vị, phân công vai trò.”
Cuối cùng, đối với Havemeyer, ngành công nghiệp này đang hướng tới mục tiêu này là các agent hoạt động độc lập. “Khi tôi nghĩ về tương lai của các agent, tôi muốn thấy và hy vọng thấy các agent thực sự tự chủ và có thể thực hiện các mục tiêu trừu tượng rồi suy luận ra tất cả các bước riêng lẻ ở giữa một cách hoàn toàn độc lập”, ông nói.
Nhưng thực tế là chúng ta vẫn đang trong giai đoạn chuyển tiếp liên quan đến các agent này, và chúng ta không biết khi nào chúng ta sẽ đạt đến trạng thái kết thúc mà Havemeyer mô tả. Mặc dù những gì chúng ta đã thấy cho đến nay rõ ràng là một bước tiến đầy hứa hẹn theo đúng hướng, chúng ta vẫn cần một số tiến bộ và đột phá để các nhân viên AI hoạt động như chúng đang được hình dung ngày nay. Và điều quan trọng là phải hiểu rằng chúng ta vẫn chưa đạt đến đó.
Bài viết liên quan