Hai đối lực chính đang thúc đẩy cuộc cách mạng AI trên toàn thế giới hiện nay: AI tạo sinh (GenAI) – được biết đến với khả năng sáng tạo và AI ứng dụng (Real-world AI) trong thế giới thực – được xây dựng cho các ứng dụng thực tế. AI tạo sinh nắm bắt trí tưởng tượng, trong khi “AI trong thế giới thực” nắm giữ chìa khóa để giải quyết các vấn đề trong thế giới thực và bao gồm mọi thứ, từ tự động hóa nhà máy đến bộ điều khiển nhiệt độ thông minh.
Giống như GenAI, AI trong thế giới thực yêu cầu khối lượng dữ liệu đáng kể để cung cấp thông tin chi tiết về hành vi của hệ thống, mở đường cho các dự đoán chính xác hoặc tự động hóa hiệu quả hơn. Tuy nhiên, không giống như GenAI, các ứng dụng Real-world AI dựa vào lượng lớn dữ liệu trong thế giới thực – thường là theo thời gian thực – để mang lại nhiều lợi ích nhất.
Nói cách khác, chúng dựa vào dữ liệu theo chuỗi thời gian.
Những chiếc xe tự lái của Tesla là một ví dụ về cách mà Real-world AI có thể được đưa vào hoạt động. Hãng đã sử dụng mạng lưới ô tô rộng lớn của mình để cung cấp dữ liệu trực quan cho mô hình đào tạo. Mô hình liên tục học cách phản ứng và giải quyết các vấn đề mới, đồng thời học cách hiểu các mô hình lái xe và luồng giao thông. Khi mô hình học các thông tin mới theo thời gian, nó sẽ được phân phối lại cho những chiếc ô tô thông qua các bản cập nhật cho phần mềm Full Self Driving (FSD) Beta của hãng.
Tesla tuyên bố rằng đội xe FSD Beta đã đi được tổng cộng hơn 500 triệu dặm, tạo ra một lượng dữ liệu khổng lồ và được sử dụng chủ động để tác động đến AI trong các tình huống vật lý thực tế.
Cảm biến của AI
Trục xương sống của AI trong thế giới thực là khả năng “cảm nhận” thế giới xung quanh chúng ta.
Bằng cách thu thập thông tin theo thời gian thực về mọi thứ, từ chất lượng không khí trong không gian xanh của chúng ta đến giao thông trên đường hay mức sử dụng năng lượng của tủ lạnh tại các siêu thị, các cảm biến cung cấp khối lượng lớn dữ liệu theo chuỗi thời gian (time series data) – về cơ bản là tập hợp các quan sát thu được thông qua các phép đo lặp đi lặp lại theo thời gian – đóng vai trò quan trọng trong việc tạo ra các mô hình AI và ML mới nhất.
Và “khối lượng lớn” dữ liệu có thể là một cách đánh giá thấp. Khối lượng các điểm dữ liệu được tạo ra bởi các cảm biến và thiết bị IoT có thể nhanh chóng tăng lên hàng tỷ, với các phép đo chuỗi thời gian ở mỗi phút, giây, mili giây – thậm chí là nano giây. Dữ liệu chuỗi thời gian đóng vai trò là ngôn ngữ chung của các thiết bị được kết nối, trình bày chuỗi các điểm dữ liệu được lập chỉ mục theo thứ tự thời gian, cho phép theo dõi các thay đổi theo thời gian từ cùng một nguồn.
Điều quan trọng là dữ liệu chuỗi thời gian có khả năng hiển thị “sự phụ thuộc nối tiếp”, có nghĩa là giá trị của một điểm dữ liệu phụ thuộc về mặt thống kê vào một điểm dữ liệu khác từ một thời điểm riêng biệt. Bằng cách sử dụng loại dữ liệu này, chúng ta có thể tạo ra những cỗ máy dự đoán hành động của mình bằng cách phân tích dữ liệu lịch sử để dự đoán kết quả trong tương lai.
Điều này mang lại một mô hình phân tích dự đoán với tiềm năng cơ bản là vô hạn. Các mô hình thống kê truyền thống trước đây là tiêu chuẩn cho phân tích dự đoán, nhưng các mô hình dựa trên AI/ML đã đạt được sự thu hút đáng kể nhờ tính chính xác và khả năng có thể được triển khai bởi các chuyên gia không nhất thiết phải là nhà thống kê được đào tạo bài bản. Việc mở rộng quyền truy cập tới cơ sở người dùng rộng hơn và trao quyền cho họ xây dựng các ứng dụng có khả năng dự đoán kết quả chính xác thông qua dữ liệu chuỗi thời gian có thể thúc đẩy quá trình phổ thông hóa AI trong thế giới thực ở mức tương đương với GenAI.
Tạo chiến lược ‘chuỗi thời gian’ ngay từ đầu
Dữ liệu chuỗi thời gian cung cấp nền tảng cho các ứng dụng AI trong thế giới thực, nhưng việc triển khai chiến lược dữ liệu chuỗi thời gian cùng với AI không đơn giản như việc thu thập và phân tích dữ liệu truyền thống.
Đầu tiên, các công ty cần bỏ tư duy giới hạn khối lượng dữ liệu họ thu thập để cải thiện thời gian truy vấn. Thu thập số lượng lớn dữ liệu phong phú là chìa khóa để làm cho AI thông minh hơn. Thay vì chỉ đo nhiệt độ và thời gian trong ngày, cảm biến có thể giám sát các yếu tố đóng góp vào khác như lượng tia UV, vị trí của mặt trời trên bầu trời và nhiệt độ cách bề mặt 10 feet để giúp xây dựng một bức tranh sâu hơn, rộng hơn để tạo ra những nắm bắt tốt hơn.
Việc sử dụng cơ sở dữ liệu được tối ưu hóa theo chuỗi thời gian giúp giảm thời gian truy vấn trong các tình huống này. Vì vậy, điều quan trọng là phải sớm đưa các cân nhắc về dữ liệu chuỗi thời gian vào chiến lược AI để tránh phải thay thế cơ sở dữ liệu truyền thống không thể xử lý khối lượng dữ liệu khổng lồ cần thiết cho các ứng dụng này.
Khi doanh nghiệp vượt qua được những thách thức đó, trọng tâm sẽ chuyển sang việc thu thập các điểm dữ liệu chuỗi thời gian. Điều này có nghĩa là đầu tư vào công cụ cần thiết để tạo và thu thập dữ liệu có giá trị này. Điều này đòi hỏi phải có chiến lược quản lý dữ liệu phù hợp với số lượng dữ liệu lớn hoặc số lượng lớn các tập dữ liệu duy nhất. Một lần nữa, công ty càng có nhiều cảm biến thì sản phẩm AI cuối của họ càng tốt, nhưng chỉ khi họ có thể quản lý dữ liệu đó một cách hiệu quả.
Những ‘khối xây dựng’ của AI
Nếu doanh nghiệp có được dữ liệu chuỗi thời gian chính xác thì tiềm năng chuyển đổi AI của công ty là rất lớn. Bằng cách phân tích lượng dữ liệu khổng lồ, AI có thể xác định hành vi của hệ thống và dự báo các tình huống trong tương lai với độ chính xác ngày càng tăng. Khả năng này, kết hợp với cơ sở dữ liệu chuỗi thời gian để quản lý lượng dữ liệu khổng lồ, là công cụ để phát triển các hệ thống tự động như ô tô tự lái và cả tên lửa bay vào không gian.
AI trong thế giới thực cũng sẽ thay đổi cách chúng ta làm việc. Khi các tổ chức tiếp tục khai thác tiềm năng của dữ liệu chuỗi thời gian, chúng ta có thể mong đợi sự kết thúc của việc giám sát thủ công và bảng điều khiển vật lý. Dữ liệu này cho phép AI và ML theo dõi các xu hướng dựa trên dữ liệu và phản ứng tự động dựa trên các quy tắc được xác định trước. Điều này ngày càng xảy ra trong các ngành công nghiệp kỹ thuật số tiên tiến hơn và nó nhanh chóng trở thành tiêu chuẩn. Cuối cùng, việc chấm dứt giám sát thủ công sẽ giải phóng các nhóm khỏi công việc nhàm chán và cho phép họ đổi mới hơn nữa.
Dữ liệu chuỗi thời gian đã dần phổ biến ở mọi bộ phận của các doanh nghiệp số ngày nay, nhưng phần lớn nó vẫn chưa phát huy hết tiềm năng. Khi lượng dữ liệu chúng ta tạo ra tiếp tục tăng lên, rõ ràng là những doanh nghiệp mang lại cho mình lợi thế cạnh tranh tốt nhất là những doanh nghiệp trở thành chuyên gia khai thác, phân tích và cuối cùng là sử dụng dữ liệu chuỗi thời gian.
Các doanh nghiệp cần nhận ra rằng thời gian là biên giới mới của dữ liệu; những người nắm bắt điều này bây giờ sẽ là người chiến thắng trong làn sóng đổi mới tiếp theo về AI và các công nghệ kết nối.
Nguồn Evan Kaplan, CEO, InfluxData
Bài viết liên quan
- Nvidia ‘đang chuẩn bị cho thời kỳ AI không dùng GPU’
- Sovereign AI là gì?
- AI trong ngành Logistics: Những lợi ích chính và ứng dụng
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Xây dựng hệ thống dữ liệu hiệu suất cao cho AI với VAST Data Platform
- LLM: Lịch sử và tương lai của các mô hình ngôn ngữ lớn