Dữ liệu thông tin đang được trao đổi hàng ngày với khối lượng ngày càng tăng, do đó, có thể nói rằng các công ty ngày nay đang phải đối mặt với một bức tranh phức tạp về dữ liệu. Dữ liệu tồn tại trong các hệ thống tại chỗ (on-premise) và trong đám mây, nó được sử dụng trên các ứng dụng và được truy cập từ các phòng ban.
Các trang web và nền tảng truyền thông xã hội đang liên tục bổ sung dữ liệu vào hệ thống của doanh nghiệp, cùng với các nguồn dữ liệu mới như Internet of Things (IoT) qua cảm biến và các thiết bị thông minh được kết nối.
Các nguồn dữ liệu khác nhau này đang hình thành “kiến trúc ngẫu nhiên” hỗn loạn, nơi các tổ chức không thể có được cái gọi là “đúng dữ liệu” cho “đúng người” vào “đúng thời điểm”. Điều đó có nghĩa là những người dùng cuối như nhà phân tích kinh doanh và nhà khoa học dữ liệu không thể phân tích đầy đủ dữ liệu có liên quan và nhận được nhiều giá trị nhất từ đó để cải thiện hoạt động của doanh nghiệp.
Cũng như phải đối phó với các nguồn dữ liệu ngày càng nhiều và khối lượng dữ liệu ngày càng khó quản lý, các doanh nghiệp cũng phải đối mặt với nhu cầu kinh doanh mới:
Tăng kỳ vọng, cả nội bộ lẫn bên ngoài: Doanh nghiệp được kỳ vọng sẽ phải nhanh nhẹn hơn, thời gian tiếp thị sản phẩm và dịch vụ nhanh hơn và thời gian phản hồi nhanh hơn cho các yêu cầu của khách hàng, vì bất kỳ sự chậm trễ nào cũng có nghĩa là mất cơ hội kinh doanh vào tay các đối thủ cạnh tranh nhanh hơn.
Nhu cầu phải liên tục tuân thủ các tiêu chí: Điều quan trọng là các tổ chức phải tuân thủ một số quy định của chính phủ và ngành công nghiệp liên quan đến bảo mật dữ liệu, quyền riêng tư và quản lý, là một phần của vấn đề quản trị dữ liệu rộng hơn. Ví dụ mới nhất là quy định GDPR mới điều chỉnh quyền riêng tư dữ liệu cho công dân của Liên minh châu Âu – hoặc Đạo luật bảo mật người tiêu dùng California mới. Ở Úc, có chương trình Vi phạm Dữ liệu Thông báo (Notifiable Data Breach – NDB).
Nhu cầu ngày càng tăng về dữ liệu có thể tiếp cận: Doanh nghiệp phải đáp ứng nhu cầu ngày càng tăng về khả năng tự phục vụ vì ngày càng có nhiều người dùng doanh nghiệp yêu cầu quyền truy cập ngay vào dữ liệu và các công cụ để phân tích dữ liệu. Thế hệ công nhân mới này kỳ vọng có thể tiếp cận liên tục đến các nguồn lực mà họ cần.
Các tổ chức cần những cách mới để làm việc với dữ liệu hiệu quả hơn để giải quyết những thách thức này hoặc nếu không họ sẽ không thể cạnh tranh trong môi trường kinh doanh ngày nay.
Data warehouse đang dần chuyển sang đám mây
Kho dữ liệu kế thừa buộc các tổ chức phải mua và duy trì nhiều phần cứng độc quyền để đáp ứng nhu cầu về năng suất và hiệu suất. Khi trộn lẫn với sự gia tăng nhanh chóng về số lượng dữ liệu và nguồn dữ liệu, điều này làm cho việc kiểm soát chi phí là một thách thức đối với các tổ chức.
Vì những trở ngại này, nhiều tổ chức đang tìm kiếm những thay đổi liên quan đến chiến lược data warehouse của họ. Nghiên cứu được thực hiện vào năm 2017 bởi Data Warehouse Institute cho thấy gần một nửa số tổ chức được khảo sát (48%) đang lên kế hoạch thay thế cho nền tảng kho dữ liệu của họ vào năm 2019.
Nhiều người trong số các tổ chức này đang di chuyển sang kho dữ liệu dựa trên đám mây, cung cấp cho họ khả năng hầu như không giới hạn, khả năng mở rộng lớn hơn và cách tiết kiệm hơn để tận dụng kho lưu trữ. Nhưng nhiều tổ chức quên rằng di chuyển cơ sở dữ liệu cũng có nghĩa là di chuyển các phân tích và mô hình trực quan. Họ đang chuyển sang business intelligent như một dịch vụ cho thấy một thách thức mới cho việc tích hợp dữ liệu.
Tích hợp dữ liệu là một điều cần thiết trong kỷ nguyên điện toán đám mây
Sự không tương thích với nền tảng đám mây mới và kho dữ liệu làm trầm trọng thêm vấn đề gắn bó với các công cụ tích hợp dữ liệu kế thừa. Nhiều công cụ cũng không hỗ trợ các mô hình triển khai kết hợp, có nghĩa là một số tải công việc cần phải được chạy tại chỗ cho phần nâng và thay đổi.
Để khắc phục những vấn đề này, các công ty đánh giá kho dữ liệu mới nên xem xét chiến lược điện toán đám mây của họ là gì và tìm ra giải pháp hỗ trợ họ, bất kỳ nhà cung cấp nào họ sử dụng hiện tại và cho họ sự linh hoạt để thay đổi trong tương lai. Việc kiểm chứng trong tương lai cũng có nghĩa là đảm bảo rằng chúng có thể thêm chất lượng dữ liệu hoặc khả năng quản trị dữ liệu khi các dự án trở nên phức tạp hơn và các tổ chức có thể giới thiệu các khả năng quản lý dữ liệu hoặc chất lượng dữ liệu. Cùng nhau, các tổ chức sẽ có thể giảm tải xử lý cho việc học máy, phân tích nâng cao hoặc khối lượng lớn dữ liệu, vào đám mây.
Một yếu tố quan trọng khác cần xem xét khi xem xét các sản phẩm tích hợp đám mây là tổng chi phí sở hữu (TCO). Nếu mô hình định giá phức tạp và khó hiểu, doanh nghiệp có thể sẽ rơi vào trạng thái ngạc nhiên khó chịu, đầy nghi hoặc khi đụng đến vấn đề thanh toán. Nhiều nhà tích hợp sẽ thêm vào chi phí cho các kết nối mà các doanh nghiệp cần để hoạt động trên các nhà cung cấp dịch vụ đám mây khác nhau, có nghĩa là tổ chức sẽ bị khóa vào chiến lược hiện tại của họ hoặc buộc phải trả thêm tiền.
Đối với nhiều công ty, đó không phải là vấn đề nếu họ chuyển chức năng kho dữ liệu của họ sang đám mây, mà đúng hơn là khi nào.
Các tổ chức cũng có thể thử nghiệm các dự án hoàn toàn mới mà công ty không thực sự quan tâm đến kho dữ liệu kế thừa. Dù bằng cách nào, họ muốn có một giải pháp tại chỗ đảm bảo tích hợp dữ liệu trơn tru và hỗ trợ dữ liệu của họ cần tốt nhất trong tương lai.