Công nghệ lưu trữ đối tượng (Object Storage) đang gia tăng về hiệu suất để đáp ứng nhu cầu về phân phối nội dung, phân tích dữ liệu và các ứng dụng IoT, trong khi nó được hỗ trợ mạnh mẽ bởi các loại phương tiện lưu trữ Flash tốc độ cao, kèm với các tiến bộ công nghệ khác.
Hiệu suất không phải lúc nào cũng được ưu tiên trong lưu trữ đối tượng. Thay vào đó, lưu trữ đối tượng nhận thấy vai trò của nó trong các ứng dụng thứ cấp, chẳng hạn như lưu kho và backup, và mặc dù lưu trữ đối tượng được sử dụng rộng rãi bởi các nhà cung cấp dịch vụ đám mây, bao gồm Amazon Web Services (AWS) và Microsoft Azure, nhưng các ứng dụng lưu trữ đám mây ban đầu không được định hướng về hiệu suất.
Tuy nhiên, những cải tiến trong công nghệ lưu trữ đối tượng đang thay đổi điều đó, cùng với sự hiểu biết tốt hơn giữa các kiến trúc sư và nhà cung cấp dịch vụ CNTT về cách khai thác lợi thế của lưu trữ đối tượng.
Mộ chuyên gia của hãng cung cấp nền tảng ảo hóa lưu trữ DataCore cho biết rằng: “Lưu trữ đối tượng trước đây liên quan đến khối lượng lớn dữ liệu phi cấu trúc. Trên thực tế, các ứng dụng của nó còn rộng hơn thế, với việc áp dụng rộng rãi cho các ứng dụng phân phối nội dung qua mạng, Big Data và phân tích dữ liệu với các đặc điểm truy cập “warm data” và nhu cầu thông lượng cao trong các ứng dụng sao lưu và khôi phục”.
Một số thay đổi được thúc đẩy bởi công nghệ. Chúng bao gồm thay thế ổ đĩa quay chi phí thấp với dung lượng cao hơn và ổ cứng SSD chi phí ngày càng thấp, bao gồm cả ổ cứng NVMe. Ngoài ra, vấn đề mã hóa được giảm tải qua cho phần cứng, bên cạnh các cải tiến trong phần mềm.
Nhưng nhu cầu cũng đóng một phần đáng kể. Các doanh nghiệp ngày càng muốn xử lý dữ liệu gần với nơi nó được lưu trữ. Phân tích dữ liệu, trí tuệ nhân tạo (AI) và Internet of Things (IoT) đều là những ứng dụng cần đến lưu trữ đối tượng. Công nghệ tốt hơn cho phép nhiều dữ liệu nằm trong kho lưu trữ đối tượng hơn là sao chép chúng vào thiết bị lưu trữ dạng block hoặc dựa trên hệ thống file nội bộ.
Sự khác biệt về lưu trữ đối tượng
Lưu trữ đối tượng thay thế File System phân cấp bằng cấu trúc “phẳng”.
Mỗi đối tượng chứa dữ liệu, metadata (thông tin mô tả) và một ID duy nhất cho đối tượng đó. Lưu trữ đối tượng cho phép người dùng tổng hợp lưu trữ của họ thành các node và nhóm, đó là lý do tại sao nó rất phổ biến trong các nhà cung cấp dịch vụ đám mây.
Lưu trữ đối tượng có khả năng mở rộng lớn. Bạn có thể thêm nhiều node hơn mà không cần mở rộng cơ sở dữ liệu cho metadata. Các node có thể được đặt ở bất cứ đâu để tạo ra khả năng dự phòng về mặt vật lý.
Khả năng bảo vệ nâng cao đến từ khả năng chịu lỗi thông qua cơ chế gọi là “Reliable Array of Inexpensive Nodes” (Redundant Array of Independent Nodes, hay RAIN). Vì vậy, một hệ thống lưu trữ đối tượng được cấu hình thích hợp có thể tồn tại khi hỏng ổ đĩa và thậm chí là toàn bộ các node.
Nhu cầu về hiệu suất của lưu trữ đối tượng
Người dùng của lưu trữ đối tượng giờ đây cũng muốn cải thiện hiệu suất. Đó là bởi vì lưu trữ đối tượng đã trở nên phổ biến hơn và bởi vì nó giải quyết các vấn đề thực tế khác, chẳng hạn như nhu cầu mở rộng quy mô để đối phó với các tập dữ liệu rất lớn. Vì nhiều ứng dụng hơn có thể hoạt động với lưu trữ đối tượng, thông qua API tiêu chuẩn S3 và Azure, các CIO muốn mang lại hiệu suất gần hơn với những gì bạn có thể nhận được từ lưu trữ dựa trên file.
Một nhà phân tích công nghệ cho biết: “Hiện có một số ứng dụng và tải công việc có thể tận dụng các kho lưu trữ đối tượng, bao gồm IoT, HPC (điện toán hiệu suất cao), phân tích dữ liệu lớn và AI”. “Việc liên kết khả năng mở rộng và hiệu suất trong cùng một hệ thống là một yêu cầu đối với các dự án lớn lên đến nhiều petabyte”.
Các doanh nghiệp muốn sử dụng dữ liệu trong kho lưu trữ của họ một cách chủ động hơn, chẳng hạn như để phân tích và học máy. Với việc lưu trữ đối tượng hiện là tiêu chuẩn thực tế cho lưu trữ doanh nghiệp, nó đang được sử dụng cho các ứng dụng khắt khe hơn.
Một ứng dụng khác là trong lĩnh vực truyền thông và viễn thông, nơi các công ty hiện lưu trữ số lượng lớn dữ liệu phim ảnh và thậm chí cả nội dung truyền hình trực tiếp qua mạng internet. Các file dữ liệu này nằm trong phạm vi nhiều gigabyte, nhưng hệ thống cũng cần hỗ trợ nhiều người dùng truy cập.
Jonathan Morgan, Giám đốc điều hành tại nhà cung cấp Object Matrix chuyên về phương tiện truyền thông cho biết: “Trong Thế vận hội Olympic Rio, nhu cầu lưu trữ lên đến 6000 luồng video 4K trong hệ thống lưu trữ đối tượng!”.
Chỉ số hiệu suất lưu trữ đối tượng
Để tăng hiệu suất, trước tiên các nhóm CNTT cần phải đo lường nó. Các chi số thông dụng về hiệu suất lưu trữ, chẳng hạn như IOPS và độ trễ, không đưa ra bức tranh đầy đủ của giải pháp lưu trữ đối tượng. Và lưu trữ đối tượng ở cấp độ “lạnh” thường được mua với giá trên mỗi GB hơn là trên cơ sở hiệu suất.
Độ trễ để lưu trữ đối tượng sẽ phụ thuộc nhiều vào mạng cũng như thông số kỹ thuật phần cứng lưu trữ – và có những ứng dụng, chẳng hạn như AI, nơi mà độ trễ rất quan trọng. Ở những ứng dụng khác, chẳng hạn như phân tích và phát trực tuyến video, thông lượng và số lượng kết nối đồng thời có thể quan trọng hơn.
Sherman Schorzman, kỹ sư tiếp thị kỹ thuật tại nhà cung cấp Quantum cho biết: “Hệ thống lưu trữ đối tượng tại chỗ có thời gian phản hồi ở mức mili giây.
“Hệ thống có hiệu suất lưu trữ đối tượng thực sự tốt có khả năng đáp ứng một ứng dụng phân tích với vài nghìn kết nối”. Ông cho biết thêm, IOPS ỏ cấp đĩa hoặc cấp Array ít quan trọng hơn.
Tốc độ thông lượng thực tế tính bằng MBps hoặc thậm chí GBps quan trọng hơn đối với một số ứng dụng và tính nhất quán cũng vậy. “Đối với một ứng dụng phát trực tuyến video, việc truy cập vào phần đầu tiên của video mất 1ms hoặc 20ms sẽ ít quan trọng hơn. Điều quan trọng là việc phân phối về mặt thông lượng là nhất quán, ”Paul Speciale của Scality nói.
Thông lượng trong các kịch bản thế giới thực có thể cao hơn đối với lưu trữ đối tượng so với lưu trữ truy cập khối.
Cải thiện hiệu suất
Việc tăng hiệu suất cho việc lưu trữ đối tượng liên quan đến những thay đổi về phần cứng, phần mềm, mạng và kiến trúc.
Signoretti của GigaOM cho biết một kho lưu trữ đối tượng “nhỏ” – với dung lượng vài petabyte – chạy cục bộ, đã có thể hỗ trợ các ứng dụng hiệu suất cao.
Ở những nơi khác, việc chuyển sang lưu trữ SSD và NVMe mang lại hiệu suất nhưng với chi phí cao hơn. Lưu trữ SSD đã được sử dụng rộng rãi cho bộ nhớ đệm/Cache, trong khi chi phí thấp hơn, phương tiện mật độ cao hơn cũng đang đẩy nó xuống các mảng lưu trữ.
Tuy nhiên, hệ thống mạng có thể trở thành một nút cổ chai. Mảng ổ cứng thường nằm trong khả năng của hầu hết công nghệ mạng, nhưng NVMe có thể bão hòa kết nối Ethernet 100Gigabit.
Jonathan Morgan của Object Matrix cho biết trong bộ nhớ đệm được cải thiện và tối ưu hóa các lệnh gọi sẽ giúp ích cho việc bổ sung đĩa, vì điều này trải rộng tải công việc I/O và chuyển một số quá trình xử lý vào phần cứng.
Intel hiện đã tích hợp mã chống lỗi (erasure coding) Reed-Solomon vào một số CPU và một số nhà cung cấp cũng đang chuyển sang các hàm băm nhẹ hơn để thực hiện.
Nhưng các kiến trúc sư CNTT cũng cần phải nhìn vào hiệu suất tổng thể của hệ thống. Độ trễ thấp hoặc tốc độ truyền cao sẽ ít được sử dụng nếu chúng làm ngập ứng dụng mục tiêu – vì vậy đầu tư vào lưu trữ đối tượng hiệu suất cao có ý nghĩa nhất khi lưu trữ đang là nút thắt cổ chai hiện tại.
Các nhà cung cấp lưu trữ đối tượng tập trung vào hiệu suất
Các nhà cung cấp lưu trữ doanh nghiệp chính đang làm việc để cải thiện hiệu suất trong các dây chuyền lưu trữ đối tượng của họ và các nhà cung cấp chuyên gia bao gồm:
Cloudian HyperStore – Nền tảng lưu trữ đối tượng chuẩn S3 được Gartner đánh giá (2021) là lựa chọn hàng đầu của khách hàng cho giải pháp “Distributed File Systems & Object Storage”.
Cloudian HyperStore Appliance HSA-1610 Đơn giá 799.970.000 VNĐ Mã hàng HSA-1610 Thương hiệu Cloudian
OpenIO – Công ty này tự quảng cáo mình như một nhà cung cấp lưu trữ đối tượng, hiệu suất cao, không thể đoán được phần cứng. Nó hoạt động tại chỗ, trên đám mây hoặc trong các ứng dụng biên. Họ tuyên bố có dung lượng lên đến quy mô exabyte và thông lượng 1Tbps.
Minio – Đây là hệ thống lưu trữ đối tượng đám mây riêng và tại chỗ tương thích với S3 và được điều chỉnh cho Kubernetes. Họ tuyên bố tốc độ đọc / ghi là 183 GBps và 171 GBps, đồng thời xuất bản một loạt các bộ phần cứng tham chiếu dựa trên bộ công cụ từ các nhà cung cấp bao gồm Dell và Supermicro.
Scality – Scality RING là một hệ thống lưu trữ đối tượng hoàn toàn dựa trên phần mềm. Nhà cung cấp tuyên bố IOPS cao nhất là 1,6 triệu trong một lần triển khai tại một nhà cung cấp dịch vụ đám mây có trụ sở tại Hoa Kỳ và thông lượng cao nhất là 60GBps tại một công ty dịch vụ du lịch.
Quantum – Hệ thống lưu trữ ActiveScale của công ty cung cấp khả năng lưu trữ quy mô exabyte dựa trên phần cứng của chính nó. Các cấu hình mở rộng quy mô hỗ trợ thông lượng lên đến 75GBps và lên đến 74PB trên mỗi đơn vị ActiveScale X100.
SwiftStack – Công nghệ 1Space của họ là một hệ thống lưu trữ dựa trên phần mềm. Nó hoạt động ở rìa, trong đám mây và trong trung tâm dữ liệu. Họ tuyên bố tốc độ ghi trên 20GBps và đọc ở 50GBps, với khả năng mở rộng lên hơn 100GBps. SwiftStack gần đây đã được NVIDIA mua lại.
Bài viết liên quan
- Các câu hỏi thường gặp về Data Lake
- Tính năng Auto-tiering ở bucket-level của lưu trữ Object với Cloudian
- NAS vs. Object Storage: Giải pháp nào tốt nhất cho việc lưu trữ dữ liệu phi cấu trúc?
- Đặc tính đa khách hàng trong giải pháp lưu trữ cloud
- Storage-as-a-Service: Nguồn doanh thu rạo ra lợi nhuận cho các nhà cung cấp dịch vụ đám mây
- Top những lý do tại sao kiến trúc lưu trữ Object Storage lại hỗ trợ tuyệt vời cho AI