Mảng lưu trữ, hay Storage Array/Disk Array, là một hệ thống lưu trữ dữ liệu để lưu trữ dựa trên block, dựa trên file hay object storage. Thay vì lưu trữ dữ liệu trên một máy chủ, mảng lưu trữ sử dụng nhiều ổ đĩa trong một bộ lưu trữ/tủ đĩa có khả năng lưu trữ một lượng lớn dữ liệu, được quản lý bởi một hệ thống quản lý trung tâm.
Hiệu suất của mảng lưu trữ có thể được cải thiện bằng cách sử dụng hệ thống quản lý chất lượng cao để theo dõi dung lượng, lỗi và xu hướng. Bài viết này sẽ bàn về những kiến thức cơ bản về mảng lưu trữ, như chúng là gì, cách chúng hoạt động và các thiết lập phổ biến của trung tâm dữ liệu.
Mảng lưu trữ hoạt động như thế nào?
Mảng lưu trữ giúp lưu trữ tách biệt với máy chủ bằng cách sử dụng tập hợp các ổ đĩa cứng (HDD) hoặc ổ cứng thể rắn (SSD). Trong một số trường hợp, họ sử dụng kết hợp cả hai để có thể mở rộng quy mô hiệu quả hơn nhiều so với dung lượng lưu trữ của một tập hợp các máy chủ.
Mảng lưu trữ HDD, hoặc mảng đĩa, thường được sử dụng trong môi trường kinh doanh cho mục đích lưu trữ và có các tính năng dự phòng tuyệt vời để giúp bảo vệ dữ liệu. Ví dụ, các RAID controller được sử dụng để tạo bản sao của cùng một dữ liệu trên nhiều đĩa cứng. Điều này bảo vệ dữ liệu khỏi bị mất nếu một trong các đĩa bị lỗi, vì tất cả các bản sao lưu vẫn có sẵn.
Mảng lưu trữ SSD, còn được gọi là mảng lưu trữ flash, có kiến trúc mảng lưu trữ cơ bản giống như mảng HDD nhưng sẽ hoạt động nhanh hơn nhiều. Tuy nhiên, ổ cứng HDD rẻ hơn nên đôi khi chúng được sử dụng kết hợp.
Mảng lưu trữ là một phần quan trọng đối với mạng lưu trữ, cho phép các chức năng lưu trữ của mạng được tách biệt hoàn toàn khỏi mạng LAN hoặc WAN kết nối tất cả các thiết bị trong một công ty. Lưu trữ dựa trên mảng đĩa tách các chức năng truyền và kết nối mạng khỏi các chức năng lưu trữ dữ liệu và cho phép nhiều máy chủ truy cập dữ liệu đã lưu cùng một lúc. Điều này có nghĩa là tất cả các máy chủ trong một doanh nghiệp đều có thể truy cập dữ liệu từ cùng một mảng lưu trữ.
Máy chủ dữ liệu là gì?
Máy chủ dữ liệu, còn được gọi là máy chủ cơ sở dữ liệu, là phần cứng back-end cơ bản dành riêng để cung cấp các dịch vụ cần thiết để hỗ trợ một hoặc nhiều hệ thống quản lý cơ sở dữ liệu (DBMS). Các dịch vụ này bao gồm các tác vụ như lưu trữ, lưu kho (archive), xử lý, phân tích và đảm bảo an toàn cho dữ liệu — nói chung là tất cả các tác vụ không dành riêng cho người dùng cuối. Máy chủ dữ liệu cũng đảm bảo dữ liệu có thể truy cập được cho đúng máy khách, dựa trên kiến trúc client/server của ứng dụng cơ sở dữ liệu.
Máy chủ có thể chứa một lượng lớn dữ liệu ở nhiều định dạng — cơ sở dữ liệu quan hệ, cơ sở dữ liệu phi quan hệ và thậm chí cả các flat file. DBMS được cài đặt trên máy chủ dữ liệu và các hệ thống khác sau đó có thể truy cập dữ liệu. Tuy nhiên, từ góc độ CNTT, thuật ngữ “máy chủ dữ liệu” không phải lúc nào cũng chính xác — nó có thể đề cập đến phần cứng, nền tảng phần mềm hoặc sự kết hợp của cả hai. Là phần mềm, máy chủ dữ liệu có thể được coi là một “instance”.
Kiến trúc Trung tâm Dữ liệu Hiện đại trông như thế nào?
Các hệ thống lưu trữ trong trung tâm dữ liệu đã phát triển theo thời gian và ngày nay, khi tốc độ và tính linh hoạt ngày càng trở nên quan trọng, nhiều công ty dựa vào sự kết hợp của cơ sở hạ tầng vật lý và ảo hóa, như các đám mây lai. Trước khi có các mảng all-flash và ảo hóa, việc lưu trữ dữ liệu phụ thuộc vào các đĩa cứng nhận các yêu cầu I/O. Để hiểu kiến trúc trung tâm dữ liệu hiện đại, điều quan trọng trước tiên là phải hiểu các hệ thống lưu trữ hiện đại điển hình nói chung.
Một số loại kho lưu trữ dữ liệu cho phép số lượng truy cập và khả năng mở rộng khác nhau. Điều quan trọng đối với kiến trúc lưu trữ là có khả năng tránh xung đột (non-blocking), cho phép nhiều request đồng thời mà không cần xếp hàng. Hệ thống con lưu trữ bao gồm một số thành phần — host adapter, device adapter, bộ nhớ cache và bộ xử lý — và kiến trúc truyền dẫn kết nối các phần này:
- Kiến trúc Bus chỉ cho phép truy cập một thiết bị tại một thời điểm. Nó đơn giản và rẻ, nhưng khó mở rộng quy mô.
- Kiến trúc Switch cho phép các thành phần được gắn vào thiết bị chuyển mạch bằng các liên kết, với tối đa 64 kết nối trên mỗi mặt của switch. Hầu hết các hệ thống con lưu trữ lớn đều sử dụng dạng này.
- Kiến trúc Matrix liên kết các thành phần với từng thành phần khác mà nó cần giao tiếp, tạo ra một mạng lưới kết nối và cho phép hệ thống dễ dàng mở rộng quy mô.
Ngày càng phổ biến hơn đó là các mô hình lưu trữ trong trung tâm dữ liệu cũng dựa vào ảo hóa, giúp hợp nhất bộ lưu trữ và máy chủ. Về cơ bản, ảo hóa trung tâm dữ liệu hợp nhất các máy chủ vật lý với các máy ảo và các máy ảo được kết nối với một lớp truy cập ảo L2. Kết hợp truy cập lưu trữ cho các máy ảo có nghĩa là hợp nhất các mạng khu vực lưu trữ (cho phép lưu trữ tập trung, all-flash, với độ trễ thấp hơn) cũng như lưu trữ NAS. Mặc dù đây là các hình thức lưu trữ kế thừa, nhưng chúng đã phát triển để hoạt động hiệu quả hơn với các mô hình lưu trữ dữ liệu hiện đại.
Cách cải thiện hiệu suất mảng lưu trữ
Mảng lưu trữ dữ liệu cần được quản lý cẩn thận để đảm bảo đĩa không bị lấp đầy dung lượng và ảnh hưởng đến hiệu suất ứng dụng cho người dùng. Bạn nên sử dụng một công cụ quản lý hữu hiệu để theo dõi và tối ưu hóa hiệu suất của mảng lưu trữ, điều này rất quan trọng để đảm bảo dữ liệu có thể được nhiều máy chủ truy cập mà không bị chậm trễ.
Bài viết liên quan
- Block Storage là gì? Nó khác gì với File và Object Storage?
- Các câu hỏi thường gặp về Data Lake
- Tính năng Auto-tiering ở bucket-level của lưu trữ Object với Cloudian
- NAS vs. Object Storage: Giải pháp nào tốt nhất cho việc lưu trữ dữ liệu phi cấu trúc?
- Đặc tính đa khách hàng trong giải pháp lưu trữ cloud
- Storage-as-a-Service: Nguồn doanh thu rạo ra lợi nhuận cho các nhà cung cấp dịch vụ đám mây