Storage Virtualization là tập hợp các thành phần lưu trữ vật lý từ nhiều thiết bị lưu trữ thành một thiết bị lưu trữ duy nhất – hoặc nhóm dung lượng storage khả dụng – được quản lý từ một bảng điều khiển trung tâm. Công nghệ này dựa vào phần mềm để xác định dung lượng lưu trữ có sẵn từ các thiết bị vật lý và sau đó tổng hợp dung lượng đó thành một nhóm lưu trữ để có thể được sử dụng bởi các máy chủ theo kiến trúc truyền thống hoặc trong môi trường ảo hóa với các máy ảo (VM).
Phần mềm lưu trữ ảo tiếp nhận các yêu cầu I/O từ máy vật lý hoặc máy ảo và gửi các yêu cầu đó đến vị trí vật lý thích hợp của thiết bị lưu trữ là một phần của tổng thể lưu trữ trong môi trường ảo hóa. Ở góc độ người dùng sẽ không thể nhìn thấy được các tài nguyên lưu trữ khác nhau tạo nên một nhóm, do đó, storage ảo xuất hiện giống như một ổ đĩa vật lý duy nhất, hoặc một Logical Unit Number (LUN) có thể chấp nhận các lệnh đọc/ghi chuẩn.
Một hình thức ảo hóa lưu trữ rất cơ bản được thể hiện bằng một lớp ảo hóa phần mềm giữa phần cứng của tài nguyên lưu trữ và máy chủ lưu trữ – máy tính cá nhân (PC), máy chủ hoặc bất kỳ thiết bị nào truy cập vào storage – giúp hệ điều hành (OS) và các ứng dụng có thể truy cập và sử dụng storage. Thậm chí một RAID array đôi khi cũng có thể được coi là một loại ảo hóa lưu trữ. Nhiều ổ đĩa vật lý trong mảng được hiển thị cho người dùng như một thiết bị lưu trữ duy nhất trong khi, ở phía bên trong, nó phân chia và sao chép dữ liệu sang nhiều đĩa để cải thiện hiệu suất I/O và để bảo vệ dữ liệu trong trường hợp có một ổ bị lỗi.
Các loại ảo hóa lưu trữ: Block so với File
Có hai phương pháp ảo hóa lưu trữ cơ bản: dựa trên File (tệp) hoặc dựa trên Block (khối). Ảo hóa lưu trữ dựa trên file là một ứng dụng cụ thể, được áp dụng cho các hệ thống lưu trữ gắn mạng (NAS). Sử dụng giao thức Server Message Block (SMB) hoặc Common Internet File System (CIFS) trong môi trường máy chủ Windows hoặc các giao thức Network File System (NFS) cho hệ thống Linux, ảo hóa lưu trữ dựa trên file phá vỡ sự phụ thuộc trong một mảng NAS thông thường giữa dữ liệu được truy cập và vị trí của storage vật lý. Việc gộp chung các tài nguyên NAS giúp xử lý việc di chuyển file ở chế độ nền dễ dàng hơn, điều này sẽ giúp cải thiện hiệu suất. Thông thường, hệ thống NAS không phức tạp để quản lý, nhưng ảo hóa lưu trữ đơn giản hóa đáng kể nhiệm vụ quản lý nhiều thiết bị NAS thông qua một bảng điều khiển (console) quản lý duy nhất.
Lưu trữ dựa trên block hoặc block access – tài nguyên lưu trữ thường được truy cập thông qua mạng lưu trữ Fibre Channel (FC) hoặc iSCSI storage area network (SAN) – được ảo hóa thường xuyên hơn so với hệ thống lưu trữ dựa trên file. Các hệ thống dựa trên block trừu tượng hóa các thành phần lưu trữ logic, chẳng hạn như phân vùng ổ đĩa, khỏi các khối storage vật lý thực tế trong thiết bị lưu trữ, chẳng hạn như ổ đĩa cứng (HDD) hoặc thiết bị storage thể rắn. Bởi vì nó hoạt động theo cách tương tự như phần mềm ổ đĩa gốc, nó giảm tải (overhead) cho các quá trình đọc và ghi, vì vậy các hệ thống lưu trữ block sẽ hoạt động tốt hơn các hệ thống dựa trên file.
Hoạt động dựa trên block cho phép phần mềm quản lý ảo hóa thu thập dung lượng của các block của không gian lưu trữ còn hiệu dụng trên tất cả các mảng được ảo hóa, và sau đó gộp chúng thành một tài nguyên dùng chung để gán cho bất kỳ số lượng máy ảo, máy chủ vật lý hay container nào. Ảo hóa lưu trữ đặc biệt có lợi cho block storage. Không giống như hệ thống NAS, việc quản lý SAN có thể là một quá trình mất thời gian; Ví dụ, hợp nhất một số hệ thống lưu trữ block dưới một giao diện quản lý duy nhất thường tránh cho người dùng khỏi các bước tẻ nhạt của việc cấu hình LUN, có thể giúp tiết kiệm thời gian đáng kể.
Các chiến lược ảo hóa có thể được áp dụng cho lưu trữ block, disk, tape và file.
Phiên bản ban đầu của ảo hóa dựa trên block là SAN Volume Controller (SVC) của IBM, hiện nay được gọi là IBM Spectrum Virtualize. Phần mềm chạy trên một thiết bị hoặc mảng lưu trữ và tạo ra một nhóm lưu trữ duy nhất bằng cách ảo hóa các LUN gắn với máy chủ được kết nối với bộ điều khiển lưu trữ. Spectrum Virtualize cũng cho phép khách hàng phân cấp dữ liệu block vào public cloud storage.
Một sản phẩm ảo hóa lưu trữ ban đầu khác là Data Systems’ TagmaStore Universal Storage Platform của Hitachi, hiện được gọi là Hitachi Virtual Storage Platform (VSP). Ảo hóa lưu trữ dựa trên mảng của Hitachi cho phép khách hàng tạo ra một nhóm lưu trữ duy nhất trên các mảng riêng biệt, ngay cả chúng từ các nhà cung cấp lưu trữ hàng đầu khác.
Cách thức hoạt động của ảo hóa lưu trữ
Để cung cấp quyền truy cập vào dữ liệu được lưu trữ trên thiết bị lưu trữ vật lý, phần mềm ảo hóa cần tạo bản đồ (map) bằng metadata hoặc trong một số trường hợp, sử dụng thuật toán để định vị dữ liệu một cách linh hoạt. Sau đó, phần mềm ảo hóa sẽ tiếp nhận các yêu cầu đọc và ghi từ các ứng dụng và sử dụng bản đồ mà nó đã tạo ra, nó có thể tìm hoặc lưu dữ liệu vào thiết bị vật lý thích hợp. Quá trình này tương tự như phương pháp được sử dụng bởi hệ điều hành PC khi truy xuất hoặc lưu dữ liệu ứng dụng.
Ảo hóa lưu trữ che giấu sự phức tạp thực tế của hệ thống lưu trữ, chẳng hạn như SAN, giúp quản trị viên lưu trữ thực hiện các tác vụ sao lưu, lưu trữ và khôi phục dễ dàng hơn và trong thời gian ngắn hơn.
Ảo hóa hướng bên trong (in-band) so với hướng bên ngoài (out-of-band)
Nhìn chung, có hai loại ảo hóa có thể được áp dụng cho hạ tầng lưu trữ: in-band và out-of-band.
- Ảo hóa in-band – còn được gọi là ảo hóa đối xứng – xử lý dữ liệu đang được đọc hoặc lưu và thông tin điều khiển (ví dụ: lệnh I/O, metadata) trong cùng một channel hoặc layer. Thiết lập này cho phép ảo hóa lưu trữ cung cấp các chức năng quản lý và vận hành nâng cao hơn như các dịch vụ sao chép và lưu trữ dữ liệu.
- Ảo hóa out-of-band – hay ảo hóa không đối xứng – chia nhỏ các đường dẫn dữ liệu và đường dẫn điều khiển. Vì lớp nền ảo hóa chỉ nhìn thấy các lệnh điều khiển nên các tính năng lưu trữ nâng cao thường không khả dụng.
Các phương pháp ảo hóa
Ảo hóa lưu trữ ngày nay thường đề cập đến dung lượng được tích lũy từ nhiều thiết bị vật lý và sau đó được tạo sẵn để phân bổ lại trong môi trường ảo hóa. Các nền tảng IT hiện đại, chẳng hạn như hạ tầng siêu hội tụ (HCI) và container hóa, tận dụng lợi thế của lưu trữ ảo, bên cạnh tài nguyên xử lý ảo và dung lượng mạng ảo.
Mặc dù dần mai một trên phương diện một phương tiện backup mục tiêu, lưu trữ tape vẫn được sử dụng rộng rãi để lưu trữ dữ liệu được truy cập không thường xuyên. Dữ liệu archive có xu hướng đồ sộ; ảo hóa lưu trữ có thể được sử dụng cho phương tiện tape để giúp quản lý kho dữ liệu lớn dễ dàng hơn. Linear tape file system (LTFS) là một dạng ảo hóa tape giúp tape trông giống như một thiết bị lưu trữ file NAS điển hình và giúp việc tìm và khôi phục dữ liệu từ tape dễ dàng hơn nhiều bằng cách sử dụng thư mục cấp file chứa nội dung của tape.
Có nhiều cách lưu trữ có thể được áp dụng cho môi trường ảo hóa:
Host-based storage virtualization dựa trên phần mềm và thường thấy nhất trong các hệ thống HCI và lưu trữ đám mây. Trong kiểu ảo hóa này, máy chủ lưu trữ hoặc hệ thống siêu hội tụ được tạo thành từ nhiều máy chủ lưu trữ, cung cấp các ổ đĩa ảo có dung lượng khác nhau cho các máy khách, cho dù chúng là máy ảo trong môi trường doanh nghiệp, máy chủ vật lý hay PC truy cập chia sẻ file hoặc cloud storage. Tất cả quá trình ảo hóa và quản lý đều được thực hiện ở cấp máy chủ thông qua phần mềm và storage vật lý có thể là hầu hết mọi thiết bị hoặc mảng. Một số hệ điều hành máy chủ có khả năng ảo hóa được tích hợp sẵn, chẳng hạn như Windows Server Storage Spaces.
Array-based storage virtualization thường đề cập đến phương pháp trong đó mảng lưu trữ hoạt động như bộ điều khiển lưu trữ chính và chạy phần mềm ảo hóa, cho phép nó gộp tài nguyên lưu trữ của các mảng khác và cung cấp các loại lưu trữ vật lý khác nhau để sử dụng làm các tầng lưu trữ . Một tầng lưu trữ có thể bao gồm ổ đĩa thể rắn (SSD) hoặc HDD trên các mảng lưu trữ ảo hóa khác nhau; vị trí thực và mảng cụ thể bị ẩn khỏi máy chủ hoặc người dùng truy cập vào storage.
Network-based storage virtualization là hình thức phổ biến nhất được sử dụng trong các doanh nghiệp hiện nay. Một thiết bị mạng, chẳng hạn như switch thông minh hoặc máy chủ được xây dựng có mục đích, kết nối với tất cả các thiết bị lưu trữ trong FC hoặc iSCSI SAN và thể hiện dung lượng trong mạng lưu trữ dưới dạng một virtual pool duy nhất.
Lợi ích và công dụng của ảo hóa lưu trữ
Khi lần đầu tiên được giới thiệu cách đây hơn hai thập kỷ, ảo hóa lưu trữ có xu hướng khó thực hiện và có ứng dụng hạn chế trong chừng mực mà công nghệ có sẵn sẽ hoạt động với các mô hình và mô hình mảng lưu trữ. Bởi vì ban đầu nó là dạng host-based, phần mềm ảo hóa lưu trữ phải được cài đặt và duy trì trên tất cả các máy chủ cần quyền truy cập vào tài nguyên lưu trữ được gộp chung. Khi nó hoàn thiện hơn về sau, công nghệ có thể được triển khai theo nhiều cách khác nhau (như mô tả ở trên), giúp dễ dàng triển khai hơn trong nhiều môi trường khác nhau, vì người dùng có thể chọn phương pháp ảo hóa phù hợp nhất với cơ sở hạ tầng hiện có của họ.
Sự phát triển hơn nữa của phần mềm ảo hóa, cùng với các tiêu chuẩn như Storage Management Initiative Specification (SMI-S), cho phép các sản phẩm ảo hóa hoạt động với nhiều loại hệ thống lưu trữ hơn, làm cho nó trở thành một lựa chọn hấp dẫn hơn nhiều cho các doanh nghiệp đang gặp khó khăn với năng lực lưu trữ kiểu xoắn ốc.
Một số lợi ích và cách sử dụng của ảo hóa lưu trữ bao gồm:
- Quản lý dễ dàng hơn. Một bảng điều khiển quản lý duy nhất để giám sát và duy trì nhiều mảng lưu trữ ảo hóa giúp giảm thời gian và nỗ lực cần thiết để quản lý hệ thống vật lý. Điều này đặc biệt có lợi khi hệ thống lưu trữ thuộc các vendor khác nhau nằm trong pool ảo hóa.
- Sử dụng lưu trữ tốt hơn. Việc gộp dung lượng lưu trữ trên nhiều hệ thống giúp dễ dàng phân bổ hơn để dung lượng được phân bổ và sử dụng hiệu quả hơn. Với các hệ thống khác biệt, không được kết nối, có khả năng một số hệ thống sẽ hoạt động bằng hoặc gần hết công suất, trong khi những hệ thống khác hầu như không được sử dụng.
- Kéo dài tuổi thọ của các hệ thống lưu trữ cũ hơn. Ảo hóa cung cấp một cách tuyệt vời để mở rộng tính hữu dụng của các thiết bị lưu trữ cũ hơn bằng cách đưa chúng vào pool như một cấp để xử lý dữ liệu lưu trữ hoặc dữ liệu ít quan trọng hơn.
- Thêm các tính năng nâng cao trên toàn cục. Một số tính năng lưu trữ nâng cao hơn như tiering, caching và replication có thể được triển khai ở cấp độ ảo hóa. Điều này giúp tiêu chuẩn hóa các hoạt động này trên tất cả các hệ thống thành viên và có thể cung cấp các chức năng nâng cao này cho những hệ thống có thể thiếu chúng.
Bài viết liên quan
- Lưu trữ doanh nghiệp năm 2025: 6 xu hướng không thể bỏ qua
- Lựa chọn lưu trữ hàng đầu cho đào tạo mô hình AI là gì?
- Hậu trường: Tầm quan trọng của việc lưu trữ dữ liệu tại các sự kiện hiện đại
- Hệ thống lưu trữ DDN đạt được hiệu suất vượt trội với MLPerf Benchmarking, thúc đẩy kết quả kinh doanh đột phá từ AI
- Giải pháp lưu trữ của Infortrend cho camera an ninh
- VAST Data Platform – Nền tảng dữ liệu doanh nghiệp toàn diện