Cách quản lý lượng dữ liệu VM lớn bằng các chiến thuật lưu trữ này

Quản trị viên có thể ảo hóa hiệu quả các máy chủ kích thước to lớn với tính năng storage-tiering và việc cấp phát ổ đĩa, nhưng họ cần dự tính các vấn đề có thể xảy ra về IOPS và khả năng dự phòng lỗi dữ liệu.

Nhiều công ty vẫn đang gặp khó khăn để tiến hành ảo hóa các máy chủ có lượng lớn dữ liệu lớn. Nhưng với việc áp dụng một cách khéo léo các kỹ thuật phân tầng lưu trữ và cấp phát ổ đĩa, quản trị viên vẫn có thể ảo hóa tất cả các máy chủ của họ.

Sau sự ra đời của các nền tảng ảo hóa, phần lớn các doanh nghiệp đã bắt đầu tiến hành ảo hóa lần lượt các máy chủ của họ. Khi công nghệ chứng minh được khả năng của nó, các công ty sẽ ảo hóa ngày càng nhiều các máy chủ quan trọng trong môi trường vận hành. Những máy chủ cuối cùng còn lại không phải lúc nào cũng là những máy chủ yêu cầu CPU xử lý nhiều nhất – chúng thường là những máy chủ có dung lượng lớn nhất.

Giải pháp ảo hóa hạ tầng lưu trữ

Hầu hết các trung tâm dữ liệu đều có một số máy chủ có kích thước lớn này. Chúng lớn về kích thước ổ đĩa, nhưng không lớn về CPU, bộ nhớ hoặc thậm chí là năng lực I/O của ổ lưu trữ. Dữ liệu trong các máy chủ này có thể lên đến nhiều terabyte.

Các công ty thường cho các máy chủ lớn nằm ngoài quá trình ảo hóa vì lượng dữ liệu VM mà họ tạo ra có thể sử dụng quá nhiều dung lượng lưu trữ chia sẻ đắt tiền. Vấn đề này thậm chí còn tồi tệ hơn với các tủ đĩa SSD.

Các máy ảo lớn tiếp tục tạo ra một số thách thức, nhưng với một vài kỹ thuật, quản trị viên có thể tìm ra cách lưu trữ chúng hiệu quả nhất.

Sử dụng phân tầng lưu trữ để tổ chức lại dữ liệu VM

Một trong những câu hỏi quan trọng với các máy ảo lớn là đặt chúng ở đâu. Các tủ đĩa all-flash đều rất đắt tiền, vì vậy quản trị viên phải hiểu đặc điểm dữ liệu của chúng. Nếu hầu hết các máy ảo không được sử dụng hoặc nếu dữ liệu trong máy ảo hiếm khi đụng đến, thì các tủ đĩa all-flash này không phải là nơi thích hợp cho chúng.

Phân tầng lưu trữ có thể cho phép quản trị viên sắp xếp các dữ liệu VM không sử dụng vào các ổ đĩa chậm hơn. Tuy nhiên, việc phân chia tầng lưu trữ thường tốn kém và đòi hỏi các ổ đĩa có đủ tốc độ và dung lượng để cho phép nó hoạt động.

Nếu quản trị viên không đủ khả năng để triển khai phương pháp này, họ có thể phải sáng tạo với cách cấp phát ổ đĩa. Trước tiên, quản trị viên nên xem liệu họ có thể tách dữ liệu VM hay không. Tùy thuộc vào cấu hình của máy khách, nhiều ký tự ổ đĩa có thể cho phép nhiều file trên ổ cứng hơn. Điều này cho phép tách các file trên ổ đĩa theo cách thủ công, vì vậy quản trị viên có thể sử dụng các đĩa cứng chậm hơn hoặc cục bộ thay vì một tủ SAN đắt tiền.

Nếu quản trị viên không thể chia ổ đĩa hoặc nhóm nó thành các logical segment, các thách thức khác có thể phát sinh.

Tuy nhiên, quản trị viên phải thận trọng vì việc tách các máy ảo trên các máy khác nhau có thể gây ra sự cố nếu một vị trí đĩa bị lỗi mà không có đủ dự phòng. Việc phân tầng đĩa theo cách thủ công không dễ dàng và để hệ thống làm việc đó là tốt nhất, nếu có thể.

Nếu quản trị viên không thể chia ổ đĩa hoặc nhóm nó thành các logical segment, các thách thức khác có thể phát sinh. Hệ thống của VMware và Microsoft có thể hỗ trợ khối lượng lớn dữ liệu VM, nhưng đó không phải là tình huống lý tưởng cho quản trị viên.

Khi các máy chủ kích thước lớn này phát triển, quản trị viên thường thêm và cấu hình nhiều nhóm ổ đĩa hơn, nhưng những bổ sung này không phải lúc nào cũng cung cấp tốc độ ổ đĩa hoặc cấu hình I/O tương đương. Việc có các mức IOPS khác nhau cho các phần của cùng một disk volume có thể dẫn đến hiệu suất không thể đoán trước.

Quản trị viên có thể không chia tải được một volume lớn trên bộ điều khiển lưu trữ của SAN hoặc NAS. Điều này phụ thuộc vào các tính năng của tủ lưu trữ, nhưng tính năng cân bằng tải trong tủ lưu trữ tập trung vào dung lượng chứ không phải băng thông, vì vậy có thể làm quá tải bộ điều khiển hoặc front-end port.

Không có giải pháp hoàn hảo để giải quyết tình trạng quá tải lưu trữ vì không phải lúc nào cũng có thể thay đổi hoặc tách dữ liệu VM, nhưng quản trị viên nên cố gắng phân vùng bộ lưu trữ trước khi nó tiếp tục phát triển.

Dữ liệu VM đưa ra những thách thức về backup

Việc backup khối lượng dữ liệu lớn cũng có thể gây ra nhiều vấn đề. Về lý thuyết, các bản snapshot truyền thống giải quyết vấn đề này, nhưng nhật ký thay đổi delta trên một volume nhiều terabyte có thể nhanh chóng vượt quá tầm kiểm soát. Các công cụ backup kết hợp một số cấp độ chống trùng lặp dữ liệu (deduplication) là rất quan trọng để tránh nguy cơ các snapshot bị hỏng. Block-level deduplication được ưu tiên hơn, nhưng tối thiểu quản trị viên nên sử dụng file-level deduplication.

Các volume lớn thường quá lớn để thực hiện backup đầy đủ ngoài giờ vận hành, do đó, kết hợp deduplication và backup toàn phần là điều cần thiết. Những thách thức tương tự cũng có thể nảy sinh với các anti-virus truyền thống, không dựa trên hypervisor. Việc quét khối lượng lớn dữ liệu VM bằng các công cụ truyền thống có thể mất nhiều thời gian và có thể chiếm hết tài nguyên máy chủ.

Quản trị viên phải xem xét việc bảo vệ các loại volume này ở cấp hypervisor. Điều này có thể tốt hơn về hiệu suất và bảo mật, nhưng nếu quản trị viên không có kế hoạch cho nó, việc thêm một công cụ thực hiện điều này có thể gây tốn kém.

Các tác vụ truyền thống khác, chẳng hạn như Storage vMotion, gặp thách thức khi dữ liệu VM đạt đến phạm vi nhiều terabyte. Vấn đề này thậm chí có thể khó khăn hơn nếu bộ nhớ có các Logical Unit Number bổ sung không có cùng cấu hình I/O.

____
Bài viết liên quan

Góp ý / Liên hệ tác giả