Cùng tìm hiểu sự khác biệt quan trọng về dung lượng, hiệu suất và độ tin cậy giữa các công nghệ lưu trữ đa lớp multi-layer SSD / flash storage khi trang bị ổ cứng SSD vào hệ thống của của bạn.
Các ổ cứng SSD, hay còn gọi là NAND flash, hiện vẫn đang là một chủ đề nóng đối với các chuyên gia CNTT. Chúng được trang bị trong các flash-array, thiết bị NAS, ổ cứng chuẩn 2.5in truyền thống và PCIe memory card. Flash SSD đã nhanh chóng trở thành nhân tố quan trọng để bàn luận trong việc nâng cấp dung lượng lưu trữ, nhưng việc đưa ra các quyết định mua sắm có thể gặp khó khăn nếu chưa hiểu hết các công nghệ bên trong.
Có những lý do rất thuyết phục cho việc các ổ SSD flash giữa các công nghệ như Single-level Cell (SLC), Multi-level Cell (MLC), Trible-level Cell (TLC), Quad-level Cell (QLC) và thậm chí là PLC (penta-level cell), bao gồm vấn đề hiệu suất, hiệu quả sử dụng điện, tính khả dụng và độ tin cậy.
Có một điểm bất lợi ở ổ SSD flash là chúng vẫn còn đắt hơn ổ cứng HDD khi được tính trên cơ sở giá tiền trên mỗi gigabyte. Chúng thường sẽ không đắt nếu được đo lường dưới dạng thông lượng như USD/1GB throughput hoặc USD/IOPS. Nhưng dung lượng vẫn là tiêu chí, là “cây đinh” chủ chốt trong lĩnh vực lưu trữ CNTT. Việc sản sinh và thu thập dữ liệu đang trên đường cong gia tăng theo cấp số nhân, từ IoT, 5G và AI-machine learning. Năng lực lực lưu trữ là một tiêu chí chính.
Chi phí so với công suất
Câu trả lời của ngành lưu trữ flash cho các vấn đề về chi phí và dung lượng của SSD flash đã đi theo hai hướng mà không loại trừ lẫn nhau. Đầu tiên là thêm số bit trên mỗi cell, hay còn gọi là ô nhớ. Mỗi ô chấp nhận một số bit nhất định. Mỗi bit được đăng ký là 1 hoặc 0. Mỗi bit được thêm vào ô sẽ làm tăng dung lượng ô theo cấp số nhân bằng cách tăng số trạng thái mà một ô có thể có 2n trong đó “n” là số bit trong một ô. SLC là 21 hoặc 2 trạng thái; MLC là 22 hoặc 4 trạng thái; TLC là 23 hoặc 8 trạng thái; QLC là 24 hoặc 16 trạng thái; và PLC là 25 hoặc 32 trạng thái. Cùng một kích thước tấm wafer tạo ra mật độ gấp đôi so với bits/cell trước đây. Điều đó làm tăng dung lượng trong khi giảm chi phí cho mỗi gigabyte.
Con đường tăng dung lượng thứ hai là chuyển từ công nghệ phẳng hay 2D sang 3D. Công nghệ 3D cho phép các ô NAND được xếp thành từng lớp. Phải mất một thời gian để các nhà sản xuất NAND thành thạo việc phân lớp 3D; giờ đây họ có thể cung cấp chip 3D NAND Flash thường có 96 lớp trở lên. Công nghệ 3D giúp tăng đáng kể dung lượng SSD flash trong khi lại giảm chi phí cho mỗi GB. Điều quan trọng cần lưu ý là hiện tại vẫn chưa có chip 3D SLC.
Nhiều bit hơn trên mỗi ô và nhiều lớp hơn trên mỗi chip giúp tăng dung lượng flash SSD đồng thời giảm chi phí trên mỗi GB. Tin tốt là mật độ dung lượng flash SSD đã được cải thiện rất nhanh chóng. Tin xấu là không có gì là “dễ ăn” cả và cần có sự đánh đổi đáng kể với những công nghệ này.
Đánh đổi giữa lỗi dữ liệu và hiệu suất
Nhiều bit hơn trên mỗi ô ảnh hưởng tiêu cực đáng kể đến lỗi đọc ghi dữ liệu, hiệu suất, độ bền và độ tin cậy. Mỗi bit bổ sung trên mỗi ô sẽ mất nhiều thời gian hơn để ghi và đọc từ một ô. Nó đòi hỏi nhiều điện áp hơn để tạo và phân biệt các trạng thái trong tế bào. Điều này là do giá trị trạng thái bổ sung làm cho việc xác định giá trị dương khó khăn hơn. Ngoài ra, nhiệt độ cao hơn gây ra rò rỉ điện tử nhiều hơn trong các cell vì độ nhạy cao hơn cần thiết để phân biệt các trạng thái. Kết quả là phạm vi nhiệt độ hoạt động hẹp hơn khi bit trên mỗi ô tăng lên. Điều này dẫn đến tỷ lệ lỗi cao hơn nhiều, hay còn gọi là hỏng dữ liệu.
Hiệu quả thực sự là bộ điều khiển flash phải tích hợp được công nghệ khắc phục lỗi toàn diện với mỗi bit bổ sung. Khi số lượt yêu cầu sửa lỗi tăng lên, và vì vậy, thời gian cần thiết để thực hiện sửa dữ liệu với mỗi bit sẽ được cộng vào. Đây là lý do chính khiến độ trễ tăng lên và IOPS giảm khi số bit trên mỗi ô tăng lên. Công nghệ 3D-layering tăng IOPS trên mỗi chip flash nhưng không ảnh hưởng đến độ trễ.
Hiệu suất của Flash SSD bị ảnh hưởng chung hơn là chỉ do các cell NAND flash. Dynamic RAM (DRAM) hoặc persistent memory cache trong ổ cứng có ảnh hưởng rất lớn đến hiệu suất của SSD. Tính năng dự phòng quá mức (overprovisioning) của Flash SSD cũng có ảnh hưởng lớn đến hiệu suất.
Chi tiết hơn về bộ nhớ flash NAND
NAND flash là một công nghệ bộ nhớ phá hủy(destructive). Mỗi khi một ô nhớ bị ghi đè, trước tiên nó phải được xóa. Flash NAND không phải là một công nghệ từ tính. Việc xóa nó đòi hỏi một lớp nền bộ nhớ được phá hủy. Việc đọc không gây ra bất kỳ hao mòn ô nhớ nào. Do đó, nguyên tắc chung cho flash NAND là ghi thì tốn kém nhưng đọc thì miễn phí. Việc ghi có thể mất nhiều thời gian nếu phải đợi quá trình tẩy xóa xảy ra. Dự phòng thừa (Overprovisioning) có nghĩa là có một nhóm các ô mới hoặc đã bị xóa trước đó đang chờ ghi mới, do đó, thao tác ghi không cần phải đợi. SSD flash liên tục theo dõi các “erase block” của chương trình. Khi dữ liệu trên một erase block hết tuổi vì các phiên bản mới hơn của dữ liệu đó đã được ghi vào các erase block khác, bộ điều khiển flash SSD sẽ thực hiện thu dọn rác.
Giao diện flash SSD cũng có ảnh hưởng đến hiệu suất. NVMe là một giao diện nhanh hơn nhiều so với SATA hoặc SAS. Giao diện và kiến trúc lưu trữ được chia sẻ cũng có ảnh hưởng rất lớn đến hiệu suất. Kiến trúc với DRAM, bộ nhớ lớp lưu trữ hoặc SLC caching hoặc công nghệ phân tầng lưu trữ sẽ cải thiện vấn đề hiệu suất. Kết nối mạng lưu trữ cũng ảnh hưởng đến hiệu suất. NVMe-oF trên Ethernet, Fibre Channel, Infiniband hoặc TCP/IP cũng sẽ cải thiện hiệu suất. Nó không chỉ đơn thuần về công nghệ SSD flash.
Đánh đổi ở độ bền và độ tin cậy
Mỗi bit được thêm vào các ô NAND flash làm giảm độ bền theo một thứ tự lớn dần hoặc 10 lần. Độ bền của ô Flash NAND được đo bằng số lần ghi trước khi tế bào bị mòn. SLC được đánh giá ở mức xấp xỉ 100.000 chu kỳ ghi trên mỗi ô. MLC được đánh giá ở khoảng 10.000 chu kỳ ghi. TLC được đánh giá ở khoảng 1.000 chu kỳ ghi. QLC được đánh giá ở khoảng 100 chu kỳ ghi. Và PLC được đánh giá là có khoảng 10 chu kỳ ghi.
Độ bền của cell và độ bền chung của cả ổ cứng flash SSD không giống nhau. Hai yếu tố chính ảnh hưởng đến độ bền của flash SSD là hiệu quả của thuật toán cân bằng độ mòn của bộ điều khiển flash và tổng lượng NAND flash trong SSD. Dung lượng flash được xếp hạng theo SSD không phản ánh tổng dung lượng flash trong SSD. Có một dung lượng dự phòng của flash NAND đáng kể trong SSD. Việc dự phòng thừa đó được sử dụng để thay thế cho các ô nhớ đã bị mòn. Số lượng dự phòng thừa của các flash SSD là khác nhau. Nói chung, khi số bit trên mỗi ô tăng lên, thì việc dự phòng thừa của flash SSD cũng vậy. Dung lượng lớn hơn tương đương với nhiều tế bào hơn ở mức độ hao mòn, giúp tăng độ bền của SSD.
Độ bền của Flash SSD thường được đánh giá ở mức terabytes written (TBW). Nó cũng được đánh giá theo số lần ghi ổ cứng mỗi ngày (drive writes per day, DWPD). DWPD dịch thành TBW. Các nhà cung cấp bảo hành ổ cứng của họ theo DWPD hoặc TBW. Tóm lại, đó là lượng dữ liệu có thể được ghi vào SSD flash trước khi nó cạn kiệt. Ví dụ: ổ đĩa 3D TLC 1 TB được xếp hạng và bảo hành ở mức .66 DWPD sẽ có định mức xấp xỉ 1.200 TBW. Như thế là có rất nhiều lần ghi trong khoảng thời gian đó.
Nhưng nếu ổ 1 TB là 3D QLC thì sao? Nó sẽ có giá thấp hơn nhiều, nhưng nó có khả năng có DWPD và TBW thấp hơn nhiều ở mức khoảng 10% hoặc 120 TBW. Con số đó có thể tăng lên nếu lượng dự phòng cũng tăng lên.
SLC, MLC, TLC, QLC và PLC: Cách chọn loại công nghệ lưu trữ SSD phù hợp với nhu cầu của bạn
Lựa chọn ổ lưu trữ NAND flash phù hợp phụ thuộc vào dung lượng, chi phí, hiệu suất, mức lỗi và độ bền.
SSD flash PLC thường có chi phí thấp nhất cho mỗi gigabyte nhưng có những hạn chế nghiêm trọng về độ bền. Hiệu suất sẽ tốt hơn bất kỳ ổ cứng HDD nào và thấp hơn đáng kể so với bất kỳ loại SSD flash nào khác. Nó rõ ràng là nhằm mục đích lưu trữ các loại dữ liệu không thay đổi nhiều, nếu có: dữ liệu lưu giữ, cold data và thậm chí cool data. Các SSD flash PLC có cùng hạng với một số công nghệ write-once-read-many khác.
Nếu một ứng dụng cần hiệu suất tốt nhất có thể, SSD flash SLC là sự lựa chọn. Tuy nhiên, loại thiết bị lưu trữ sử dụng SLC lại quan trọng. Một mảng lưu trữ sử dụng SSD flash SLC làm bộ nhớ đệm hoặc làm phương tiện lưu trữ chính của nó sẽ không nhanh hơn đáng kể so với mảng lưu trữ sử dụng SSD MLC hoặc TLC. Điều này là do tắc nghẽn độ trễ trong đường truyền dữ liệu của SSD, bao gồm bộ điều khiển SATA hoặc NVMe, bộ điều khiển hệ thống lưu trữ, mạng lưu trữ hoặc liệu hệ thống có phải là NVMe-oF giữa application server và storage server, và bus dữ liệu của application server. Sự khác biệt về hiệu suất trong kịch bản SSD SLC so với MLC này sẽ rất khó để chứng minh về mặt tài chính. Ngược lại, một SLC PCIe card trong một máy chủ application hoặc một thiết bị lưu trữ dữ liệu dựa trên SLC gắn liền với mạng, thể hiện hiệu suất rất lớn lợi thế hơn các sản phẩm MLC tương đương. Ví dụ về SLC này giải thích hơn.
Việc quyết định loại công nghệ lưu trữ flash nào – cũng như thiết bị nào – sẽ sử dụng đòi hỏi phải cân nhắc sự đánh đổi. Hiệu suất phụ có cần thiết không? Dung lượng có quan trọng hơn không? Chi phí đóng vai trò gì trong quyết định đó? Điều gì về phần mềm có thể sử dụng hiệu quả công nghệ flash? Nó có tiêu tốn nhiều chu kỳ CPU ứng dụng hơn không? Lưu ý rằng flash NVMe card đánh đổi hiệu suất cao hơn với mức tiêu thụ tài nguyên CPU cao hơn tới 20%.
Dưới đây là một số quy tắc chung về SSD, nhưng hãy nhớ rằng những quy tắc này không phải lúc nào cũng áp dụng.
- Khi hiệu suất tăng tốc ứng dụng phải cao nhất có thể – với độ trễ thấp nhất có thể – và giá cả không phải là một yếu tố quan trọng, thì ổ SSD flash NVMe SLC là một câu trả lời rất tốt. Chúng không phải là câu trả lời duy nhất, như cách đây chỉ vài năm. Ổ cứng dạng storage class memory của 3D Xpoint nhanh hơn tới bốn lần với chi phí gấp 10 lần. Các mô-đun bộ nhớ liên tục của data center chạy ở chế độ trực tiếp ứng dụng nhanh hơn 10 lần với chi phí gấp 10 lần.
- Khi tăng tốc ứng dụng là quan trọng, nhưng chi phí là một vấn đề, MLC, TLC và ở mức độ thấp hơn, QLC, là những lựa chọn thay thế khả thi.
- Khi yêu cầu phải có một hệ thống lưu trữ chia sẻ hiệu suất cao, thì kiến trúc hệ thống lưu trữ quan trọng hơn là chỉ về mặt phương tiện SSD flash. Kết nối NVMe-oF trên Ethernet, Fibre Channel, Infiniband hoặc TCP / IP; cách dữ liệu được lưu vào bộ nhớ đệm hoặc phân cấp là những vấn đề lớn hơn. SLC, MLC, TLC, QLC và PLC đều khả thi. Một số hệ thống lưu trữ trên thị trường, chẳng hạn như hệ thống của VAST, đã chứng minh điều này với QLC.
- Khi chi phí cho mỗi gigabyte là tối quan trọng, thì hiệu suất cũng quan trọng, nhưng không quan trọng bằng và độ bền ghi không phải là yếu tố lớn – do vấn đề caching và writing – MLC, TLC (và cả QLC) có thể là lựa chọn phù hợp.