Bắt tay vào hành trình Generative AI (GenAI), sự kết hợp mang tính đột phá giữa Trí tuệ nhân tạo và dữ liệu phi cấu trúc (unstructured data) đòi hỏi một kiến trúc lưu trữ mạnh mẽ có khả năng điều hướng sự phức tạp và mở rộng quy mô đi cùng với sự đổi mới. Trong bài này hãy cùng tìm hiểu về PowerScale, một hệ thống lưu trữ được đánh giá là đáng tin cậy, dẫn đầu thị trường, được thiết kế để chuẩn hóa các môi trường IT và thúc đẩy việc phân phối mô hình GenAI với tốc độ, sự đơn giản và tính hiệu quả về chi phí chưa từng có.
Kiến trúc hệ thống của PowerScale
Trái tim của PowerScale là nền tảng kiến trúc do AI tạo ra, được hỗ trợ bởi phần mềm OneFS, được thiết kế để quản lý dữ liệu phi cấu trúc trong những môi trường phân tán. Hãy đi sâu vào ba lớp nền tảng.
Lớp Client Access. Thành phần quan trọng này của hệ thống tệp mạng đảm bảo quyền truy cập liền mạch vào dữ liệu phi cấu trúc từ nhiều máy khách và tác vụ khác nhau. Tự hào với khả năng kết nối ethernet tốc độ cao và hỗ trợ nhiều giao thức như Network File System (NFS), Server Message Block (SMB) và Hadoop Distributed File System (HDFS), lớp Client Access đơn giản hóa và thống nhất quyền truy cập tệp trên các tác vụ khác nhau. Nó bao gồm các công nghệ tiên tiến như NVIDIA GPUDirect Storage và Remote Direct Memory Access (RDMA), tạo điều kiện để truyền dữ liệu trực tiếp giữa bộ nhớ GPU và thiết bị lưu trữ cho các ứng dụng GenAI. Chính sách cân bằng tải thông minh tối ưu hóa hiệu suất và tính khả dụng, trong khi các biện pháp kiểm soát multi-tenancy đảm bảo tính bảo mật và mức độ dịch vụ phù hợp.
Lớp OneFS File Presentation. Thống nhất quyền truy cập dữ liệu trên toàn cụm (cluster), lớp này giúp loại bỏ rắc rối lo lắng về vị trí dữ liệu vật lý. OneFS tích hợp liền mạch khả năng quản lý volume, bảo vệ dữ liệu và phân tầng (tiering), đơn giản hóa việc quản lý các volume dữ liệu lớn trên nhiều loại lưu trữ khác nhau. Với tính sẵn sàng cao và hoạt động không gián đoạn, nó cho phép người dùng nâng cấp, mở rộng và di chuyển dễ dàng, đảm bảo hệ thống tệp thông minh và hiệu quả thích ứng với các nhu cầu đa dạng.
Lớp PowerScale Compute và Storage Cluster. Đóng vai trò là xương sống, lớp này cung cấp các node và các thành phần mạng trong node, cho phép các cụm tệp có khả năng mở rộng và có tính sẵn sàng cao. Từ các cụm nhỏ, chi phí hợp lý – xử lý tác vụ tính toán cơ bản cho đến các cấu hình mở rộng chứa dữ liệu ở quy mô petabyte, PowerScale dễ dàng mở rộng quy mô và tự động cân bằng các cụm mà không phải chịu gánh nặng quản trị. Được thiết kế để quản lý vòng đời dễ dàng, các node hỗ trợ nâng cấp, di chuyển và làm mới công nghệ mà không làm gián đoạn hoạt động của cụm.
Các lớp này tạo thành nền tảng cho việc triển khai GenAI, hỗ trợ việc nhập, xử lý và phân tích dữ liệu hiệu suất cao theo cách thức linh hoạt và “always-on”.
Khả năng cốt lõi của PowerScale
Được tăng cường nhờ những cải tiến mới nhất trong công nghệ PowerScale all-flash và phần mềm OneFS, các nhà phát triển có thể đẩy nhanh vòng đời AI từ chuẩn bị dữ liệu đến suy luận mô hình. Thúc đẩy bởi các máy chủ Dell PowerEdge, PowerScale mang lại hiệu suất nâng cao, tăng tốc độ đọc và ghi trực tuyến cho các mô hình AI tiên tiến. Những khả năng cốt lõi này, kết hợp với các node hiệu suất cao và mật độ cao, mở đường cho các quyết định dựa trên dữ liệu thông minh với tốc độ và độ chính xác tuyệt vời.
GPUDirect cho hiệu suất cực cao. Tận dụng lưu trữ GPUDirect, PowerScale thiết lập một đường dẫn trực tiếp giữa bộ nhớ GPU và bộ lưu trữ, giảm độ trễ và tăng băng thông. Hỗ trợ các máy chủ có GPUDirect và NFS over RDMA, nó tăng cường thông lượng và giảm mức sử dụng CPU, mang lại cải thiện băng thông và thông lượng lên tới 8 lần.
Client driver cho hỗ trợ Ethernet thông lượng cao. Nâng cao hiệu suất của máy khách NFS qua mạng Ethernet tốc độ cao, driver máy khách tùy chọn cho phép tận dụng đồng thời nhiều kết nối TCP đến các node PowerScale khác nhau. Kiến trúc phân tán này đạt được thông lượng cao hơn cho các hoạt động I/O, cải thiện hiệu suất mount NFS đơn lẻ và cân bằng lưu lượng mạng để ngăn ngừa tắc nghẽn.
Scale-out để tăng giảm quy mô. Được thiết kế để có khả năng mở rộng liền mạch, PowerScale đáp ứng nhu cầu GenAI ngày càng phát triển, từ các cụm nhỏ đến môi trường nhiều petabyte. Với việc bổ sung và nâng cấp node dễ dàng, PowerScale đảm bảo hiệu suất nhất quán và có thể dự đoán được, ngay cả trên các loại node và cấu hình khác nhau.
Tính linh hoạt để hỗ trợ các tầng lưu trữ. Cung cấp các node All-Flash, Hybrid và Archive, PowerScale đáp ứng nhu cầu và ngân sách lưu trữ đa dạng. Chính sách cân bằng tải thông minh tối ưu hóa việc sử dụng tài nguyên, đồng thời in-line data reduction – giúp giảm chi phí lưu trữ hiệu quả bằng cách loại bỏ dữ liệu trùng lặp hoặc dư thừa.
Bắt đầu với GenAI ngay hôm nay
Trong lĩnh vực GenAI, việc lựa chọn kiến trúc là điều tối quan trọng. PowerScale nổi lên như một giải pháp tối ưu, đẩy nhanh hành trình AI và mang lại kết quả tốt hơn. Với những khả năng mạnh mẽ, bao gồm giao tiếp GPU trực tiếp, xử lý dữ liệu tốc độ cao và khả năng mở rộng liền mạch, PowerScale mở đường cho những đổi mới đối với quy trình làm việc GenAI.
Dell Technologies
Bài viết liên quan
- LLM: Lịch sử và tương lai của các mô hình ngôn ngữ lớn
- Hướng đến tương lai: Generative AI dành cho các giám đốc điều hành
- HPE và NVIDIA công bố ‘NVIDIA AI Computing by HPE’ để thúc đẩy cuộc cách mạng AI tạo sinh
- Giải mã hiệu suất AI trên PC và Workstation RTX AI
- NVIDIA bắt đầu chứng nhận cho các loại hệ thống mới sẵn sàng cho Generative AI
- Làm cách nào lựa chọn GPU phù hợp cho các công cụ AI tạo sinh?