Các nhà quản lý DC cần chuẩn bị gì cho sự bùng nổ của AI và ML?

Các công nghệ mới đang đặt ra nhu cầu mới cho các trung tâm dữ liệu (DC). Nhưng với việc trang bị các hệ thống phù hợp, chúng cũng sẽ mang đến những cơ hội đáng chú ý.

Sự bùng nổ của trí tuệ nhân tạohọc máy (ML) trong nhận thức cộng đồng đã mang lại sự tập trung mới vào tiềm năng của những công nghệ đầy hứa hẹn này. Những tiến bộ trong việc phát triển các mô hình ngôn ngữ lớn đã giúp công chúng dễ dàng tiếp cận công nghệ AI hơn thông qua các chatbot như ChatGPT và các công cụ tạo hình ảnh như DALL-E 3. Nhưng các công nghệ tiêu dùng chỉ mới khai phá được tiềm năng bề mặt của AI – những công nghệ này đang được các doanh nghiệp khai thác để hỗ trợ quản lý chuỗi cung ứng, phân tích tài chính, tiếp thị, tìm kiếm, sáng tạo hình ảnh, v.v.

Ngành công nghiệp AI dự kiến ​​sẽ tăng trưởng đáng kể trong thập kỷ tới và đạt gần 2 nghìn tỷ USD vào năm 2030. Khi nó tiếp tục được cải thiện và các chính phủ trở nên thoải mái hơn với việc triển khai chúng, các ngành như y tế, viễn thông, năng lượng và tiện ích công sẽ mở rộng quy mô sử dụng AI để thúc đẩy các hoạt động kinh doanh hợp lý hơn và mang lại kết quả tốt hơn cho khách hàng của họ.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

Công nghệ mới, nhu cầu trung tâm dữ liệu mới

Khách hàng có thể đã quen với các giao diện được sắp xếp hợp lý của các ứng dụng AI và ML, nhưng những người quản lý DC hiểu rằng lượng dữ liệu cực lớn phải được xử lý ở phía sau để biến những trải nghiệm này thành hiện thực. Điều này đòi hỏi các chip hiệu suất cao hàng đầu trong phát triển CNTT.

Các con chip mạnh mẽ hỗ trợ cho AI yêu cầu việc quản lý điện năng chính xác và quan trọng là khả năng làm mát. Nhiệt lượng tỏa ra từ các ứng dụng tiên tiến đòi hỏi các nhà quản lý DC phải thích ứng với tải nhiệt cao trong khi vẫn duy trì khả năng mở rộng quy mô hoạt động để đáp ứng nhu cầu. Để làm phức tạp thêm vấn đề, việc tăng diện tích vật lý có thể không phải lúc nào cũng là một lựa chọn – các nhà quản lý và kỹ sư hệ thống DC thường cần giải quyết thách thức kỹ thuật trong việc lắp thêm sức mạnh điện toán vào cùng một không gian. Ngoài ra, khách hàng từ mọi ngành nghề sẽ luôn yêu cầu uptime 24/7, do đó, các nhu cầu của ứng dụng AI cần được đáp ứng mà không phải chỉnh sửa hoặc tái cấu trúc hoàn toàn kiến ​​trúc trung tâm dữ liệu.

Phương pháp làm mát phải thay đổi

Đối với các hệ thống nhắm đến hỗ trợ hạ tầng AI và các chip xử lý hiệu năng cao thế hệ mới, các phương pháp làm mát truyền thống sẽ là không đủ. Các DC đang cố gắng quản lý lượng nhiệt ngày càng tăng bằng phương pháp làm mát không khí tốc độ cao sẽ nhanh chóng trở thành một môi trường giống như đường hầm gió, khó làm việc và vận hành tốn kém. Ngoài ra, khi hệ thống làm mát không khí hoạt động thêm giờ để duy trì nhiệt độ vận hành cần thiết, điều đó sẽ khiến các cơ sở có nguy cơ hỏng hóc thiết bị, ngừng hoạt động ngoài kế hoạch và chi phí điện năng cao. Làm mát bằng chất lỏng (Liquid Cooling) cung cấp giải pháp tốt hơn cho nhiều trung tâm dữ liệu.

Cho dù đó là giải pháp làm mát bằng chất lỏng hoàn chỉnh hay giải pháp kết hợp, việc đưa làm mát bằng chất lỏng vào kiến ​​trúc DC có thể mang lại hiệu suất tốt hơn, đồng thời tiết kiệm năng lượng. Tuy nhiên, đối với các DC đang được thiết kế hoặc chuyển đổi lại để phù hợp với các ứng dụng công nghệ cao nhất, làm mát bằng chất lỏng và trực tiếp đến chip (direct-to-chip) thường là lựa chọn khả thi duy nhất.

Hệ thống làm mát bằng chất lỏng có thể giúp các DC tăng công suất trong khi vẫn duy trì việc sử dụng không gian và năng lượng hiệu quả. Họ cũng có thể giảm tổng chi phí sở hữu các hệ thống DC. Hệ thống làm mát bằng chất lỏng cung cấp giải pháp hiệu quả để đạt được các thông số nhiệt độ cần thiết của công nghệ thế hệ tiếp theo vì chất lỏng mang lại khả năng truyền nhiệt lớn hơn nhiều so với không khí. Điều này làm tăng hiệu quả sử dụng năng lượng – phép đo mức độ hiệu quả của các DC trong việc sử dụng năng lượng cơ sở cho các máy tính thay vì các hệ thống phụ trợ.

Giải pháp ở quy mô lớn

Có một số lựa chọn dành riêng cho các DC không thể triển khai kiến ​​trúc làm mát toàn bộ bằng chất lỏng. Các DC này có thể triển khai hệ thống làm mát đơn trên từng rack hoặc một cụm rack nơi chạy các ứng dụng AI và học máy. Tức là chúng không cần triển khai làm mát bằng chất lỏng quy mô toàn DC.

Khi triển khai các giải pháp theo điểm nóng này, nhà quản lý DC cần hiểu các kế hoạch kinh doanh trong tương lai. Sử dụng các giải pháp làm mát chuyên dụng để giải quyết một vấn đề riêng lẻ là một phương pháp khả thi, nhưng do chi phí, hiệu quả sử dụng năng lượng và các yếu tố khác, giải pháp cho một vấn đề có thể không phải là giải pháp tối ưu. Như tất cả các nhà quản lý DC đều hiểu, những thách thức khác nhau đòi hỏi các giải pháp khác nhau và cách tiếp cận “one-size-fits-all” hiếm khi thành công. Điều này cho thấy rằng, việc lập kế hoạch cho các trung tâm dữ liệu thế hệ tiếp theo là rất quan trọng. Chúng có thể được làm mát hoàn toàn bằng chất lỏng (Fully Liquid-Cooled), hoặc sử dụng các giải pháp kết hợp để đưa làm mát bằng chất lỏng đến từng rack và từng chip, ngay trong bên trong hạ tầng làm mát bằng không khí.

Ngoài ra, nhiều trung tâm dữ liệu đang chuẩn bị các tủ rack máy chủ cho hệ thống làm mát thế mới bằng cách lắp đặt các giá đỡ máy chủ có ống góp và những cân nhắc bổ sung về đường ống cần thiết cho việc làm mát bằng chất lỏng về sau. Điều này cho phép các trung tâm dữ liệu dễ dàng chuyển đổi sang làm mát bằng chất lỏng khi nó xuất hiện vì hạ tầng rack của họ đã tương thích.

Ưu điểm lớn nhất mà việc lập kế hoạch cho tương lai và hiểu rõ tải xử lý CNTT sẽ mang lại là nhận ra rằng hầu hết tất cả các giải pháp làm mát khả thi đều có thể được xây dựng kết hợp, cho phép các nhà quản lý DC điều chỉnh công suất và khả năng làm mát của họ phù hợp với nhu cầu thay đổi. Chìa khóa cho sự tăng trưởng bền vững là có nhiều lựa chọn linh hoạt để hỗ trợ các thiết bị thế hệ mới. Công nghệ làm mát bằng chất lỏng giúp thúc đẩy sự linh hoạt đó.

Những cân nhắc khác về hạ tầng

Ngoài khả năng làm mát, còn có những thành phần trong hạ tầng trung tâm dữ liệu khác rất quan trọng cho việc triển khai công nghệ AI và ML. Ví dụ: khả năng giám sát và điều khiển từ xa của các thiết bị phân phối điện thông minh (PDU) có thể tăng hiệu quả sử dụng điện năng, đồng thời giảm nguy cơ xảy ra downtime.

Việc phát hiện rò rỉ cũng rất quan trọng. Ở cấp độ cơ sở, có rất nhiều cách để chất lỏng có thể xâm nhập vào trung tâm dữ liệu. Đường ống nước của cơ sở, nếu không được bảo vệ đúng cách, có thể đóng băng và vỡ. Máy phát điện dự phòng có thể rò rỉ nhiên liệu. Trong một số trường hợp, đường làm mát bằng chất lỏng có thể bị hỏng. Công nghệ phát hiện rò rỉ giúp nhà quản lý DC xác định từ xa nguồn rò rỉ  một cách chính xác và tắt thiết bị để chống hỏng hóc. Việc giám sát và điều khiển thiết bị từ xa này rất quan trọng đối với các sự cố khẩn cấp này cũng như để theo dõi hiệu quả hàng ngày và hoạt động trơn tru của cả DC.

Sự phát triển nhanh chóng của AI, ML và điện toán hiệu năng cao (HPC) đang mang đến nhiều thách thức mới cho các nhà quản lý trung tâm dữ liệu, nhưng với các giải pháp và hệ thống hỗ trợ phù hợp, nó cũng sẽ mở ra những cơ hội tiềm năng. Với các công nghệ làm mát và quản lý năng lượng được thiết kế chu đáo, các nhà quản lý DC, cũng như người tiêu dùng, đều hoàn toàn có thể hưởng lợi từ công nghệ thú vị này.

DCK

____
Bài viết liên quan

Góp ý / Liên hệ tác giả