CPU ARM ngày càng trở nên phổ biến hơn đối với các hệ thống điện toán hiệu năng cao (HPC) do tính hiệu quả, mật độ cao, khả năng mở rộng và còn mang đặc tính cloud-native để quản lý các thiết bị IoT.
Lĩnh vực Trung tâm Dữ liệu (DC) và HPC đã chứng kiến sự tăng trưởng đáng kể trong những năm qua và với sự bùng nổ của Big Data, nhu cầu về điện toán hiệu năng cao (HPC) hiệu quả hơn đã trở thành động lực lớn cho các nhà thiết kế máy tính. Các bộ xử lý ARM, được sử dụng trong hầu hết mọi chiếc smartphone trên thế giới và hiện đã trở thành một tùy chọn khả thi cho các giải pháp máy chủ. Ví dụ, Fugaku ở Nhật Bản, một trong những siêu máy tính nhanh nhất thế giới, chạy trên các bộ vi xử lý theo kiến trúc ARM.
Đã có nhiều sự quan tâm và chuyển đổi từ các bộ xử lý x86 truyền thống sang các bộ xử lý dựa trên ARM cho các workload nhất định. ARM, viết tắt của Advanced RISC Machine, là một loại kiến trúc vi xử lý được sử dụng rộng rãi trong các thiết bị di động và hiện đang có vai trò quan trọng trong DC và các hệ thống HPC.
Khu vực của các Trung tâm dữ liệu và HPC từ lâu đã bị thống trị bởi các CPU x86 của AMD và Intel. Tuy nhiên, các CPU ARM của Ampere đang khuấy động ngành công nghiệp và tạo ra làn sóng mới trong các Data Center, cũng như lĩnh vực HPC, với việc xuất hiện của nhiều nền tảng phát triển, các máy chủ cloud dựa trên kiến trúc ARM. Trong bài viết này, chúng ta sẽ tìm hiểu sâu hơn về CPU ARM và các tính năng giúp chúng phù hợp với HPC, cũng như lý do tại sao chúng lại có thể thay đổi cuộc chơi như vậy.
ARM là gì?
ARM là một loại kiến trúc vi xử lý được sử dụng rộng rãi trong các thiết bị di động, chẳng hạn như điện thoại thông minh và máy tính bảng, được biết đến với mức tiêu thụ điện năng thấp và thiết kế hiệu quả do Acorn phát triển lần đầu tiên vào năm 1994. Và ngày nay, công ty thiết kế chip Ampere đang giữ một chỗ đứng quan trọng trong lĩnh vực máy chủ ARM.
Một trong những điểm khác biệt chính giữa các CPU ARM của Ampere và CPU x86 truyền thống là kiến trúc của chúng. CPU ARM sử dụng kiến trúc Reduced Instruction Set Computing (RISC), trong khi CPU x86 sử dụng kiến trúc Complex Instruction Set Computing (CISC).
Điều này có nghĩa là các CPU ARM có thể thực hiện những tính toán nhanh hơn và hiệu quả hơn, vì chúng yêu cầu ít tập lệnh hơn để thực hiện một tác vụ nhất định. CPU ARM được biết đến với mức tiêu thụ điện năng thấp, khiến chúng trở thành một lựa chọn hấp dẫn cho các Trung tâm dữ liệu và HPC để khai thác trong bối cảnh chi phí và mức tiêu thụ năng lượng tăng đột biến.
ARM so với x86
Hiệu suất trên mỗi Watt
Tiêu thụ điện năng là một trong những yếu tố quan trọng trong DC và HPC. Các bộ xử lý ARM tiêu thụ ít điện năng hơn so với x86, khiến chúng tiết kiệm điện hơn. Với nhu cầu điện toán tiết kiệm năng lượng ngày càng tăng, các máy chủ dựa trên ARM đang trở thành giải pháp phù hợp cho các DC và HPC.
Các workload được phân bổ cho một số lượng lớn các core nhỏ hơn, hiệu quả hơn, thay vì ít core mạnh hơn. Do đó, các core của một bộ xử lý ARM có thể mang lại hiệu suất tốt hơn trên mỗi watt điện đối với các workload nhẹ. Các ứng dụng dựa trên đám mây yêu cầu hoạt động suốt ngày đêm như web hosting, quản lý cơ sở dữ liệu và điện toán biên được hưởng lợi từ bộ xử lý tiêu thụ điện năng thấp để có thể hoàn thành công việc.
Vấn đề nhiệt độ tốt hơn
So với các bộ vi xử lý x86, ARM được biết đến với hiệu quả năng lượng tốt hơn do sử dụng các tập lệnh đơn giản có thể được thực thi trong một clock cycle. “Reduced Instructions” trong RISC yêu cầu ít transistor hơn và cho phép pipelining giữa các bộ lệnh khác nhau giúp các bộ xử lý ARM tiết kiệm năng lượng cao đồng thời giảm thiểu sự sinh nhiệt, một tính năng quan trọng đối với các bộ xử lý ARM của thiết bị di động. Duy trì sự mát mẻ để ngăn chặn các vấn đề về hiệu suất, những thuộc tính chứng tỏ có lợi cho các bộ xử lý máy chủ ARM, vì tản nhiệt hiệu quả có thể tăng hiệu suất và độ ổn định.
Điện toán mật độ cao, Cloud-native
Ampere đã đặt các bộ vi xử lý Altra và Altra Max của mình ở vị trí hướng tới các nhà cung cấp dịch vụ cloud siêu quy mô, cung cấp tới 128 core. Các nhà cung cấp này có khả năng phát triển phần mềm – mở rộng hiệu quả với số lượng core thay vì hiệu suất của từng core. Chiến lược này giới hạn cơ sở khách hàng tiềm năng cho các giải pháp dựa trên ARM nhưng khi Trung tâm dữ liệu phát triển và mức độ phổ biến của cloud tăng lên, chúng ta sẽ thấy sự gia tăng trong việc áp dụng.
Ampere hiện đang đưa các CPU Altra và Altra Max của mình ra thị trường với mức giá thấp hơn cho mỗi core. Bằng chủ ý nhắm vào không gian Điện toán đám mây (cloud computing) với số lượng core khổng lồ và hiệu quả cao để cung cấp lượng điện toán tối đa cho hầu hết số lượng vCPU (virtual-CPU), Ampere có thể tận dụng một thị trường hoàn toàn mới – chạy các workload của họ ở mức điện năng thấp hơn cho một tổng chi phí thậm chí còn thấp hơn.
Những thách thức đối với việc ứng dụng kiến trúc ARM
Mặc dù các bộ xử lý máy tính dựa trên ARM đang được áp dụng bởi các DC, nhưng đây vẫn là một kiến trúc khá non trẻ, chưa thách thức được thị trường phổ thông mà Intel và AMD đang nắm giữ. Ampere hiện nhắm mục tiêu đến các ứng dụng và trường hợp sử dụng ít phức tạp hơn. Databases, media encoding, web services, networking, cloud mobile gaming và inferencing – yêu cầu bộ xử lý riêng và mật độ cũng như hiệu quả năng lượng mà ARM cung cấp để đáp ứng các khối lượng công việc nhẹ này.
Để thực sự chứng kiến những tiến bộ hơn nữa của ARM nhằm tăng tốc các workload phức tạp hơn như Scientific Computing và đào tạo AI, chúng ta vẫn cần hướng tới các nhà phát triển để hỗ trợ bộ tập lệnh ARM và bổ sung các bộ tăng tốc như AVX-512. Hiệu quả năng lượng của nó có thể cách mạng hóa HPC để được xử lý theo hướng cloud-native.
Một trong những thách thức lớn nhất khi áp dụng các bộ xử lý dựa trên ARM là khả năng tương thích phần mềm. Hầu hết các ứng dụng được thiết kế để chạy trên các bộ xử lý x86, nghĩa là chúng cần được biên dịch lại để chạy trên ARM. Điều này có thể mất thời gian và tốn kém, đặc biệt là đối với các công ty có số lượng lớn các ứng dụng.
Tương lai của ARM
Nhiều công nghệ cầm tay hiện đại được hỗ trợ bởi các bộ vi xử lý ARM. Hiệu quả năng lượng của nó giúp cung cấp năng lượng cho một số tác vụ smartphone phức tạp nhất cho đến nay cho thấy tiềm năng của nó trong việc thúc đẩy các workload của Trung tâm dữ liệu. Chúng ta có thể thấy các chip M1 và M2 dựa trên ARM của Apple có ít sự cạnh tranh về hiệu năng trên thị trường laptop tiêu dùng. Các thiết bị IoT như xe tự hành và rô-bốt đều được xây dựng trên RISC và ARM.
Việc hướng tới hiệu quả cao hơn và tiêu thụ điện năng thấp hơn cho các DC nhẹ hơn và các tác vụ dựa trên cloud – có thể dự trữ điện toán thô mà các máy chủ x86 có cho các khối lượng công việc nặng và phức tạp hơn. Microsoft Azure, Amazon AWS và Google đã chuyển sang sử dụng các bộ xử lý dựa trên ARM trong điện toán cloud-native của họ.
Khi các nhà cung cấp cloud tìm cách tăng hiệu quả sử dụng năng lượng cho các DC của họ, các bộ xử lý ARM có thể sẽ trở thành một lựa chọn ngày càng phổ biến để hỗ trợ cho các cloud instance. Các công ty khởi nghiệp có thể tận dụng chi phí thấp hơn để vận hành các hệ thống này cho những cải tiến mới và thú vị trong thế giới kết nối.
Bài viết liên quan
- Các chuyên gia AI của NVIDIA dự báo gì cho năm 2025
- Top các xu hướng trung tâm dữ liệu trong năm 2025
- Hyperscale computing: Làm cách nào để đạt được năng lực điện toán quy mô lớn tốt hơn
- Máy chủ tăng tốc cho AI thúc đẩy tăng trưởng chi tiêu cho trung tâm dữ liệu
- Cách quản lý hiệu quả phần cứng của bạn trong các trung tâm dữ liệu co-location
- Cluster Computing – Thế nào là điện toán cụm?