Bộ vi xử lý AMD EPYC Genoa-X và Bergamo – Hiệu suất tốt nhất trong phân khúc

AMD EPYC Genoa-X

Vừa được công bố hôm nay, AMD EPYC Genoa-X tích hợp công nghệ 3D V-Cache cho các part thế hệ thứ 4 của họ. 3D V-Cache là công nghệ xếp chồng bộ nhớ đệm (cache), bằng cách xếp lớp L3 cache trực tiếp lên trên khuôn lõi, AMD có thể tăng dung lượng L3 cache trên các CPU của họ để giảm độ trễ bộ nhớ cần thiết khi truyền dữ liệu qua lại từ RAM. EPYC Genoa-X hoặc 9004X được bán ra với 3 SKU mới và có bộ nhớ cache trong CPU lớn hơn nhiều so với chúng ta từng thấy trước đây.

SKU Cores Threads L3 Cache Boost Clock Base Clock TDP (W)
9684X 96 192 1152 MB 3.7 GHz 2.55 GHz 400
9384X 32 64 768 MB 3.9 GHz 3.1 GHz 320
9184X 16 32 768 MB 4.2 GHz 3.55 GHz 320

Tổng cộng 1.1 GB bộ nhớ cache bổ sung thật sự là rất “khủng”, đặc biệt là trong các ứng dụng có dataset lớn như mô phỏng, CFD, đào tạo AI và Deep Learning cũng như các ứng dụng HPC khác. Phoronix đã công bố kết quả đo điểm benchmark của AMD EPYC 9684X trong các tải công việc HPC khác nhau. So với các SKU CPU hàng đầu khác từ AMD và Intel, L3 cache mang lại lợi thế đáng kể trong các ứng dụng khác nhau mặc dù có tốc độ xung nhịp cơ bản và tăng cường thấp hơn.

Với số lượng core thấp hơn, tỷ lệ core – cache là một lợi thế to lớn cho các ứng dụng như máy ảo. Trong 9384X, mỗi core sẽ có 24 MB cache đi kèm và trong 9184X, sẽ là 48 MB mỗi core. Số lượng core thấp hơn sẽ hỗ trợ vào việc cấp phép cho mỗi core (per core licensing) thường được thấy trong các ứng dụng doanh nghiệp, mỗi core phải là nhanh nhất và bộ nhớ đệm L3 bổ sung trên mỗi core sẽ giúp tăng tốc độ và giảm độ trễ.

Nếu có bất kỳ dấu hiệu nào cho thấy cache bổ sung thậm chí còn làm được bất cứ điều gì, thì các CPU Milan-X có thể thấy được săn đón rất nhiều trong lĩnh vực máy chủ và HPC. Genoa-X, mặc dù có chi phí khởi đầu cao hơn với nền tảng mới của nó nhưng có thể chứng tỏ nó là một khoản đầu tư rất đáng giá cho những người dùng sớm tiếp cận. Các biến thể 3D V-Cache gaming của AMD như AMD 5800X3D thế hệ trước vẫn có tính hoàn thiện cao so với các bộ vi xử lý thế hệ hiện tại.

Tại sao AMD EPYC Bergamo là hoàn hảo cho Cloud

AMD EPYC Bergamo cũng được thông báo về sự sẵn có rộng rãi. CPU dành cho doanh nghiệp này chứa rất nhiều core trên cùng một nền tảng có tên là các CPU AMD EPYC 97X4.

SKU Cores Threads L3 Cache Boost Clock Base Clock TDP (W)
9754 128 256 256 3.1 GHz 2.25 GHz 360
9754S 128 128 256 3.1 GHz 2.25 GHz 360
9734 112 224 256 3.0 GHz 2.20 GHz 340

Số lượng core trong EPYC Bergamo có thể đạt tới 128, nghĩa là cấu hình dual processor có tới 256 cores và 512 threads. Hãy xem qua kết quả điểm chuẩn của Phoronix trên AMD EPYC Bergamo 9754 đối với các ứng dụng khác nhau. Nếu EPYC Bergamo có cùng gói kích thước khuôn như các CPU AMD EPYC khác, thì làm cách nào chúng đạt được mức tăng số core?

Bằng cách giảm kích thước bộ đệm, các core AMD EPYC Bergamo nhỏ hơn về bản chất, giờ đây có thể phù hợp hơn với khuôn đóng gói. Điều này có vẻ trái ngược với ý nghĩa của Genoa-X và 3D V-Cache. Tuy nhiên, sự đánh đổi là khác nhau. Những khách hàng có các workload không sử dụng nhiều bộ nhớ cũng như không cần tốc độ xung nhịp cao gần bằng có thể tận dụng các core bổ sung được cung cấp từ các core Zen 4c.

Với các core nhỏ hơn cho phép AMD định tuyến các core khác nhau, do đó, AMD quyết định định dạng lại thiết kế CCD với 16 core trên 8 CCD. Khi càng có nhiều core trên mỗi CCD, thì chúng càng gần nhau, nghĩa là chúng càng hiệu quả, tối ưu hóa hiệu suất trên mỗi watt. Các máy chủ ảo hóa workload dựa trên cloud và các ứng dụng không chuyên sâu khác có thể tận dụng các core trong Zen 4c.

AMD EPYC Genoa với EPYC Genoa-X và EPYC Bergamo – Stack CPU hoàn chỉnh nhất

Đã qua rồi cái thời phát hành GPU với những thay đổi nhỏ đối với tốc độ xung nhịp, core và tính năng của chúng. Thay vào đó, AMD đang chia stack CPU hiệu suất cao của họ thành các danh mục riêng biệt, khiến chúng dễ được nhận biết, xác định và lựa chọn dựa trên trường hợp sử dụng riêng của khách hàng.

AMD EPYC Genoa (không -X) được gắn nhãn EPYC 9004 được thiết kế cho các workload tính toán chung. Các core này có tốc độ xung nhịp cao hơn trong lô, hữu ích cho những ai cần core hiệu năng tốt nhất hoặc rất nhiều core. Nhiều SKU core thấp hơn của AMD EPYC 9004 có tốc độ xung nhịp tốt nhất để tăng tốc các workload. Những khách hàng có các workload không thường xuyên sử dụng bộ nhớ và cần tần số cao nhất sẽ chọn AMD EPYC là phần nhanh nhất cho trường hợp sử dụng của họ.

AMD EPYC Genoa-X được gắn nhãn EPYC 9004X được thiết kế cho điện toán kỹ thuật hoặc HPC. Các bộ vi xử lý này với 3D V-Cache, có xung nhịp chậm hơn để giữ cho bộ đệm L3 được xếp chồng ổn định. Nhưng đối với những người dùng thường xuyên cần sử dụng bộ nhớ là các workload dataset lớn như CFD, dự báo thời tiết và AI Deep Learning có thể tận dụng bộ nhớ đệm.

AMD EPYC Bergamo được gắn nhãn EPYC 97X4 được thiết kế cho các workload cloud-native hay nói chung là mọi thứ khác. Những CPU có mật độ cao này với core tốc độ thấp hơn có thể cung cấp khả năng tính toán tốt nhất cho các workload không chuyên sâu. Trong những tác vụ đơn giản đó, nhiều core hơn đồng nghĩa với tốt hơn, đặc biệt là khi bạn sử dụng một máy chủ AMD EPYC Bergamo đơn lẻ cho nhiều workload dựa trên cloud.

Theo exxactcorp

____
Bài viết liên quan
Góp ý / Liên hệ tác giả