Xeon E5 V3 - 2S против 4S CPU - Влияние размера кэша L3 на производительность

Я пытался найти ответ на этот вопрос, но мне было трудно получить конкретную информацию, поэтому решил спросить Вот. Извините за сложное название, но суть моего вопроса такова: в семействе процессоров Xeon E5 V3 SKU 4S часто имеют больше кэша L3, чем SKU 1S / 2S; дает ли это материальную выгоду при использовании 4S SKU в конфигурации с одним / двумя процессорами?

Например, рассмотрим следующие 2 примерно одинаковых чипа: E5-2620 v3 и E5-4655 v3. Оба они имеют 6 ядер / 12 потоков, оба имеют максимальную частоту турбо-частоты 3,2 ГГц, идентичный кэш L1 (6x32 КБ, 8-позиционный набор ассоциативных инструкций / данных), идентичный кэш L2 (6x256 КБ, 8-позиционный набор ассоциативных), но E5 -4655 v3 имеет более высокую базовую частоту (2,9 ГГц против 2,4 ГГц) и вдвое больший объем кэша L3 (30 МБ 20-позиционного ассоциативного общего кэша против 15 МБ 20-позиционного ассоциативного общего кэша). За исключением разницы в базовой частоте, при различных рабочих нагрузках (включая виртуализацию Windows / Linux / FreeBSD, перекодирование видео, базы данных, сжатие / извлечение архивов и т. Д.), Было бы разумно увидеть разницу между этими процессорами в конфигурации с одним / двумя процессорами из-за разница в кэше L3?

Я спрашиваю, потому что в настоящее время у меня есть сервер Dell R730 с двумя процессорами E5-4655 v3, и я рассматриваю возможность модернизации процессора в не столь отдаленном будущем до одного процессора (я не Мне действительно нужны линии PCIe или дополнительный объем памяти, предлагаемый вторым процессором, и я хотел бы сократить энергопотребление и потенциальные потери производительности, присущие системе 2S). Цены на бывшие в употреблении процессоры 2S обычно немного ниже, чем цены на процессоры 4S с аналогичными характеристиками (количество ядер / потоков, базовые / повышающие тактовые частоты), но мне интересно, какое влияние окажет уменьшение вдвое кеша L3. Имейте в виду, что если бы я объединил 2 процессора в 1, я бы не стал покупать упомянутый выше E5-2620 v3 (это было просто для иллюстративных целей); Я бы получил> = 12 основных компонентов (пока не определился).

Я понимаю, что на этот вопрос может быть непросто дать конкретный ответ, но я был бы признателен за любые вводные или соответствующие данные тестов. Спасибо.

0
задан 10 March 2020 в 12:56
2 ответа

Предпосылка вопроса - что Xeon E5 4xxx всегда имеет больше кэша L3, чем Xeon E5 2xxx - не всегда верна. Возьмем, к примеру, Xeon 2690v3 : он имеет 30 МБ кэш-памяти третьего уровня, хотя и является процессором 2S.

Тем не менее,влияние уменьшения вдвое кэша L3 на ЦП на базе Broadwell будет полностью зависеть от рабочей нагрузки, которую ваше приложение возлагает на процессор: перекодирование или другие тяжелые задачи FPU будут практически не затронуты, в то время как виртуализация и базы данных могут показать 5- Попадание 15% (при тех же тактовых частотах / ядрах).

Однако основная причина, по которой процессоры 4S часто имеют больше кэша L3 на ядро, заключается в том, что они используют более сложную схему NUMA, где добавленный кеш означает меньшую задержку при доступе к основной памяти. Более того, системы 4S могут использовать значительную часть LLC (в данном случае L3) для каталогов / отслеживания / согласованности, «тратя впустую» больше кеша, чем система 2S (но это сильно зависит от процессора и архитектуры системы)

. Для будущего обновления с использованными деталями просто купите то, что обеспечит вам лучший ремешок за свои деньги. Если переход на большой ЦП L3 стоит дорого, просто избегайте этого (возможно, вкладывая средства в большее количество тактовых частот / ядер).

0
ответ дан 30 March 2020 в 01:30

Я понимаю, что этот вопрос может быть непростым, чтобы дать конкретную ответ на, но был бы признателен за любые исходные данные или соответствующие контрольные данные.

Зависит, особенно после того, как вы описали разнообразную и разнообразную рабочую нагрузку. Невозможно узнать подробности, кроме тестирования вашей рабочей нагрузки. Тесты могут определять относительную производительность одного объекта, но производительность - это более сложный вопрос.

В целом, конечно, новая микроархитектура, большее количество ядер, более высокая частота и больший объем кэша лучше. Но у вас есть и другие ограничения, такие как мощность и стоимость.

Haswell, о которых вы говорите, старше нескольких поколений. Часто это старое не стоит потребляемой энергии и вызывает опасения по поводу оставшейся продолжительности поддержки. Если вы ищете бывшее в употреблении или со скидкой, попробуйте одно поколение передовых технологий.

Система с четырьмя сокетами только для одного сокета, и ее кеш-память кажется сомнительной, пока Intel поддерживает высокосегментированную линейку продуктов с премиальными функциями. Не самый извращенный стимул для экономики ЦП, возможно, имеет смысл. Но это довольно искажено только потому, что больше кеша выглядит заманчиво, нужны некоторые данные для поддержки такого решения.

Также подумайте, хотите ли вы оценить других поставщиков. У AMD EPYC простая история с одним сокетом. Например, 16-ядерный EPYC 7302P имеет 128 МБ L3, как и EPYC 7302 с двумя сокетами. Это не тот используемый Xeon, который вы просили, но он может обеспечить ценовую конкуренцию. AMD определенно хочет продавать однопроцессорные системы.

0
ответ дан 30 March 2020 в 01:30

Теги

Похожие вопросы