Стресс (Linux): настройки, ожидания и вопросы [закрыто]

Только на прошлой неделе получил несколько новых ядер и оперативной памяти, хотел провести стресс-тест и посмотреть, насколько они хороши. К сожалению, я не смог найти никаких реальных ресурсов о том, как это сделать без OD, поэтому я запустил StressLinux.

Dual QC Xeon 2.66 с HT, 16 ГБ ОЗУ, вызвал стресс с помощью:

stress --cpu 10240 --io 256 --vm 16 --vm-bytes 1G --vm-keep --timeout 2000

Ответный огонь (среди прочего):

<-- worker 8129 got Signal 9
now reaping child worker process
failed run completed in 2009s

Что это означает? Куда мне идти?

[[РЕДАКТИРОВАТЬ]]

Кроме того, какие хорошие настройки и параметры тестирования для такой машины? Что касается этой правки, которую я использую:

stress --cpu 30000 --io 2000 --vm 30 --vm-bytes 1G --vm-keep

И я все еще не могу получить температуру процессора выше <60 ° C ... Опять же, это Dell PowerEdge 1900, и воздушный поток безумный ...Но разве я не могу еще немного поднять темп?

[[РЕДАКТИРОВАТЬ СНОВА]]

Может, мне стоит перефразировать вопрос в сторону Я думал, что очевидным направлением будет: как мне довести процессоры до предела (какие настройки), чтобы у меня были надежные чипы (т. е. до истечения срока гарантии на подержанные).

Я использую «тепло» как меру налогообложения, потому что это единственный известный мне способ. Низкий нагрев (всего на 20 ° C выше холостого хода) указывал бы мне на то, что я не нажимаю на них так сильно, как мог бы.

Естественным продолжением этого вопроса может быть: «Есть ли способ узнать, сколько напряжения я на самом деле прикладываю к сердечникам? Или насколько больше у меня запас по высоте?

Где моя духовка?

-2
задан 21 February 2013 в 22:11
1 ответ

Вы делаете это НЕПРАВИЛЬНО .

Серьезно - это НЕ "стресс-тест" системы.
То, насколько сильно нагревается ЦП, является плохим показателем рабочей нагрузки ЦП - я мог бы легко заставить ЦП легко превысить расчетные параметры рабочей температуры (и, вероятно, отключить схему тепловой защиты и отключить). Я мог бы заставить ЦП работать на полную мощность при нулевом градусе, если бы я хотел охлаждать его жидким гелием.
You are testing the efficiency of your cooling system, nothing else.


If you want to determine if a system is stable and functional simply put any general processor and memory intensive workload on it (try re-compiling an operating system: make world is still the standard stress test in the BSD community).

  • If the system crashes it's not stable, and you can start looking at components (RAM, CPU, Motherboard) to determine why.
  • If it survives you have one datapoint indicating possible stability, but remember:
    You can never tell how strong something IS, only how strong it WAS right before failure.

If you induce a failure in testing you know the component is now no longer serviceable. Whether it was bad when you got it or not you can't say - your stress test may have caused the failure (particularly if you're using "heat" as your arbiter of stress: Running a CPU above its maximum rated temperature is a great way to destroy it).


Modern computers sold by reputable vendors use high quality parts which are extensively tested by the manufacturer prior to sale. Companies like Intel rely on their good name to keep their business.
Соответственно, шансы на то, что у вас плохой процессор, относительно низки. Вероятность плохой оперативной памяти или жесткого диска значительно выше, но именно поэтому у нас есть ОЗУ с ECC и RAID-массивы.

2
ответ дан 5 December 2019 в 21:19

Теги

Похожие вопросы