Когда делают серверы Dell PowerEdge (R210II и R620) автоматически завершают работу из-за по нагреванию?

Лучшим приложением для изменения IP в победе является http://www.netsetman.com/index.php?s=nsm

что-то как администратор сети в Linux

2
задан 12 December 2013 в 17:37
2 ответа

Thanks to Thomas for digging up the OpenManage doc reference. OMSA, which needs to be installed somewhere, then remotely or locally used to connect to BMC, ultimately sets IPMI PEFs. I discovered that Dell makes a deployment kit that basically contains all the tools OMSA uses to accomplish this.

The Dell OpenManage Development Kit can be had here:

http://www.dell.com/support/drivers/us/en/19/DriverDetails/Product/poweredge-r720?driverId=65JXF&osCode=RH60&fileId=3196318431&languageCode=EN&categoryId=SM

The Linux version (seems to be 64-bit only, there used to be a 32-bit version but I can't find it) include a bootable image for installing firmware, etc... but also getting a console prompt with all the deployment tools accessible. Download it, burn it, insert it into a server and boot it. At the prompt you have access to the 'syscfg' command.

The documentation can be found here, but what you want is the reference guide!

http://www.dell.com/support/Manuals/us/en/19/Product/dell-opnmang-dplymnt-toolkit-v4.2

Using the syscfg command, you can set a PEF to have BMC trigger an action when a regular IPMI alert would be issued. The current usage would look like this:

syscfg pcp --filter=tempfail --filteraction=powerdown

Now when IPMI would normally report a tempfail alert, BMC will issue a power down event. The OS should be informed of the event via APIC and try to gracefully power down. Barring that, the built-in thermal thresholds will do their thing.

If you're familiar with the ipmitool, you can also check (and possibly set PEFs with it, but I haven't tried) the new PEF you set with something like this:

ipmitool <options> pef list

If you grep for "Temperature" you'll see something like this: (can't C&P from the console)

11 | active | 0x11 | Temperature | Any | Critical | Threshold | (0x01/0x0204),<LC,<UC | Alert,Power-off | 1

The Power-off being the newly added PEF action.

I haven't figured out the correct usage to set the temperature threshold using Dell's tools, BUT I have using ipmitool!

ipmitool <options> sensor list | grep Ambient

Ambient Temp | 24.000 | degrees C | ok | na | na | 3.000 | 8.000 | 42.000 | 47.000 | na

You can then set a new threshold based on the ipmitool sensor thresh parameter usage. Here's an exmaple where I change the upper critical threshold to 48C:

ipmitool <options> sensor thresh "Ambient Temp" ucr 48.000

You can try issuing a upper critical temperature event manually, but it seems to only issue the event and is not subject to PEF filter action settings. (issuing event 1 is easier than manually identifying the sensor, etc...)

ipmitool <options> event 1

What I did was set the shutdown temp to 25C and turn off my server room AC for 5 minutes with a colleague while we monitored everything. The target server shutdown right at 25C.

0
ответ дан 3 December 2019 в 15:21

Лучшее, что я смог найти, было из ветка на форумах Spiceworks . Ответ от представителя Dell:

Есть много способов сделать это. Вы правы, что по умолчанию ни одна из опций для постепенного завершения работы не включена, но сервер выключится, если будет достигнут критический порог.

Вы можете установить действия по предупреждению в iDRAC / CMC. Вы можете настроить его на отключение при достижении температурного предупреждения или критического порога. Вы также можете установить события платформы или действия предупреждений в OMSA. Так же в OMSA есть раздел под отключение по тепловому. Вы также можете настроить его на выполнение действия. Кроме того, вы можете настроить OMSA для выполнения программы при возникновении события. Вы можете использовать эту функцию для выполнения программы завершения работы в Windows.

Параметр «Отключение питания» в действиях по предупреждению - это плавное завершение работы. Я рекомендую вам установить его на выключение при достижении порога предупреждения. Если вы настроите его для критического порога, он может попытаться плавно завершить работу, а затем достигнет критического предела и выполнит принудительное отключение до того, как плавное завершение будет завершено.

Я также прочитал официальный PDF-файл Dell относительно OpenManage с этим упоминанием о тепловом отключении:

Dell OpenManage Server Administrator (OMSA) позволяет администраторам устанавливать пороговые значения температуры, при которых серверы должны выполнять аварийное тепловое отключение.

Таким образом, ответ, кажется, да, серверы Dell поддерживают изящную тепловое отключение и эту температуру можно настроить. Вы можете использовать OpenManage Server Administrator на каждом сервере для внесения этих изменений (я считаю, что вы можете вносить эти изменения во время работы сервера). Вам не нужно устанавливать централизованный сервер управления OpenManage, Я должен добавить, что эти ответы являются общими для серверов Dell. Я не нашел ничего особенного для перечисленных вами моделей серверов.

0
ответ дан 3 December 2019 в 15:21

Теги

Похожие вопросы