Безопасное проведение тестов, требующих отключения сервера.

Итак, в основном я тестирую и диагностирую свой ИБП, а также источники питания (БП) моего сервер. Для этой цели я выключаю сервер "жестким путем", отсоединяя его от стены , чтобы имитировать потерю мощности.

Я делал это так, как описано, и помог мне найти, какие ИБП не работают должным образом, а также какие блоки питания нужно изменить (если сервер выключается, что-то нужно изменить, иначе все в порядке). Однако, Я начинаю беспокоиться, что постоянное отключение моего сервера от сети и его "убийство" на собственном опыте может нанести некоторый ущерб ему или моим данным.

Это подводит меня к моему вопросу: Есть ли альтернативный способ выполнение этих тестов, чтобы свести к минимуму вероятность повреждения сервера или его частей? Или нет проблем с тем, что я делаю сейчас?

Я снова пытаюсь определить, какие источники питания неисправны (то есть ИБП в порядке, но сервер все равно умирает при отключении от сети). ИБП я ​​могу протестировать самостоятельно, чтобы не пытаться использовать этот метод с сервером, но я не могу понять, как проверить, может ли мой блок питания справляться с колебаниями и всплесками, не проверяя их на реальном сервере. Приветствуются любые указания.


Рассматриваемый сервер : Сервер HP ProLiant DL380 G7 с Intel Xeon . У меня также есть он с уровнем RAID 1 на жестких дисках. Он имеет Ubuntu 16.04.3 LTS , работающий на его SSD.

2
задан 31 January 2018 в 03:26
3 ответа

У вас HP ProLiant DL380 G7 . Посмотрите на следующее:

Дисплей Systems Insight Display (SID) показывает состояние внутренних компонентов. enter image description here

Если на одном из блоков питания горит желтый свет: отображается на SID или на реальных физических модулях. , возникла проблема.

Вы также можете войти в ILO сервера, чтобы проверить журнал интегрированного управления. В случае внезапного отключения питания в журнале может быть запись, указывающая что-то вроде:

- Server reset.
- Server power removed. 
- Server power restored.

У вас есть возможность не подключать оба источника питания к одному ИБП. Подключите один к электросети и наблюдайте за поведением.

Проверьте прошивку в вашей системе. Серверы G7 сейчас старые, но при запуске Ubuntu вам, вероятно, не хватает агентов отчетности и управления HP (они оптимизированы для RHEL / CentOS / VMware / Windows). Вы можете загрузить полный набор микропрограмм для этой модели, используя этот загрузочный DVD HP .

2
ответ дан 3 December 2019 в 09:57

Два примечания:

Во-первых, лучший способ подключения ИБП - это двойной источник питания ваших серверов. В случае отказа питания или ИБП (батареи) все остается включенным.

Второе: за исключением того, что было сказано об ослаблении позиций, неплохо отключить сервер (если вас не волнует повреждение данных) , за исключением SSD . В зависимости от того, какие SSD у вас могут быть, он может иметь суперконденсатор, чтобы справиться с этим. Но потеря питания может повредить блоки, которые стираются или записываются.

Правка о двойном источнике питания: правильный путь - один источник питания в стене, а другой источник питания через ИБП. Неправильно было бы подключать только один блок питания или соединять их оба через ИБП. Если вы это сделаете, то неудачное самотестирование ИБП приведет к прерыванию питания, и вы не сможете отключить его для замены батареи.

Конечно, никто не может позволить себе такую ​​роскошь с серверами без двойного блока питания.

1
ответ дан 3 December 2019 в 09:57

Не отключайте ИБП от сети. Я задал аналогичный вопрос 9 лет назад на этом сайте и получил следующий ответ от Эвана Андерсона :

ИБП теряет электрическое заземление, когда вы отключаете его от сети. Хотя маловероятно, что что-то пойдет не так, разработчики ИБП «ожидают», что этот путь к земле будет оставаться доступным все время, и если что-то произойдет во время вашего теста, вы можете увидеть искры (дым, пламя и т. путь к земле. Я отсоединял ИБП от стены для тестирования и раньше, но увидев вспышку «молнии» и услышав громкий «хлопок», исходящий из ИБП во время одного из таких тестов, я почувствовал «веру» в то, что больше этого не делать.

Поэтому, если вы используете розетку с переключателем, выключите ее. Если у вас нет коммутируемой розетки, подумайте о том, чтобы переключить питание на выключатель, чтобы цепь заземления оставалась подключенной.

Что касается отключения ваших серверов, выдергивая вилки, вы не должны причинять физический ущерб машинам, делая тот. Вы можете повредить RAID-массивы без батарейного питания или нарушить запись во время полета, что может вызвать беспорядок в файловых системах и потерю данных, но с вашими физическими серверами все должно быть в порядке.

Что касается вашей фактической проблемы, то есть во время отключений / отключений питания / скачков напряжения вы все равно теряете серверы перед своим ИБП, есть несколько причин, которые могут вызвать это:

  1. Если у вас есть два блока питания на ваших серверах, и один из них подключен к ИБП, а другой - нет (что достаточно часто), у вас может быть сбой в переключении блока питания внутри сервера
  2. Опять же, если у вас два источника питания, возможно, один из них перегружается и сервер выключается по соображениям безопасности
  3. В зависимости от в зависимости от типа имеющегося у вас ИБП, он может работать некорректно. Однажды у меня был сайт, на котором были постоянные отключения - от 20 до 30 раз в день мощность падала ниже 200 В (обычно 230 В), и ИБП переходил в режим повышения напряжения, а иногда напряжение поднималось до 250 В, и ИБП переходил в режим пониженного напряжения. Режим. Это резко сократило срок службы традиционных ИБП (я обычно использовал ИБП около года). Мы перешли на ИБП с двойным преобразованием (также называемый ИБП онлайн), который решил эту проблему.
1
ответ дан 3 December 2019 в 09:57

Теги

Похожие вопросы