Большой процент идентичных систем зависает при мягкой перезагрузке

Обращаюсь к любым другим идеям после того, как в течение недели бился головой об этой проблеме.

У нас есть примерно 100 идентичных систем, использующих материнская плата AAEON PICO-ITX BT01 с процессором J1900 Celeron.

Каждая система работает на Debian Jessie с ядром 3.16.0-0-686. Каждая система создается с использованием одного и того же образа clonezilla одинаковым образом.

Мы ' re испытывает режим периодического сбоя, который проявляется одним из трех способов (хотя я считаю, что все 3 являются одной и той же основной причиной)

1) В самом конце заставки BIOS он зависает и не восстанавливается. Хотя он показывает код ошибки 99, этот код всегда отображается в момент перед загрузкой ядра, поэтому я чувствую, что этот код BIOS не является диагностическим (это просто последнее, что отображается на экране). Отключение заставки BIOS не показывает ничего полезного, только версию BIOS и код ошибки.

http://imgur.com/ifse045

2) На самых начальных этапах загрузки ядра он сообщает, что ядра процессора не могут быть проснувшийся. Затем система зависает и не восстанавливается.

http://imgur.com/hZdzq74

3) Сразу после заставки BIOS вывод на экран прекращается, и система зависает и не восстанавливается.

Это НЕ случается с каждой доской, хотя все они из одного производственного цикла и используют одно и то же оборудование (при этом мы поменяли местами твердотельные накопители и обнаружили ту же проблему, поэтому я не верю, что это модуль SSD).

После того, как увидел это внезапно в полевых условиях я ввел процедуру тестирования, при которой система будет отображать образ, а затем настроить crontask на перезагрузку через 60 секунд после загрузки. Мы сжигали системы таким образом, и, поскольку они не восстанавливались после сбоя, через 24 часа мы увидим, какие системы все еще перезагружались, а какие не прошли проверку.

Я прошу здесь посмотреть, есть ли у кого-нибудь другие идеи, по сути. Я был в постоянном контакте с производителем платы, и у них есть две затронутые системы, которые они тестируют, но пока никаких результатов. Я могу провести любой тест на имеющихся у меня системах, и доски, которые прошли, и те, которые потерпели неудачу.

Есть еще одна важная вещь. Жесткая перезагрузка (отключение питания) ВСЕГДА позволяет системе загрузиться. Система, идентифицированная как неисправная, не сможет загрузиться в БОЛЬШИНСТВЕ СЛУЧАЕВ во время первой мягкой перезагрузки после повторного включения питания на материнскую плату. Я когда-либо видел этот режим отказа только во время мягкой перезагрузки.

Это было большой загадкой, а кроме этого, я люблю оборудование и с удовольствием буду его покупать.

Спасибо, ребята и девушки.

4
задан 14 May 2016 в 01:43
1 ответ

Причина неисправности была обнаружена при сотрудничестве с производителем, это оказалась неисправная ревизия BIOS. Мы оба протестировали откат BIOS, и проблема исчезла.

Это должно было быть ранней диагностикой, но живите и учитесь!

0
ответ дан 3 December 2019 в 04:20

Теги

Похожие вопросы