Устранение неполадок при случайном зависании сервера без записей журнала

Мы столкнулись с очень конкретной и уникальной проблемой в нашем приложении C #, которое работает под .NET framework 4.7 .2, в режиме киоска в операционной системе Windows 10, которая работает на Lenovo ThinkStation P320 Tiny в качестве оборудования (такая же проблема была обнаружена и на другом оборудовании).

Описание среды:

сценарий включает постоянно работающее приложение, с автоматическим переключением режима день / ночь.
Когда приложение не находится в режиме видеозвонка, оно непрерывно воспроизводит некоторые видео / фильмы.
Приложение запускается в Windows именно в режиме киоска при запуске системы. К мини-ПК (Lenovo) подключены следующие периферийные устройства:

  • Основной монитор (сенсорный планшет)
  • Дополнительный монитор (телевизор 40 дюймов)
  • Сканер
  • USB-веб-камера
  • USB-микрофон
  • USB LAN

Единственное возможное взаимодействие пользователя с системой осуществляется в контролируемой среде с помощью сенсорного планшета.

Описание проблемы:

очевидно случайным образом мы наблюдаем своего рода зависание машины:
основной и дополнительный мониторы включаются с фиксированным изображением, сетевой интерфейс не отвечает на команду ping.
Операционная система в этот период времени не отслеживает выполнение (нет сбоев в журнале системных событий, нет дампа, нет активных процессов).
Даже подключив мышь и клавиатуру к мини-ПК, невозможно восстановить контроль над операционной системой.
Нет точного момента, когда эта проблема начала проявляться, когда мы начали этот проект несколько месяцев назад.
Та же проблема возникала на разных моделях оборудования, отличном от оборудования Lenovo ThinkStation P320 Tiny, используемого в качестве целевого устройства.

Мы безуспешно пытались включить журналы системных событий в программе настройки BIOS Lenovo, но мы не обнаружили никаких ошибок.

11100580] Мы попытались принудительно создать дамп из Windows, но операционная система не может этого сделать.
Мы привлекли поставщика Lenovo (даже если на самом деле проблема также возникает на другом оборудовании), выполнив диагностические инструменты, которые могут выявить любую несовместимость оборудования или внутренние проблемы нашей компании.
Конфигурация: проблем не обнаружено.

В этой ситуации единственная возможность - снять блок питания мини-ПК.
При перезагрузке, анализируя приложение и системные журналы, ничего не обнаруживается в течение периода времени, в течение которого Мини-ПК был заблокирован (заморожен), никаких проблем не обнаруживается в период непосредственно перед зависанием или после перезапуска.

Вопрос:

Учитывая, что ни с точки зрения приложения, ни с точки зрения операционной системы невозможно получить информацию о диагностике системы и анализе проблем, мы хотели бы понять, как устранить проблему или включить низкоуровневые журналы или дампы, которые могут рассказать нам больше о состоянии мини-ПК, когда он зависает, или о возможных причинах его возникновения.

3
задан 20 June 2019 в 11:00
1 ответ

Если программное обеспечение не может зарегистрировать проблему, то она определенно связана с аппаратной ошибкой. Обычно проблемы взаимодействия драйвера и программного обеспечения вызывают панику ядра (BSOD).

Что нужно проверить:

  • Не перегревается ли устройство? (Убедитесь, что в киоске хороший воздушный поток)
  • Есть ли проблемы с источником электроэнергии? (Отсутствие замыкания на землю, падения и скачки напряжения? Используйте ИБП, чтобы сгладить подачу питания. Для устранения замыканий на землю вызовите электрика.)
  • Неисправный или дешевый источник питания. (Это может произойти на нескольких устройствах, использующих один и тот же блок питания. Проверьте блок питания.)
  • Рядом большой источник электромагнитных помех? (Пример: аппараты МРТ, катушка Тесла)
  • Ошибка BIOS. (Может существовать на всех устройствах с определенной прошивкой. Проверьте наличие обновлений.)
1
ответ дан 3 December 2019 в 07:21

Теги

Похожие вопросы