Можно ли доверять значению времени безотказной работы Linux для точного определения времени простоя?

У меня 2 сервера, один сообщает о времени безотказной работы 9 часов, другой 7 часов. У меня нет другой системы мониторинга. Мой "хостинг-провайдер" говорит, что это был единичный скачок мощности, который перезапустил оба, и что время безотказной работы нельзя считать точным. Есть ли способ, которым он прав? Могут ли 2 сервера, перезагруженных одновременно, показывать разницу во времени безотказной работы в 2 часа? Спасибо.

1
задан 10 August 2017 в 15:17
2 ответа

Можно ли доверять значению времени безотказной работы Linux для точного определения времени простоя?

Нет. Команда

/ proc / uptime и / или uptime сообщает вам только, как долго работает система, т. Е. Позволяет определить, сколько времени прошло с момента восстановления системы ] от сбоя.

Даже если у вас нет мониторинга last -F reboot или быстрой проверки / var / log / messages , обычно отображается временной интервал между последними записанными сообщениями. и восстановление системы, что позволяет (приблизительно) оценить продолжительность сбоя.

Uptime - это AFAIK простой постоянно увеличивающийся счетчик ядра, на который не влияют манипуляции с датой / временем системных часов. Т.е. при изменении часовых поясов или изменении системного времени / даты, например, с помощью NTP, команды date или управления (неправильными) аппаратными часами с помощью hwclock , счетчик времени безотказной работы не изменится .

Если время безотказной работы ваших систем отличается на два часа, и они пострадали от такого же сбоя, наиболее очевидный вывод - восстановление после этого сбоя заняло дополнительные два часа для одной из этих систем ...

Существует множество потенциально возможных кстати, вполне веские причины.

2
ответ дан 3 December 2019 в 18:29

uptime допустимо только в том случае, если вы хотите знать время, в течение которого система работала с момента последнего запуска, не более того.

Вместо этого tuptime ведет учет событий запуска и выключения системы. Это полезно для отображения аварийных отключений, например, вызванных отключениями электроэнергии и зависаниями, поскольку в их отчете в столбце «Конец» указывается, было ли это нормально или плохо:

$ tuptime -t
No.        Startup Date                                Uptime       Shutdown Date   End                                       Downtime

1     22:21:49 05/15/18             50 minutes and 44 seconds   23:12:33 05/15/18    OK                                     13 seconds
2     23:12:46 05/15/18                1 minute and 2 seconds   23:13:48 05/15/18    OK            18 hours, 57 minutes and 18 seconds
3     18:11:06 05/16/18              2 minutes and 34 seconds   18:13:40 05/16/18   BAD               1 hour, 48 minutes and 6 seconds
4     20:01:46 05/16/18     1 hour, 29 minutes and 30 seconds   21:31:15 05/16/18   BAD                      14 minutes and 31 seconds
5     21:45:47 05/16/18             19 minutes and 42 seconds   22:05:28 05/16/18    OK             21 hours, 7 minutes and 18 seconds
6     19:12:47 05/17/18               37 minutes and 1 second   19:49:47 05/17/18    OK                                     26 seconds
1
ответ дан 3 December 2019 в 18:29

Теги

Похожие вопросы