Вероятные причины NTPD, умирающего неожиданно и решений

На веб-приложении, которое использует s3 для физического хранения документов, мы испытываем проблемы с NTP, непрерывно умирающим. Это, кажется, происходит примерно несколько раз день. Существует очень мало информации, предоставленной, когда это происходит кроме этого, файл PID существует, но сервис мертв, когда я проверяю состояние.

Кто-либо может предложить вероятные причины смерти NTPD? Я предполагаю, что, возможно, синхронизируют дрейф, заставляет это умирать, но я не уверен, что вызвало бы это также. Существует более чем достаточно памяти и доступного дискового пространства.

В прошлый раз, когда сервис умер, это было выводом:

Sep  6 06:15:25 vm02 rsyslogd: [origin software="rsyslogd" swVersion="5.8.10" x-pid="988" x-info="http://www.rsyslog.com"] rsyslogd was HUPed
Sep  6 06:17:06 vm02 ntpd[10803]: 0.0.0.0 0618 08 no_sys_peer
Sep  6 08:01:10 vm02 ntpd[10803]: 0.0.0.0 0617 07 panic_stop -28101 s; set clock manually within 1000 s.
9
задан 25 September 2015 в 14:42
3 ответа

من می گویم هیچ روش 1 دقیقه ای برای یافتن دلیل دقیق وجود ندارد.

ما قبلاً در محیط ESXi خود با همین مشکلات روبرو بودیم. برای کوتاه کردن این ماجرا ، متوجه شدیم که ساعت میزبان ESXi بسیار زیاد شده و ماشین های مجازی مهمان هم از میزبان ESXi و هم از سرور NTP بالادست زمان را همگام سازی می کنند. این باعث سردرگمی NTPd در سیستم عامل های مجازی می شود ، بنابراین اغلب می میرد.

همچنین در موارد نادری متوجه شدیم که از دست رفتن بسته تصادفی باعث ترک NTPd نیز می شود زیرا از زمان رفت و برگشت بین سرور شما و سرور NTPd بالادستی برای محاسبه زمان رانش استفاده می شود. رانش زمان عظیم ، به عنوان مثال بیش از 1000 ، به طور پیش فرض ترک می شود. گزینه -g کمی کمک خواهد کرد.

  -g به طور معمول ، اگر جبران از آستانه وحشت بیش از حد باشد ، ntpd با پیغامی به سیستم وارد می شود ،
  که به طور پیش فرض 1000 ثانیه است.  این گزینه اجازه می دهد تا زمان بدون محدودیت روی هر مقداری تنظیم شود.
  با این حال ، این می تواند فقط یک بار اتفاق بیفتد.  اگر بعد از آن از آستانه عبور کنید ، ntpd با a خارج می شود
  پیام به سیستم ورود به سیستم.  این گزینه را می توان با گزینه های -q و -x استفاده کرد.  دستور tinker را ببینید
  برای گزینه های دیگر.
 

شما می توانید به سیستم ورود به سیستم نگاهی بیندازید ، که در برخی از کلمات ممکن است به شما اشاره کند. شما همچنین می توانید بر خروجی "ntpq -p" نظارت داشته باشید تا تصور تقریبی از نحوه ایجاد جبران داشته باشید.

6
ответ дан 2 December 2019 в 22:32

Сообщение журнала четко указывает на то, что причиной выхода является дрейф часов. Возможные решения:

  • Запустите ntpd с флагом -g; однако это не устранит основную причину, а именно сдвиг часов.
  • Запустите ntpdate перед запуском ntpd; вероятно, та же оговорка.
  • Добавьте больше источников времени; NTP необходимо 4-6 источников для поддержания хорошей точности. Простой способ сделать это - включить повторяющиеся ссылки на [0-3] .YOURREGION.pool.ntp.org в вашей конфигурации, например

     server 0.au.pool.ntp.org iburst
    сервер 1.au.pool.ntp.org iburst
    сервер 2.au.pool.ntp.org iburst
    сервер 3.au.pool.ntp.org iburst
    
    сервер 0.au.pool.ntp.org iburst
    сервер 1.au.pool.ntp.org iburst
    сервер 2.au.pool.ntp.org iburst
    сервер 3.au.pool.ntp.org iburst
     
3
ответ дан 2 December 2019 в 22:32

Другой вариант, который вы можете попробовать, - хрони. В нашем тестировании он работает более стабильно, чем ntpd, и лучше обрабатывает временной сдвиг в виртуальных средах.

http://chrony.tuxfamily.org/

1
ответ дан 2 December 2019 в 22:32

Теги

Похожие вопросы