На веб-приложении, которое использует s3 для физического хранения документов, мы испытываем проблемы с NTP, непрерывно умирающим. Это, кажется, происходит примерно несколько раз день. Существует очень мало информации, предоставленной, когда это происходит кроме этого, файл PID существует, но сервис мертв, когда я проверяю состояние.
Кто-либо может предложить вероятные причины смерти NTPD? Я предполагаю, что, возможно, синхронизируют дрейф, заставляет это умирать, но я не уверен, что вызвало бы это также. Существует более чем достаточно памяти и доступного дискового пространства.
В прошлый раз, когда сервис умер, это было выводом:
Sep 6 06:15:25 vm02 rsyslogd: [origin software="rsyslogd" swVersion="5.8.10" x-pid="988" x-info="http://www.rsyslog.com"] rsyslogd was HUPed
Sep 6 06:17:06 vm02 ntpd[10803]: 0.0.0.0 0618 08 no_sys_peer
Sep 6 08:01:10 vm02 ntpd[10803]: 0.0.0.0 0617 07 panic_stop -28101 s; set clock manually within 1000 s.
من می گویم هیچ روش 1 دقیقه ای برای یافتن دلیل دقیق وجود ندارد.
ما قبلاً در محیط ESXi خود با همین مشکلات روبرو بودیم. برای کوتاه کردن این ماجرا ، متوجه شدیم که ساعت میزبان ESXi بسیار زیاد شده و ماشین های مجازی مهمان هم از میزبان ESXi و هم از سرور NTP بالادست زمان را همگام سازی می کنند. این باعث سردرگمی NTPd در سیستم عامل های مجازی می شود ، بنابراین اغلب می میرد.
همچنین در موارد نادری متوجه شدیم که از دست رفتن بسته تصادفی باعث ترک NTPd نیز می شود زیرا از زمان رفت و برگشت بین سرور شما و سرور NTPd بالادستی برای محاسبه زمان رانش استفاده می شود. رانش زمان عظیم ، به عنوان مثال بیش از 1000 ، به طور پیش فرض ترک می شود. گزینه -g کمی کمک خواهد کرد.
-g به طور معمول ، اگر جبران از آستانه وحشت بیش از حد باشد ، ntpd با پیغامی به سیستم وارد می شود ، که به طور پیش فرض 1000 ثانیه است. این گزینه اجازه می دهد تا زمان بدون محدودیت روی هر مقداری تنظیم شود. با این حال ، این می تواند فقط یک بار اتفاق بیفتد. اگر بعد از آن از آستانه عبور کنید ، ntpd با a خارج می شود پیام به سیستم ورود به سیستم. این گزینه را می توان با گزینه های -q و -x استفاده کرد. دستور tinker را ببینید برای گزینه های دیگر.
شما می توانید به سیستم ورود به سیستم نگاهی بیندازید ، که در برخی از کلمات ممکن است به شما اشاره کند. شما همچنین می توانید بر خروجی "ntpq -p" نظارت داشته باشید تا تصور تقریبی از نحوه ایجاد جبران داشته باشید.
Сообщение журнала четко указывает на то, что причиной выхода является дрейф часов. Возможные решения:
Добавьте больше источников времени; NTP необходимо 4-6 источников для поддержания хорошей точности. Простой способ сделать это - включить повторяющиеся ссылки на [0-3] .YOURREGION.pool.ntp.org в вашей конфигурации, например
server 0.au.pool.ntp.org iburst
сервер 1.au.pool.ntp.org iburst
сервер 2.au.pool.ntp.org iburst
сервер 3.au.pool.ntp.org iburst
сервер 0.au.pool.ntp.org iburst
сервер 1.au.pool.ntp.org iburst
сервер 2.au.pool.ntp.org iburst
сервер 3.au.pool.ntp.org iburst
Другой вариант, который вы можете попробовать, - хрони. В нашем тестировании он работает более стабильно, чем ntpd, и лучше обрабатывает временной сдвиг в виртуальных средах.