Что такое регулярное техобслуживание, которое необходимо выполнить на сервере Linux?

Попробуйте - опция изменять-окна для rsync

Windows не гарантирует точности времени изменения файла лучше, чем 2 секунды, поэтому дает rsync некоторый дрейф в его сравнениях при помощи изменять-окна.

--modify-window=1

обычно достаточно.

7
задан 14 April 2011 в 02:48
6 ответов

Самая важная вещь состоит в том, чтобы сохранить Ваш сервер контролируемым так, чтобы Вы знали то, что идет на сервер в каждый момент. Важно отслеживать использование диска, использование CPU, загрузку, использование памяти, трафик, и т.д. Существует много инструментов с открытым исходным кодом, которые могут помочь Вам с этой задачей. Это также помогает Вам запланировать будущие обновления.

С другой стороны, необходимо выполнить регулярные и автоматические резервные копирования, и очень важно протестировать резервные копии время от времени, чтобы удостовериться, что они работают.

Также важно проверить на обновления, особенно безопасности, и установить их при необходимости.

Все, что может быть сделано автоматическим способом, должно быть сделано автоматическим способом, но не забывает проверять Ваши журналы время от времени.

Надеюсь, это поможет!

10
ответ дан 2 December 2019 в 23:15

Существует два полезных класса инструмента здесь:

  1. Контроль Инструментов как Nagios позволил Вам отслеживать использование и другую статистику.
  2. Инструменты управления конфигурацией как Марионетка и Шеф-повар позволяют Вам сделать операторы об ожидаемом состоянии системы (какие пакеты оно должно было установить, каково содержание файлов должно быть, и т.д.), и затем работайте периодически, чтобы гарантировать, что система соответствует.
3
ответ дан 2 December 2019 в 23:15

Исправьте свою ОС для получения последнего bugfixes и обновлений системы защиты. Это - единственный самый важный шаг, который можно сделать. Кроме того, необходимо иметь в распоряжении контроль, чтобы говорить Вам состояние Вашей системы со временем. Я должен не согласиться с точкой выше того контроля, не обслуживание. Необходимо получить базовое понимание системы и как она работает для наблюдения, когда вещи не работают или нуждаются в обслуживании во-первых. Единственный способ действительно сделать это должно изобразить все в виде графика. Мы используем комбинацию Nagios, кактусов и ганглий для этого.

До сценариев Вы упомянули, что сжали журналы, таким образом посмотрите на logrotate. Существует также logwatch.

3
ответ дан 2 December 2019 в 23:15

Предыдущие к этому вопросу являются всеми достойными ответами, но они все окрашены крупномасштабными взглядами. Если у Вас есть только единственный хост, обеспечивая веб-сайты, отказ которых сразу не уничтожит котят, можно хотеть думать несколько меньшие. Я предложил бы следующее:

Используйте logwatch или аналогичную систему, которая агрегировала Ваши журналы и отправляет Вам по почте сводку. Прочитайте сводку по крайней мере через день. Используйте инструмент, который уплотняет Ваши блоги (например, аналог) в читаемую сводку. Если Вы хотите быть немного более амбициозными, используйте облачный сервис для контроля сайтов.

Однако сущность системного обслуживания остается тем же: уничтожьте каждую проблему, которая происходит мертвая так, чтобы она никогда не могла происходить снова. Это - важный момент, потому что это означает, что не должно быть никакого "регулярного" обслуживания.

Теперь для большего масштаба:

Среди первых выпусков Вы имеете, когда Вы увеличиваетесь, то, что что-то повреждается, и Вы не знаете это. Это никогда не должно происходить снова. Затем Вы получаете решение по контролю полномасштабное. Кроме того, видя, что проблема происходит на одном хосте, Вы хотите предотвратить его происходящий на любом другом хосте. Именно тогда Вы получаете систему управления конфигурацией.

Но Вы не должны в этой точке быть удовлетворенными. Все Ваше усилие должно войти в постоянные решения.

3
ответ дан 2 December 2019 в 23:15

Обслуживание сделано путем контроля. Если Вам подвергли машину внешнему доступу, у Вас должны быть некоторые инструменты проверки: rkhunter, chkrootkit являются основами с письмами, отправляемыми ежедневно.. smartd должен проверить HDD и отправить почту в случае, если что-то начинает идти не так, как надо, растяжка для средства проверки целостности, помощник для IDS + средство проверки целостности и много других.. конечно, предполагается, что система уже укреплена (по крайней мере, с предназначенной политикой SElinux по умолчанию), будет большим сделать производительность, контролирующую с nagios, zabbix и другими.. (для продолжения глаза на из обычных событий и состояния машины)

1
ответ дан 2 December 2019 в 23:15

Marcos сделал хорошее резюме об общих точках ОБСЛУЖИВАНИЯ: контроль, резервные копии и обновления.

Я должен повторить (людьми комментарии) тот контроль! = обслуживание.

Я хотел бы добавить: очистки старых пользователей, старых задач крона, и т.д. обновления Паролей. Эволюция конфигурации системы (смотрящий на контролирующую историю) (и это включает эволюцию контроля и резервных копий) с жизненными изменениями сервера. Проверки защиты. Пользовательские отчеты (т.е. подробное использование сервисов, совместно используемых ресурсов, отчетов безопасности). И...

Восстановление копирует случайным образом (не будучи должен сделать это). Также всегда включайте копию MBR (Главная загрузочная запись), если Вы не используете систему автоматизированного развертывания для восстановления целого сервера.

Я видел, что брандмауэры переживают 500 дней времени работы (да, который является ПЛОХИМ maintenace, потому что существует о 10/15 обновлениях ядра, которые год, так большие времена работы, использует, чтобы быть равным уязвимому ядру) без любого человеческого обслуживания. Это - просто хорошая конфигурация на разделах, системном журнале и никаких основных изменениях конфигурации.

Вы просите сценарии. Возможно, существуют универсальные предварительно упакованные сценарии, но это больше о DIY (Сделайте Это Сами). Таким образом, сначала Вы учитесь или читаете, как Ваша система работает (это включает дистрибутив, определенный REAMEs, страницы справочника, политики и параметры компиляции), затем эй думают, как Ваша система должна вести себя, и затем Вы пишете пользовательские сценарии (крон, пользовательские команды, и т.д.) для управления комбинацией O.S. + требовал behavior/results/reports/change-management/rollbacks/reactions/etc.

Кроме того, доступные универсальные инструменты (monit, nagios, кактусы, zabbix, и т.д.) могут быть расширены с помощью Ваших навыков сценариев и доступных сторонних плагинов.

В примере: Вы должны только знать, "если раздел полон", или необходимо ли также контролировать дисковую температуру, свободный inodes, файлы и права папок, контрольные суммы, состояние S.M.A.R.T., поврежденные секторы, проверки файловой системы и цикл расчетного срока службы физического оборудования?

И а также резервные копии, система контроля + настройки, должны быть проверены, если это возможно, моделировав отказы, нападения, и т.д.

Пользовательские сценарии лучше, когда можно проверить их и убрать ошибки, на сервере (серверах) подготовки производства, среде, каталоге, базе данных, и т.д.

1
ответ дан 2 December 2019 в 23:15

Теги

Похожие вопросы