Я использовал различные внештатные веб-сайты как Scriptlance и Get Фрилансер с хорошим успехом. В то время как те сайты главным образом фокусируются на программировании проектов, существуют категории для системного администрирования и связанных задач.
Я нанял несколько администраторов юниора неполного рабочего дня от обоих из тех сайтов с хорошими результатами.
Мое первое предположение - то, что Nagios имеет маленькую утечку памяти и после того, как месяцы выполнения исчерпали RAM или подкачку. Однако, так как машина отказала несколько раз в тот же день, который предлагает дефектную микросхему RAM. Мой первый шаг должен был бы сделать тест памяти или проверить плохой журнал памяти (если Ваш сервер поддерживает его).
Я голосую за неисправный поршень также. Я рекомендовал бы использовать memtest86, чтобы сделать полную проверку поршня. Кроме того, температуры в комнате хороши и прохладны?
Я голосую за дефектную RAM также. Если Вы не можете использовать memtest86, потому что машина удаленно расположена, можно хотеть попробовать инструмент пространства пользователя - memtester, вместо этого. Это не работает вполне также, но может брать некоторые ошибки памяти, если они там.
Просто быстрым взглядом, это похоже на процесс, который запаниковал, был Nagios. Это было последовательно каждый раз, когда это испугано и заперто? Раз так я спросил бы, запустились ли проблемы во время, Вы устанавливаете Nagios. Если это так, затем Вы могли бы хотеть попытаться завершить работу Nagios и видеть, возвращается ли сервер, чтобы быть стабильным. Если это делает затем, Вы нашли преступника и потребность выглядеть ближе для наблюдения что случилось с Nagios.
Google или форумы/список Centos, вероятно, будут Вами лучший выбор. Без дампа crsah будет трудным быть уверенным, таким образом, необходимо изучить получение, которое настроило.
Можно также перерыть Redhat Bugzilla. Это смотрит возможность на основе мало, Вы имеете из снимка экрана.