Почему мой сервер случайно понижается?

Я использовал различные внештатные веб-сайты как Scriptlance и Get Фрилансер с хорошим успехом. В то время как те сайты главным образом фокусируются на программировании проектов, существуют категории для системного администрирования и связанных задач.

Я нанял несколько администраторов юниора неполного рабочего дня от обоих из тех сайтов с хорошими результатами.

1
задан 30 July 2009 в 16:58
5 ответов

Мое первое предположение - то, что Nagios имеет маленькую утечку памяти и после того, как месяцы выполнения исчерпали RAM или подкачку. Однако, так как машина отказала несколько раз в тот же день, который предлагает дефектную микросхему RAM. Мой первый шаг должен был бы сделать тест памяти или проверить плохой журнал памяти (если Ваш сервер поддерживает его).

3
ответ дан 3 December 2019 в 17:00
  • 1
    Как я могу выполнить этот тест? Сервер находится в центре обработки данных. –  lexsys 30 July 2009 в 15:38
  • 2
    Необходимо было бы заставить штат DC выполнять тест памяти. Вы могли судить тестер памяти пространства пользователя как pyropus.ca/software/memtester, но clean-boot-with-memtest86 +-or-similar - то, что Вы действительно хотите и you' ll не смочь сделать это самостоятельно удаленно (если это не параметр загрузки на машине и у Вас есть доступ KVM по IP). –  David Spillett 30 July 2009 в 16:04

Я голосую за неисправный поршень также. Я рекомендовал бы использовать memtest86, чтобы сделать полную проверку поршня. Кроме того, температуры в комнате хороши и прохладны?

2
ответ дан 3 December 2019 в 17:00

Я голосую за дефектную RAM также. Если Вы не можете использовать memtest86, потому что машина удаленно расположена, можно хотеть попробовать инструмент пространства пользователя - memtester, вместо этого. Это не работает вполне также, но может брать некоторые ошибки памяти, если они там.

1
ответ дан 3 December 2019 в 17:00

Просто быстрым взглядом, это похоже на процесс, который запаниковал, был Nagios. Это было последовательно каждый раз, когда это испугано и заперто? Раз так я спросил бы, запустились ли проблемы во время, Вы устанавливаете Nagios. Если это так, затем Вы могли бы хотеть попытаться завершить работу Nagios и видеть, возвращается ли сервер, чтобы быть стабильным. Если это делает затем, Вы нашли преступника и потребность выглядеть ближе для наблюдения что случилось с Nagios.

0
ответ дан 3 December 2019 в 17:00
  • 1
    Nagious является процессом пространства пользователя. Это ain' t собирающийся пугать ядро –  goo 30 July 2009 в 15:29
  • 2
    После второго катастрофического отказа я выключил nagios. Это didn' t справка. –  lexsys 30 July 2009 в 15:31

Google или форумы/список Centos, вероятно, будут Вами лучший выбор. Без дампа crsah будет трудным быть уверенным, таким образом, необходимо изучить получение, которое настроило.

Можно также перерыть Redhat Bugzilla. Это смотрит возможность на основе мало, Вы имеете из снимка экрана.

0
ответ дан 3 December 2019 в 17:00

Теги

Похожие вопросы