В настоящее время каждый:
Кажется, что определенный AMI изменяется со временем (и конечно между регионами).
Ответ может быть найден в любое время или регион:
Выполнение curl http://169.254.169.254/2011-01-01/meta-data/ami-id
после соединения с ssh к одному из кластеров EMR Вы создаете.
Проверка консоли управления EC2 или инструментов CLI от того региона. Ваши экземпляры EMR обнаруживаются как экземпляры EC2.
Также кажется, что возможно запустить их в Ваш собственный EC2 или VPC. Я проверил, что (по крайней мере, с упомянутым выше изображением), Вы можете SSH в него после запуска в EC2. Я понятия не имею, что произойдет с hadoop, если Вы сделаете это или если этот доступ будет прекращен в какой-то момент.
Сейчас
Примерно через 5 лет
Проблема была обнаружена и решена за несколько дней.
Это было так сложно для такого младшего системного администратора, как я;)
Была проблема в файловой системе кластера GFS2, которую мой товарищ по команде подготовил на iSCSI LUN, и эта проблема привела к различным проблемам и проблемам в Dovecot и roundcube (а затем и в apache)
, к вашему сведению, когда я обращаю внимание на% Параметр wa в верхней команде (это было около 90%), я подумал (возможно), что проблема на уровне файловой системы.
Затем я решил перенести все данные в новую файловую систему кластера (ocfs2), потому что GFS устарела!
Прежде всего, все данные были перенесены в новую кластерную файловую систему (на ocf2), а затем перепроектирована вся система на основе пейсмейк хапрокси на debian wheezy!
Ответ:
Я изменил параметр apache max_client на меньшее значение 256 -> 50 почему!?
из-за (все еще) неизвестной проблемы все предварительно подготовленные процессы apache занимают около 100% загрузки ЦП (100% использование этого ядра, на котором запущен предварительно созданный процесс apache в течение нескольких секунд)
Итак, система отключается, потому что в системе 64 Ядра ЦП, когда все 256 процессов apache используют 100% ЦП, система и службы отключаются
проблема все еще существует, но у служб нет проблем Я думаю, проблема связана с сетевыми атаками (наши инструменты мониторинга сообщают о множестве атак в день), которая иногда вызывает проблемы, такие как блокировка ресурсов или что-то еще
спасибо за все предложения.