Добавление меньших узлов к псевдораспределенному nutch/hadoop кластеру

Да, 6to4 IPv4 к функции перехода IPv6, на которую клиенты IPv4 могут рассчитывать, чтобы говорить друг с другом с протоколом IPv6. Так как Вам не нужен IPv6 (ни переход IPv6), можно проверить, как он работает, если Вы отключаете 6to4 Адаптер.

  1. Нажмите Start – Выполнение – Тип devmgmt.msc - и нажмите "OK" – в Диспетчере устройств, нажмите View и выберите Шоу, скрытые устройства – расходуют Сетевые адаптеры – проверяют состояние 6TO4 адаптер.

  2. Отключите 6TO4 адаптер в Диспетчере устройств.

0
задан 21 May 2011 в 12:54
2 ответа

Необходимо будет переместиться в кластерную установку от псевдокластерной установки и путем выполнения так, Вы действительно вытащите больше процессивности из своего кластера путем добавления большего количества узлов, т.е. Вы сможете обработать больше карты и уменьшить задачи. Увеличение процессивности, как Вы ожидали бы, линейно.

Репликация решит, что количество копирует, которые присутствуют в Вашем кластере для каждого блока HDFS. Так позволяет, предполагают, что у Вас есть файл, который разделяется на 6 блоков для репликации 3, 18 блоков будут распространены в Вашем кластере. Чем больше узлов Вы имеете, тем более высокое покрытие Вы получите и таким образом когда оно сведется к открытию Вашей фазы карты, меньше данных будет иметь, чтобы быть переданным между узлами данных. И отвечать на Ваш заключительный вопрос, Hadoop будет всегда пытаться присвоить задачи карты узлам, которые служат узлами данных для входа к тем задачам карты. Так в этом случае копирование сделает эту задачу легче, так как будет больший пул tasktrackers для выбора из.

1
ответ дан 4 December 2019 в 22:21

Ваш вопрос немного сбивает с толку. Если Вы работаете в псевдораспределенном режиме, то это - то, где все четыре процесса (JobTracker, NameNode, DataNode, TaskTracker) все запускаются на том же (обычно разработка) система.

Конфигурация xxx-site.xml Hadoop для псевдораспределенного имеет все говорящее localhost, таким образом добавляя, что новые узлы не будут работать.

При оставлении в стороне этого, если Вы добавляете больше узлов, и они выполняют и DataNodes и TaskTrackers, затем Вы получите добавленное устройство хранения данных и способность ЦП.

Обратите внимание, что, поскольку Вы заполняете HDFS, в конечном счете 3x, репликация не будет возможна, когда все меньшие узлы будут на полной мощности, таким образом, Вы начнете получать предупреждения/ошибки.

0
ответ дан 4 December 2019 в 22:21

Теги

Похожие вопросы