Веб-сайт перемещен на новый сервер - обновлен DNS - поисковые роботы по-прежнему обращаются к старому сайту по IP

Около десяти дней назад я переместил сайт - в основном доску обсуждений Joomla - на новый сервер с другим IP-адресом. Во время короткого запланированного простоя я реплицировал контент и завершил переключение DNS (через Cloudflare), как обычно, и большая часть трафика последовала за ним - все реальные пользователи могут получить доступ к сайту в новом месте, и это похоже на большинство веб-сканеров запросов.

Однако, У меня все еще есть поисковые роботы, пытающиеся получить доступ к моему сайту со старого IP-адреса. И я имею в виду, в частности, по IP-адресу - хотя они пытаются сканировать действительные пути, которые теперь существуют на новом сервере. В первую очередь это GoogleBot, хотя я также вижу спорадические записи BingBot или Yahoo Slurp. Журналы Apache показывают 1-2 доступа в минуту на старом сервере.

Однако все три этих бота выполняют большую часть своего сканирования на новом сервере.

Я удалил контент со старого сервера, поэтому эти запросы удовлетворяются с 404. Существует ли соглашение, по которому сканеры каким-либо образом индексируют IP-адрес сервера?

Есть ли способ заставить их просматривать новый сайт? Следует ли мне активно пытаться перенаправить их с помощью пользовательских кодов ошибок HTTP?

0
задан 18 November 2015 в 22:26
1 ответ

Обновление кэша DNS на этих сканерах может занять невероятное количество времени, но 10 дней мне кажутся растянутыми. OTOH вы говорите, что они попадают на ваш сайт по IP, что, безусловно, ошибочно. TBH это больше похоже на плохую ссылку и тот факт, что ваш веб-сервер не перенаправляет IP-адреса на фактические URL-адреса FQDN, а затем поисковый робот продолжает просматривать собственные относительные ссылки сайта (но это всего лишь предположение).

I не стал бы беспокоиться о перенаправлениях, если только вы не собираетесь запускать этот старый сервер в течение длительного времени, чтобы сделать именно это. Например, мы ввели SSL год назад (с перенаправлением 301), но все еще получаем много запросов по обычному HTTP. И они являются прямыми ссылками на определенные ресурсы (например, загрузки), поэтому дело не в том, что они вводят основной адрес без указания https: //. Пока вы продолжаете обслуживать его, они будут продолжать его использовать.

Если эти же самые боты будут сканировать и ваш новый сервер, я действительно не буду возражать. Мои 2 цента.

1
ответ дан 4 December 2019 в 16:46

Теги

Похожие вопросы