Я могу использовать Google Appliance/Mini, чтобы проверить и индексировать сайты, которыми я не владею?

Конфигурация, которую Вы отправили, значительно более сложна, чем это должно быть. Я не совсем уверен, почему это настраивается тот путь, но я действительно замечал несколько вещей, которые могли бы иметь значение.

Прежде всего в drupal6.conf все, в чем необходимо нуждаться, следующее:

<Directory /home/d/r/drupal/web/public_html/>
    Options +FollowSymLinks
    AllowOverride All
    order allow,deny
    allow from all
</Directory>

Остальная часть материала вторична и может усложнять (или вызывать), проблема. Я рекомендовал бы - специально для начальной установки - упростить конфигурации как можно больше. Я выполняю много сайтов Drupal, и я никогда не смешиваю ни с чем вне указания на mysite.conf к каталогу Drupal и созданию (корень Drupal) каталог /sites/my.site.com и файлы настроек.

Я рекомендовал бы разорвать все другие материал из drupal6.conf и видеть, работает ли он на установку. Затем добавьте назад в блоках доступа на / администраторе, install.php, и т.д. Я не рекомендую смешать с .htaccess файлами в файле конфигурации. Не учтите строку включая .htaccess в апачских конфигурациях и просто позвольте .htaccess быть взятым, поскольку это разработано к апачем.

0
задан 26 July 2010 в 17:33
1 ответ

Это должно быть прекрасным, пока Ваша проверка уважает файл robots.txt сайтов.

Поиск Google для robots.txt даст Вам большую информацию.

Кратко, это - файл для определения, как поисковый робот/робот получает доступ к сайту, позволенному, и запретил содержание, скорость доступа, время суток, и т.д.

1
ответ дан 4 December 2019 в 22:57
  • 1
    Право, robots.txt содержит "правила" для индексации сайта. Не то, чтобы я был бы, но быть там чем-нибудь "официальное" высказывание, что я должен уважать тот файл? (Кроме не желания быть dick) –  John Bubriski 23 July 2010 в 23:56
  • 2
    Вы не можете быть вынуждены использовать его, как реализация находится на стороне поискового робота, не стороне сервера. До законный, не, что я услышал о, но я никогда не исследовал его. AFAIK это - просто сообщество, создал стандарт, чтобы помочь всем играть по правилам друг с другом. –  ManiacZX 24 July 2010 в 01:07
  • 3
    Игнорирование IMO "robots.txt" пересекает строку в неэтичное поведение, которое находится, вероятно, на территории "злоупотребления". Думайте о нем как о наличии разрешения использовать мое объединение, затем злоупотребляя тем разрешением путем обеспечения шумной стороны, это повреждает мой дом. Если Вы сделаете это к неправильному объекту (правительство, банк, и т.д.), то Вы будете, вероятно, мог быть в неприятностях с законом. –  duffbeer703 26 July 2010 в 19:23

Теги

Похожие вопросы