Я могу запустить поиск сайта как Lucene на единственном сервере на 2 ГБ, это - также сеть и mysql сервер

apt-get install star
man star
star -acl -whatever -other -options -you -need

Звезда является tar с поддержкой расширенных заголовков POSIX, то есть, способность хранить некоторые дополнительные данные о файле в файле tar. -acl опция получает ACLs; Вам нужен он и для создания архива и для извлечения.

2
задан 15 December 2014 в 22:31
1 ответ

Сколько страниц Вы, должно быть, превысили предел Google Custom Search (просто задающийся вопросом)?

Я рекомендую использовать Сфинкса, Lucene был прекрасен до нескольких тысяч индексируемых объектов, но кроме того это было неприменимо, поиски были невыносимо медленными и восстановили, индекс займет часы.

У нас есть Сфинкс, работающий на Облачном Сервере Rackspace с 1 ГБ RAM вместе с остальной частью сервисов, требуемых выполнять сайт (Apache, PHP, MySQL, Memcached и т.д.), и это работает большой.

Веб-сайт у нас есть Сфинкс, работающий в настоящее время, имеет> 70 000 статей, поиски, завершенные очень быстро, и он может восстановить свой весь индекс через ~11 секунд. Я выбрал Sphinx на основе рекомендаций от других разработчиков и знания, что несколько больших сайтов полагаются на него для своих поисковых систем (Неопобеда, являющаяся одним из них).

3
ответ дан 3 December 2019 в 11:14
  • 1
    Просто смотря на статистику CSE и это только, кажется, имеет индексированных приблизительно 9 850 страниц, но мы имеем намного больше при рассмотрении общедоступного поиска Google. I' ve думал о Сфинксе прежде, но много наших страниц не находится в нашей mysql базе данных. It' s предложил иметь бросок поискового робота страницы & URL в дб и затем имеют индекс Сфинкса что, но я haven' t нашел поисковый робот все же, которые бросают его результаты в mysql. –  Ian 22 February 2010 в 03:03
  • 2
    Я вижу, я думаю you' d определенно сталкивается с трудностью быстро с тем количеством данных в Lucene, Сфинкс может быть хорошим вариантом, но мной don' t знают, как Вы могли пойти о получении Вашего non-mysql содержания в индекс. Возможно, необходимо задать другой вопрос о crawler-> mysql?:) –  Steve 22 February 2010 в 14:22
  • 3
    Какая lucene версия/реализация Вы использовали это, у Вас были проблемы с по нескольким тысячам документов? Lucene и Solr могут решить миллионы легких проблем, таким образом, это кажется нечетным, у Вас были проблемы –  Cristian Vat 11 June 2010 в 08:58
  • 4
    я не был ясен на этом; это была реализация PHP Lucene. Я думаю, что могу прекратить писать теперь, что :P –  Steve 2 October 2010 в 14:20

Теги

Похожие вопросы