Простое решение с открытым исходным кодом для хранения документов PDF и поиска по ним [закрыто]

Я работаю в очень маленькой управляющей компании, у которой много документов, которые я хочу оцифровать в PDF и разместить в Интернете для всех жителей. Многие люди не разбираются в технике, поэтому необходимо что-то простое в использовании.

У меня есть навыки создания серверного решения на базе LAMP, но такого, которое не должно стоить значительных денег на покупку или поддержку, следовательно, с открытым исходным кодом, желательно с небольшим объемом памяти. Все, что я рассмотрел до сих пор (например, Alfresco, KnowledgeTree и LogicalDOC), кажется мне излишеством и сложным как с точки зрения установки, так и для пользователей.

Я думал о чем-то вроде AjaxExplorer, который, похоже, отлично справляется с просмотром файлов. Что касается полнотекстового поиска, есть ли продукт, который будет работать с AjaxExplorer, или что-то другое, что может работать вместе с ним, что люди могли бы порекомендовать как относительно простой в настройке инструмент для индексирования и последующего поиска в хранилище документов?

Было бы приемлемо иметь отдельные области внешнего интерфейса для просмотра дерева файлов, простого поиска по имени файла / метаданным и полнотекстового поиска, если, как я подозреваю, нет подходящего интегрированного решения.

2
задан 4 January 2012 в 19:21
3 ответа

Я использовал MNOGOsearch для индексации стопки файлов PDF. Он выполняет полнотекстовый поиск PDF-файлов и многих других типов документов. Вы также можете найти интерфейс поиска довольно знакомым.

Версии * nix лицензированы GNU.

http://www.mnogosearch.org/

1
ответ дан 3 December 2019 в 10:59

Лично я бы просто использовал обычный дистрибутив Apache (без PHP), а затем добавьте фильтр для обслуживания только документов .pdf:

Есть много разных способов сделать это. Например, эту директиву, которую вы помещаете в свой узел "Каталог" в файле httpd.conf:

<Directory "C:/Apache2.2/htdocs">
    Options Indexes Includes MultiViews
    IndexOptions +ScanHTMLTitles -IconsAreLinks FancyIndexing FoldersFirst NameWidth=*
    AddIcon (IMG,/webicons/image3.gif) .gif .png .jpeg .jpg .xbm .PNG .JPG .GIF .tiff .bmp
    AddIcon (IMG,/webicons/compressed.gif) .7z .zip .cab .tar .jar .mdb .ldf .mdf .CAB
    AddIcon (IMG,/webicons/binary.gif) .exe .msi .rdp .pcf .dia .class .ks .keystore .scc
    AddIcon (IMG,/webicons/a.gif) .txt .log .properties .doc .xls .xml .ts .msg .dat .sql .csv .pem .sh .py .tlp .java .der .csr .key .crt .bat .cmd .inf
    AddIcon (IMG,/webicons/link.gif) .lnk .htm .url .URL
    AddIcon (IMG,/webicons/pdf.gif) .pdf
    AddIcon /webicons/folder.png ^^DIRECTORY^^
    #ForceType application/octet-stream
    ....
    ....

Затем введите: http://domain.com/pdf/blah.pdf

Если вам действительно необходимо есть функция поиска, вы можете установить PHP и использовать Поиск плоских файлов PHP .

1
ответ дан 3 December 2019 в 10:59

ownCloud - это решение с открытым исходным кодом для хранения файлов, которые могут работать на LAMP. У него очень чистый интерфейс , и хотя у него есть другие функции (календарь, контакты, музыка, изображения), все они могут быть легко отключены . Начиная с версии 3 он имеет встроенную программу просмотра PDF. Начиная с версии 5 , он имеет полнотекстовый поиск PDF на базе Lucene.

1
ответ дан 3 December 2019 в 10:59

Теги

Похожие вопросы