Возможный выполнить OCR на Linux?

wget? См. http://www.gnu.org/software/wget/manual/wget.html#Recursive-Retrieval-Options

Это получит дерево каталогов, что можно затем архивировать использование любой из обычных застежек-молний командной строки. Вы только что поместили все это в пакетные файлы и выполнили его из Планировщика задач.

МЛАДШИЙ]

1
задан 25 January 2012 в 08:34
4 ответа

Teseract, кажется, является лучшим. http://code.google.com/p/tesseract-ocr/

Обзоры, кажется, говорят, что это - единственное, которое бьет перепечатывающие вещи. http://www.linux.com/archive/feature/138511 http://www.linux.com/archive/feed/57222

Разве люди не гуглят mone? 5 минут, читая то, что я потянул с "ocr Linux" как мои критерии поиска.

3
ответ дан 3 December 2019 в 19:50
  • 1
    @Ronald Pottol, я сделал Google для OCR в Linux и я нашел среди другого tesseract и gocr, но я был сувенирами, чтобы видеть, было ли некоторое подобное приложение, которое может использоваться в качестве сервера и которое я возможно пропустил в своем поиске. Это - причина, что я задал такой общий вопрос. –  crazybyte 2 March 2010 в 14:21
  • 2
    А-ч, я знаю чувство (I' ve задал вопросы, что я исследовал хорошо надежду на лучшие ответы). –  Ronald Pottol 2 March 2010 в 23:37

У меня был  проект , который потребовал OCR.  Можно использовать GOCR для   части OCR. Для преобразования в pbm  формат изображения  можно использовать djpeg. Если Вам нужно в  быть интегрированными с сетью,  можно назвать преобразование/ocr из PHP, также   отсюда до реализации  сохранение DB.

0
ответ дан 3 December 2019 в 19:50

Я настроил очередь сообщений и отправляю задачи ей для обработки. Все, что необходимо было бы действительно сделать, загрузить файл как изображение к общей платформе хранения, возможно, GlusterFS или подобный, затем продвинуть имя файла и путь к очереди сообщений, для обработки. Все, что необходимо было бы сделать затем, настраивается процесс, чтобы слушать очередь и выполнить gocr на нем, продвигая выходные данные в базу данных..

Легкий.. В теории.;)

0
ответ дан 3 December 2019 в 19:50
  • 1
    Спасибо за предложение. У меня было подобное (если не то же) идея. Я хотел только видеть если wasn' t там уже разработанное серверное приложение, которое может использоваться. –  crazybyte 2 March 2010 в 14:23
  • 2
    Я сомневаюсь, что существует. There' s много компонентов все предварительно сделанные и доступные, очередь сообщений, база данных, совместно используемая память, пакет OCR. Все, что необходимо сделать, обеспечивают Связующее звено. –  Tom O'Connor 2 March 2010 в 17:22
  • 3
    Существует такой сервер, но it' s не свободный или с открытым исходным кодом. –  crazybyte 3 March 2010 в 09:56

Вы посмотрели на WatchOCR? Это - свободный и сервер OCR с открытым исходным кодом, который преобразовывает изображение только PDFs в текст доступный для поиска PDFs от наблюдаемой папки или сетевого ресурса.

0
ответ дан 3 December 2019 в 19:50