XHTML2PDF является набором инструментов Python, который включает и сценарии командной строки и библиотеку Python (должны Вы хотеть встроить это во что-то большее, не выходя из оболочки к сценарию.) Это поддерживает HTML/XHTML и CSS, с дополнительными определенными для поставщика стилями CSS для тонкой настройки отформатированного вывода (например, номера страниц, поток абзаца, и т.д.)
Я только привык его крошечный бит для пакетной обработки несколько документов HTML, но это хорошо работало, и его набор функций кажется всесторонним мне. Руководство скрыто на демонстрационной странице, но является, самой, хорошим примером преобразования от документа HTML до PDF.
У меня был хороший набор ссылок на "прежде" и "после" примеров, но я просто создал свою учетную запись, и, по-видимому, только спаммеры помещают больше чем одну ссылку в свое первое сообщение :-p
Предполагая, что у вас есть доступ оболочки к серверу с файлом журнала, попробуйте
egrep '2[789]/Sep/2011' logfile.big > /tmp/logfile.small
Это вернется к началу 27-го числа, которое немного больше 48 часов, но я ожидал, что это будет намного меньше, чем весь файл, и это быстро. Не забудьте заархивировать полученный файл перед его передачей, это ускорит работу еще больше.