Debian (и вероятно Ubuntu) имеет систему, названную 'debootstrap', который сделает то, что Вы хотите для тех систем. Существует хорошая основная статья о нем.
Webalizer очень хорош в горной промышленности Ваших журналов Apache для статистики - кто посещает, от того, какие IP-адреса, разбивка видов доменов они обратная твердость дюйм/с к (.com, .NET, .co.uk, .ru, и т.д.), чем их браузеры утверждают, что были (который обычно является, хотя не всегда, что они на самом деле), что использует операционная система пользователь (снова, если браузер сообщает об этом честно), и т.д., и т.д. Это абсолютно ненавязчиво; ничто специальное на Ваших веб-страницах, никаких дополнительных запросах к внешним серверам на каждой загрузке страницы, и т.д.
Аналитика Google, с другой стороны, работает на клиентском уровне. Каждая страница на Вашем сайте обращается к Google Analytics через тег script так, чтобы они могли получить эту информацию для Вас (и гораздо больше кроме того). Очень простой в использовании, но это действительно подвергается тому дополнительному запросу к их серверам на каждой загрузке страницы. Кроме того, обратите внимание, что некоторые рекламные блокировщики также заблокируют Google Analytics; и GA требует JavaScript, который некоторые (хотя не многие), возможно, выключили.
Это были бы два из больших, каждого с его другим подходом. Webalizer быть совершенно локальным (и поэтому частный) и ненавязчивый может обращаться; объем и аналитические функции GA могут обращаться.
Для обработки больших файлов журнала Вы могли бы хотеть изучить вращающие устройства журнала: http://www.cyberciti.biz/faq/how-do-i-rotate-log-files/
Существует локальная, основанная на PHP альтернатива С открытым исходным кодом Google Analytics под названием Piwik, который все еще находится в процессе тяжелого развития, но уже стоящий внимательного взгляда.
В то время как webalizer недавно видел некоторое действие, AWStats предоставляет больше информации для управления обоими сайт, а также контроль мощности сервера.
Аналитика Google, которая лучшая функция для маркетинга, если бы Вы надеетесь управлять сервером, я предложил бы инструменты Google Webmaster
Аналог предварительно упаковывается для для Ubuntu. Это легко установить и работает обоснованно хорошо с минимальной установкой. Волшебство отчета может использоваться для улучшения формата вывода.
Данные, от которых статистические данные найдены в/var/log/apache. Они автоматически повернуты и сжаты для Вас logrotate. Размер файлов зависит от количества запросов, формата журнала и размера URL на Вашем сайте. Если у Вас нет очень занятого сервера, они не должны быть очень большими.
awstats также упаковывается для Ubuntu, но не так легок установить. Это действительно сохраняет статистику в своих собственных файлах журнала. Я утверждаю, что смог отследить посещения.