Webalizer - Webalizer

Webalizer
Оригинальный автор (ы)Брэдфорд Л. Барретт
изначальный выпуск1997
Стабильный выпуск
2.23-08 / 26 августа 2013 г.; 7 лет назад (2013-08-26)
Написано вC
Операционная системаКроссплатформенность
Доступно вБолее 30 языков
ТипВеб-аналитика
ЛицензияСтандартная общественная лицензия GNU
Интернет сайтwww.webalizer.org[мертвая ссылка ]

В Webalizer является программное обеспечение для анализа веб-журналов, который создает веб-страницы анализ, из журналов доступа и использования. Это один из наиболее часто используемых инструментов администрирования веб-сервера. Это было инициировано Брэдфорд Л. Барретт в 1997 г. Статистика, обычно предоставляемая Webalizer, включает посещения, посещения, источники перехода, страны посетителей и объем загруженных данных. Эти статистические данные можно просматривать в графическом виде и в разных временных рамках, например, по дням, часам или месяцам.

Обзор

Анализ трафика веб-сайта производится путем группировки и агрегирования различных элементов данных, захваченных веб-сервером в виде файлов журнала, когда посетитель веб-сайта просматривает веб-сайт. Webalizer анализирует файлы журналов веб-сервера, извлекая такие элементы, как IP-адреса клиента, пути URL-адресов. , время обработки, пользовательские агенты, источники перехода и т. д. и группирование их для создания отчетов в формате HTML.

Веб-серверы регистрируют HTTP-трафик, используя разные форматы файлов. Распространенные форматы файлов: Общий формат журнала (CLF), пользовательский формат журнала Apache и расширенный формат файла журнала. Пример строки журнала CLF показан ниже.

192.168.1.20 - - [26 / дек / 2006: 03: 09: 16 -0500] "GET HTTP / 1.1" 200 1774

Пользовательский формат журнала Apache может быть настроен для регистрации большинства параметров HTTP, включая время обработки запроса и размер самого запроса. Формат настраиваемого журнала контролируется строкой формата. Типичная конфигурация формата журнала Apache показана ниже.

LogFormat "% a% l "% u  "% t% m "% U  ""% q  "% p%> s% b% D "% {Referer} i  ""% {Пользователь -Агент} i  "" my_custom_logCustomLog журналы / access_log my_custom_log

Веб-сервер Microsoft Internet Information Services (IIS) регистрирует HTTP-трафик в расширенном формате файла журнала W3C. Аналогично формату пользовательского журнала Apache, журналы IIS могут быть настроены для регистрации таких расширенных параметров, как время обработки запроса. Расширенные журналы W3C можно распознать по наличию одной или нескольких строк формата, например, показанной ниже.

# Поля: дата время s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs (User-Agent) cs (Referer) sc-status sc-bytes cs-bytes time -взято

Webalizer может обрабатывать файлы журналов CLF, Apache и W3C Extended, а также HTTP прокси файлы журнала, созданные Кальмар серверы. Другие форматы файлов журнала обычно конвертируются в CLF для анализа. Кроме того, журналы, сжатые с помощью GZip (.gz) или BZip2 (.bz2), можно обрабатывать напрямую, без необходимости распаковывать их перед использованием.

Командная строка

Webalizer - это приложение командной строки, которое запускается из Операционная система приглашение оболочки. Типичная команда показана ниже.

webalizer -p -F clf -n en.wikipedia.org -o сообщает файлы журнала / access_log

Эта команда предписывает Webalizer проанализировать файл журнала access_log, запустить его в инкрементном режиме (-p), интерпретировать журнал как файл журнала CLF (-F), использовать доменное имя en.wikipedia.org для ссылок на отчеты (-n ) и создайте выходной подкаталог текущего каталога. Используйте параметр -h, чтобы просмотреть полный список параметров командной строки.

Конфигурация

Помимо параметров командной строки, Webalizer можно настроить с помощью параметров файла конфигурации. По умолчанию Webalizer читает файл webalizer.conf и интерпретирует каждую строку как инструкцию обработки. В качестве альтернативы пользовательский файл может быть предоставлен с использованием опции -c.

Например, если веб-мастер хочет игнорировать все запросы, сделанные от определенной группы хостов, он или она может использовать параметр IgnoreSite, чтобы отбросить все записи журнала с IP-адресом, соответствующим указанному шаблону:

IgnoreSite 192.168.0. *

Имеется более сотни доступных параметров конфигурации, которые делают Webalizer легко настраиваемым приложением для анализа веб-трафика. Полный список параметров конфигурации см. В файле README, поставляемом с каждым исходным или двоичным дистрибутивом.

Отчеты

По умолчанию Webalizer создает два вида отчетов - годовой сводный отчет и подробный ежемесячный отчет, по одному на каждый анализируемый месяц.

Ежегодный сводный отчет предоставляет такую ​​информацию, как количество обращений, запросов файлов и страниц, хостов и посещений, а также среднесуточные значения этих счетчиков за каждый месяц. Отчет сопровождается годовой сводной диаграммой.

Каждый из ежемесячных отчетов создается как одна HTML-страница, содержащая ежемесячный сводный отчет (с указанием общего количества обращений, запросов файлов и страниц, посещений, хостов и т. Д.), Ежедневного отчета (сгруппированные счетчики для каждого дня месяца), агрегированный почасовой отчет (группирование счетчиков за один и тот же час каждого дня вместе), отчет по URL (группировка собранной информации по URL), отчет хоста (по IP-адресу), отчеты по URL входа и выхода (с отображением наиболее распространенные URL-адреса первого и последнего посещения), отчет реферера (группировка ссылающихся сторонних URL-адресов, ведущих на анализируемый веб-сайт), отчет строки поиска (группировка элементов по условиям поиска, используемым в таких поисковых системах, как Google), отчет пользовательского агента (группировка по типу браузера) и отчет по стране (группировка по стране происхождения хоста).

В каждом из стандартных отчетов HTML, описанных выше, перечислены только самые популярные записи для каждого элемента (например, 20 самых популярных URL). Фактическое количество строк для каждого отчета контролируется конфигурацией. Webalizer также можно настроить для создания отдельного отчета для каждого элемента, в котором будет перечислен каждый элемент, например, все посетители веб-сайта, все запрошенные URL-адреса и т. Д.

Помимо отчетов в формате HTML, Webalizer можно настроить для создания файлов дампа с разделителями-запятыми, в которых перечислены все данные отчета в виде простого текстового файла. Файлы дампа можно импортировать в приложения для работы с электронными таблицами или в базы данных для дальнейшего анализа.

Интернационализация

Отчеты HTML могут быть созданы на более чем 30 языках, включая каталонский, хорватский, чешский, датский, голландский, английский, эстонский, финский, французский, галисийский, немецкий, греческий, венгерский, исландский, индонезийский, итальянский, японский, корейский, латышский, Малайский, норвежский, польский, португальский, португальский (Бразилия), румынский, русский, сербский, упрощенный китайский, словацкий, словенский, испанский, шведский, турецкий, украинский.

Для создания отчетов на альтернативном языке требуется отдельный двоичный файл webalizer, скомпилированный специально для этого языка.

Критика

  • Сгенерированная статистика не делает различий между посетителями-людьми и роботами. В результате все указанные показатели выше, чем показатели, связанные с людьми. Многие веб-мастера утверждают, что webalizer выдает крайне нереалистичные цифры посещений, которые иногда на 200-900% выше, чем данные, полученные с помощью веб-статистики на основе Javascript, такой как Гугл Аналитика или StatCounter.
  • Количество зарегистрированных совпадений слишком велико для менеджеров загрузки с сегментированными загрузками; каждые 206 «Частичное содержимое» регистрируются как одно попадание.
  • Нет анализа строки запроса. Динамически сгенерированные веб-сайты не могут быть указаны отдельно (например, страницы PHP с аргументами).

Смотрите также

внешние ссылки