Правильная ссылка на эту страницу
http://az-design.ru/Projects/WebStat/Stat001.shtml

Методы сбора статистики посещений

       1) Счетчик посещений
       2) Участие в рейтингах
       3) Анализ логов сервера
       4) Программа WebAlizer
       5) Сбор данных непосредственно со страницы

       Счетчик посещений – это самый простой способ узнать, интересуются ли твоим сайтом люди или он как "глас вопиющего в пустыне". Заключается он в том, что на странице размещается некоторый код, который вызывает достаточно простую программу на сервере, которая увеличивает на 1 число в текстовом файле, после чего содержимое файла отображается на странице в графическом или текстовом виде. Как правило эта функция предоставляется провайдером, а в случае отсутствия может быть установлена самостоятельно, благо бесплатных скриптов на эту тему множество.

Единственное достоинство этого способа – простота.

Недостатки:
       1) Самый главный недостаток – неизвестно что показывает счетчик. Если он установлен на главной странице, то он показывает сколько раз запрашивалась ЭТА страница. Если он установлен на всех страницах, то это не количество посетителей, а количество просмотренных страниц. Есть способы фильтрации пользователей используя его IP-адрес, но один пользователь может заходить с нескольких адресов (например, работая через модем при обрыве связи пользователь в каждой сессии будет получать новый IP-адрес), с другой стороны с одного адреса могут работать несколько пользователей – при работе в локальной сети через прокси-сервер.
       2) Невозможно определить динамику посещений. В самом деле не будешь же каждый день заходить на сайт и записывать показания счетчика.
       3) Раскрутка сайта, основанная на показаниях счетчика ничем не отличается от накрутки (или скрутки) спидометра в автомобилях. Это основной прием жуликов, которые хотя продать старый автомобиль, как новый.

       Участие в рейтингах. Другой способ посчитать посетителей – это различные рейтинги mail.ru, rambler_top100, SpyLog, HotLog и другие. Суть остается та же – прибавляется единичка. Только в этом случае эту операцию делает кто-то другой.

Достоинства: кто-то другой выполняет всю работу по определению уникальных пользователей (правда тоже по IP-адресу). Кто-то другой может посчитать динамику посещений, статистику по дням и часам, регионам и др.

Недостатки:
       1) Кто-то другой определяет правила подсчета посетителей и формы отчета по заданным параметрам. Владелец сайта не имеет ни прав, ни возможностей влиять на ситуацию. Например, Rambler считает только посещения главной страницы, а это в десятки раз меньше реальных значений.
       2) Для вызова функции на странице устанавливается код, котрый вызывает программу на ДРУГОМ сервере. Это означает, что даже если ваша страница достаточно мала и ваш провайдер достаточно быстрый, время загрузки определяется временем отклика ДРУГОГО сервера. А так как на него ссылается много других сайтов, то этот ДРУГОЙ сервер оказывается наиболее загружен. Если на странице установлены несколько счетчиков (рейтингов), то время загрузки может создавать значительный дискомфорт при работе со страницей, со всеми вытекающими последствиями – а повлиять на это нельзя – см. п.1.
       3) Если эта статистика бесплатная, то с ней могут твориться совершенно непонятные вещи. Например, установленный на сайте www.az-design.ru счетчик HotLog два месяца работал нормально, потом сбросился на 0, через день показания стали в 1.5 раза меньше чем до сбоя. Таким образом, что он показывает неизвестно.

       Анализ логов сервера. Этот способ основан на возможностях, которые может предоставить провайдер. Как правило любой WEB-сервер может записывать протокол обращений к файлам сайта, так называемый Log. Если ваш провадер предоставил вам возможность считывать эти логи, то вы можете самостоятельно проанализировать посещаемость.

Достоинства: достаточно подробная информация, отсутствие задержек на странице (вся работа выполняется WEB-сервером и не видна посетителю)

Недостатки:
       1) Предоставление доступам к лог-файлам – право, а не обязанность провайдера.
       2) Несмотря на стандартизованный формат данных (есть два-три формата, которые достаточно подробно описаны в литературе), как правило это список значений, разделенных каким-либо символом – запятой или точкой с запятой. Таким образом даже простой анализ требует разработки дополнительных средств.
       3) Для экономии места на сервере провайдер осуществляет так называемую "ротацию" логов. Т.е. каждый день файлы переименовываются – вчерашний из 0.log в 1.log, 1.log в 2.log и так далее, а на место 0.log записывается сегодняшний файл. Таким образом нужно либо каждый день скачивать эти свежий файл, либо написать программу и запускать ее с помощью программы Cron для посылки файла по e-mail. Возможность запуска программы Cron также предоставляют не все провайдеры и не во всех тарифных планах.

       Программа WebAlizer. Многие провайдеры стали устанавливать программу WebAlizer (подробности на сайте http://www.mrunix.net/), которая производить анализ лог-файлов и генерирует достаточно подробные отчеты по дням и месяцам, есть также суммарная статистика по часам. При всем том, что управление программой осуществляет провайдер (владелец сайта не имеет возможности что-либо менять), она удобна для предварительного анализа того, что происходит на вашем сайте. Как выглядят результаты работы этой программы можно посмотреть на сайте www.az-design.ru/webalizer/index.html, а более подробное описание посмотреть здесь.

       Сбор данных непосредственно со страницы. Даже при отсутствии вышеперечисленных средств возможно собирать статистику посещений сайта и при этом, достаточно точную и полную.
       Для этого нужно вспомнить, что пользователь вместе с запросом страницы передает на сервер так называемые переменные окружения. Необходима небольшая программа которая:
       1) выделяет эти переменные
       2) формирует из них протокол в удобном виде
       3) посылает их на указанный вами e-mail.
       Что и было сделано. Код на странице вызывает программу на сайте, которая выбирает все "полезные" переменные окружения, формирует из них скрипт на языке SQL, который готов для ввода в базу данных. При этом появились возможности, которые отсутствуют в других системах:
       1) С помощью Cookies помечается БРАУЗЕР пользователя. Таким образом, пользователь может менять не только IP-адрес, но и провайдера. Пока жив cookies. пользователя можно будет отследить.
       2) дополнительно - отслеживаются скачивание отдельных файлов с сайтов и ведеться подсчет количества скачанных файлов. БД скачанных файлов одна на весь сайт.
       3) дополнительно – отслеживаются переходы по ссылкам на "чужие" сайты, т.е. сайты, на которых нет этой программы.
       4) дополнительно – отслеживаются вызовы почтовой программы для отправки e-mail.
       И, наконец, с помощью этого метода легко определяется эффективность одной или другой рекламной кампании. Причем, количество одновременно проводимых рекламных акций не ограничено.

© 27.11.2003, Архангельский А.Г.

Оглавление
Главная страница




Дата последнего изменения:
Thursday, 21-Aug-2014 09:11:43 MSK


Постоянный адрес статьи:
http://az-design.ru/Projects/WebStat/Stat001.shtml