Сбор информации начинается с того момента, как посетитель запросил вебстраницу на веб-сервере. Сервер направляет запрашиваемую страницу обратно в веб-браузер пользователя (Шаг № 1). Когда браузер пользователя обработал присланные сервером данные, он запускает специальный код urchin.js (Шаг № 2) и передает информацию об этом событии на сервер Google Analytics.

Детальная схема работы системы Google Analytics

Рис. Детальная схема работы системы Google Analytics

После того как браузер запустил код, GATC начинает отслеживать каждую последующую страницу, запрашиваемую пользователем. Во время выполнения запущенный код (программа) пытается собрать как можно больше идентификационных атрибутов, приходил ли данный пользователь уже на сайт, откуда пришел и т. п.

После того как вся нужная информация собрана, GATC записывает данные в файлы cookies (Шаг № 3). Файлы Cookies нужны для сохранения информации о посетителе. После сохранения файлов Cookies трекинг-код посылает данные на сервер Google Analytics (Шаг № 4). После того как сервер Google Analytics получил информацию, он сохраняет все данные в специализированном файле, который называется лог-файл (Шаг № 5). Данные по каждой странице сайта хранятся отдельными записями в этом лог-файле. Каждая запись лог-файла содержит большое количество атрибутов страницы, например:

? время визита на страницу (дата и время);

? откуда пришел посетитель (реферальный сайт, поисковая система и т. п.);

? сколько раз заходил на сайт (количество посещений);

? географические данные посетителя (местоположение);

? IP-адрес посетителя.

После того как информация сохранена в лог-файле, сбор-информации закончен. Следующим шагом является обработка информации.

Каждый определенный промежуток времени (обычно раз в несколько часов) Google Analytics обрабатывает данные, хранящиеся в лог-файле. Во время обработки каждая отдельная запись лог-файла расщепляется на маленькие части, каждая часть соответствует определенному атрибуту страницы. Далее мы приведем примерный шаблон лог-файла:

67.57.345.12 www.www.seo-study.ru - [21/NOV/2007:19:05:06 -0600] "GET

/_utm.gif ?utmwv=l&utmn=3237 03347&utmcs=utf-8&utmsr=

1600x1200&utmsc=32-bit&utmul=enus&

utmje=l&utmf1=8.0&utmcn=l&utmdt=EpikOne%20%2 0Google%2 0Analytics%20Support%2C%2 0Training%2 0-%2 0Urchin%2 05%2 0Software%2C%2 0

Analytics%2 0Consulting&utmhn=www.seo-study.ru&utmr=&utmp=/ HTTP/1.1" 200 35 "http://www.seo-study.ru/" "Mozilla/4.0 (compatible; MSIE 6.0;

Windows NT 5.1; SV1; .NET CLR 1.1.4322; .NET CLR 2.0.50727)"

"_utma=100957269.3237 03347.1164157501.1164157501.1164157 501.1;

_utmb=1009572 69;

_utmc=1009572 69;

_utmz=1009572 69.1164157501.1.1.utmccn=(direct)|utmcsr=

(direct)|utmcmd=(none)" Большинство кода не очень понятно, но часть его все же можно расшифровать, например, дата и время (21 ноября 2007 года в 19:05:06) и IP-адрес посетителя (67.57.345.12) вполне понятны. Google Analytics помещает данные в лог-файл в специальные поля (Field). Например, IP-адрес помещается в поле, называемое IP-адрес. Каждая страница вашего сайта имеет множество атрибутов, и каждый из этих атрибутов хранится в отдельных полях.

После того как каждый атрибут был помещен в свою форму (Шаг №6), ваши данные проходят через фильтр (Шаг №7). Фильтры контролируют данные, которые появятся в ваших отчетах.

Наконец, после фильтрации создаются отчеты (Шаг №8) и сохраняются в базе данных (Шаг №9). Каждый отчет в Google Analytics создается в сравнении одного поля с другим. Например, Города посетителей интегрируются с другими данными (Посетители, Просмотренные страницы, Показатель отказов, Уровень конверсии и т. п.).

Когда данные попали в базу данных, процесс завершен. Когда вы (или любой другой пользователь) запрашивает определенный отчет, необходимые данные запрашиваются из базы данных и направляются в браузер пользователя.