Достоверность библиотечной веб-статистики


The Presentation inside:

Slide 0

Достоверность библиотечной веб-статистики Канн Сергей Константинович снс ГПНТБ СО РАН [email protected]


Slide 1

Значение сбора и анализа статистики сайта Управление ресурсами ? мониторинг посещаемости ? определение аудитории ? изучение поведения и запросов пользователей ? принятие решений по развитию функционала ? оценка эффективности вложений ? выявление проблем сайта (в структуре, навигации и контенте) Выявление тенденций развития (анализ и прогноз) Отчётность Библиометрия и библиотековедение Сравнения (рейтинги) 2


Slide 2

Инструменты веб-статистики Внешние ? ? счётчики-рейтинги (hotlog, liveintemet, openstat, rambler’s top 100) ? счётчики-трекеры (яндекс.метрика, google analytics) ? системы интернет- аналитики для детализации разных веб-показателей по просмотрам страниц, поведению пользователей, etc. (clicktale, iplogger, spybox, woopra) Внутренние ? ? лог-анализаторы (analog, awstats, piwik, semonitor, webalizer, webtrends) ? специализированные модули статистики (lc-bitrix-web- analytics, drupal statistics, joomlastats, wordpress wp- statistics) 3


Slide 3

Недочёты внешней статистики Предъявляя единые требования к мониторингу разных сайтов, внешние системы слежения слишком зависимы от каналов связи (пропускной способности, устойчивости, особенностей конфигурации сети и пр.); обрабатываемые узлы ставятся в заведомо неравное положение В профессиональной печати всё чаще ставятся вопросы о точности и корректности данных Google Analytics В Яндекс.Метрике сами авторы проекта пишут: «Большинство роботов не исполняют код Метрики и могут быть обнаружены только в логах веб-сервера» 4


Slide 4

Точность данных в Google Analytics На стороне сервера Не на всех страницах установлен код отслеживания (Google Analytics Tracking Code) Код отслеживания неверно расположен (не успевает загрузиться) Путаница кодов отслеживания на одном ресурсе Ошибки выполнения JavaScript Ошибки в синтаксисе кода отслеживания Подсчет собственных посещений Некорректная настройка utm-меток На стороне клиента В браузере не включен JavaScript Отключены или удалены cookie-файлы Истёк срок действия cookie-файлов Одно устройство ? несколько пользователей; один пользователь ? разные устройства Данные обрабатываются не сразу 06.11.2013 | Автор: Алексей Макаров (ведущий специалист по аналитике Russian Promo) 5


Slide 5

Инструменты внутренней веб-статистики На сайте Отделения ГПНТБ СО РАН используется статистическая система AWStats 6.5 (устаревшая) Система не знает браузера Chrome, ОС Windows 7, многих мобильных приложений Общие недостатки систем лог-анализа ? плохое отслеживание роботов (ботов) Статистика искажается при использовании разных средств «анонимизации» посещений [режимы приватности браузеров («инкогнито»), очистка журнала, удаление cookie, подавление скриптов с помощью плагинов (disallow script button, ghostery, noscript), блокирование сценариев, изображений и встроенных объектов (пиксельных тегов, веб-маяков)] 6 устойчивость показателей


Slide 6

Проблема различения «ботов» и людей Автоматические средства работы с сайтом являются главным фактором искажения веб-статистики При отслеживании ботов необходимо использовать несколько инструментов 7


Slide 7

Основные блоки веб-статистики сайта Достоверность веб-статистики сайта должна определяться по каждому из блоков для ключевых показателей необходимо определять доверительный интервал в конечном итоге веб-статистика сайта сводится к выявлению фактов и трендов 8


Slide 8

Заключение Значимость библиотечной веб-статистики в первую очередь определяется потребностями рационального управления ресурсами (анализ и прогноз развития сайтов) Для совершенствования статистических отчётов по библиотечным сайтам необходимо совершенствовать инструменты и методики сбора и анализа веб-статистики Наиболее важной проблемой в области получения достоверной статистики представляется проблема идентификации и отделения веб-статистики ботов от статистики реальных пользователей В любом случае, представляется, что на данный момент веб-анализ библиотечных сайтов является больше искусством, чем сложившейся наукой 9


Slide 9

Спасибо за внимание ! Канн Сергей Константинович старший научный сотрудник ГПНТБ СО РАН [email protected] | [email protected] 10


×

HTML:





Ссылка: