Разделы

Big Data Маркет

Big Data увеличила суммарное время аудитории на сайте Sports.ru до 20 лет в день

Анализ больших данных о посетителях портала Sports.ru помог существенно повысить посещаемость и привлечь авторов «из народа». Данные используются для сегментации аудитории и создания персонализированных email-рассылок или индивидуальных рекомендаций на сайте. Благодаря этому подписки на блоги выросли в восемь раз, а число регистраций – в пять раз. Суммарное время, проводимое пользователями на сайте в течение дня, достигло 20 лет.

Около года назад руководство спортивного сайта Sports.ru и спортивной социальной сети «Трибуна» пришло к выводу, что аналитика, поставляемая публичными счетчиками, недостаточна для развития интернет-проекта. Руководители проектов начали искать новые способы обработки данных. Портал, собирающий более 1 млн уникальных посетителей в сутки, располагает большим объемом информации для анализа. Ежедневно на сайте размещается около 700 новостей и 500 текстов (97%  из которых пользовательские). Впоследствии они также доступны через 160 мобильных приложений и в 1200 тематических группах в соцсетях (посвященных разным видам спорта, клубам и спортсменам), что значительно расширяет конечную аудиторию потребителей.

«Нельзя сказать, что мы знали, что делаем в начале пути. Мы предполагали, что данные добавят нашему интуитивному творчеству чуть больше смысла. И нам очень хотелось много красивых графиков и больше понимания, чем живут наши пользователи. Мы совсем не ожидали, что за год построим систему полного цикла обработки данных, а компания начнет дышать в ритме DataDriven», – вспоминает Илья Салтанов, директор по развитию Sports.ru.

Для анализа обширной информации о пользователях Sports.ru обратился к технологиям BigData. Сбор сырых данных компания делает сама, а функции хранения, вычисления, анализа и визуализации было решено вынести в облако. Для этих задач аналитики Sports.ru воспользовались сервисами Amazon Redshift, Chart.io и AppAnnie. Такая архитектура позволила обойтись без капитальных затрат. На аренду серверов и оплату внешних сервисов компания тратит около 60 тыс. руб. в месяц.

Сейчас Sports.ru анализирует и соотносит данные об источниках трафика, просмотрах страниц, активности пользователей и их предпочтения. Информацию об интересах читателей компания получает разными способами. Например, посетителям на сайте задается вопрос об их любимой команде, анализируется по каким тегам человек чаще всего читает новости и посты, сравниваются источники трафика с базой фанатских сайтов и т.д. Sports.ru также контролирует активность подписчиков своих новостных потоков о командах, спортсменах и видах спорта в социальных сетях.

Полученные данные используются для сегментации аудитории и создания персонализированных email-рассылок или индивидуальных рекомендаций на сайте. Например, система позволяет сделать рассылку для пользователей, болеющих за ЦСКА, имеющих телефон c Android и аккаунт в Facebook, заходивших на сайт регулярно в течение прошлого года, но переставших посещать сайт на прошлой неделе. «Мы знаем теперь очень многое о наших читателях. Формируя матрицу предпочтений каждого посетителя, мы накладываем на нее матрицу рекомендаций и даем каждому релевантные подсказки», – говорит Илья Салтанов.

По словам руководителя отдела аналитики Sports.ru Олега Новикова, понимание интересов аудитории сайта сильно помогает повышать активность пользователей. «Некоторые типы рекомендаций давали очень сильный эффект: например, восьмикратный роста числа подписок на блоги и теги или пятикратный рост числа регистраций. CTR некоторых персонализированных блоков достигает 50%. Из числа посетителей с явными клубными предпочтениями, перешедших с фанатских сайтов, 80% ответило на вопрос о любимом клубе. Персонализация помогла сделать сайт более удобным и рассказать пользователям о новых возможностях, про которые они не знали. Сейчас дневная аудитория сайта достигает 1,2 млн уникальных посетителей, а суммарное время, проводимое пользователями на сайте в течение дня, достигло 20 лет», – рассказал он.

Анализ аудитории сайта помог редакции Sports.ru получить глубокое понимание информационных потребностей пользователей. Как рассказали в компании, кластеризация посетителей по интересующим их тегам показала, что кроме очевидных групп пользователей, читающих только про клубы российской премьер-лиги или ЦСКА, есть сегмент посетителей, предпочитающих только такие «мужские» виды спорта, как хоккей, бокс и бои без правил.

Александр Бабкин, Газпромбанк: Сейчас иностранные ИБ-решения в Газпромбанке замещены на 65%
безопасность

Интересно, что анализ Big Data выявил достаточно большую группу посетителей, которые интересуются только красивыми спортсменками независимо от вида спорта или клуба. Представители этого сегмента аудитории регулярно читают посты и смотрят галереи про Илону Корстин, Марию Кириленко и Анастасию Янькову.

Технологии помогают Sports.ru привлекать и продвигать авторов из социальных сетей. «Мы замечаем действительно ярких персонажей и берем их в оборот в социальной редакции: выносим посты на главную, раскидываем ссылки по потокам, даем им советы по оформлению и подаче», – рассказывает Илья Салтанов.

Анализ больших данных помог переформатировать редакционную стратегию Sports.ru, ставшего по сути средством массовой информации поколения 2.0. Его новостной поток формируется из сообщений профессиональных журналистов и авторов из социальных сетей с учетом интересов пользователей, а место на первой полосе определяется не редактором, а каждым конкретным читателем.

8 задач, чтобы перезапустить инженерную школу в России
импортонезависимость

Sports.ru идет по логичному пути, по которому уже прошли многие крупные интернет-компании, такие как Google, Facebook, «Яндекс», Mail.ru. Они используют технологии, по масштабу соответствующие задачам проекта. «Вероятно, со следующим значительным скачком количества пользователей Sports.ru начнет использовать и Hadoop, который вполне вписывается в описанную задачу, - говорит Михаил Соловьев, ведущий системный архитектор дивизиона данных компании IBS. - Sports.ru – очень интересный пример современного СМИ 2.0. Сейчас мы видим несколько лидеров этого тренда: digg.com, reddit.com, habrahabr.ru, livejournal.com. На примерах этих сайтов видно, как по-разному могут быть реализованы схожие идеи, как они работают на разных рынках».

Сайт Sports.ru представляет собой самостоятельный бизнес, а не интернет-страницу бумажного СМИ. Для этого бизнеса, живущего по своим правилам, важны все знания о посетителе: как, когда и почему он пришел на сайт, зачем, с чем ушел. При помощи Big Data сайт готовится к следующему визиту этого посетителя, становится «лучше» для него и для всех остальных сотен тысяч посетителей – так достигается увеличение охвата аудитории и гарантируются повторные визиты пользователей. «В модели, когда еще и наполнение сайта генерируют в большой степени сами пользователи, их вовлеченность, широта охвата аудитории, проникновение становятся критическими показателями для бизнеса. СМИ 2.0 уже сейчас масштабируемые, мобильные, актуальные и персонифицированные. Они похожи на газету в романе про Гарри Поттера – персональные новости объединяются в блоки, рубрики в момент начала чтения такой газеты. И по ходу чтения газета актуализируется, подстраивается под читателя», – добавляет Михаил Соловьев.

Александра Кирьянова