Григорий Кочаров: В проектах Big Data надо быть готовым работать за процент от достигнутого экономического эффекта
Чтобы предлагать своим клиентам индивидуальные, персонифицированные услуги, современным компаниям приходится анализировать большие массивы неструктурированных данных. По мнению первого заместителя генерального директора и главы дивизиона «Управление данными» компании IBS Григория Кочарова, технологии Big Data дают компаниям большие конкурентные преимущества, но одновременно лишают потребителей приватности.CNews: Как вы считаете, почему именно сейчас активно зазвучал термин Big Data?
Григорий Кочаров: Бизнес компаний ряда отраслей уже много лет требует сбора и анализа действительно больших объемов структурированных и неструктурированных данных. Федеральные госструктуры, поисковые интернет-системы, крупные розничные банки, энергетические компании, структуры ЖКХ, ритейл, телекоммуникационные компании собирают данные для решения своих бизнес-задач, причем это действительно большие по объему данные. В то же время за последние годы значительно снизилась стоимость технологических решений, как в сегменте генерации сбора и передачи информации, так и в сегменте хранения и обработки.
В результате мы получили практически одновременно и гигантский поток технологической, аудио-, фото-, видеоинформации и комплекс аппаратно-программных решений, способный обрабатывать большие объемы информации за разумное время. Получилось так, что очередной виток развития технологий лёг на подготовленную почву бизнес-потребностей. В итоге, то, что все стали называть объединенным термином Big Data, оформилось в одно из наиболее интересных направлений аналитических систем для поддержки бизнеса и принятия решений.
CNews: Разные эксперты по-разному трактуют термин Big Data. Что вы вкладываете в это понятие?
Григорий Кочаров: Да, действительно под термином Big Data многие сейчас понимают совершенно разные вещи. Мы больше ориентируемся на позицию агентства Gartner, которое подробно описывает сегмент технологий под условным названием Big Data. Прежде всего, когда мы говорим про «большие данные», мы не обязательно имеем дело с громадными объемами информации в абсолютных цифрах. В этот класс попадают в том числе технологии обработки неструктурированной информации, образов, речи, видео, мониторинг социальной активности и так далее.
Представьте такую ситуацию: вы идете по улице, заходите в магазин, вас сняла камера на входе в магазин, установила вашу личность и определила, что вы – постоянный покупатель с крайне высоким уровнем лояльности, купивший четыре дня назад сумочку, для которой в магазине как раз есть аксессуар. Сегодня все это можно сделать в течение нескольких секунд. Вы еще даже не успеете порог переступить, как к вам подойдет менеджер зала и скажет: «Здравствуйте, Наталья! Посмотрите, у нас есть красивый кошелек, который подойдет к вашей сумке». Или: «Знаете, Наталья, через два дня у вашего мужа день рождения. Помните, в прошлом году вы ему подарили вот такой сувенир? А у нас сейчас есть интересное предложение из той же коллекции».
CNews: Возможно, Наталье не понравится, когда так много данных о ней известно магазину, и больше она туда не пойдет.
Григорий Кочаров: Сегодня очень мало кто говорит о социальных аспектах использования Big Data. К сожалению, мир будущего – это мир, который будет лишен приватности. Вот представляете, вы идете по улице, вас сняла камера, на следующем же рекламном щите поменялось изображение: этот же кошелек, который вам очень подходит, и вы должны его купить. Причем появился рядом с вашей сумочкой и рядом с фотографией какого-то очень любимого вами актера, который усиленно рекомендует ходить именно так, и указатель на ближайший магазин. Защититься от этого будет невозможно, надо привыкнуть и принять этот новый мир. Нравится это или нет, вам все равно подскажут, где полка, на которой лежит любимая вещь вашего мужа. Мы чаще говорим о технологической стороне вопроса, но есть еще огромное число социальных аспектов.
CNews: А как же нарушение приватности?
Григорий Кочаров: Нечего будет нарушать, ее не будет. Люди сами раскрывают свою личную информацию в обмен на удобство и другие выгоды – например, заполняя анкету на карточку лояльности в магазине, вы вносите туда свой день рождения и электронный адрес, а потом к вам приходит поздравление. Вы же продолжаете их заполнять?
CNews: Негативная реакция клиентов сможет сдержать распространение этих технологий?
Григорий Кочаров: Я думаю, если благодаря Big Data продажи поднимутся на 15%, магазин не посмотрит на социальные аспекты и будет стремиться максимизировать продажи.
CNews: Подобная индивидуализация клиентского сервиса – это главный потенциальный эффект для бизнеса от Big Data?
Григорий Кочаров: Я вижу два источника эффективности Big Data для бизнеса. Во-первых, появились технологии, которые позволяют быстро подготовить информацию для принятия более корректных решений. Раньше это было или невозможно, или стоило очень дорого. Сейчас появились более эффективные и более дешевые технологии, которые позволяют сократить время на принятие решений, повысить их качество. Эти задачи больше характерны для сегмента B2B. Здесь под технологиями Big Data понимаются те, которые обеспечивают быструю обработку большого объема данных, быструю доставку и интегрирование данных.
Второй источник эффективности связан с наблюдаемой сейчас тенденцией в сегменте B2C – это все большая индивидуализация и персонификация услуг. Живя в индустриальном обществе, мы пользовались штампованными сервисами: покупали типовые туфли, типовую одежду… А ведь изначально, очень давно, все сервисы были индивидуальными: нам делали индивидуальный лапоть, шили индивидуальную шляпу, готовили индивидуальный обед. Перейдя к индустриальному обществу, мы потеряли персонификацию и получили массу очень дешевых поточных продуктов и сервисов.
Григорий Кочаров: Под термином Big Data многие сейчас понимают совершенно разные вещи
Сейчас мы опять переходим к ситуации, когда любой сервис может быть персонифицирован. Вы можете заказать себе одежду, которая будет произведена промышленным способом, но будет абсолютно индивидуальна, второй такой в мире не будет. Затраты на ее производство почти такие же, как затраты на поточное производство. Тренд сильно меняет индустрию B2C. Технологии, которые обеспечивают персонализацию услуг, мы тоже включаем в сегмент Big Data, потому что там действительно приходится обрабатывать огромные массивы данных.
CNews: Предлагает ли рынок нужную ИТ-инфраструктуру для проектов в сфере Big Data? Есть ли на рынке квалифицированные специалисты?
Григорий Кочаров: Если мы понимаем под инфраструктурой аппаратно-программные комплексы, то да, предлагает. Есть множество предложений, начиная с грандов, типа IBM, Oracle, HP, SAS, SAP, Informatica и заканчивая Open source. А вот решений конкретных задач, специфичных для каждой отрасли, пока нет.
Российский рынок очень молодой, и он молодой во всех смыслах: у него незрелый спрос в среднем по рынку и такое же предложение – растущие, но очень-очень молодые исполнители, только входящие в этот бизнес. Это касается и представителей международных компаний, и наших отечественных интеграторов.
Поэтому с точки зрения аппаратно-программных комплексов – да, инфраструктура предлагается. С точки зрения адекватного предложения консультантов и специалистов – пока нет, мы все пока в процессе обучения, как на стороне консалтинговых компаний, так и на стороне заказчика.
Кадровая проблема, думаю, будет решена достаточно быстро. Наша система высшего образования, в большинстве технических специальностей создает очень хороший задел базовых знаний в области математической статистики, обработки и анализа данных. В стране сохранилась хорошая научная основа, поэтому я не думаю, что у нас будет какой-то сильный дефицит именно аналитиков данных. Нельзя сказать, что на рынке дикий спрос, и нет предложений – они растут параллельно. Пока с формированием подходящих команд хорошо справляются корпоративные службы в компаниях реального сектора экономики и собственные центры обучения в крупных ИТ-компаниях. В Яндексе, например, есть своя двухлетняя школа анализа данных, у нас – свой корпоративный университет, есть несколько совместных программ в ИТ-компаниях и ведущих вузах страны.
CNews: Если говорить не только о подготовке кадров – что еще предпринимает IBS, чтобы соответствовать спросу заказчиков на Big Data?
Григорий Кочаров: В этом году в компании создано отдельное направление, которое занимается технологиями как традиционной бизнес-аналитики (BI), так и Big Data – сегодня это примерно 150 человек, и число их быстро растет. У нас есть свой центр R&D, обеспечивающий собственные разработки и мониторинг состояния технологий в развитых странах. Мы запустили лабораторию по обкатке решений, создаем региональный центр разработки, формируем команды универсальных и отраслевых аналитиков данных. В стадии активного развития отношения с научными и студенческими коллективами.
Продуктовый портфель IBS в области Big Data включает всю цепочку решений в жизненном цикле управления информацией и данными: это системы генерации и сбора, очистки и атрибутирования, хранения и обработки, визуализации, анализа, моделирования и интерпретации. В каждом слое выбраны наиболее яркие и эффективные решения как от хорошо известных компаний, представленных в РФ, так и от компаний, решения которых хорошо зарекомендовали себя на других рынках, но пока малоизвестны в России.
Другой важный аспект – это новая модель взаимодействия с заказчиком, разделение ответственности за результаты. Освоение технологий Big Data на нашем рынке пока находится в начальной стадии, а значит, по статистике, в ближайшие 2 года примерно 25% всех проектов в стране в этой области в силу разных причин будут завершены без ожидаемого эффекта.
Для нас это означает, что на этом этапе развития технологий от компании-подрядчика потребуется не только быть инновационной и компетентной, но и нести реальную ответственность за достижение результата проекта. В том числе использовать схемы совместного финансирования, основанные на разделении рисков неуспеха проекта или учитывающие получение вознаграждения в зависимости от достигнутого экономического эффекта. Мы к этому готовы.
CNews: Если можно, поговорим подробнее о потребностях заказчика. Кто является инициатором проектов в сфере использования технологии Big Data и каковы предпосылки таких проектов?
Григорий Кочаров: Предпосылки, наверное, такие же, как в любом другом случае внедрения ИТ-решений. В основном, все они ориентированы на формирование какого-то экономического эффекта. В нашей стране есть уже много хороших примеров применения Big Data: в Сбербанке, в Яндексе, в Mail.ru, в ряде других компаний. Пока в основном проекты реализуются силами собственных подразделений, хотя бывали случаи, когда привлекались и внешние ресурсы.
Внутренним заказчиком выступают чаще всего бизнес-лидеры: финансово-экономические, закупочные, сервисные службы, службы маркетинга, сбыта, безопасности, аналитические подразделения, логистика. Конечно, очень важна роль ИТ-лидера компании, как миссионера, проводника современных решений, но заказчиком выступают в основном бизнес-лидеры.
CNews: Какие гипотезы проверяются обычно в ходе проектов Big Data? Наверное, можно рассказать уже о каких-то примерах решения задач из практики?
Григорий Кочаров: Существуют две базовые модели проверки гипотез. Первая – традиционная модель: первый шаг – формирование бизнес гипотезы, второй шаг – построение модели поведения системы, и третий – проверка гипотезы, дальше по кругу. Вторая модель более специфична и менее привычна: первый шаг – построение модели данных, второй – выявление взаимосвязей и зависимостей, третий – формирование бизнес-гипотез и/или решений.
Гипотезы могут быть совершенно разными и зависят от того, кто в данный момент выступает заказчиком. Это может быть выявление злоумышленников вне и внутри компании, определение стоимости и состава портфеля продуктов, определение оптимальных маршрутов движения транспорта – масса разных гипотез. В первой модели гипотезы чаще всего звучат примерно так: что будет с набором экономических параметров деятельности при изменении таких операционных показателей процесса? Во втором случае задача звучит чуть-чуть по-другому: определите, какие факторы являются наиболее значимыми для поведения сложной системы объекта или процесса. То есть надо найти эти факторы, связать их, а потом уже придать этой связи какую-то бизнес-логику, или не придавать, в мире больших данных не всегда важна причинно-следственная связь, иногда достаточно просто информации о корреляции событий.
Есть примеры применения и первой модели, и второй, хотя пока не обо всех сегодня я могу рассказать. Допустим, в телекоммуникационной компании анализ трафика по каждому потребителю позволил создать типовые профили поведения злоумышленников. Мы разработали систему, которая позволяет анализировать потребление трафика всеми абонентами в реальном режиме времени, формировать типовой профиль злоумышленника и выявлять его из всего потока абонентов для последующего анализа.
CNews: Кроме телекома, в каких секторах экономики востребованы технологии больших данных?
Григорий Кочаров: Основные отрасли – это государство, розничные банки, страховые компании, телекоммуникационный сектор, торговля, транспорт, медицина, безопасность, весь сектор B2C, в нем будут наиболее востребованы эти решения.
CNews: Можно ли говорить о каких-то мифах в области Big Data?
Григорий Кочаров: Я бы не говорил об устойчивых мифах, но под давлением маркетинговых программ продвижения на рынке формируется чрезмерное ожидание от этих технологий. У ИТ-компаний – от объемов потенциального спроса, а у заказчиков – от такой якобы универсальности и всеохватности решения. На самом деле Big Data – это просто хорошие технологические продукты, многофункциональные, надежные и современные. Но, как это всегда бывает с использованием новых технологий, без понимания, зачем и как их использовать, проект превращается в красивую, но затратную игрушку.
CNews: Насколько активно эти технологии используются в России и каковы перспективы Big Data в нашей стране?
Григорий Кочаров: Наша страна достаточно быстро приняла это новое направление. Некоторые отечественные компании применяли такие решения еще до появления коммерческих продуктов. Яндекс, Mail.ru нуждались в таких технологиях и разрабатывали их сами. Поэтому нельзя говорить о том, что мы отстали.
Основным двигателем развития является конкуренция, неважно, внутрикорпоративная или рыночная. Там, где она высокая, есть эффект от ИТ-решений в целом и от Big Data в частности. Там, где ее нет, бессмысленно ждать эффекта. Часть отраслевых сегментов в России уже высоко конкурентны, например, ритейл. Здесь эти решения приносят очень быстрый эффект. Если в сегменте нет конкуренции, то эффект будет незначительным. Поэтому я бы выделил два подсегмента: конкурентный, например, страхование, банки, розничная торговля, весь телеком, и сегмент с более низким уровнем конкуренции, все остальные отрасли. Вот, в первом сегменте технологии Big Data нормально и быстро развиваются, а во втором сегменте необходимость в них просто пока не осознали.