Разделы

Бизнес Цифровизация

Александр Лемзин: Большие данные будут в тренде еще долгое время

Сегодня работа с большими массивами данных является нормой почти для всех крупных игроков рынка. Причем в самых разных отраслях: финтех, телекоммуникации, ритейл. О перспективах работы с библиотеками данных, которые меняют облик компаний, и своем вкладе в развитие Big Data в России рассказал специалист в сфере ИТ-технологий, лауреат премии Digital Leaders Александр Лемзин.

CNews: Александр, расскажите, какова роль Big Data сегодня? Что мы можем благодаря большим данным?

Александр Лемзин: Давайте попробую объяснить на примере телекоммуникационных компаний, где я сам работаю. Благодаря инструментам анализа статических данных, а также данных, приходящих в режиме реального времени, например, с коммутаторов или DPI, компании могут проанализировать профиль своего клиента и понять, с чем связан отток прибыли. Еще можно проанализировать целесообразность и оптимизацию затрат в разных секторах — допустим, в логистике. Один из моих проектов — это многокомпонентная система, которая упорядочивает абонентскую базу таким образом, что позволяет довольно детально составлять портреты клиентов, проводить с ними точечные коммуникации и знать наверняка, что нужно той или иной группе абонентов.

Александр Лемзин: Благодаря инструментам анализа статических данных компании могут проанализировать профиль своего клиента и понять, с чем связан отток прибыли

На основе этой информации можно создавать новые тарифы, которые понравятся этой категории людей, делать индивидуальные коммерческие предложения и так далее. Или, к примеру, другой мой проект, реализованный в «Мегафоне», где я работал ранее, — это программа, вычисляющая мошенников. И делающая это довольно точно, без всяких следственных органов! Достаточно предоставить ей данные биллинга, и она, проанализировав звонки и перемещения абонента, делает выводы, причем, довольно точные. Собственно, вот вам ответ на вопрос о роли больших данных. С их помощью мы можем развивать бизнес, зарабатывать деньги, угождать клиентам и даже проводить расследования.

CNews: Вы также создали программу, которая позволяет тратить на написание кода две-три недели вместо шести месяцев, как было раньше. Расскажите о ней.

Александр Лемзин: Это библиотека-стартер для фильтрации и обогащения данных. Она позволяет экономить время при разработке и является кроссплатформенной разработкой, то есть, универсальной. Перенос инфраструктурного кода при работе с ней не требуется — за счет этого в несколько раз сократилось и количество ошибок. Причем использовать данную библиотеку могут не только разработчики, но и devops инженеры, что в общем-то нонсенс в индустрии. Разработка тестировалась в сфере телекома и в банковской сфере. Она легко может быть интегрирована и в другие отрасли, думаю, в ближайшее время мы сможем это сделать.

CNews: На премию Digital Leaders, лауреатом которой вы стали, заявлялся именно этот проект?

Александр Лемзин: Он был не один. Кроме этой библиотеки, в числе достижений упоминался модуль для подключения к различным источникам данных, передачи в кластер Kafka и работы в кластерах K8S — это одна из разработок, которой я действительно горжусь. Этот модуль позволяет писать код в несколько раз быстрее. Кроме того, он является отказоустойчивым, легким и легко настраиваемым. Таким набором преимуществ не могут похвастаться те решения, что существовали ранее как open source, так и коммерческие версии.

CNews: Есть результаты в цифрах?

Александр Лемзин: Конечно. На 80 с лишним процентов сократился срок разработки. Количество потенциальных ошибок сократилось более, чем на 70% за счет машинного анализа структуры данных. Ну, а что касается экономической составляющей, то рост доходов Nexign, где я на данный момент являюсь ведущим инженером, составил 20% за один год — в этом есть и моя заслуга, точнее — моих разработок, которые именно на это и направлены: оптимизировать работу, найти пути для экономии и развития.

CNews: Какие перспективы вы видите в развитии направления больших данных и лично для себя?

Александр Лемзин: Перспективы я бы оценил как исключительно положительные. Несмотря на кризисы, востребованность в грамотных специалистах только растет. И я считаю, что это — хороший стимул начать осваивать эту отрасль уже сегодня. Для себя я бы отметил, что хотел бы и дальше совершенствовать телекоммуникационное и финансово-техническое направления. Мне интересно работать и развиваться именно в этих отраслях.

CNews: Вы ведете активный диалог с профессиональным сообществом, являетесь участником и экспертом одного из кластеров ассоциации РАЭК. О чем говорят программисты на своих заседаниях? Про Big Data есть что-то?

Александр Лемзин: Обязательно. В Российской ассоциации электронных коммуникаций в мои задачи входит выстраивание диалога как среди «своих», так и с членами других кластеров. Далее, я занимаюсь разработкой консолидированных предложений для развития нашей отрасли, некоторые из этих предложений находят отклик у власти. Предполагается разработать законопроект, который будет касаться непосредственно больших данных, но это пока планы. Также у меня есть намерение заняться научной деятельностью — чтобы было, о чем предметно говорить с коллегами. Недавно я написал статью о потоковой обработке данных и о современном подходе решения задачи обработки больших массивов данных — мне понравилось. Думаю, нужно продолжить работать в этом направлении.

CNews: Александр, вы упомянули, что стоит присмотреться к вашей профессии всем, кто еще не определился. Какие мировые тенденции в части востребованности экспертов Big Data вы можете отметить?

Александр Лемзин: Объемы хранимых данных увеличиваются с каждым годом, так как есть четкая тенденция на цифровизацию не только в России, но и во всем мире. Становятся все более популярными такие направления, как электронная коммерция, интернет вещей и многие другие. А это значит, что направление анализа больших данных и обработки больших массивов данных в режиме реального времени будет актуально как минимум ближайшие десятилетия.

Иван Егоров