Разделы

Бизнес Цифровизация ИТ в госсекторе Маркет

Большие данные принесут российской экономике 4 триллиона. Откуда они возьмутся?

Использование технологий больших данных к 2024 г. внесет вклад в российский ВВП в размере 4,2 трлн руб., подсчитали авторы соответствующей дорожной карты. При этом по большинству субтехнологий больших данных российские разработки находятся практически на одном уровне готовности с зарубежными.

Дорожная карта технологий больших данных

В распоряжении CNews оказался проект дорожной карты по развитию технологий «Больших данных», подготовленный «Национальным центром информатизации» (НЦИ, «дочка» госкорпорации «Ростех») вместе с входящей в «ИКС-Холдинг» компанией «Форпост». Документ был разработан в рамках реализации мероприятий федерального проекта «Цифровые технологии» национальной программы «Цифровая экономика».

Документ разделяет технологии больших данных на четыре субтехнологии. Уровень готовности каждой из субтехнологий оценивается по шкале от 1 до 9. В мире готовность большинства технологий работы с большими данными находится на максимальном, девятом уровне.

Субтехнология сбора данных

Субтехнология сбора данных представляет из себя ряд технологий, включающих стандарты, протоколы и системы сбора данных из различных источников, обеспечивающих прослеживаемость данных от источника до потребителя, включая интероперабельность данных.

Российский рынок интернета вещей в 2016 г. оценивался в $4 млрд, к 2024 г. он вырастет до $26 млрд. Мировой рынок за аналогичный период вырастит с $166 млрд до $1,1 трлн. И российские, и зарубежные технологии в этой сфере находятся на седьмом уровне готовности (субтехнология сбора данных – единственная из субтехнологий больших данных, где уровень готовности зарубежных разработок меньше девятого).

Российскими разработчиками в данной сфере являются Nexign, «Орбита», Mail.ru Group, Nvision Group («дочка» МТС), «Протей», «Искрауралтел», CoreClass и АО ГЛОНАСС. Зарубежными решениями представлены продукцией Cisco, Nokia и IBM.

Субтехнология хранения данных

Субтехнология хранения данных представляет из себя программно-определяемые хранилища данных (SDS). SDS включает в себя пулы виртуализированных хранилищ с характеристиками, которые могут быть заданы через управляющий интерфейс.

Ожидается, что к 2020 г. 90% организаций адаптируют свою гибридную инфраструктуру, а вместимость центров хранения данных вырастет до 1,8 Збайт. К этому времени рынок облачного хранилища вырастит на 30% и достигнет $92 млрд, при этом 83% данных компаний будет хранится в облаке.

Сравнение отечественных и зарубежных технологий больших данных и уровней их технической готовности (УГТ)

Субтехнология Технологическая компонента Отечественное решение Стадия готовности (УГТ 1 - 9) Зарубежное решение Стадия готовности (УГТ 1 - 9)
Машинное обучение (Machine Learning. ML) Компонента системы управления базами данных Линтер Реализована PostreSQL Реализована
Компонента системы управления базами данных РедБазаДанных Реализована Му SQL Реализована
Компонента системы управления базами данных 1C База Данных Реализована MS SQL Server Реализована
Компонента системы управления базами данных ClickHouse Реализована Oracle Database Реализована
Компонента системы управления базами данных - Реализована Redis Реализована
Компонента системы управления базами данных ClickHouse Реализована Vellica Реализована
Компонента языков программирования - - Python Реализована
Компонента языков программирования - - R Реализована
Компонента языков программирования - - MAIL AB Реализована
Компонента языков программирования - - c++ Реализована
Компонента языков программирования - - Scala Реализована
Компонента разметки и обработки данных Яндекс. Толока Реализована Handl Реализована
Компонента разметки и обработки данных Яндекс. Толока Реализована Prodi.gy Реализована
Компонента разметки и обработки данных Яндекс. Толока Реализована Label.me Реализована
Компонента разметки и обработки данных Яндекс. Толока Реализована Mechanical Turk Реализована
Компонента разметки и обработки данных Яндекс. Толока Реализована CrowdFlow ег Реализована
Компонента фреймворка ML - - Tlieano Реализована
Компонента фреймворка ML - - Keras Реализована
Компонента фреймворка ML - - TensorFlow Реализована
Компонента фреймворка ML - - PyTorch Реализована
Компонента фреймворка ML - - MatrixNet Реализована
Компонента фреймворка ML - - CatBoost Реализована
Компонента вычислительных кластеров Sun Fire X4100/ Sun Blade X8420 Реализована IBM eServer Cluster 1350 Реализована
Компонента графический процессор (GPU) - - NVidia Реализована
Компонента графический процессор (GPU) Эльбрус Реализована Intel Реализована
Компонента графический процессор (GPU) Байкал Реализована AMD Реализована
Бизнес- аналнтика (Business Intelligence, BI) Компонента создания отчетов Polymatica Реализована SAP BI Реализована
Компонента создания отчетов Visiology Реализована Tableau Реализована
Компонента создания отчетов ALPHA BI Реализована Oracle BI Реализована
Компонента информационные панели (Dashboard) Visiology Реализована Qlik Реализована
Компонента информационные панели (Dashboard) Polymatica J Реализована Tableau Реализована
Компонента информационные панели (Dashboard) ALPHA BI Реализована Power BI Реализована
Компонента интерактивной аналитической обработки данных (OLAP Online Analytical Processing) Visiology Реализована Power BI Реализована
Компонента предиктивного моделирования (Predictive Modelling) Polymatica Реализована SAS Реализована
Компонента интеллектуального анализа данных (Data Mining) Polymatica Реализована SAS Реализована
Компонента создания отчетов Prognoz Platform Реализована Tableau Реализована
Компонента создания отчетов Yandex DataLens Реализована Oracle BI Реализована
Компонента информационные панели (Dashboard) Prognoz Platfonn Реализована Qlik Реализована
Компонента информационные панели (Dashboard) Yandex DataLens Реализована Power BI Реализована
Компонента интерактивной аналитической обработки данных (OLAP Online Analytical Processing) Prognoz Platform Реализована Power BI Реализована
Компонента предиктивного моделировани я (Predictive Modelling) Prognoz Platform Реализована SAS Реализована
Компонента интеллектуального анализа данных (Data Mining) Prognoz Platform Реализована SAS Реализована
Конвергентные, программно-определенные (распределенные) хранилища данных Контроллер программно- определяемого хранилища RAIDIX УТГ9 vSAN УТГ9
Сервисы данных RAIDIX УТГ9 vSAN УТГ9
Программно- определяемые сети BrainFoiNet УТГ8 Open vSwitch УТГ9
Платформы виртуализации и контейнеризацИИ ROSA VIRTU ALIZ ATION УТГ9 VMware Kubemetes УТГ9
х86 серверная платформа Эльбрус Байкал Ядро УТГ7 Dell УТГ9
SSD NanoTech УТГ7 Huawei УТГ9
HDD - HP УТГ9

В данную субтехнологию входят конвергентные (распределенные) программно-определяемые хранилища. В России готовность соответствующих технологий находится на восьмом уровне, отставая от зарубежных решений на одно деление. Мировой рынок соответствующих технологий с $442 млн в 2018 г. вырастет до $15,7 млрд в 2024 г. Доля российских разработчиков на этом рынке за аналогичный период вырастет с 2,2% до 3,4%.

Российские разработки в данной области представлены решениями под брендами Yadro, Radix, «R-хранилище», Yandex Object Storage, Tarantool, Click House, «Сбербанк-Технологии», «Ростелеком» и «Мегафон». Иностранными продуктами являются VMWare vSAN, Dell ScalelO и NetApp Ontap.

Субтехнология обработки и управления данными

Субтехнология обработки и управления данных включает в себя технологии обработки и утилизации данных с использованием искусственного интеллекта (AI) и машинного обучения (ML). Данные технологии представляют из себя класс методов искусственного интеллекта, характерной чертой которых является не прямое решение задач, а обучение в процессе применения решений множества сходных задач.

Для построения таких методов используются средства математической статистики, численных методов, методов оптимизации, теории вероятностей, теории графов и различные техники работы с данными в цифровой форме. Готовность российских технологий в данной сфере находится на шестом уровне - на три шкалы ниже, чем зарубежных. Это единственная субтехнология, где российские разработки заметно отстают от зарубежных.

Российскому рынку соответствующих технологий предрекают большие перспективы. С $40 млн в 2018 г. он вырастет до $2 млрд в 2024 г. Мировой рынок за этот период вырастет с $4,3 млрд до $33,5 млрд, а доля российского рынка за это время увеличится с 1% до 6%.

Российские разработки в данной сфере представлены продукцией компаний Abbyy, «Центр речевых технологий», Сбербанк, «Концерн «Вега», «Газпром», «Яндекс» и Mail.ru Group. Иностранные решения представлены компаниями Google, Facebook, Microsoft, Apple, Amazon, Alibaba, Baidu, Tencent и IBM.

Технологии обогащения данных

Также в состав субтехнологии обработки и управления данных входят технологии обогащения данных. Готовность российских разработок в этой сфере находится на восьмом уровне - на одно деление ниже, чем готовность зарубежных решений. Российский рынок с 8,6 млрд руб. в 2018 г вырастет до 85,9 млрд руб. в 2024 г.

Российские разработки в данной сфере представлены решениями OneFactor, «Яндекс», VisionLabs, Mail.ru Group - Predict, Сбербанк, Банк «Тинькофф», «Мегафон» и «Вымпелком». Зарубежные решения представлены продукцией Facebook, Microsoft и Google.

Субтехнология вывода данных

Четвертой субтехнологией является субтехнология вывода данных. В нее входят технологии, обеспечивающие использование доверенных данных для BI (Business Intelligence, набор компьютерных методов для перевода транзакционной информации в человекочитаемую форму). Готовность российских разработок находится на восьмом уровне, отставая на одно деление от уровня готовности зарубежных решений.

Мировой рынок в данной сфере вырастит с $600 млн в 2018 г. до $1,5 млрд в 2024 г.

Российские решения представлены продуктами Progzon Platform, Polymatica, Visioly, Alpha BI и CoreClass. Зарубежные продукты - это MS Power BI, Tableau, Qlik и SAP BI.

Предиктивная аналитика

Частью субтехнологии вывода данных является предиктивная аналитика. Это финальное и самое ответственное звено в извлечении пользы из больших данных для бизнеса и государства. Готовность российских разработок в данной сфере находится на восьмом уровне, отставая от уровня готовности зарубежных решений на одно деление.

Мировой рынок соответствующих решений в 2018 г. составил $4,5 млрд, к 2024 г. он вырастет почти в 10 раз до $43 млрд. В России этот рынок в 2018 г. составлял $200 млн - 4,5% от мирового.

Сколько триллионов рублей большие данные принесут ВВП России

Авторы дорожной карты оценивают, что развитие технологий больших данных к 2021 г. даст дополнительный вклад в ВВП (внутренний валовой продукт) на сумму 1,94 трлн руб., что составляет 1,7% от ВВП. К 2024 г. данная сумма увеличится до 4,2 трлн руб. (3% от ВВП).

Облегченная миграция с Oracle: как осуществить переход на новую СУБД быстрей и проще
Импортозамещение

В том числе к 2024 г. за счет технологий больших данных отрасль добычи полезных ископаемых получит дополнительно 430 млрд руб., торговли и ремонта - 878 млрд руб., недвижимости - 252 млрд руб., строительства - 480 млрд руб., транспортировки и хранения - 235 млрд руб., финансов и страхования - 141 млрд руб., здравоохранения и социальных услуг - 314 млрд руб., обрабатывающих производств - 408 млрд руб., связи и ИТ - 81 млрд руб.,

Также в сфере административной деятельности за счет больших данных дополнительно будет получено 352 млрд руб., в сфере государственного управления, обеспечения военной безопасности и социального обеспечения - 292 млрд руб., в сфере профессиональной, научной и технической деятельности - 271 млрд руб., в отрасли электроэнергии, газа и пара - 54 млрд руб.

Единая облачная платформа для органов власти и поддержка СПО-решений

В дорожной карте говорится о необходимости поддержки 20 проектов в области больших данных на общую сумму 9 млрд руб., включая поддержку компаний-лидеров (3 млрд руб.), выделение грантов (1 млрд руб.), субсидии кредитным организациям (500 млн руб.) и разработку и внедрение платформ (780 млн руб.). Также отмечается необходимость принятия 48 проектов нормативно-правовых актов и 10 законодательных инициатив.

Авторы дорожной карты предлагают ряд мероприятий по развитию больших данных. В первую очередь, речь идет о переводе информационных систем и информационных ресурсов в государственную единую облачную платформу для федеральных органов исполнительной власти и государственных внебюджетных фондов (ГЕО), созданную на базе программно-определяемых хранилищ. Также должны быть обеспечено использование ГЕО для госкорпораций и компаний с госучастием.

Другое направление документа - проекты по использованию свободного программного обеспечения (СПО) для развития субтехнологий больших данных и поддержка разработки оборудования и платформ для интернета вещей.

В дорожной карте обозначены проекты по использованию в официальной государственной статистике больших данных, а также использование органами государственной власти иных данных в целях принятия решений. Запланировано обеспечение органов государственной власти, органов местного самоуправления, физических и юридических лиц актуальными и достоверными сведениями, необходимыми для осуществления градостроительной деятельности, полученных с использованием больших данных.

CNews Analytics: Рейтинг операторов фискальных данных 2024
ритейл

Кроме того, в документе говорится о создании научных центров по исследованию проблем больших данных в коммерческом секторе и в государственном управлении, создании платформы для обмена и обогащения данными для коммерческих целей, государственного управления и социальных целей и разработке индексов развития больших данных, влияющих на развитие отраслей экономики России в сравнении этих показателей с другими странами.

Президиум наблюдательного совета АНО «Цифровая экономика», рассмотрев проекты дорожных карт по девяти прорывным направлениям сквозных технологий, решил отказаться от дальнейшей разработки отдельной дорожной карты по большим данным. Данное направление будет объединено с другими направлениями федерального проекта «Цифровые технологии».

Игорь Королев