В России создадут государственного гиганта, торгующего большими данными
Минцифры предлагает создать государственного оператора больших данных, который сможет предоставлять обезличенные большие данные министерств и ведомств коммерческим разработчикам искусственного интеллекта на платной основе. В настоящее время идея находится в стадии предварительного варианта концепции.Государственный оператор больших данных
Минцифры России разрабатывает концепцию создания государственного оператора больших данных, накопленных министерствами и ведомствами, который возьмет на себя функции регулирования доступа к ним разработчиков искусственного интеллекта (ИИ) на коммерческой основе. Работа над концепцией ведется по поручению вице-премьера Дмитрия Чернышенко, первый вариант документа уже обсудили эксперты по ИИ АНО «Цифровая экономика», сообщается на сайте Минцифры.
«Минцифры России разработает концепцию доступа к госданным, – сказал вице-премьер Правительства России Дмитрий Чернышенко. – Возможность создать единую фабрику данных делает государство уникальным оператором, который имеет в своем распоряжении практически неограниченное количество датасетов и их комбинаций. Такие базы представляют интерес для бизнеса, который выстраивает маркетинговые коммуникации и планы развития, опираясь на аналитику датасетов».
Разработка над документом ведется Минцифры совместно с Минэкомразвития в рамках реализации федерального проекта «Искусственный интеллект» нацпрограммы «Цифровая экономика», отметили в ведомстве. Концепция регулирования доступа разработчиков к наборам госданных будет включать несколько типов датасетов, которые будут разделены по признаку конфиденциальности – с ограниченным доступом и общедоступные, а также по принадлежности к оператору – ведомственные и межведомственные.
Замглавы Минцифры Олег Качанов отметил строгий порядок работы с персональными данными и подчеркнул обязательное условие поставки обезличенных данных.
«Существует ряд чувствительных тем, связанных с данными, – сказал Олег Качанов. – Некоторые данные не вызывают опасений до тех пор, пока невозможно определить, какому человеку они принадлежат. Поэтому при формировании наборов, оператор в первую очередь должен обеспечить невозможность персонификации».
По мнению авторов концепции, наборы государственных данных станут основой машинного обучения для организаций и предприятий в ключевых отраслях экономики, при этом внедрение ИИ позволит увеличить производительность и ускорить цифровую трансформацию.
Госструктура для работы с госданными
Оператором, который будет предоставлять доступ к государственным большим данным, станет специализированная госорганизация, которая в проекте концепции называется «оператором государственных наборов данных», пишут «Ведомости» со ссылкой на текст документа.
На госоператора предлагается возложить обязанность по созданию и эксплуатации инфраструктуры доступа к государственным наборам данных, а также функции формирования наборов данных по запросам разработчиков ИИ, анонимизации и обезличивания таких наборов данных. Госоператор также будет наделен правом разрешения или отказа в доступе к определенным данным для различных заказчиков. Так, доступ к данным с той или иной степенью секретности смогут получить только организации, аккредитованные профильными ведомствами (например, ФСБ), следует из текста документа.
Согласно документу, услуги государственного оператора госнаборов данных для коммерческих пользователей будут предоставляться на платной основе, пишут «Ведомости» со ссылкой на слова Олега Качанова. Доступ к дата-сетам с общедоступной информацией предполагается осуществлять на безвозмездной основе, заявил он.
«Стоимость будет определяться исходя из их сложности и объема – это позволит избежать неэффективных расходов государства», – отметил замминистра.
Реакция рынка
Представитель МТС Алексей Меркутов заявил «Ведомостям», что в компании знакомы с концепцией, но будут готовы комментировать только когда в документе появится конкретика. Президент Ассоциации больших данных (АБД) Анна Серебряникова назвала идею организации доступа к госнаборам данных для развития технологий ИИ и реализации проектов в области цифровой «правильной».
Председатель совета директоров Института развития информационного общества Юрий Хохлов рассказал «Ведомостям» о нескольких подходах к предоставлению доступа к государственным массивам данных: «США придерживаются децентрализованного доступа к таким данным, в том числе путем привлечения негосударственных операторов для обеспечения функционирования государственных систем, в Китае доступ, наоборот, жестко централизован, в ЕС же планируется развитие рынка в первую очередь промышленных данных путем создания компаний-посредников, которые будут обеспечивать безопасный доступ в том числе и к государственным большим данным.
По мнению Хохлова, России нужно выбрать что-то из этого или сформировать свою национальную модель обеспечения доступа к госнаборам данных. Он также считает, что одного оператора госнаборов данных для России недостаточно. По его мнению, за качество данных «должны отвечать те органы власти и местного самоуправления, где эти данные порождаются при выполнении государственных функций или предоставлении услуг».
Директор по направлению «Искусственный интеллект» АНО «Цифровая экономика» Алексей Сидорюк заявил «Ведомостям», что модель Минцифры наряду с госоператором предусматривает возможность создания коммерческих операторов. По его мнению, это позволит сформировать «новый рынок обмена и разметки данных».
Рынок больших данных в России
Объем российского рынка больших данных по состоянию на конец 2019 г. оценивался аналитиками Boston Consulting Group в 45 млрд руб., с темпом прироста 12% в течение последних пяти лет. Согласно подсчетам АБД, объем рынка больших данных в России составляет 10-30 млрд руб., при этом к 2024 г. по усредненным прогнозам российских и иностранных экспертов ожидается его рост в десять раз до 300 млрд руб.
В декабре 2020 г. CNews рассказал о планах Росстата завершить к 2023 г. разработку центральной аналитической платформы (ЦАП) «Население» стоимостью 719 млн руб. Платформа, по замыслу разработчиков, станет «витриной данных» для граждан и бизнеса, при этом компании смогут получать бесплатный доступ к платформе и выгружать данные для своих целей.
В январе 2022 г., как ранее писал CNews, вступит в силу закон о создании единого регистра информации о россиянах. В него войдет детальная информация о каждом гражданине России, включая базовые сведения (фамилия, имя, отчество, дата и место рождения и смерти, пол, реквизиты записи акта гражданского состояния о рождении и смерти, СНИЛС, ИНН) и дополнительные (семейное положение, родственные связи человека и т.д.).
По данным ФНС, которая станет оператором регистра, основу нового ресурса составят более 500 млн записей актов гражданского состояния, при этом речь не только о гражданах России, но также об иностранцах, проживающих и (или) работающих в России.
В середине марта 2021 г. CNews рассказал о внесенной Минцифры в Госдуму второй версии поправок к законопроекту о персональных данных, среди которых, в частности, для российских компаний вводится обязанность делиться с государством обезличенными данными россиян на полностью безвозмездной основе.
Поправки к закону также предлагают, чтобы власти предоставляли отечественным ИТ-компаниям доступ к обезличенным персональным данным из госинформсистем. Документ также предусматривает запрет ИТ-компаниям на накопление таких данных в собственных информсистемах.