Цифровизация Искусственный интеллект

22 Апреля 2026 12:07 22 Апр 2026 12:07 |

В МИФИ разработана архитектура нейросети, устойчивая к «отравлениям»

Команда исследователей из Национального исследовательского ядерного университета «МИФИ» (Москва) разработала архитектуру под названием MambaShield. Об этом CNews сообщили представители МИФИ.

Большинство современных ИИ-моделей (например, знаменитые «Трансформеры», лежащие в основе ChatGPT) обладают фундаментальной уязвимостью перед так называемыми «атаками отравления». Если злоумышленник подмешивает в обучающие данные вредоносные образцы, логика работы модели целенаправленно изменяется, что позволяет провести атаку.

В случае с последовательными данными (логи сети, временные ряды датчиков, финансовые транзакции) атака особенно коварна. Вред наносится не сразу, а растягивается во времени: сначала чуть-чуть, потом еще, и еще, при этом сама модель внешне продолжает функционировать корректно. Классические алгоритмы либо пропускают угрозу, либо требуют огромных вычислительных ресурсов для ее предотвращения.

Ученые МИФИ обратились к новой архитектуре — селективным моделям в пространстве состояний (Selective State Space Models, sSSM). Такие модели, в отличие от классических SSM, способны адаптироваться к входным данным. Модель обучается динамически решать, какую информацию из прошлого контекста сохранить, а какую — отбросить. Эта идея положена в основу архитектуры MambaShield, в которой механизм селекции позволяет эффективно обнаруживать отравленные образцы в массиве обучающих данных.

Для того чтобы получить модель с заданной устойчивостью к атакам отравления, исследователи «сшили» три инновационные технологии в одну систему:

1. Прогрессивная дистилляция устойчивости (PARD). Вместо того чтобы учить одну модель сопротивляться всем видам атак, ученые обучили множество «учителей». Один специализируется на защите от подмены меток в данных, другой — от скрытых закладок (бэкдоров), третий — от градиентных атак. А затем специальный алгоритм передает знания всех моделей одному компактному «ученику», который работает быстро и надежно.

2. Иерархическое обучение с подкреплением (HRL). Система сама адаптируется к меняющемуся поведению нарушителя. Грубо говоря, если атака становится хитрее, MambaShield меняет свою стратегию защиты в реальном времени — без участия человека.

3. PAC-Bayesian сертификация. Самое важное для критической инфраструктуры (АЭС, аэропорты, банки). Система не просто «думает», что она защищена, — она дает математические гарантии своей устойчивости. Теоретически доказано, что даже при отравлении 30% обучающих данных, точность останется выше 97%.

Эксперименты проводились на трех сложнейших наборах данных о кибератаках (CIC-IoT-2023, CSE-CICIDS2018, UNSW-NB15), включающих миллионы образцов вредоносного трафика. Получены результаты: точность обнаружения: 99,1% (у лучших аналогов — около 97%); работа в условиях отравления: при атаке точность падает всего на 2–3%, тогда как обычные модели деградируют на 18–20%; MambaShield обрабатывает последовательности в 4,2 раза быстрее, чем классический «Трансформер». Это достигается за счет линейной сложности алгоритма (время растет пропорционально длине последовательности, а не квадратично, как у Трансформеров).

«Для практиков это означает меньше пропущенных угроз, меньше ложных тревог и меньшие счета за облачные вычисления», — отметили авторы.

Сергей Клевогин: Роль руководителя ИБ превратилась из админа в бизнес-лидера Безопасность

Конечно, у предлагаемой архитектуры есть и недостатки. Система прекрасно работает на отрезках до 1000 шагов. Но если последовательность слишком длинная (более 5000 шагов), накапливаются ошибки округления, и точность может упасть. Кроме того, если в обучающих данных больше 50–70% отравленных примеров, любая система, включая MambaShield, начнет ошибаться.

Разработка не ограничивается защитой серверов. Предлагаемая архитектура может пригодиться в самых разных областях:

– Здравоохранение. Защита от злонамеренных искажений медицинских данных в сетях взаимодействия с пациентами.

– Беспилотный транспорт. Злоумышленник отравляет открытые датасеты изображений дорожных знаков, внедряя в них специальный шум. MambaShield позволит повысить устойчивость моделей, обученных на таких датасетах.

Когда внешняя команда разработки становится безопаснее внутренней Безопасность

– Финансы. Злоумышленники в течение нескольких месяцев совершают странные транзакции друг другу, на которые никто не жалуется. Обычная антифрод-система помечает их как безопасные, после чего злоумышленник проводит реальную кражу, оставаясь незамеченным.

– Промышленность. Представьте электростанцию, где установлена турбина стоимостью в миллионы долларов. Система ИИ (или предиктивной аналитики) следит за ее состоянием, чтобы вовремя отправить на техобслуживание. Атакующий начинает незаметно подмешивать в поток данных от датчиков искаженные значения, и в результате система больше не считает опасные аномалии поводом для тревоги. Использование системы предиктивной аналитики совместно с MambaShield позволит выявить и отсеять отравленные данные.

Работа, опубликованная в престижном журнале Expert Systems with Applications, уже получила грант от Министерства экономического развития России в рамках программы развития центров искусственного интеллекта.

«MambaShield — это не просто очередной алгоритм, — пишут исследователи. — Это фундамент для доверенного ИИ, который можно устанавливать на атомные станции, в финансовые и медицинские организации, не боясь, что злоумышленник "отравит" обучающую выборку одной хитрой картинкой или пакетом данных».

Присоединяйтесь к AgroCode Conf Genetics — будущее отечественной селекции и генетики уже здесь!

Подписаться на новости

Короткая ссылка

В МИФИ разработана архитектура нейросети, устойчивая к «отравлениям»

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

DRaaS

CRM

IaaS

Email-рассылки

Техника

Обзор HUAWEI nova 15: базовый смартфон с акцентом на автономность

Качественный домашний звук: саундбар или система 5.1 — что выбрать?

Рынок аэрогрилей: как Demiand стал брендом №1 в России

Наука

Удивительное открытие: у самых древних позвоночных было две пары глаз, а не одна

Как все-таки первые растения переместились из моря на сушу и навсегда изменили Землю?

Совершенно новый класс миров — необычная планета с гигантским океаном магмы всего в 35 световых годах от нас

ERP признали объектами КИИ — кто ответит за безопасность SAP и «1С»

Крупнейшие ИКТ-бюджеты регионов России 2026

Крупнейшие ИКТ-бюджеты регионов России 2026

ERP признали объектами КИИ — кто ответит за безопасность SAP и «1С»

Топ-10 корпоративных ИИ-помощников

Вся работа из одного окна:
CNews протестировал приложение VK WorkSpace

В МИФИ разработана архитектура нейросети, устойчивая к «отравлениям»

Другие материалы рубрики

Конференции

Business Process Management 2026

Технологии искусственного интеллекта 2026

Цифровизация HR 2026

CNewsMarket

DRaaS

CRM

IaaS

Email-рассылки

Техника

Обзор HUAWEI nova 15: базовый смартфон с акцентом на автономность

Качественный домашний звук: саундбар или система 5.1 — что выбрать?

Рынок аэрогрилей: как Demiand стал брендом №1 в России

Наука

Удивительное открытие: у самых древних позвоночных было две пары глаз, а не одна

Как все-таки первые растения переместились из моря на сушу и навсегда изменили Землю?

Совершенно новый класс миров — необычная планета с гигантским океаном магмы всего в 35 световых годах от нас

ERP признали объектами КИИ — кто ответит за безопасность SAP и «1С»

Крупнейшие ИКТ-бюджеты регионов России 2026

Крупнейшие ИКТ-бюджеты регионов России 2026

ERP признали объектами КИИ — кто ответит за безопасность SAP и «1С»

Топ-10 корпоративных ИИ-помощников

Вся работа из одного окна: CNews протестировал приложение VK WorkSpace

Вся работа из одного окна:
CNews протестировал приложение VK WorkSpace