Цифровизация Искусственный интеллект

14 Мая 2025 10:54 14 Мая 2025 10:54 |

Исследование TRASSIR и AIRI: применение мультимодальных моделей в задачах видеоаналитики

TRASSIR и институт AIRI завершили первый этап совместного исследовательского проекта, направленного на изучение потенциала мультимодальных моделей в анализе видеоданных. Проект сосредоточен на разработке и апробации эффективных пайплайнов видеоаналитики с использованием современных ИИ-архитектур. Об этом CNews сообщили представители AIRI.

Проект был направлен на создание эффективного пайплайна видеоаналитики с использованием мультимодальных моделей для расследования краж товара в магазинах. В процессе работы особое внимание уделялось снижению уровня ложных срабатываний и обеспечению устойчивости алгоритмов при отсутствии дополнительного обучения.

В исследовании использовались мультимодальные модели, работающие в zero-shot-режиме, то есть без дообучения на специализированных выборках. Такой подход позволил оценить универсальность моделей и определить границы применимости к задачам видеоаналитики.

Разработанный пайплайн учитывает и ограничения — объем видеопамяти и скорость обработки, а также хорошо справляется с анализом сцен. Проблемной зоной являются короткие, быстрые эпизоды. В ответ на этот вызов предложены методы повторной обработки видео с фокусировкой на детализацию значимых фрагментов.

Были реализованы следующие методические улучшения: механизмы рассуждения, позволяющие лучше распознавать сложные действия (например, «взятие+возврат» товара); детализация эпизодов интереса для более точного анализа коротких событий; поддержка потокового видео с учетом длинного временного контекста.

Так, в рамках одного из тестовых сценариев система изначально ошибочно определила резкий наклон покупателя как попытку кражи. После внедрения механизма рассуждения и анализа последовательности действий система корректно распознала, что покупатель просто наклонялся за упавшим товаром.

Ирина Окладникова, Минфин в интервью CNews: Нецелевого расходования бюджетных средств стало меньше благодаря цифровизации

цифровизация

Анализ решений западных коллег, включая Amazon, показал, что основными ограничениями зарубежных систем являются отсутствие адаптации моделей к специфике целевого домена и слабая эффективность при анализе краткосрочных событий. Учет этих факторов позволил создать более устойчивую архитектуру.

Результаты исследования задали направление для последующих работ в области прикладной видеоаналитики. Один из будущих проектов предусматривает использование мультимодальных моделей для оценки соблюдения стандартов обслуживания в предприятиях общественного питания, включая: анализ аудиокомпоненты на предмет соблюдения речевых скриптов, визуальный контроль за соблюдением санитарных норм и стандартов внешнего вида персонала, а также детекцию нарушений, связанных с условиями допродаж и чистотой торгового пространства.

Особенность проекта заключается в интеграции речевых и визуальных данных в рамках единого аналитического пайплайна — одного из первых коммерчески ориентированных решений на основе мультимодальных ИИ-моделей.

TRASSIR и AIRI планируют продолжать исследовательскую деятельность в направлении разработки интеллектуальных и адаптивных систем видеоанализа.

Почём сегодня объектное хранилище на 2 000 Гб? Предложения десятков поставщиков ― на ИТ-маркетплейсе CNewsMarket

Подписаться на новости

Короткая ссылка

Исследование TRASSIR и AIRI: применение мультимодальных моделей в задачах видеоаналитики

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Цифровизация ритейла и электронная торговля

CNewsMarket

Colocation

RPA

Kubernetes

Онлайн-бухгалтерия

Техника

Обзор смартфона HUAWEI nova 14i: суперавтономность и огромный экран

Обзор стирально-сушильной машины Hyundai Proxima WMD 9424: две функции в одном корпусе

Лучшие устройства Dreame на распродаже в Черную пятницу: выбор ZOOM

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Российским ритейлерам
стоило бы поучиться у коллег из Китая

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Первая карта заводов компьютерной техники в России

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Российским ритейлерам
стоило бы поучиться у коллег из Китая

Исследование TRASSIR и AIRI: применение мультимодальных моделей в задачах видеоаналитики

Другие материалы рубрики

Конференции

Современный цифровой офис 2025

Современные контакт-центры 2025

Цифровизация ритейла и электронная торговля

CNewsMarket

Colocation

RPA

Kubernetes

Онлайн-бухгалтерия

Техника

Обзор смартфона HUAWEI nova 14i: суперавтономность и огромный экран

Обзор стирально-сушильной машины Hyundai Proxima WMD 9424: две функции в одном корпусе

Лучшие устройства Dreame на распродаже в Черную пятницу: выбор ZOOM

Наука

OLED объединили с метаповерхностями: голографические гаджеты из фантастики — уже реальность

Исследование древнего кладбища перевернуло устоявшиеся представления о жизни в каменном веке

Если квантовые вычисления отвечают на неразрешимые вопросы, то как понять, что ответы верные?

Российским ритейлерамстоило бы поучиться у коллег из Китая

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Первая карта заводов компьютерной техники в России

Импортозамещение4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока общего рынка

Российским ритейлерамстоило бы поучиться у коллег из Китая

Российским ритейлерам
стоило бы поучиться у коллег из Китая

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Импортозамещение
4 карты:Аппаратное обеспечениеСистемное ПОКорпоративное ПООфисное ПО

Как СУБД Jatoba прошла путь от узкоспециализированного продукта до игрока
общего рынка

Российским ритейлерам
стоило бы поучиться у коллег из Китая