Разделы

ПО Софт Цифровизация Бизнес-приложения Техника Маркет

Россияне научили «Эльбрусы» и «Байкалы» распознавать вражеские танки. Видео

Smart Engines представила кроссплатформенную программу распознавания танков Smart Tank Reader на основе собственного фреймворка Hieroglyph. В процессе разработки использованы технологии машинного обучения и нейронные сети.

Система распознавания образов танков

Как стало известно CNews, российская компания Smart Engines разработала систему распознавания образов танков в видеопотоке.

Полностью отечественная разработка Smart Tank Reader способна отличать союзную боевую технику от вражеской без использования специализированного оборудования – достаточно обычной цифровой видеокамеры и компьютера. Причем, по заявлению разработчиков, она работает даже в неблагоприятных погодных условиях и в случае частичного перекрытия распознаваемого объекта (танка) посторонними объектами.

Помимо идентификации боевой машины, система может определять некоторые геометрические показатели, такие как расстояние до объекта и его преимущественную ориентацию.

Для Smart Tank Reader характерны как аппаратная, так и программная кроссплатформенность. Программа поддерживает российские процессорные архитектуры «Эльбрус», «Байкал», КОМДИВ, а также глобальные x86 и ARM. Что же касается операционных систем, по заявлению разработчиков, продукт заработает под управлением ОС «Эльбрус», Astra Linux, «Атликс», Windows, macOS, iOS и Android. Кроме того, подойдут дистрибутивы GNU/Linux с коллекцией компиляторов gcc 4.8.

Как создавалась Smart Tank Reader

Smart Tank Reader базируется на главной коммерческой технологии компании-разработчика – фреймворке распознавания данных Hieroglyph, рассказали CNews представители компании.

В качестве основного алгоритма при решении задачи специалисты Smart Engines выбрали подход статистического машинного обучения, одной из ключевых проблем которого является необходимость наличия достаточного количества исходных данных для обучения системы.

Изображения, содержащие сцены с боевыми машинами, в таком количестве разработчикам доступны не были, поэтому было решено прибегнуть к генерации необходимых для обучения данных. И все же специалисты решили не ограничиваться лишь синтезированием данных для решения этой задачи. Для моделирования сцен был подготовлен специальный макет, на котором устанавливались различные объекты, моделирующие сельскую местность: кусты, деревья, заграждения и т.д.

Макет для моделирования сцен

Как рассказали CNews разработчики, целевыми объектами выступили четыре модели современных основных боевых танков: Т-90 «Владимир» (Россия), М1А2 Abrams (США), Т-14 «Армата» (Россия), «Меркава» Mk.3 (Израиль). Объекты располагались на различных позициях полигона, тем самым расширяя список допустимых видимых ракурсов объекта. Значительную роль сыграли инженерные заграждения, деревья, кусты и прочие ландшафтные элементы.

Изображение захватывалось с помощью цифровой малоформатной камеры. В процессе захвата существенно менялся задний план сцены для обеспечения большей устойчивости алгоритмов к изменениям фона.

Танки располагались на различных позициях полигона, тем самым расширяя список допустимых видимых ракурсов

Таким образом было собрано несколько десятков тысяч изображений, что разработчики сочли достаточным для обучения системы и последующей оценки качества работы алгоритма.

Непосредственно распознавание было решено разбить на две части: локализацию объекта и его классификацию. Локализация выполнялась по методу Виолы–Джонса, который позволяет с достаточно высокой точностью обнаруживать объекты (как правило – лица) на изображениях в реальном времени.

Для классификации и определения ракурса применили сверточную нейронную сеть, так как при решении задачи разработчикам было важно, чтобы детектор успешно выделял особенности, отличающие, например, Т-90 от «Меркавы». В результате удалось построить композицию алгоритмов, решающую задачу локализации и классификации однотипных объектов.

Напомним, что нейронная сеть – это реализация математической модели, которая построена по принципу организации и функционирования биологических сетей нервных клеток живого организма. Сверточная нейронная сеть – спецархитектура нейронных сетей, расчитанная на распознавание образов. Работа сверточной нейронной сети, условно говоря, характеризуется переходом от конкретных особенностей изображения к более абстрактным деталям и так далее, вплоть до выделения понятий самого высокого уровня.

Далее полученная программа была протестирована на всех имеющихся в распоряжении специалистов Smart Engines платформах (x86, ARM, «Эльбрус», «Байкал», КОМДИВ), вычислительно-трудные алгоритмы были оптимизированы для повышения быстродействия и достижения устойчивой работы программы в режиме реального времени.

Фреймворк Hieroglyph

Фреймворк Hieroglyph был впервые представлен Smart Engines в марте 2018 г. Он умеет распознавать удостоверения личности 55 стран и поддерживает 38 языков.

Андрей Зотов, Cloud.ru: Облачные платформы становятся основой для масштабирования ИИ-решений

облака

Hieroglyph использует собственные наработки Smart Engines в области распознавания изображений. В основе системы лежат глубокие целочисленные нейронные сети. Для ускорения их работы, разработчики применили сепарированную архитектуру сверточных слоев и 8-битную модель вычислений.

Чтобы экономить ресурсы, Hieroglyph генерирует компактные описания изображений, которые представляются в виде векторов многомерного метрического пространства. В этих описаниях отсеиваются искажения, которые являются следствием разной яркости освещения и ракурса съемки. По словам разработчиков, это помогает распознавать документы из видеопотока и при непредсказуемых условиях освещения.

В октябре 2018 г. CNews рассказывал о внедрении разработки на базе Hieroglyph в мобильное приложение 6profis для распознавания документов работниц легальной секс-индустрии Германии.

Несколько фактов о Smart Engines

Smart Engines — российский разработчик систем обработки изображений и распознавания символов в видеопотоке. Компания была основана в 2010 г., но до 2015 г. работала только на зарубежном рынке. Ее штат насчитывает более 45 сотрудников из России и других стран, среди них 14 имеют ученую степень.

Генеральным директором Smart Engines является Владимир Викторович Арлазаров. Директором по научной части и соучредителем Smart Engines выступает Владимир Львович Арлазаров, сооснователь еще нескольких российских ИТ-компаний. В частности, он является основателем компании Cognitive Technologies, где с 1991 г. по 2008 г. занимал пост генерального директора.

Технологии Smart Engines используют компании SITA (швейцарский разработчик ИТ для авиации), MITEK Systems (американский разработчик средств идентификации для мобильных ОС), Jumio (американский разработчик инструментов идентификации для платежных систем), а также австрийская компания-интегратор S&T System Integration & Technology Distribution и японская AlterKnowledge.

Тренды ML-разработки, R&D и Bare Metal: как меняются облачные технологии для бизнеса
Облака

В декабре 2016 г. система распознавания документов Smart IDReader была внесена в Реестр отечественного ПО, курируемый Минкомсвязи.

В марте 2018 г. стало известно, что Smart Engines адаптировала часть своих решений под платформу «Эльбрус» и перешла на цикл, когда новые разработки сразу создаются под отечественные процессоры, то есть не требуют последующего портирования.

Дмитрий Степанов