Владимир Арлазаров, Smart Engines: ИИ должен стать частью повседневной среды, как электричество или интернет
Пока искусственный интеллект ассоциируется у многих с генеративными технологиями, в России он уже стал невидимой, но незаменимой инфраструктурой. Ежедневно им пользуются сотни миллионов людей в российских банках, налоговой, страховых, нотариальных конторах, аэропортах и государственных сервисах при распознавании и проверке документов. Стоящая за этой разработкой компания Smart Engines за десять лет создала надежный и безопасный инструмент для ежедневного банкинга и KYC, финтеха и цифровых услуг. О том, как команде российских ученых удалось добиться существенных результатов в ключевых прикладных задачах ИИ, почему качество и скорость распознавания стали конкурентными преимуществами и каким будет следующий этап цифровой трансформации, рассказал Владимир Арлазаров, основатель и генеральный директор Smart Engines, доктор технических наук.
CNews: Smart Engines исполняется десять лет — для ИТ-рынка это показательный срок, за который компания способна стать драйвером заметных изменений в отрасли. Можно ли сказать так в отношении Smart Engines?
Владимир Арлазаров: Да, можно. И именно в таком масштабе об этом и стоит говорить применительно к нашим технологиям. Речь идет не об изменениях в одном продукте или отдельном сегменте рынка. Наши решения на базе искусственного интеллекта стали частью повседневной технологической среды, а компания стала технологическим лидером в области распознавания документов — не только в России, но и в мире.
Во многом благодаря практическому внедрению этих разработок искусственный интеллект для миллионов людей перестал быть чем-то абстрактным или существующим исключительно в лабораториях и центрах R&D. Он стал рабочим инструментом, встроенным в привычные процессы и сервисы. Фактически — инфраструктурой, которая функционирует «по умолчанию» и не требует отдельного внимания. Как электричество, калькулятор или интернет: технология, о которой не думают, но которой регулярно пользуются. Именно к такому результату мы последовательно шли, развивая решения в области распознавания документов.
CNews: Вернемся к истокам. Сегодня автоматический ввод паспортных данных стал абсолютной нормой для KYC. Но десять лет назад почти никто не верил, что это возможно. В чем заключался тот самый первый прорыв?
Владимир Арлазаров: Десять лет назад мы первыми в мире представили систему распознавания российского паспорта на смартфонах. Это был принципиальный разрыв парадигмы, в которой ИТ-индустрия жила до этого момента. До нас документы либо сканировали на громоздких планшетных сканерах, либо перепечатывали данные вручную. Паспорт — основной документ гражданина — требовал участия человека, времени, внимания, был велик риск ошибок. Мы показали, что паспорт можно распознать, просто наведя на него камеру смартфона. Быстро, точно и безопасно.
Это перевернуло представления о дистанционном обслуживании. Банки, телеком-операторы, государственные сервисы получили возможность автоматизировать ввод данных, сделать возможным удаленное и выездное обслуживание клиентов. Сегодня это кажется чем-то очевидным, даже можно сказать обыденным, а тогда — почти никто не мог подумать, что это возможно.
CNews: Почему именно смартфон стал точкой входа для этой революции?
Владимир Арлазаров: Совпали два фундаментальных процесса. С одной стороны, смартфоны «доросли» до того уровня, при котором на них стало принципиально возможным решать по-настоящему сложные вычислительные задачи. С другой — начался взрывной рост финтеха и удаленных сервисов, которым была жизненно необходима быстрая и безопасная идентификация личности для оказания услуг онлайн. Мы увидели возможность уйти от сканеров, от ручной перепечатки и изменить сам процесс ввода данных. Сделать так, чтобы данные вносились моментально и автоматически — без участия человека.
Старые методы OCR, рассчитанные на работу со сканами, здесь просто не работали. Смартфон — это совершенно другой мир. Блики, перекосы, расфокус, съемка «на весу», плохое освещение, тени. Для паспорта — еще и защитные элементы, штампы, рукописные поля. Мы сознательно поставили цель: не требовать от пользователя идеальных условий съемки, освещения и положения документа в кадре. Человек не должен подстраиваться под ИИ — ИИ должен решать задачу. Только в таком случае он будет приносить пользу.
Для решения этой задачи мы первыми перешли к анализу видеопотока. Научили систему накапливать информацию сразу с нескольких кадров. Создали сверхбыстрые 4,6-битные нейросетевые алгоритмы, которые работают в условиях реальной жизни, при этом не требовательны к «железу» и запускаются прямо на телефоне. Сегодня наш ИИ распознает паспорт «книжкой», практически в полной темноте, поддерживает рукописное заполнение и работает на всех платформах — от серверов и мобильных приложений, до веб-страниц и мессенджеров. И все это на центральном процессоре устройства, без GPU. С научной точки зрения это стало настоящим прорывом.
CNews: Вы упомянули рукописный текст. Для рынка это до сих пор одна из самых болезненных тем. В чем была сложность задачи и как вы с ней справились?
Владимир Арлазаров: Рукописный текст — действительно одна из самых сложных задач в распознавании вообще. Но не решить ее значило бы обойти вниманием колоссальное число пользователей с паспортами, заполненными от руки, и оставить ограничение для бизнеса. Для наших клиентов из финтеха, обслуживающих миллионы человек ежегодно, это было просто недопустимо.
Мы разработали собственную нейросетевую архитектуру «Да Винчи», которая распознает кириллическую рукопись без «додумывания», не опираясь на лингвистический контекст. Это позволило достичь беспрецедентного уровня качества распознавания. В отрасли даже есть известная шутка про слово «шиншилла» — кошмар для любого распознавателя. Мы решили и эту задачу. Сегодня система уверенно распознает как печатные, так и рукописные данные на основном развороте и странице с пропиской паспорта РФ и в других документах — даже в самых нетривиальных случаях.
CNews: Вы с самого начала отказались от облаков и ручной верификации. Почему для вас было принципиально, чтобы ИИ работал локально, без передачи данных?
Владимир Арлазаров: Персональные данные — это одна из фундаментальных ценностей нашего времени. Любой разрыв контура безопасности при вводе такой информации — это риск утечки, юридической ответственности и потери доверия. Поэтому распознавание на мобильном телефоне по определению должно быть on-premise.
Мы изначально проектировали технологии так, чтобы все работало локально — без передачи данных на сторонние сервера, без ручной верификации и при этом без серьезных мощностных требований. Это потребовало решения множества сложнейших научных задач. Но именно это сегодня является одним из наших ключевых конкурентных преимуществ. Наши решения можно использовать и на сервере, и в приложениях, и в браузере, и даже в мессенджере — и они всегда работают on-premise.
Наш искусственный интеллект построен на собственной технологической платформе без использования сторонних OCR-библиотек и внешних фреймворков, что критически важно для банков, государственных организаций и любых компаний. Такой подход обеспечивает полный контроль над системой ввода данных и стабильную работу в изолированных контурах.
CNews: Можно ли сказать, что вы не просто создавали продукт под запрос рынка, а стремились задать новые стандарты целой индустрии?
Владимир Арлазаров: Да. Мы первыми сделали мобильную систему распознавания паспорта РФ и тем самым задали стандарт для KYC. Сегодня автоматический ввод паспортных данных — это абсолютная норма для любых цифровых сервисов. Это подтверждается ежегодными рейтингами мобильных банков: все лидеры по оценкам доступности продуктов, качества ежедневных операций и уровня пользовательского опыта — наши клиенты. Они задают уровень удобства и безопасности, на который ориентируются российские и зарубежные финансовые организации. К примеру, не так давно Альфа-Банк, внедривший наши технологии, был признан лидером финтеха мирового уровня в ОАЭ и Саудовской Аравии. Мы рады помогать нашим клиентам формировать будущее в финтехе и за его пределами и теперь успешно осваиваем ежедневный банкинг в мессенджерах, включая национальный мессенджер MAX.
Сейчас мы переходим к следующему этапу. Это KYB и распознавание документов широкого класса — от бухгалтерской первички до кадровых, юридических, финансовых документов, а также анкет, опросников и других. Мы уже сделали возможным распознавание этих типов документов на мобильных телефонах, веб-страницах и даже в мессенджерах, и наша главная цель — сделать ИИ для их ввода таким же естественным инструментом для выполнения ежедневных бизнес-задач, как и технологию распознавания паспорта. Это основа цифровой экономики будущего.
CNews: О каких документах идет речь помимо паспорта?
Владимир Арлазаров: Технологии компьютерного зрения давно вышли за рамки простого распознавания типовых документов, и мы успешно применяем наш ИИ для работы с любыми формами. В рамках одной платформы мы сделали возможным распознавание жестких и гибких форм, любых удостоверений личности — свидетельств о рождении, водительских прав и других, а также полнотекстовое распознавание на сотне языков мира.
Сейчас наша система поддерживает 5 тысяч шаблонов документов для всех стран мира. Из них 120 — для России, включая более 80 типов преднастроенных документов для РФ без учета удостоверений личности. Но на деле ее возможности не ограничены. Гибкость технологии позволяет адаптировать ее под любые задачи заказчика — от распознавания комплектов документов для трудоустройства работников из любых стран до ввода бухгалтерской первички с производительностью, сопоставимой с целым отделом сотрудников. Система уверенно работает с многостраничными документами и таблицами, контролирует полноту и корректность, а весь процесс происходит без участия человека. Это снимает значительную нагрузку, операционные издержки на разбор инцидентов и позволяет исключить ошибки, которые раньше обходились компаниям дорого.
Более того, мы предлагаем возможность автоматической настройки новых шаблонов по одному образцу — это позволяет буквально за несколько минут кастомизировать систему под конкретные потребности заказчика без обращения к вендору. В условиях стремительной динамики рынка, экономических и внутренних процессов бизнесу просто необходимо уметь быстро адаптироваться к новым правилам игры и работать с любыми документами без бюрократии и временных затрат.
CNews: Ведущие банки по версии Markswebb используют ваш ИИ для обеспечения ежедневных платежей — по QR, номерам телефонов и другим реквизитам. Многие уже забыли, что когда-то было иначе.
Владимир Арлазаров: И это, на мой взгляд, лучший комплимент. Когда в 2022 году привычные сервисы бесконтактной оплаты оказались недоступны в России, возникла реальная проблема для ежедневного банкинга. Мы на этот вызов ответили и проблему решили.
Сегодня оплата или перевод по QR-коду, номеру телефона, карты или по реквизитам в квитанции без QR стала обыденностью. Наш ИИ применяется в мобильных приложениях, на веб-страницах банков, даже в мессенджерах. Мы пошли дальше и реализовали автоматическое распознавание показаний счетчиков ЖКХ для удобной оплаты коммуналки — эта функция уже доступна в большинстве современных банковских сервисов.
После массового удаления российских приложений из зарубежных сторов мы помогли банкам перенести возможности ежедневного банкинга в веб, реализовали распознавание паспортов, документов, QR-кодов прямо в браузере с помощью технологии WebAssembly. Интернет-банки наших клиентов стали своевременной заменой классическим нативным приложениям, не уступая им по функциональности и качеству. Сейчас никто уже и не вспоминает, что когда-то приходилось вбивать данные вручную.
CNews: Если вернуться к дискуссии об ужесточении западных технологических ограничений: есть ли в России все необходимое для работы в таких условиях?
Владимир Арлазаров: Да, безусловно. Суверенность искусственного интеллекта изначально была для нас базовым принципом, с которого начиналось развитие продукта. Наши решения полностью импортонезависимы и способны функционировать на любых процессорных архитектурах и операционных системах, в том числе на российских: Эльбрус, КОМДИВ-64, ARM, RISC-V, x86 и ОС Эльбрус, ОС Аврора, kvadraOS, Astra Linux, ALT Linux, РЕД ОС, РОСА «Хром», Windows, Linux и других. Поэтому даже в случае расширения ограничений в отношении западных экосистем, включая iOS и Android, для нас и наших клиентов это не станет проблемой, ведь мы поддерживаем Аврору, РЕД ОС М и Kvadra. Бизнес-процессы продолжат работать в штатном режиме, и возвращаться к ручному вводу данных, разумеется, никому не придется. Вероятно, ни один человек даже не задумается об этом.
CNews: Считаете ли вы, что Smart Engines изменила ожидания людей от цифровых сервисов?
Владимир Арлазаров: Во многом это действительно так. Сегодня людей чаще удивляет не возможность автоматически ввести данные, а скорее ее отсутствие. Если паспортные данные или платежные реквизиты требуется вводить вручную — это вызывает закономерное недоумение. Зачем тратить на это время, если можно этого не делать?
За десять лет мы приучили рынок к тому, что автоматический ввод должен быть «по умолчанию». Искусственный интеллект стал естественной частью современной цифровой среды. Он не заставляет человека думать о себе, подстраиваться под него. Он просто есть — делает повседневную жизнь людей проще и удобнее. Без оговорок.
CNews: Вы часто говорите о повышении качества распознавания. Почему это принципиально важно в документах?
Владимир Арлазаров: Это неотъемлемый, фундаментальный критерий для достижения экономического эффекта: роста производительности труда, минимизации расходов, повышении прозрачности и управляемости бизнеса. Массовое внедрение не оставляет иного выбора — искусственный интеллект обязан работать гораздо лучше человека, будь то распознавание паспорта РФ для открытия счета, ежедневные платежи или ввод данных первички. Только тогда технология имеет шанс прижиться и стать средой, а не остаться мыльным пузырем или бесполезной игрушкой. За десять лет существования компании мы смогли сделать так, чтобы наш предметный искусственный интеллект не просто «прижился», а стал обыденностью для сотен миллионов пользователей. И это подтверждает ценность проделанной работы.
Кроме того, высочайшее качество распознавания данных необходимо для защиты от мошенников. Без него не работает антифрод. Распознанные данные становятся основой для дальнейшей цепочки проверок документа, и даже малейшие ошибки здесь недопустимы. Наш антифрод «Шерлок 2о» уже доказал свою эффективность в самых разных кейсах — от автоматического паспортного контроля в аэропортах по всей России до получения электронной подписи в налоговой и обслуживания в ведущих банках и МФО. Наши модули не ограничиваются кросс-верификацией, а проводят более 600 проверок, позволяют считывать данные с чипов NFC, сверять лица без биометрии. И все это on-premise, без интернет-соединения и подключения к внешним базам данных.
CNews: Что дальше? Какую цель вы ставите перед собой на ближайшие годы?
Владимир Арлазаров: Наша главная задача — чтобы перестала существовать сама задача ввода любых документов. Как мы это сделали для распознавания паспорта РФ и других удостоверяющих личность документов всех стран мира. Еще одна наша цель — развитие антифрод-технологий для защиты от мошенников, угроза от которых становится все серьезнее. Это очевидно из-за распространения инструментов генеративного ИИ, который стимулирует демократизацию фрода. Перед нами классическое противостояние добра и зла, и нужно прикладывать серьезные усилия, чтобы не проиграть в этой битве. Мы уже многое сделали в этой области и планируем и дальше повышать качество и надежность работы наших систем, чтобы предвосхищать новые типы атак.
Все десять лет мы работаем над тем, чтобы убрать раздражающую рутину, бесполезную трату времени и риски из повседневной жизни. Там, где уже используется наш искусственный интеллект, процессы стали быстрыми, прозрачными и удобными — это регулярно отмечают наши заказчики и их клиенты. Мы рады, что именно наша компания стояла у истоков этой новой реальности, и планируем, не сбавляя темпов, продолжать формировать облик нашего общего будущего. В котором искусственный интеллект работает для человека, а не наоборот.
■ Рекламаerid:2W5zFJUVbRSРекламодатель: ООО "СМАРТ ЭНДЖИНС СЕРВИС"ИНН/ОГРН: 7728328449/1167746085297Сайт: https://smartengines.com/






