Спецпроекты

Обзор скоро выйдет
Игорь Беляк, Directum: В последние годы рынок технологий OCR и IDP серьезно трансформируется

Генеративные модели ИИ не нуждаются в больших наборах данных для обучения или специализированных инструментах, но при этом способны обрабатывать не только текст, но также изображения и сканы, таким образом их использование существенно сокращает стоимость внедрения и владения системами и позволяет эффективно решать комплексные задачи. Подробнее об этом в интервью CNews рассказывает Игорь Беляк, директор по ИИ компании Directum.

Игорь БелякDirectum

«Бизнесу необходимо end-to-end-решение. Ценность заключается не только в распознавании или классификации документов — нужно комплексное решение задач»

Market.CNews: Как сегодня развивается рынок OCR IDP в РФ? Какие технологии используются для распознавания и обработки документов?

В последние годы рынок технологий OCR и IDP серьезно трансформируется. Ранее его делили между собой несколько крупных вендоров, а сегодня мы видим множество стартапов, которые используют более эффективные и экономичные технологии. Лидирующие позиции традиционных игроков вроде ABBYY и Kofax уже не так бесспорны — многие из задач, которые они решали, становятся менее актуальными в свете появления современных мультимодальных генеративных моделей ИИ.

Генеративные модели обрабатывают, помимо текста, изображения и сканы, и за счет этого эффективнее решают комплексные задачи, которые ранее требовали использования множества разных инструментов. Они тоже распознают, классифицируют и извлекают факты, но требуют при этом меньше усилий для настройки и внедрения, так как не нуждаются в больших наборах данных для обучения или специализированных инструментах для разметки и подготовки данных. То есть мы получаем тот же результат, но с меньшими трудозатратами и более низкой стоимостью внедрения.

Игорь Беляк, Directum: В последние годы рынок технологий OCR и IDP серьезно трансформируется

Вместо того чтобы тратить время и ресурсы на создание и подготовку обучающих наборов, разработчики могут сосредоточиться на написании фронтенда, интеграции с существующими информационными системами организации и отладке работы системы. Да, стоимость оборудования для генеративных моделей выше, однако, учитывая экономию на проекте, эти инвестиции окупятся гораздо быстрее.

В свете тренда на цифровизацию большинство бумажных форматов может вообще исчезнуть — включая личные документы, например паспорта. Так что сама задача распознавания, вероятно, подрастеряет свою актуальность. Конечно, есть специализированные сегменты, где еще много работы для систем OCR: архивы, проектные и конструкторские бюро — учреждения, где нужно оцифровывать профильную документацию, чертежи и пр.

Ключевая проблема, с которой сегодня сталкиваются как стартапы, так и традиционные вендоры, в том, что бизнесу необходимо end-to-end-решение. Ценность заключается не только в распознавании или классификации документов — нужно комплексное решение задач. Например, оформление договоров, согласование документов или обработка платежей. Для этого требуется глубокая интеграция с core-системами, такими как BPM, ECM или ERP.

«В ближайший год мы увидим значительное сокращение требований к ресурсам для запуска локальных моделей»

Market.CNews: Если для большей эффективности компаниям стоит использовать языковые модели, то какие? Нет ли риска в применении иностранных моделей?

Важно четко различать облачные и локальные модели. Облачные решения, безусловно, предлагают высокий уровень качества и удобства. Если говорить о безопасности данных, то локальные модели, даже если они иностранные и с открытыми лицензиями, могут быть развернуты в контуре конкретной организации. То есть данные не покидают пределы компании, что является критически важным аспектом для многих компаний.

Хотя облачные модели действительно демонстрируют более высокий уровень качества, локальные решения, доступные для бизнеса, уже достаточно эффективны для разных задач. Например, суммаризации документов, генерации текстов и нормоконтроля. Эти модели могут работать на относительно доступном оборудовании, что позволяет получать существенный экономический эффект от внедрения подобных технологий и гарантирует безопасность данных.

Не стоит забывать и о российских разработках, таких как YandexGPT, которые также могут быть использованы для решения различных задач. Если заказчик готов работать с облачными моделями, решения от Сбера или Яндекса могут быть вполне приемлемыми. Риски, связанные с безопасностью, в этом случае не выше, чем при использовании локальных моделей.

Думаю, в ближайший год мы увидим значительное сокращение требований к ресурсам для запуска локальных моделей. Они смогут работать на менее мощном оборудовании, при этом качество их работы останется на высоком уровне или даже улучшится. Примером может служить модель DeepSeek, локальная версия которой показывает результаты, сопоставимые с облачной. А облачная, как вы помните, своим появлением чуть ли не обвалила акции крупнейших ИТ-гигантов США.

Market.CNews: Каков технологический стек IDP Directum?

Мы, как и многие другие вендоры в этой области, начинали с разработки собственных решений для классификации, извлечения фактов из документов и разметки данных — использовали OCR, машинное обучение и большие объемы данных. В последнее время мы активно включились в развитие генеративных моделей, которые в сочетании с традиционными методами машинного обучения открывают новые горизонты для обработки информации. В некоторых кейсах, где у нас не было готовых решений, применение генеративных моделей стало настоящим прорывом.

Генеративные модели существенно сокращают стоимость внедрения и владения системами. Даже несмотря на дорогостоящее оборудование, так как клиенты могут самостоятельно развивать эти решения. Аналитики или даже просто продвинутые пользователи систем могут настраивать и адаптировать решения без привлечения разработчиков, что снижает общие затраты. К примеру, в Directum RX Intelligence можно добавлять этапы ИИ-обработки в бизнес-процессы прямо в no-code-редакторе.

Market.CNews: Какие процессы внутри организации могут быть оптимизированы за счет генеративных моделей ИИ в составе Directum RX Intelligence?

Ранее мы ограничивали процессы обработки документов лишь их занесением и маршрутизацией. Теперь мы можем не только генерировать ответные письма с учетом контекста взаимодействия с конкретным контрагентом, но и проводить проверку этих писем на соответствие нормам, внутренним правилам, стилистике и пр. В договорной работе ГенИИ в составе системы не просто автоматизирует занесение и сравнение договоров, но и проводит юридический нормоконтроль: проверяет наличие необходимых разделов и выявляет потенциальные риски. Кажется, что это какие-то небольшие этапы, участки процессов, но ГенИИ здесь очень выручает человека, полностью исключая пресловутый человеческий фактор.

Еще пример – процессы управления совещаниями. Ранее подготовка протоколов и назначений требовала много ручного труда. Теперь по завершении встречи запись автоматически транскрибируется, на основе этого текста формируется протокол совещания. Все необходимые данные заносятся в систему, и протокол мгновенно рассылается участникам. Это позволяет не забывать о важных решениях, принятых в ходе встрече, и экономит время.

«Мы будем двигаться в русле общих трендов развития ИИ, а главная тенденция сегодня — использование генеративных моделей»

Market.CNews: Какие у Directum планы на развитие?

Мы будем двигаться в русле общих трендов развития ИИ, а главная тенденция сегодня — использование генеративных моделей. Продолжим развивать агентный подход в наших продуктах, взаимодействие на естественном языке и голосом — стремиться к ZeroUI.

Ожидаем, что на горизонте 1,5 лет качество ИИ-обработки вырастет, а требования к ресурсам — снизится, соответственно, ниже будет и порог вхождения в ИИ для бизнеса. В свою очередь мы в Directum добавляем пользователям возможность самостоятельно настраивать, корректировать, модифицировать работу с генеративными моделями с помощью no/low-code. Так они смогут получать наиболее качественный результат, который будет соответствовать конкретной организации, процессу, сотруднику.

erid:2W5zFGkeQbzРекламодатель: ООО "Директум"ИНН/ОГРН: 1835056809/1031801962092Сайт: https://www.directum.ru/

37-я международная выставка информационных и коммуникационных технологий Связь-2025 37-я международная выставка информационных и коммуникационных технологий Связь-2025

erid: 2W5zFHRYEHv

Рекламодатель: АКЦИОНЕРНОЕ ОБЩЕСТВО «ЭКСПОЦЕНТР»

ИНН/ОГРН: 7718033809/1027700167153