«Окская птицефабрика» оцифровала 300 тыс. рукописных записей, применив отечественные ИИ-технологии
«Окская птицефабрика» оцифровала 300 тыс. рукописных записей, применив отечественные ИИ-технологии. В формат электронной базы данных перевели архив зарплатных сведений, накопленный за 20 лет. Теперь представители предприятия могут нажатием одной кнопки отвечать на запросы Социального фонда РФ и подтверждать права на пенсионные выплаты для 10 тыс. бывших работников. Для этого 1,2 млн параметров из старых рукописных журналов оцифровали с помощью российской платформы Beorg Smart Vision. Проект занял 1,5 месяца. Технологию обработки документов и распознавания изображений с применением технологий искусственного интеллекта (ИИ) разработала компания «Биорг», резидент «Сколково».
АО «Окское» (ранее имело название «Окская птицефабрика») поставляет на российский рынок 4 млн куриных яиц в сутки, предприятие основали в апреле 1972. К 2025 г. десятки тысяч его сотрудников вышли на пенсию. Компания обязана подтверждать данные о зарплатах бывших сотрудников по запросу из Социального фонда России (СФР).
«Это типичная ситуация для производства, которое действует ещё с советских времён. Тысячи организаций в России направляют зарплатные сведения для Социального фонда РФ, которому надо понимать, в какой период конкретный человек работал на предприятии, какой у него стаж, сколько он зарабатывал, чтобы начислить ему пенсию. Проблема в том, что почти все подобные данные – это архив рукописных журналов и выплатных документов. Удобно ли работать в таком формате? А если в кадровый отдел только вышел новый сотрудник? А если предприятие отдает на аутсорс все непрофильные функции, связанные с поддержкой офисной деятельности?», – сказал Илья Веригин, директор «Биорг» по работе крупным бизнесом и госведомствами.
Другая проблема, которую обозначил Веригин: зарплатные журналы иногда вели добросовестно, по строгой форме, а иногда в довольно свободном стиле, например, ставили первую букву имени, фамилию и сумму. Это трудность для системы распознавания – как обнаружить и понять, что и где написано, если формат данных – «плавающий», а требования к качеству электронных данных – самые высокие. В проекте оцифровки для «Окской птицефабрики» требования к точности составляли 99,9%.
«Качество электронного массива, близкое к 100% – ключевое условие для старта проекта цифровой трансформации архива, где содержатся данные по социально значимым вопросам, по начислению пенсий. Получить на выходе электронный массив со средним качеством – результат, который просто не имеет смысла. Точность распознавания даже на уровне 98% создает проблемы для людей в будущем. По этой причине мы искали гарантий при подборе подрядчика. Компания «Биорг» гарантировала нам качество данных на уровне договора», – сказал Руслан Мясников, директор по бухгалтерскому и налоговому учету.

На основе полученных электронных сведений предприятие создало базу данных, где вся информация представлена в едином формате. Теперь не надо идти в архив, искать и выписывать отдельные строки из журналов.
По словам представителя фабрики, преимуществом проекта стала автоматизация процесса распознавания рукописных сведений.
«Вручную эту информацию пришлось бы переносить в базу данных на протяжении минимум 3 лет. Организация подобной работы потребовала бы не только времени, но и затрат, по крайней мере, на 30% превышающих бюджет оцифровки на базе платформы «Биорг». Таким образом, сроки, прогнозируемый бюджет и качество автоматизированной обработки данных с применением ИИ-технологий стали главными аргументами для старта проекта», – отметил Руслан Мясников.