Технологии ABBYY помогают оцифровать культурное наследие Европы
Компания ABBYY, мировой разработчик программного обеспечения и поставщик услуг в области лингвистики, распознавания документов и ввода данных, объявила результаты своего участия в международном проекте IMPACT (Improving Access to Text, «улучшая доступ к тексту») — масштабном мероприятии, инициированном Европейской комиссией для преобразования европейского печатного наследия в цифровые ресурсы и объединяющем 26 организаций, среди которых национальные и региональные европейские библиотеки, научно-исследовательские институты и технологические партнеры.
ABBYY участвует в проекте с 2008 г., программное обеспечение компании используется для оптического распознавания текста документов (Optical Character Recognition — OCR), набранных старинными шрифтами. В процессе работы с важными историческими материалами из коллекции ведущих европейских библиотек специалисты компании оптимизировали технологии предварительной обработки и анализа структуры документов. Это позволило добиться более точного распознавания символов, говорится в сообщении ABBYY. Многие новые разработки в области распознавания специализированных текстов и документов уже нашли применение в продуктах ABBYY FineReader Engine и ABBYY Recognition Server 3.0. Обновленные решения компании теперь доступны для использования организациями во всем мире.
В рамках IMPACT в тесном сотрудничестве с участниками других организаций специалисты ABBYY решают технологические задачи, характерные для таких крупномасштабных проектов, как оцифровка библиотечных фондов. Благодаря этому взаимодействию национальные библиотеки получают возможность преобразовывать оригиналы старинных документов в электронный вид, осуществлять в цифровых копиях поиск по тексту, а также создавать на различных языках мира собственные электронные словари.
«Раньше нам не всегда удавалось качественно распознать текст или преобразовать данные в формат XML, особенно когда приходилось работать со старинными книгами, журналами и газетами, — отметил Али Конте (Aly Conteh), член исполнительного совета проекта IMPACT, руководитель программы Британской национальной библиотеки по преобразованию печатных текстов в цифровой формат. — Участие в IMPACT открыло нам доступ к передовым технологиям распознавания, в том числе предоставляемым компанией ABBYY. Эти решения позволили нам и другим участникам проекта эффективно обрабатывать документы, качество которых ранее оставляло желать лучшего».
«Оцифровка печатного интеллектуального наследия Европы не только помогает сохранить его для будущих поколений. Так мы сможем открыть доступ к этому информационному массиву для миллионов исследователей, студентов и простых читателей по всему миру, — объяснил Андрей Исаев, директор департамента технологических продуктов ABBYY. — Это благородная цель, и мы рады возможности принимать в этом участие совместно с другими организациями, воодушевленными этой идеей».
Отметим, что продукты и технологии ABBYY также применяются и в крупнейших библиотеках России. Так, в Российской государственной библиотеке (РГБ) оцифрован архив Высшей аттестационной комиссии Минобразования РФ. в Государственной публичной научно-технической библиотеке России (ГПНТБ России) с помощью ABBYY стал электронным каталог карточек. В научной педагогической библиотеке им. К.Д. Ушинского (НПБ им. К. Д. Ушинского), крупнейшей отраслевой библиотеки России по педагогике и психологии, технологии ABBYY помогли оцифровать авторефераты и реализовать полнотекстовый поиск по ним.