Разделы

Цифровизация

Specom 2007: распознавание речи работает на силовиков

На российском рынке наблюдается рост интереса к разработкам в области систем распознавания речи (СРР). Он высок как со стороны государственных структур, так и со стороны коммерческих организаций. Однако большая часть разрабатываемых продуктов все же подстраивается под госнужды, поскольку силовые ведомства уже давно понимают необходимость перехода на более совершенные технологии. Они могли бы помочь в борьбе с преступностью, в обеспечении ИБ и шифровании данных. Именно госструктуры выделяют деньги на проведение исследований и создание ПО. Но, к сожалению, во взаимоотношениях заказчик-разработчик все не так гладко, как могло бы быть.

Во-первых, финансирование разработок осуществляется очень непропорционально. Так, например, на создание речевых корпусов, они же – речевые базы данных для разных языков, в том числе и народов РФ, деньги практически не выделяются. А их создание необходимо для дальнейших разработок прототипических версий автоматических распознавателей или синтезаторов речи.

Из-за отсутствия координации многие предприятия ведут дублирующие друг друга разработки, что тоже является немаловажной проблемой для отечественного рынка речевых технологий.

И, наконец, организациям и научным лабораториям попросту не хватает квалифицированных кадров. Число ВУЗов, выпускающих подобных специалистов, очень невелико.


В президиуме конференции Specom 2007 присутствовали все те, кто принимает наиболее активное участие в развитии СРР

Для решения всех этих проблем несколько лет назад был создан консорциум "Российские речевые технологии", в который вошли ведущие российские компании и научные учреждения, занимающиеся разработкой новых речевых информационных технологий. Однако, по словам директора компании "Стэл", также входящей в консорциум, Михаила Андреева: "За несколько лет своего существования организация на шаг не приблизилась к решению этих проблем". В ноябре часть организаций, входящих в консорциум, планирует провести заседание с целью смены руководства и составления четкого плана работ. В число этих учреждений вошли Вычислительный Центр Академии наук, Институт информатики и автоматизации РАН из Санкт-Петербурга, Московский государственный лингвистический университет, "Стэл – компьютерные системы" и "Центр речевых технологий".

В случае неготовности консорциума "Российские речевые технологии" к реорганизации вышеперечисленные организации готовы приступить к созданию альтернативной ассоциации.

Эти намерения были озвучены на двенадцатой международной конференции "Речь и компьютер" (Specom 2007).

Несмотря на немалое количество проблем, стоящих перед разработчиками СРР и лингвистами, конференция наглядно показала, насколько далеко продвинулись исследования в области создания систем распознавания речи. По словам ученого из университета Джорджии, доктора Ли (Chin-Hui Lee), всего десять лет назад точность распознавания речи для дикторонезависимых систем была менее 50%, сейчас же эта цифра приближается к 70%. Проблему распознавания отдельных слогов и слов можно считать уже практически решенной. Однако по-прежнему нет особенных успехов в распознавании спонтанной речи. И по-прежнему автоматизированные системы распознавания речи как минимум в десять раз хуже возможностей человека.

Коммерсанты нацелились на выгоду

Фарид Нигматуллин, «ВидеоМатрикс»: У видеоаналитики в промышленности большие возможности
Цифровизация

Тем не менее на коммерческом рынке уже достаточно давно и успешно работают системы распознавания речи для call-центров, системы автоматического оповещения. Существуют довольно удачные разработки управления голосом для интеллектуальных зданий, некоторых моделей автомобилей. Немало сделано для осуществления речевого общения с компьютером, что весьма актуально для людей с ограниченными функциями. На конференции Specom 2007 были продемонстрированы несколько работающих моделей, правда, лишь для французского и балканских языков.

К недостаткам уже существующих систем можно отнести их некоторую ограниченность: акцент, проблемы с дикцией у говорящего, посторонние шумы – все это может повлиять на качество распознавания не в лучшую сторону.

Читать далее

Михаил Андреев: Между различными структурами, развивающими СРР, нет согласия

Михаил АндреевНа вопросы CNews ответили Михаил Андреев, директор компании "Стэл - компьютерные системы" и Сергей Мельников, начальник управления перспективных технологий компании.

CNews: Как вы оцениваете конференцию Specom 2007 и свое участие в ней?

Михаил Андреев: В мире существует несколько ведущих конференций по речевой тематике, две из них проводятся в Америке, Specom – это третья по величине. Мы впервые принимаем участие в этой конференции в качестве организаторов, и у нас складывается такое ощущение, что мы сюда привнесли немножко бизнеса…

Читать далее