Компьютер понял русский разговорный
Компания «Центр речевых технологий» завершила работу над технологией распознавания слитной русской речи. Разработку предполагается использовать в call-центрах, электронных переводчиках и промышленности. В планах компании - доводка технологии для голосового управления компьютером, бытовой техникой и транспортом. Работы над проектом продолжались более 3 лет и потребовали $5 млн. инвестиций. Созданная питерским «Центром речевых технологий» система получила название «Руссограф», она способна распознавать 30 тыс. словоформ.
Специально под этот проект в «Центре речевых технологий» создали
"Русский язык принципиально отличается от других языков не только фонетически (например, звуком "ы"), но и свободным порядком слов в предложении, что значительно усложняет математическое моделирование речи. В результате использование западных технологий для качественного распознавания русской речи не представляется возможным", отмечает генеральный директор ЦРТ Михаил Хитров.
Важной частью проекта стало создание базового речевого декодера, который, используя оригинальные акустические и языковые модели русского языка, преобразовывает речевой сигнал в текст. Как сообщили CNews в ЦРТ, точность распознавания цифр в телефонной линии составляет 99,9%, а сложных слов 90%. Тем временем, западные системы анонсируют 9599% правильного распознавания речи. Однако специалист по компьютерной лингвистике Виктор Бочаров рассказал CNews, что на практике это значение может быть ниже и существенно зависит от набора ожидаемых системой фраз, условий и качества канала (например, телефонного).
Михаил Хитров: Русский язык отличается от других свободным порядком слов в предложении и звуком "Ы"
Сейчас ЦРТ работает над аппаратной реализацией своей технологии. В 2008 г. компания собирается вывести на рынок несколько продуктов, построенных на основе своей разработки, в частности, систему интерактивного голосового управления для
Решения на базе распознавания речи могут применяться и для управления «интеллектуальным зданием». «На базе этой технологии можно организовать управление подсистемами „умного дома“ с обратной связью, то есть реализовать голосовой диалог между хозяином и системой, управляющей домом. Наша компания уже испытывает технологию распознавания речи, созданную в ЦРТ, и через полгода мы планируем внедрить его в наши решения», рассказал CNews генеральный директор компании IntelVision Иван Анцев.
Мировой рынок речевых технологий в 2006 г. был равен $5,6 млрд., а в 2007 г., по оценкам «Финама», вырос на 16% и составил $6,5 млрд. Аналитик «Финама» Владислав Кочетков отмечает, что технология распознавания слитной русской речи может быть сильно востребована на быстроразвивающемся рынке
Татьяна Ландо, специалист по обработке текста, считает, что в целом проект выглядит многообещающим. «Если он действительно будет работать хорошо, то это значительно подстегнет рынок технологий, связанных не только с обработкой звука, но и текста. А заодно поможет исправить репутацию технологиям распознания слитной речи, в которых уже многие разочаровались», полагает Татьяна Ландо.
«Распознавание речи это тот технологический барьер, преодолев который, мы сможем общаться с компьютером так же, как с человеком. ЦРТ сделал серьезную заявку на право быть первыми, по крайней мере, в области славянских языков», полагает независимый эксперт