Разделы

Цифровизация Инфраструктура

IBM: пора разговаривать с машиной по-человечески

Еще в этом десятилетии корпорация IBM надеется создать машину, способную распознавать разговорную речь на 20 языках, а также понимать различные диалекты, акценты и контексты, что позволит безукоризненно переводить юридические и медицинские документы, и даже свидетельские показания в зале суда.

Проект был начат в этом году и рассчитан до конца 2010 года. По словам IBM, пока сделаны только наброски, но общая цель ясна - заставить машины сравняться, а затем и превзойти возможности человека в распознавании речи.

"В течение прошлого года мы пытались оценить, насколько мы приближаемся к возможностям человека", - заявил менеджер отделения IBM по технологиям распознавания речи Дэвид Нахамо (David Nahamoo). По его словам, пока машины справляются с задачей примерно в 3-10 раз хуже человека. IBM же хочет создать такую технологию, чтобы вплотную приблизиться и даже превзойти его.

ПК, мобильные телефоны и некоторые другие устройства способны "говорить" и "слушать" уже довольно давно, но существует нескольких тормозящих факторов - машинам мешают акценты, диалекты. Английский язык особенно сложен из-за его "нефонетичности". Добавляют проблем также различные фоновые шумы. Машина должна работать с каким-то конкретным голосом, что существенно улучшает результаты работы.

Решения, основанные на технологии распознавании речи, уже применяются в мобильных телефонах, интерактивном ТВ, и даже встраиваются в автомобильные панели управления. По оценкам аналитической фирмы IDC, общий рынок систем распознавания речи в телефонной индустрии может достигнуть $3,5 млрд. к 2005 году. Лидерами исследований в этой области являются IBM, AT&T, Lucent и Philips.

Государство и бизнес делят ИИ на зоны ответственности
Импортонезависимость

Системы распознавания речи будут использовать и аудио-визуальные технологии. Например, камеры, расположенные перед сидением водителя, смогут распознавать его речь по движению губ, и тогда посторонние шумы или разговоры пассажиров не будут создавать помех.

Системы распознавания речи позволят также реализовать такие услуги, как прослушивание и голосовая отправка почты, электронной почты, факсов, а также обеспечить удобный доступ к личному ежедневнику и персональной записной книжке.


IBM является крупнейшей в мире корпорацией, работающей в области информационных технологий, которая более 90 лет сохраняет лидерство в разработке и внедрении инновационных решений для бизнеса. IBM является одним из ведущих мировых поставщиков аппаратных и программных решений и осуществляет свою деятельность в 164 странах мира. IBM производит широкий спектр компьютеров, включая персональные компьютеры, мейнфреймы и сетевые серверы. IBM предлагает обширный портфель систем хранения данных, программного обеспечения и различных периферийных устройств.