Интернет Веб-сервисы

04 Августа 2014 12:08 04 Авг 2014 12:08 |

«Яндекс» запустил облачный сервис распознавания речи

Новый сервис SpeechKit Cloud от «Яндекса» позволит разработчикам добавлять функцию распознавания голоса в приложения для мобильных устройств, автомобильных навигаторов, систем телефонии и т. д. В компании утверждают, что распознавание запроса выполняется за одну секунду.

Компания «Яндекс» объявила о запуске облачного сервиса SpeechKit Cloud. С его помощью разработчики смогут добавлять функцию распознавания речи в различные программы, сервисы и устройства.

Сервис может быть полезен: для десктопов и ноутбуков (голосовой ввод и голосовые интерфейсы в приложениях и играх), для автомобилей (голосовое управление функциональностью автомобиля, навигационными и мультимедийными системами), в телефонии (интерактивное голосовое меню, автоматизация телемаркетинга и информирования), в медицине (протоколирование приема пациента, протоколирование операций) и пр.

«Облачный сервис распознавания речи «Яндекса» уже используют компания Oktell, выпускающая программное обеспечение для колл-центров, и Cubic Robotics — разработчик домашнего робота Cubic. Робот понимает заданные голосом вопросы и отвечает на них, а система Oktell распознает речь звонящего в колл-центр человека и соединяет его с нужным специалистом», — рассказали в компании.

SpeechKit Cloud понимает русский и турецкий языки. Качество распознавания на русском языке составляет: диктовка текстов — 82%, короткие запросы из 3–5 слов на любую тематику — 85% и геозависимые запросы — 95%.

Обработка голосовых запросов производится на серверах «Яндекса». Распознавание происходит в реальном времени одновременно с передачей звуковых данных. В компании уверяют, что распознавание занимает около секунды: именно столько времени проходит с момента отправки данных на сервер до получения ответа.

«Яндекс» запустил облачный сервис распознавания речи

Доступ к SpeechKit Cloud организован с помощью HTTP API. В компании объяснили, что такой способ является для разработчиков наиболее простым. «Чтобы интегрировать эту технологию «Яндекса», необходимо прочитать всего пару страниц документации и написать несколько строчек кода в своем продукте», — пояснили CNews в пресс-службе.

Разработчики могут бесплатно использовать SpeechKit Cloud в течение месяца. По окончании пробного периода стоимость будет зависеть от количества запросов.

Как рассказали в «Яндексе», средняя стоимость использования SpeehKit Cloud для 1 тыс. голосовых запросов — $5. При этом некоторым категориям клиентов в компании готовы предоставлять доступ бесплатно. К таким клиентам, например, относятся некоммерческие образовательные и медицинские организации.

В основе SpeechKit Cloud лежит технология распознавания речи Yandex SpeechKit, которую «Яндекс» запустил в 2013 г. Технология базируется на акустических и языковых моделях, построенных с использованием нейронных сетей. Сейчас Yandex SpeechKit используется в 400 мобильных приложениях для Android, iOS и Windows Phone и ежедневно обрабатывает миллионы голосовых запросов.

Как пояснили CNews в «Яндексе», SpeechKit Mobile SDK предназначен для добавления функции распознавания в приложения для iOS, Android и Windows Phone. Что же касается SpeechKit Cloud, то новый сервис разрешает выполнить интеграцию практически в любую систему. Оба проекта от начала до конца были разработаны в стенах российской компании.

Добавим, что сервис, подобный Yandex SpeechKit, есть и у Google. Он называется Speech API и доступен только в Android.

Supply & Demand Planning Conference

Сергей Попсулин

Подписаться на новости

Короткая ссылка

«Яндекс» запустил облачный сервис распознавания речи

Другие материалы рубрики

Конференции

Цифровизация промышленности 2025

Связь-2025

Low-code и no-code 2025

MARKET.CNEWS

IaaS

IP-телефония

BPM

ERP

Техника

Как помыть окна весной и не устать: лучшие роботы для мойки окон

Обзор Trouver X4 Pro: умный пылесос, который моет пол горячей водой

Лучшие смартфоны стоимостью до 20 000 рублей: хиты продаж

Наука

ИИ обнаружил скрытый космический взрыв, который меняет основы астрономии

Найдена первая гробница египетского фараона после Тутанхамона: что внутри?

Квантовая машина времени реальна? Новое исследование бросает вызов всему, что мы знаем

Цифровизация закупок: простая автоматизация
или способ сохранить бизнес в 2025 году

Чем ИИ может быть полезен в госуправлении? Мнения участников рынка

Цифровизация закупок: простая автоматизация
или способ сохранить бизнес в 2025 году

Больше чем Jira и Trello? Обновилось российское решение по управлению проектами

Чем ИИ может быть полезен в госуправлении? Мнения участников рынка

Совместимость решений — один из главных вызовов при внедрении заказного ПО

«Яндекс» запустил облачный сервис распознавания речи

Другие материалы рубрики

Конференции

Цифровизация промышленности 2025

Связь-2025

Low-code и no-code 2025

MARKET.CNEWS

IaaS

IP-телефония

BPM

ERP

Техника

Как помыть окна весной и не устать: лучшие роботы для мойки окон

Обзор Trouver X4 Pro: умный пылесос, который моет пол горячей водой

Лучшие смартфоны стоимостью до 20 000 рублей: хиты продаж

Наука

ИИ обнаружил скрытый космический взрыв, который меняет основы астрономии

Найдена первая гробница египетского фараона после Тутанхамона: что внутри?

Квантовая машина времени реальна? Новое исследование бросает вызов всему, что мы знаем

Цифровизация закупок: простая автоматизация или способ сохранить бизнес в 2025 году

Чем ИИ может быть полезен в госуправлении? Мнения участников рынка

Цифровизация закупок: простая автоматизация или способ сохранить бизнес в 2025 году

Больше чем Jira и Trello? Обновилось российское решение по управлению проектами

Чем ИИ может быть полезен в госуправлении? Мнения участников рынка

Совместимость решений — один из главных вызовов при внедрении заказного ПО

Цифровизация закупок: простая автоматизация
или способ сохранить бизнес в 2025 году

Цифровизация закупок: простая автоматизация
или способ сохранить бизнес в 2025 году