Разделы

Интернет Веб-сервисы Цифровизация Искусственный интеллект

Yandex B2B Tech запустил сервис для быстрого синтеза уникального голоса для бизнеса

Yandex B2B Tech запустила сервис для быстрого синтеза речи Brand Voice Lite. Теперь компаниям достаточно загрузить в сервис 20-40 минут записи речи диктора, чтобы создать уникальный голос своего бренда. Его можно использовать для создания персонализированных голосовых ботов в контакт-центрах, а также для озвучки подкастов, образовательных материалов и других креативных бизнес-проектов. Сервис уже доступен компаниям на платформе Yandex Cloud. Об этом CNews сообщили представители Yandex Cloud.

Как работает быстрый синтез для бизнеса

Для синтеза голоса достаточно озвучить текст в интерфейсе сервиса или загрузить в него уже готовую запись. Дикторами могут стать, например, приглашенные актеры или владельцы и амбассадоры бизнеса. Они могут синтезировать голос в разных амплуа: для каждой дополнительной эмоции (например, грустной или агрессивной речи) нужно записать еще от 20 минут. Модель синтеза станет доступна в течение семи дней после загрузки записей в сервис.

Технология Brand Voice Lite соответствует принципам «Яндекса» при работе с синтезом речи. Бизнес должен получить согласие человека на использование записи его голоса. Доступ к результатам синтеза будет только у заказчика. При этом он соглашается с правилами использования сервиса, которые ограничивают сценарии применения синтеза.

Кому нужен быстрый синтез

По оценке Fortune Business Insights, глобальный объем рынка разговорного ИИ в 2024 г. достиг $12,2 млрд, и в 2025 г. он вырастет на 21% и составит $14,8 млрд. Объем российского рынка диалогового ИИ в 2024 г. должен был достигнуть 7,45 млрд руб., прогнозировали в Naumen.

Как власти сэкономят 109 млрд руб. на создании инфраструктуры для дронов и обеспечении защиты от них
Техника

«Синтезированные голоса наиболее востребованы у банков, крупных ритейлеров и телеком-операторов, которые с их помощью автоматизируют первую линию поддержки. Всего с помощью технологий SpeechKit Brand Voice компании синтезировали уже более 50 голосов. После запуска Lite-версии сервиса мы ожидаем многократное увеличение таких проектов», – сказал CTO платформы Yandex Cloud Иван Пузыревский.

В основе Brand Voice Lite – собственные ML-модели Yandex SpeechKit, которые дообучаются под каждого клиента на их датасетах. Данные для обучения хранятся в дата-центрах компании, которые отвечают самым строгим стандартам в сфере информационной и физической безопасности.