Разделы

Цифровизация

«Яндекс» опубликовал принципы синтеза речи

«Яндекс» сделал общедоступным внутренний документ, в котором описаны принципы компании при работе с технологией синтеза речи. Это нормы и правила, которые, на взгляд «Яндекса», позволяют сделать технологию комфортной и безопасной для всех, кто с ней так или иначе соприкасается. Об этом CNews сообщили представители «Яндекса».

В документе рассказывается, как «Яндекс» обрабатывает данные синтеза — они хранятся в дата-центрах компании, соответствующих индустриальным требованиям безопасности, — как строится работа над технологией и какие ограничения действуют при ее использовании. Отдельное внимание уделено дикторам — людям, на чьих голосах обучается модель синтеза. «Яндекс» запрашивает у них согласие на использование голоса и объясняет им, что их голосами впоследствии будут озвучены произвольные тексты.

«Наши принципы будут полезны всем, кто имеет дело с синтезом речи: звукозаписывающим студиям, разработчикам технологии и компаниям, которые ее у себя внедряют. Если наш подход разделят другие участники рынка, в будущем он сможет послужить основой для отраслевого стандарта», — сказал директор «Яндекса» по развитию технологий искусственного интеллекта Александр Крайнов.

Бесплатная российская замена Active Directory упрощает переход на отечественное ПО
Безопасность

«Союз дикторов приветствует инициативу «Яндекс» по разработке этических норм при работе с синтезом речи. Это первый, но важный шаг по защите голосов дикторов и актеров. Мы поддерживаем идею предложить им прозрачные условия работы — когда компания детально информирует их о том, как может быть использован голос. Пока законодательные меры еще не приняты, поэтому Союз дикторов рекомендует дикторам и актерам внимательно выбирать проекты для участия. В любом случае мы рады, что поднимается тема этики — это может стимулировать развитие качественного партнерства разработчиков, студий и дикторов», — отметил Александр Лапшин, председатель Союза дикторов России.

«Яндекс» с 2012 г. развивает собственные речевые технологии, в том числе технологию синтеза речи. Она используется в «Алисе», «Браузере», «Книгах», «Навигаторе», «Картах» и других сервисах. Технология доступна внешним пользователям в составе сервиса Yandex SpeechKit на облачной платформе Yandex Cloud. Ее можно применять для создания голосовых помощников, автоматизации коммуникаций в колл-центрах, озвучивания книг и не только.