Японский генетический алгоритм выработает командный голос
Новая система обработки голоса сможет преобразовать человеческий голос, изменив его оттенок: в результате даже обладатель слабого и тихого голоса сможет заговорить выразительно и четко, получив возможность произносить яркие зажигательные речи даже перед большими скоплениями народа. Для некоторых правильная постановка голоса - ключ к успеху в жизни. Маргарет Тэтчер, к примеру, специально тренировалась понижать голос, что придавало ее речи большую "авторитарность".Руководителям, по мнению разработчика новой системы Юджи Сато (Yuji Sato) из токийского университета Хосэй (Hosei), без сильного и непререкаемого голоса не обойтись. Именно в помощь желающим стать начальниками он и создал систему обработки голоса, которая позволит любому, как мужчине, так и женщине, зазвучать в нужном регистре - весело, спокойно или мужественно.
Для обработки голоса используется так называемый генетический алгоритм. Алгоритм анализирует образцы речи человека, произносящего определенные фразы, и определяет, каким образом ее необходимо преобразовать, чтобы получить желаемый эффект. Для этого создается последовательность так называемых "голосовых хромосом", представляющих способы возможной модификации голоса. Каждая хромосома состоит из трех "генов", соответствующих изменению высоты, громкости и скорости речи. Хромосомы "применяются" к записанной речи, после чего получившиеся в результате трансформированные образцы речи дают прослушать наблюдателям, которые ранжируют их в соответствии с требуемым критерием.
После этого система отбраковывает часть хромосом, оставляя лишь наиболее эффективные, и производит обмен генов между ними, производя тем самым "на свет" новую популяцию хромосом. Вдобавок она в состоянии слегка, случайным образом варьировать гены, создавая потенциально интересные вариации различных оттенков человеческой речи - спокойствия, мужественности или веселости.
Оказалось, что система г-на Сато всего лишь в результате нескольких "поколений" генетических преобразований оказалась в состоянии превратить невыразительное блеяние в ясную, сочную и непререкаемую речь.
Жаль только, что в реальном времени система обработки голоса пока что работать не может, но г-н Сато уже трудится над решением и этой задачи. Однако даже существующая ее версия вполне способна оказать неоценимые услуги при записи телепередач, а также для "оживления" компьютерных игр, заявляет разработчик.
Источник: по материалам журнала New Scientist.