[userpic]

Компьютерный синтез голоса с интонациями

ailev в Openmeta (оригинал в ЖЖ)

Metapractice
Multi-level communication
  1. Формальное начало старой темы metanymous
    Говорить_как_петь metanymous
Языкоиды -- моделируем и тренируем
  5. Языкоиды -- моделируем и тренируем metanymous
  4. Языкоиды -- моделируем и тренируем metanymous
  3. Языкоиды -- моделируем и тренируем metanymous
  2. Языкоиды -- моделируем и тренируем metanymous
"Слова бывают только вместе с жестом, или тоном голоса, или чем-то в этом роде." Бейтсон.
  "Слова бывают только вместе с жестом, или тоном голоса, или чем-то в этом роде." Бейтсон. metanymous
Openmeta
Ранжированный список тем опенметы
  Ранжированный список тем опенметы metanymous
Предварительная опись выявленных моделей ОпенМеты
  Предварительная опись выявленных моделей ОпенМеты metanymous
    МодельРечиКакПения metanymous
Компьютерный синтез голоса стал еще ближе -- послушайте, например, Вокалоид (http://www.vocaloid.com/en/sample.html).
Кто не знает про Вокалоид: это такая фирменная технология от Yamaha, которая на входе берет японский или английский письменный текст и миди, и поет этот текст голосом засэмплированного певца/певицы в соответствии с миди. И все это удовольствие будет стоить каких-нибудь $330 для голосов безвестных вокалистов, которые, думаю, нас вполне удовлетворят. В продаже все эти чудеса с января 2004г.
Нас, конечно, интересует не пение, а речь -- интонационные паттерны (коих metanymous оценивал, насколько я помню, в пару десятков). Петь, оказывается, легче, чем говорить: It is possible to synthesize the spoken word by inputting notes and pitch bend to represent the intonation, but it is not easy to create the complex intonation curve by hand. Please note that VOCALOID is a system for mainly synthesizing songs. Для наших целей, конечно, нужно будет сделать приладу, которая создает сложные интонационные кривые отнюдь не руками. Теперь достаточно взять какой-нибудь кинодвижок, создать аватару с грудью попышнее или торсом помогучей, приделать синхронизацию с голосом -- и вот уже можно генерировать внушения на любую подходящую тему.
Потом начнем разбираться с вербальной/невербальной обратной связью -- эти технологии тоже могут оказаться доступны быстрее, чем мы сейчас думаем.

4 комментария

сначала старые сначала новые