roboforum.ru

Технический форум по робототехнике.

Проект по созданию качествоенного голоса для компьютера.

Проект по созданию качествоенного голоса для компьютера.

eznatok » 11 авг 2006, 13:40

Итак предлагаю всем желающим принять участие в проекте по созданию СВЕРХКАЧЕСТВЕННОГО синтезатора человеческой речи!

Суть его в построении трехмерной компьютерной модели речевого аппарата человека. Со всякими голосовыми связками, горлом, ртом, языком, зубами и прочим, что формирует речь.


Причем можделируем мы это все так. чтобы оно динамически могло менять свою форму.

Затем "запускаем" в голосовую систему виртуальный поток с миллионом частиц и на выходе ставим виртуальную мембрану.

С этой мембраны и снимаем идеальную речь.

Что вы думаете об этой идее?

Хотите присоединиться к проекту?

avr123.nm.ru » 11 авг 2006, 13:46

круто ! главно очень нужная вещь !

Johnny Bravo » 11 авг 2006, 15:05

Конечно хотим! :D
Только управление автомобилем доделаю, а тут и глядишь и шофер появится!  :wink: Наверно нужно рыть в направлении электростатических синтезаторов!?

=DeaD= » 11 авг 2006, 16:14

Жесть :) миллиона скорее всего не хватит только...

А раз беретесь за такой крутой проект - вот и посчитайте сначала сколько вам частиц надо будет "запускать", если брать их реального размера :)

eznatok » 11 авг 2006, 16:43

Я думаю миллиона частиц хватит.

Вопрос, насколько сложна речеобразующая система человека, глотка, связки, рот, язык?

Сколько полигонов, нужно для моделирования?

По моим оценкам, приблизительно несколько тысяч для простой модели должно хватить.

Ну и конечно нужно проанализировать, говоря какую букву, как мы сокращаем, поджимаем, высовываем что в речевом аппарате, чтобы говорить звуки.

После этого, виртуально как бы из легких запускаем в речевой аппарат миллион частиц. Тут тоже нужно будет проэксперементировать, потому как в реальном голосовом аппарате мы запускаем трилионы частиц.

Перспективы у проекта просто фантастические. Например можно будет синтезировать голос, который вам будет нравиться. Делать виртуальный певцов и певиц, которые по своим голосовым данным, в сто раз превзойдут обычных певцов и певиц.

Значит начать проект я предлагаю вот с чего.

Давайте запрограмим модель обычного свистка?

Разберемся, что влияет на его частоту, вибрации и прочее.

ASin » 11 авг 2006, 17:01

(стоя аплодирует)

Сразу после окончания этого проекта надо заняться созданием ИИ путём молекулярного моделирования человеческого мозга. Перспективы тоже неслабые: можно будет создавать виртуальных  людей, которые своим умом в 100 раз превзойдут людей обычных.  

:lol: :lol: :lol:

eznatok » 11 авг 2006, 17:09

Размер и вес виртуальных частиц тоже можно  будет подобрать эксприментальным путем.

Что за неверие? Уважаемый объясните ваш скептицизм?

ASin » 11 авг 2006, 17:35

Скептицизм?
Ничего подобного. Это вот когда камрады в соседнем форуме 3Д распознавание планируют, тогда да, тогда появляется скептицизм.  (Типа, тема слишком сложная, но и люди толковые, может чего и изобретут...)

Ваш же проект вызывает только умиление ;)

=DeaD= » 11 авг 2006, 17:36

eznatok писал(а):Я думаю миллиона частиц хватит.

Так это... рассчеты в студию, для начала так сказать... оценка проекта и всё такое... :)

PS: (уже апплодировал лёжа :))

lebaon » 11 авг 2006, 19:56

синтезировать любой голос можно и сейчас :wink:
вот только настраивать это гемморооооой :evil:

Kanoka » 12 авг 2006, 02:16

Че ржете? Это ж непаханое поле, есть роботы которые умеют видеть, слышать, нюхать, а вот робота умеющего сморкаться еще нет. Коль уж собрались делать носоглотку то этому его нужно научить в первую очередь.

P.S. Я тут простыл немного, оттого и мысли такие :)

-= Александр =- » 13 авг 2006, 04:01

Эх... Я тоже в общих чертах знаю что такое число Авогадро и сколько нужно будет частиц... И устройство речевого аппарата я знаю примерно на том-же уровне что и устройство ядерного реактора. Но толку от этих общих знаний мало, а сделать как то так и другое - ой как не просто. Это задача для целой толпы ученых, а не для десятка любителей. И если б оно и правда было так просто - давно бы кто-то сделал. Только вот мне кажется что для симуляции этого процесса нужен будет далеко не один компьютер, тем более чтоб получить результат в реальном времени, а не на бумажку... У меня на компе и Протеус-то притормаживает, не говоря уже о физической 3Д-симуляции миллионов чстиц с разницей давлений и физических параметров стенок камеры... Это, как говорится, дохлый номер, тут работы больше чем у многих терпения, да и результат мне кажется того не стоит.

А вот сделать на базе сэмплов слогов речевой аппарат для робота - вот это уже другое дело! А то все диоды, дисплеи, да телеметрия. Я пока-что не видел ни одного говорящего робота! (не считая конечно всяких профессиональных)  :wink:
Хм... Где-то у мя валялась карта на 32 метра, туда вполне алфавит влезет несжатым звуком, пойти чтоли попробовать?  :roll:

gab » 14 авг 2006, 02:51

2 Автор топика:
А как этим управлять вы думали?
PS: Идея синтеза качественного звука уже успешно решена в сотовой телефонии и секретной связи. Так что, в контексте топика, задача сводится к адекватному разбору текстов и синтезу параметров формующих фильтров и возбуждающего генератора.

eznatok » 14 авг 2006, 14:57

Синтез речи, еще качественно не решен.

Дайте пожалуйста ссылочку на качественный синтез русской речи?

eznatok » 14 авг 2006, 15:01

Вопрос тут вот в чем.

Синтез речи при мат. маделировании голосового аппарата должен дать невиданные до сих пор возможности.

1 Это синтез голоса любого человека с интонациями и вообще всем, что присуще голосу живого человека.

2 Создание удивительных по красоте синтезированных голосов. Вот каждому из нас нравится определенный голос. Нам нравится как кто то поет.

А ведь можно же сделать голос еще лучше. Скажем не тянет кто то высокую ноту, а мы синтезируем голос, который будет тянуть любую ноту.

Представьте певца с диапазоном в от 15 до 30 000 герц?


Rambler\'s Top100 Mail.ru counter