roboforum.ru

Технический форум по робототехнике.

Проект по созданию качествоенного голоса для компьютера.

Обсуждаем рождающиеся мысли и результаты экспериментов.

Проект по созданию качествоенного голоса для компьютера.

Сообщение eznatok » 11 авг 2006, 13:40

Итак предлагаю всем желающим принять участие в проекте по созданию СВЕРХКАЧЕСТВЕННОГО синтезатора человеческой речи!

Суть его в построении трехмерной компьютерной модели речевого аппарата человека. Со всякими голосовыми связками, горлом, ртом, языком, зубами и прочим, что формирует речь.


Причем можделируем мы это все так. чтобы оно динамически могло менять свою форму.

Затем "запускаем" в голосовую систему виртуальный поток с миллионом частиц и на выходе ставим виртуальную мембрану.

С этой мембраны и снимаем идеальную речь.

Что вы думаете об этой идее?

Хотите присоединиться к проекту?
eznatok
Премодерация постов
 
Сообщения: 169
Зарегистрирован: 07 янв 2006, 02:12

Сообщение avr123.nm.ru » 11 авг 2006, 13:46

круто ! главно очень нужная вещь !
Аватара пользователя
avr123.nm.ru
отсылающий читать курс
 
Сообщения: 14195
Зарегистрирован: 06 ноя 2005, 04:18
Откуда: Москва
Предупреждения: -8

Сообщение Johnny Bravo » 11 авг 2006, 15:05

Конечно хотим! :D
Только управление автомобилем доделаю, а тут и глядишь и шофер появится!  :wink: Наверно нужно рыть в направлении электростатических синтезаторов!?
Johnny Bravo
 
Сообщения: 400
Зарегистрирован: 26 фев 2006, 15:21
Откуда: Омск

Сообщение =DeaD= » 11 авг 2006, 16:14

Жесть :) миллиона скорее всего не хватит только...

А раз беретесь за такой крутой проект - вот и посчитайте сначала сколько вам частиц надо будет "запускать", если брать их реального размера :)
Аватара пользователя
=DeaD=
 
Сообщения: 24218
Зарегистрирован: 06 окт 2004, 18:01
Откуда: Ебург
прог. языки: C++ / PHP / 1C
ФИО: Антон Ботов

Сообщение eznatok » 11 авг 2006, 16:43

Я думаю миллиона частиц хватит.

Вопрос, насколько сложна речеобразующая система человека, глотка, связки, рот, язык?

Сколько полигонов, нужно для моделирования?

По моим оценкам, приблизительно несколько тысяч для простой модели должно хватить.

Ну и конечно нужно проанализировать, говоря какую букву, как мы сокращаем, поджимаем, высовываем что в речевом аппарате, чтобы говорить звуки.

После этого, виртуально как бы из легких запускаем в речевой аппарат миллион частиц. Тут тоже нужно будет проэксперементировать, потому как в реальном голосовом аппарате мы запускаем трилионы частиц.

Перспективы у проекта просто фантастические. Например можно будет синтезировать голос, который вам будет нравиться. Делать виртуальный певцов и певиц, которые по своим голосовым данным, в сто раз превзойдут обычных певцов и певиц.

Значит начать проект я предлагаю вот с чего.

Давайте запрограмим модель обычного свистка?

Разберемся, что влияет на его частоту, вибрации и прочее.
eznatok
Премодерация постов
 
Сообщения: 169
Зарегистрирован: 07 янв 2006, 02:12

Сообщение ASin » 11 авг 2006, 17:01

(стоя аплодирует)

Сразу после окончания этого проекта надо заняться созданием ИИ путём молекулярного моделирования человеческого мозга. Перспективы тоже неслабые: можно будет создавать виртуальных  людей, которые своим умом в 100 раз превзойдут людей обычных.  

:lol: :lol: :lol:
ASin
 
Сообщения: 155
Зарегистрирован: 18 дек 2004, 03:14
Откуда: Москва

Сообщение eznatok » 11 авг 2006, 17:09

Размер и вес виртуальных частиц тоже можно  будет подобрать эксприментальным путем.

Что за неверие? Уважаемый объясните ваш скептицизм?
eznatok
Премодерация постов
 
Сообщения: 169
Зарегистрирован: 07 янв 2006, 02:12

Сообщение ASin » 11 авг 2006, 17:35

Скептицизм?
Ничего подобного. Это вот когда камрады в соседнем форуме 3Д распознавание планируют, тогда да, тогда появляется скептицизм.  (Типа, тема слишком сложная, но и люди толковые, может чего и изобретут...)

Ваш же проект вызывает только умиление ;)
ASin
 
Сообщения: 155
Зарегистрирован: 18 дек 2004, 03:14
Откуда: Москва

Сообщение =DeaD= » 11 авг 2006, 17:36

eznatok писал(а):Я думаю миллиона частиц хватит.

Так это... рассчеты в студию, для начала так сказать... оценка проекта и всё такое... :)

PS: (уже апплодировал лёжа :))
Аватара пользователя
=DeaD=
 
Сообщения: 24218
Зарегистрирован: 06 окт 2004, 18:01
Откуда: Ебург
прог. языки: C++ / PHP / 1C
ФИО: Антон Ботов

Сообщение lebaon » 11 авг 2006, 19:56

синтезировать любой голос можно и сейчас :wink:
вот только настраивать это гемморооооой :evil:
Аватара пользователя
lebaon
Безбашенный Теоретик
 
Сообщения: 1137
Зарегистрирован: 07 янв 2006, 18:30
Откуда: Подмосковье

Сообщение Kanoka » 12 авг 2006, 02:16

Че ржете? Это ж непаханое поле, есть роботы которые умеют видеть, слышать, нюхать, а вот робота умеющего сморкаться еще нет. Коль уж собрались делать носоглотку то этому его нужно научить в первую очередь.

P.S. Я тут простыл немного, оттого и мысли такие :)
Kanoka
Модератор
 
Сообщения: 1274
Зарегистрирован: 11 ноя 2004, 03:18
Откуда: Москва

Сообщение -= Александр =- » 13 авг 2006, 04:01

Эх... Я тоже в общих чертах знаю что такое число Авогадро и сколько нужно будет частиц... И устройство речевого аппарата я знаю примерно на том-же уровне что и устройство ядерного реактора. Но толку от этих общих знаний мало, а сделать как то так и другое - ой как не просто. Это задача для целой толпы ученых, а не для десятка любителей. И если б оно и правда было так просто - давно бы кто-то сделал. Только вот мне кажется что для симуляции этого процесса нужен будет далеко не один компьютер, тем более чтоб получить результат в реальном времени, а не на бумажку... У меня на компе и Протеус-то притормаживает, не говоря уже о физической 3Д-симуляции миллионов чстиц с разницей давлений и физических параметров стенок камеры... Это, как говорится, дохлый номер, тут работы больше чем у многих терпения, да и результат мне кажется того не стоит.

А вот сделать на базе сэмплов слогов речевой аппарат для робота - вот это уже другое дело! А то все диоды, дисплеи, да телеметрия. Я пока-что не видел ни одного говорящего робота! (не считая конечно всяких профессиональных)  :wink:
Хм... Где-то у мя валялась карта на 32 метра, туда вполне алфавит влезет несжатым звуком, пойти чтоли попробовать?  :roll:
Аватара пользователя
-= Александр =-
Мастер Самоделкин
 
Сообщения: 3678
Зарегистрирован: 11 окт 2004, 19:20
Откуда: Россия, СПб
прог. языки: C/C++, Python, asm
ФИО: Курмис Александр Андреевич

Сообщение gab » 14 авг 2006, 02:51

2 Автор топика:
А как этим управлять вы думали?
PS: Идея синтеза качественного звука уже успешно решена в сотовой телефонии и секретной связи. Так что, в контексте топика, задача сводится к адекватному разбору текстов и синтезу параметров формующих фильтров и возбуждающего генератора.
gab
 
Сообщения: 212
Зарегистрирован: 30 апр 2005, 03:11
Откуда: Москва
прог. языки: C/C++, Verilog
ФИО: Гвоздев Александр Борисович

Сообщение eznatok » 14 авг 2006, 14:57

Синтез речи, еще качественно не решен.

Дайте пожалуйста ссылочку на качественный синтез русской речи?
eznatok
Премодерация постов
 
Сообщения: 169
Зарегистрирован: 07 янв 2006, 02:12

Сообщение eznatok » 14 авг 2006, 15:01

Вопрос тут вот в чем.

Синтез речи при мат. маделировании голосового аппарата должен дать невиданные до сих пор возможности.

1 Это синтез голоса любого человека с интонациями и вообще всем, что присуще голосу живого человека.

2 Создание удивительных по красоте синтезированных голосов. Вот каждому из нас нравится определенный голос. Нам нравится как кто то поет.

А ведь можно же сделать голос еще лучше. Скажем не тянет кто то высокую ноту, а мы синтезируем голос, который будет тянуть любую ноту.

Представьте певца с диапазоном в от 15 до 30 000 герц?
eznatok
Премодерация постов
 
Сообщения: 169
Зарегистрирован: 07 янв 2006, 02:12

След.

Вернуться в Идеи

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 48