roboforum.ru

Технический форум по робототехнике.

Проект по созданию качествоенного голоса для компьютера.

gab » 14 авг 2006, 16:41

eznatok писал(а):Синтез речи, еще качественно не решен.

Дайте пожалуйста ссылочку на качественный синтез русской речи?

Посмотри на сотовый телефон :)

gab » 14 авг 2006, 17:01

Вот например книга "Линейное предсказание речи".
Рассмотрены модели звукообразования речи и методы сжатия речевой информации для передачи по каналам связи.
Вложения
lpr.part10.rar
(146.48 КиБ) Скачиваний: 97
lpr.part09.rar
(146.48 КиБ) Скачиваний: 93
lpr.part08.rar
(146.48 КиБ) Скачиваний: 98
lpr.part07.rar
(146.48 КиБ) Скачиваний: 94
lpr.part06.rar
(146.48 КиБ) Скачиваний: 97
lpr.part05.rar
(146.48 КиБ) Скачиваний: 91
lpr.part04.rar
(146.48 КиБ) Скачиваний: 94
lpr.part03.rar
(146.48 КиБ) Скачиваний: 93
lpr.part02.rar
(146.48 КиБ) Скачиваний: 96
lpr.part01.rar
(146.48 КиБ) Скачиваний: 98

gab » 14 авг 2006, 17:04

Продолжение
Вложения
lpr.part20.rar
(28.95 КиБ) Скачиваний: 92
lpr.part19.rar
(146.48 КиБ) Скачиваний: 92
lpr.part18.rar
(146.48 КиБ) Скачиваний: 95
lpr.part17.rar
(146.48 КиБ) Скачиваний: 96
lpr.part16.rar
(146.48 КиБ) Скачиваний: 91
lpr.part15.rar
(146.48 КиБ) Скачиваний: 98
lpr.part14.rar
(146.48 КиБ) Скачиваний: 95
lpr.part13.rar
(146.48 КиБ) Скачиваний: 95
lpr.part12.rar
(146.48 КиБ) Скачиваний: 92
lpr.part11.rar
(146.48 КиБ) Скачиваний: 97

Johnny Bravo » 15 авг 2006, 09:16

eznatok писал(а):вообще всем, что присуще голосу живого человека...
Представьте певца с диапазоном в от 15 до 30 000 герц

Что присуще голосу - незнаю может там  30 и есть, но ухи воспринимают до 20кГц (ито не у каждого :D ), а остальному ултразвуку разве что собаки и другие ультразвукослышащие порадуются.
И если каждый будет обладать супер голосом, зачем тогда вообще певцы?!
Другое дело качественное воспроизведение музычки. Я давно перестал винамп гонять, - перешел на WM - кодек у него получше, звук живее, насыщеней.

Johnny Bravo » 15 авг 2006, 09:17

А предсказание, помойму, в каждой 3-ей книге по ЦОСу есть.

gab » 15 авг 2006, 15:52

Johnny Bravo писал(а):А предсказание, помойму, в каждой 3-ей книге по ЦОСу есть.

Да, я это заметил. :)
В принципе, это частный случай адаптивной фильтрации.

cahbtexhuk » 05 янв 2007, 14:39

Вы, мягко говоря, ежанетесь это просчитывать. Особенно певца от 15 до 30к :D Диапазон голоса человека, в среднем, 4кГц. Слоги - переход от буквы к букве? Возьмем слог из 2 букв. В нашей речи 16+16+1+6 звуков. Итого 39. Комбинаций из 2 звуков получиться 2^39. И теперь представтье себе: вы пишите программу, где находяться алиасы для 2^39 адресов на карточке. У проца хватит мозгов для такого текста?
Че-то я последнее время больно скептически ко всему отношусь

lebaon » 05 янв 2007, 14:47

вопрос, где карточку такую взять :evil:
2^32=4g

cahbtexhuk » 05 янв 2007, 15:13

Угумс, это только для кода надо будет 549755813888 адресов, а если учесть, что каждый звучок, неужатый, весит около 100кб... Надобно уже хард вешать :)

lebaon » 06 янв 2007, 23:37

одним хардом не отделаешься, тут массив нужен :twisted:


cron
Rambler\'s Top100 Mail.ru counter