roboforum.ru

Технический форум по робототехнике.


linvinus

Блоги посетителей.
Правила форума
В данном разделе каждый может иметь не более одной темы. Тема должна начинаться с логина (ника) робофорума.

Re: linvinus

Сообщение linvinus » 04 янв 2017, 12:56

Dmitry__,
вот такую команду попробуй, я так все демо сделал.
Код: Выделить всёРазвернуть
echo "Проверка синтезатора речи" | RHVoice-client -s Anna+CLB | aplay


Репозитарий с пакатеми тут https://launchpad.net/~linvinus/+archive/ubuntu/rhvoice
R3 forum87/topic15337.html
R2 roboforum.ru/forum102/topic13980.html
R4 roboforum.ru/post336339.html#p336339
Делать надо хорошо - плохо получится само!
Аватара пользователя
linvinus
 
Сообщения: 1651
Зарегистрирован: 29 апр 2011, 12:37
Откуда: Москва
прог. языки: С

Re: linvinus

Сообщение Dmitry__ » 04 янв 2017, 16:00

linvinus писал(а):вот такую команду попробуй, я так все демо сделал.


Я давал команду отличающуюся только голосом:
echo "Докладываю текущую температуру в квартире " | RHVoice-client -s Elena+CLB | aplay

Сейчас решил собрать из исходникив (до этого устанавливал бинарный вариант), теперь все сломалось, команда выполняется, ошибок не выдает, звука нет.
Вообще, я хотел этот RHVoice портировать на какой-нибудь stm32 или pic32, но сейчас понимаю, что проще свое написать. Один foma чего стоит...

Добавлено спустя 3 минуты:
Во, по твоей ссылке попробовал:
2) Если вы установили пакет speech-dispatcher-rhvoice то нужно выполнить команду
echo "Проверка синтезатора речи" | spd-say -o rhvoice -l ru -e -t female1

Так работает.
Аватара пользователя
Dmitry__
 
Сообщения: 7591
Зарегистрирован: 13 янв 2011, 15:25
Откуда: Санкт-Петербург

Re: linvinus

Сообщение linvinus » 04 янв 2017, 22:40

какой-нибудь stm32 или pic32

нее, не взлетит. тут много памяти нужно. (по меркам контроллера)
мне кажется своё написать не реально, либо будет очень синтетический голос, так что не разберешь что он говорит,
проще сделать совой сервер который будет генерить wav файлы которые затем отправлять в stm для воспроизведения.

Добавлено спустя 9 минут 23 секунды:
Код: Выделить всёРазвернуть
echo "Докладываю текущую температуру в квартире " | RHVoice-client -s Elena+CLB | aplay

тут rhvoice в pipe Отдаёт wav файл , хочешь проигрывай, хочешь сохраняй
программа очень продуманная, глюков не замечено, так что если звука нет то вряд ли дело в ней, может голос не стоит который указывается в параметрах?
На мой вкус лучше всего говорит Anna

Код: Выделить всёРазвернуть
echo "Проверка синтезатора речи" | spd-say -o rhvoice -l ru -e -t female1

эта команда пропускает звук через дополнительный d-bus демон (он выводит звуковой поток на звуковую карту), строго говоря он тут лишний, если вспомогательные технологии для людей с ограниченным зрением не планируется использовать.
R3 forum87/topic15337.html
R2 roboforum.ru/forum102/topic13980.html
R4 roboforum.ru/post336339.html#p336339
Делать надо хорошо - плохо получится само!
Аватара пользователя
linvinus
 
Сообщения: 1651
Зарегистрирован: 29 апр 2011, 12:37
Откуда: Москва
прог. языки: С

Re: linvinus

Сообщение Dmitry__ » 04 янв 2017, 23:29

linvinus писал(а):нее, не взлетит. тут много памяти нужно. (по меркам контроллера)

Ну понятно, что плату взять с sd картой, например pinguino micro, в остальном - взлетит. Там только фонемы место занимают, кста не так и много - 5 метров, а вся логика влезет в нормальный контроллер.

linvinus писал(а):мне кажется своё написать не реально, либо будет очень синтетический голос, так что не разберешь что он говорит,
проще сделать совой сервер который будет генерить wav файлы которые затем отправлять в stm для воспроизведения.

Не понимаю я этих решений с серверами и wav файлами. А все писать и не собираюсь, лингвистику содрать с RHVoice, и.т.д. Жалко что проект "не совсем" открытый, если fomу и бинарные базы данных готов ковырять, то бинарные фонемы - не готов...

Добавлено спустя 7 минут 17 секунд:
linvinus писал(а):тут rhvoice в pipe Отдаёт wav файл , хочешь проигрывай, хочешь сохраняй
программа очень продуманная, глюков не замечено, так что если звука нет то вряд ли дело в ней, может голос не стоит который указывается в параметрах?

Так работало все до компиляции из исходников. Голос, скорее всего, был хуже из-за более старой версии RHVoice. А пропал звук из-за компиляции проекта по пункту 2.
Я почитал сообщения, где просили сделать голос с более высокой дискретизацией, сначала ломались, не хотели, потом сделали. В общем остыл я к этому синтезатору из-за фонем без исходников. Лингвистику можно выковыривать из этого проекта, остальное - искать другие варианты.
Жизнь класть на изучение лингвистики точно не буду :)
Аватара пользователя
Dmitry__
 
Сообщения: 7591
Зарегистрирован: 13 янв 2011, 15:25
Откуда: Санкт-Петербург

Re: linvinus

Сообщение Scorpio » 05 янв 2017, 00:41

Забацай такую шнягу, только на русском и по-разборчивее. Будем брать у тебя пачками. Я так понял это просто прошитый PIC.
Аватара пользователя
Scorpio
 
Сообщения: 2100
Зарегистрирован: 30 сен 2008, 18:49
Откуда: Где-то в Латинской Америке

Re: linvinus

Сообщение Dmitry__ » 05 янв 2017, 04:37

Scorpio писал(а):только на русском и по-разборчивее. Будем брать у тебя пачками.

Так штоле? :)
http://radiokot.ru/forum/viewtopic.php?f=59&t=94614
В мп3:
speech_test.mp3.pdf
(392.66 КиБ) Скачиваний: 0

В конце убрать "pdf"
Аватара пользователя
Dmitry__
 
Сообщения: 7591
Зарегистрирован: 13 янв 2011, 15:25
Откуда: Санкт-Петербург

Re: linvinus

Сообщение Scorpio » 05 янв 2017, 08:21

А че. Вполне. Я давно подозреваю, что все уже сделано до нас.
Аватара пользователя
Scorpio
 
Сообщения: 2100
Зарегистрирован: 30 сен 2008, 18:49
Откуда: Где-то в Латинской Америке

Re: linvinus

Сообщение Dmitry__ » 05 янв 2017, 14:40

В этом проекте хорошо описан принцип формирования своего голоса. Есть утилитa (на VB) по вытаскиванию фонем из wav и формирования из них заголовочного файла. Вообще проглядываются растущие ноги таких синтезаторов как "голос" и "RHVoice".
Единственное что осталось - добавить базу данных "текст в фонемы". Чтоб было не как сейчас: "гавари+т ричиво+й мо+дуль на эс тэ эм 32".

Добавлено спустя 6 минут 51 секунду:
Да, с этого проекта ссылки на полезняшки:
Распознавание речи. Arduino
http://www.polesite.ru/?p=2001

Говорилки на avr:
http://bascom.at.ua/publ/sintezator_rechi_rc2_na_avr_govorilka/1-1-0-79
Робофорум :)
http://roboforum.ru/forum2/topic5106.html

Синтезатор "голос":
http://beriinfo.narod.ru/
А там есть образцы голосов, понравились "VitalVoice " :shock:
http://beriinfo.narod.ru/VitalVoice1.mp3
Последний раз редактировалось Dmitry__ 05 янв 2017, 14:46, всего редактировалось 1 раз.
Аватара пользователя
Dmitry__
 
Сообщения: 7591
Зарегистрирован: 13 янв 2011, 15:25
Откуда: Санкт-Петербург

Re: linvinus

Сообщение linvinus » 05 янв 2017, 14:43

я в синтезаторе речи не разбираюсь, но у меня сложилось впечатление что это очень непростая тема.

тут был?
https://github.com/Olga-Yakovleva/RHVoice/wiki
http://tiflo.info/pipermail/rhvoice-users_tiflo.info/
R3 forum87/topic15337.html
R2 roboforum.ru/forum102/topic13980.html
R4 roboforum.ru/post336339.html#p336339
Делать надо хорошо - плохо получится само!
Аватара пользователя
linvinus
 
Сообщения: 1651
Зарегистрирован: 29 апр 2011, 12:37
Откуда: Москва
прог. языки: С

Re: linvinus

Сообщение Dmitry__ » 05 янв 2017, 14:54

linvinus писал(а):тут был?

Издеваешься? :) Там все и брал. А в списке рассылки Rhvoice-users тебя и нашел :)
Только говорю, у них фонемы/базы данных бинарные, смысл от всех этих исходников?


linvinus писал(а):я в синтезаторе речи не разбираюсь, но у меня сложилось впечатление что это очень непростая тема.

Ссылка на sintez_v1 очень многое обьясняет. Разница между sintez_v1 и RHVoice только в базе данных текст/феня :)
Аватара пользователя
Dmitry__
 
Сообщения: 7591
Зарегистрирован: 13 янв 2011, 15:25
Откуда: Санкт-Петербург

Re: linvinus

Сообщение TedBeer » 05 янв 2017, 20:25

Последнее слово в этой теме это использование нейронных сетей(WaveNet). Генерация речи находится уже на уровне дикторской. Я особо не разбирался, но какие-то реализации есть на гитхабе.
Аватара пользователя
TedBeer
 
Сообщения: 1116
Зарегистрирован: 08 авг 2012, 00:38
Откуда: Нидерланды, Алмере
Skype: edwbes
ФИО: Эдуард

Пред.

Вернуться в Блоги

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1

Mail.ru counter