roboforum.ru

Технический форум по робототехнике.

Голосовые команды для робота

Голосовые команды для робота

kibo75 » 06 сен 2012, 23:15

Может кто подскажет как реализована система распознования голоса в роботе игрушке "ЭЛЕКТРОН", именно интересует его обратная связь, тоесть вопрос ответ или действие. Я так думаю так как это не дорогая игрушка, система распознования команд видимо не сложная, но в инете толком по этому вопрса ни чего нет кроме книги Джона Ловина.

Re: Голосовые команды для робота

Angel71 » 06 сен 2012, 23:56

цена, сложность, ресурсоёмкость,... вещи слабо связанные.
low cost voice recognition soc, "embedded speech recognition",...

Re: Голосовые команды для робота

Scorpio » 07 сен 2012, 00:34

Надо его расковырять и посмотреть, что внутри.

Re: Голосовые команды для робота

Angel71 » 07 сен 2012, 00:40

спеиализированная микра или микроконтроллер с/без дсп. :D не факт, что без компаунда обошлось :) а вообще инфы на русском море, как можно было не найти эт загадка.

Re: Голосовые команды для робота

kibo75 » 07 сен 2012, 20:50

Вот хоть убей не могу найти. Мне надо чтоб система не просто включала релюшки, а именно построить хотя бы примитивный диалог.

Re: Голосовые команды для робота

Angel71 » 07 сен 2012, 21:43

релюшки тут при чём? говорите "стой", с расспознавалки получаете в каком-нибудь виде что оно расспознало слово №n. говорите "вперёд", "поверни на лево", ... :) потом прикручиваете синтезатор голоса, а хоть самый примитивный, всё - он теперь сможет огрызаться, т.е. диалог есть.
или для тугосоображающих по простому опишите, что есть "примитивный диалог" и т.д.

Re: Голосовые команды для робота

Scorpio » 07 сен 2012, 22:06

Кто-нибудь вообще живьем видел нормально работающую распозновалку русской речи, если не считать смартфонов? Те, которые мне приходилось пробовать, предполагали длительный процесс обучения на голос, и даже после этого, результаты были весьма скромные.

Re: Голосовые команды для робота

Angel71 » 07 сен 2012, 22:59

живьём у человека нормальная распозновалка, хотя... попробуйте отличить один звук, издаваемый животным, птичкой или насекомым от другого. ну так, не до уровня, что они там сообщают, а хотя бы вот этот чик-чирик это 100500 фраза 1, а вот этот чик-чирик фраза 2. :D удачи. :) попроще: кто какой иностранны язык изучал, попробуйте врубить телепередачу (новости и проф. дикторы,... не в счёт), фильм какой или выступление на конференции и хотя бы почти все слова разобрать. аха, сначала будет сплошное аюбукьедлафываьывюа с редкими вау, дя я тут одно слово узнал. у нас к евро в транспорте остановки на фиглише озвучивали, я недели 2 пытался втыкнуть что за ... это "shopping more". потом один знакомый сказал, что это "shopping mall" и еще спустя какое-то время бегущую надпись пофиксили и таки к русскому тексту добавили английский. таки да, shopping mall.
:) попробуйте записать в аудиоредакторе произношение одного и того же слова, но с разной интонацией, ударением на разные слоги, басом или писклявым голосом и т.д. потом попросите ещё кого-нибудь проделать тоже самое. сравните визуально что записали. чуть-чуть простудились и всё, это уже совсем другой сигнал. и это только крохотная часть проблем.

Re: Голосовые команды для робота

kibo75 » 07 сен 2012, 23:37

Спасибо за советы! Нашёл схему звукового управления с частотным дешифратором, правда древняя как мир. Единственное прийдётся несколько схем собирать на isd1620 с записаными фразами.

Re: Голосовые команды для робота

elmot » 07 сен 2012, 23:58

Я думаю, такая задача схемотехнически не решается. Надо пользоваться программным распознаванием, причем для этого нужны вполне отчетливые вычислительные мощности и сложные алгоритмы.
См по теме:
http://habrahabr.ru/post/146501/
http://mikepultz.com/2011/03/accessing- ... chrome-11/

Re: Голосовые команды для робота

Angel71 » 08 сен 2012, 00:36

гугл войс? :D читеры.

Re: Голосовые команды для робота

elmot » 08 сен 2012, 01:05

ага, меня тоже прикололо.
но если не читерить то
http://www.speechapi.com/

Re: Голосовые команды для робота

Scorpio » 08 сен 2012, 01:35

Т.е. про возможности робота "Электрон", в котором явно нет никаких вычислительных мощностей, это просто наглая ложь производителей и продавцов?

Re: Голосовые команды для робота

Angel71 » 08 сен 2012, 02:23

попробуйте софтово декодировать full hd h.264 видео. как минимум 2х ядерник сильно напряжётся. теперь тоже самое с аппаратным ускорением за счёт децельного специализированного блока в видюшке.
попробуйте хэши посчитать на процах без блока криптографии. потом на бюджетной видюшке. потом сравните это с тем как всё летает на на сэнди/иви с маиньким таким блоком криптографии.
бля более-менее несложного алгоритма крайне желателен проц с дсп. но это уже "шашечки или ехать?". кто чуть выше читал, наверно заметил
Angel71 писал(а):цена, сложность, ресурсоёмкость,... вещи слабо связанные.
low cost voice recognition soc, "embedded speech recognition",...

:) тыкаем в ссыль, смотрим в подписи в выдаче, тыкаем чуть ли не в первую попавшуюся. забавный сайтик, а на нём вот такая страничка есть http://www.sensoryinc.com/company/pr10_01.html
Price and availability: The NLP-5x is available now. The chip is priced at under $2 per unit in die form in volumes exceeding 100K/year.

начинаем искать где можно купить. парам-пам-пам по ссылкам представителей и опа http://www.veear.eu/, где на http://www.veear.eu/where-to-buy/ есть упоминание терры. :) терра это очень грусно, так что можно даже не заходить. ищем дальше. :) http://www.tigal.com/products.asp?src=voice http://robosavvy.com/store/index.php/manufacturers_id/30
кроме nlp-5x или veear готовых недорогих решений море. Voice Recognition Module -- Arduino Compatible, Ultimate Real Robots Issue 47 the handset's voice recognition processor board
не хотите готовое? нужен не шибко хилый проц, желательно с дсп и кодить, кодить, кодить.

Re: Голосовые команды для робота

elmot » 08 сен 2012, 03:09

Scorpio писал(а):Т.е. про возможности робота "Электрон", в котором явно нет никаких вычислительных мощностей, это просто наглая ложь производителей и продавцов?

Думаю, качество распознавания голоса не впечатлит совершенно. Сильно подозреваю, что имеет место распознавание гласных, там шумов меньше. Если всмотреться в список команд -у них у всех уникаольная последовательность гласных. Так что это не есть полноценное распознавание. А воспроизведение предопределенного набора фраз - задача очень простая.


Rambler\'s Top100 Mail.ru counter