roboforum.ru

Технический форум по робототехнике.

Голосовое общение с роботом. Что посоветуете?

Голосовое общение с роботом. Что посоветуете?

Rai220 » 19 мар 2012, 22:32

Добрый день. Занимаюсь созданием "говорящего" робота. Робот должен "общаться" с клиентами магазина, рассказывая о товарах.

База слов - где-то 100-150 штук. Платформа - PC.

Кто бы что выбрал в качестве движка распознавания речи? Вот что я уже попробовал:
1. Sphinx. Вообще не работает. Взял русскую базу VoxForge, оставил в ней 10 слов и он всё равно половину определяет не правильно. К тому же на больших базах время распознавания - секунд 30 даже на i7.

2. Распознавание от Microsoft. Неплохо распознает 10 слов через Kinect, даже не смотря на то, что не поддерживает русский. Быстро работает. Но некоторые слова транслитом записать невозможно, а какого-либо обучения не предусмотрено.

3. Распознавание от Google. Время ответа на вопрос может колебаться от 3 до 10 секунд. Распознает очень хорошо... но не всех. Скажем, на тестовой выборке у мужиков - 95% попаданий, а у девушек с высоким голосом - 50%. И поскольку это хак, никакому тюнингу он не подлежит.

В итоге получилось, что поставленную задачу имеющимися средствами решить нельзя. Или я что-то пропустил?

Re: Голосовое общение с роботом. Что посоветуете?

RootAdmin » 20 мар 2012, 10:57

Можно добавить к роботу тачскрин с меню. Если клиента "не понимает" - предлагает ткнуть пальцем.
Вот как определить, что не понимает?

Re: Голосовое общение с роботом. Что посоветуете?

Rai220 » 20 мар 2012, 13:36

Согласен, про тачскрин тоже думаю. Но так хочется без него :)

Определить, что не понимает просто. Если человек тыкает в тачскрин, значит надо обрабатывать "тычок" в любом случае. А говорит он или нет при этом, не важно :)

Re: Голосовое общение с роботом. Что посоветуете?

Scorpio » 20 мар 2012, 19:31

Rai220 писал(а):2. Распознавание от Microsoft. Неплохо распознает 10 слов через Kinect

А как распознавалку через кинект сделать?

Re: Голосовое общение с роботом. Что посоветуете?

Rai220 » 21 мар 2012, 09:26

Scorpio писал(а):А как распознавалку через кинект сделать?


В Kineckt SDK от Microsoft есть набор тестовых примеров. Один из них распознает слова и расположение источника звука.


Rambler\'s Top100 Mail.ru counter