Добрый день. Занимаюсь созданием "говорящего" робота. Робот должен "общаться" с клиентами магазина, рассказывая о товарах.
База слов - где-то 100-150 штук. Платформа - PC.
Кто бы что выбрал в качестве движка распознавания речи? Вот что я уже попробовал:
1. Sphinx. Вообще не работает. Взял русскую базу VoxForge, оставил в ней 10 слов и он всё равно половину определяет не правильно. К тому же на больших базах время распознавания - секунд 30 даже на i7.
2. Распознавание от Microsoft. Неплохо распознает 10 слов через Kinect, даже не смотря на то, что не поддерживает русский. Быстро работает. Но некоторые слова транслитом записать невозможно, а какого-либо обучения не предусмотрено.
3. Распознавание от Google. Время ответа на вопрос может колебаться от 3 до 10 секунд. Распознает очень хорошо... но не всех. Скажем, на тестовой выборке у мужиков - 95% попаданий, а у девушек с высоким голосом - 50%. И поскольку это хак, никакому тюнингу он не подлежит.
В итоге получилось, что поставленную задачу имеющимися средствами решить нельзя. Или я что-то пропустил?