Myp писал(а):
видеть объект и понимать что это объект способен только человек.
робот видит только то чему ты его научил.
то есть процесс работает на оборот, сначала ты обучаешь конкретному предмету, а потом, если повезёт, робот сможет найти среди хаоса этот предмет.
А как же маленькие дети? Ребёнок не рождается со знанием того что на него смотрит врач, он в больнице, вон там стул и стол. Детей ведь приходится учить. Я понимаю что пример немного не верный, но в общем похож.
Myp писал(а):
понятие "объект" это чисто человеческая фигня, только человек может осмысленно разделить например стол и вазу стоящую на столе на 2 объекта.
для робота в лучшем случае будет нечто типа "столоваза", массив точек с 4мя выступами вниз по краям и одним вверх по центру.
Я прекрасно тебя понял, но спешить с разделением объектов, это наверное следующий этап или нужен какой то очень хитрый алгоритм (идею я тут еще не сгенерировал, но все в переди

)
Myp писал(а):
кинект выдаёт карту глубины, не 3D объекты какие-то, а именно карта глубины пространства

вот такая малопонятная картинка
если обойти со всех сторон то получим такую же малопонятную 3D модель.
причём не какую то конкретную, а в виде массива точек, тоесть то что массив точек это шар, надо будет ещё догадаться.
вот немного про распознавание 3D
http://confpubs.ru/p6_11.phpВ этой статье показанно как видит кинект.
http://www.gercekbilim.com/kinect-fusio ... cok-kolay/ Возможно что мелкомягкие в SDK 1.7 привинтили, что то интересное, но челокек, чайник и другие предметы не плохо выделяются на фоне стены или стола. Конечно, что бы отличить что есть, что картинку нужно будет прогнать через множество фильтров, но это мне еще предстоит узнать ))
За ОБЗОР АЛГОРИТМОВ РАСПОЗНАВАНИЯ 3D спасибо. Прочту обязательно.
PS: Наверно я еще не достаточно хорошо понимаю как работает вся система от того и кажется все просто ))
А если попробовать пойти по другому варианту. Научить робота отделять теплые вещи от холодных. В таком случае имя 3D модель человека конорый на фоне стены будет ясно выделяться робот начнет понимать что вот это человек, а по зади что то еще не преодолимое. Если посадить того же человека на стул то он тоже будет выделяться и в единую картинку со стулом не сольется.
Добавлено спустя 6 минут 24 секунды:dccharacter писал(а):
Отличная идея! По итогам работы алгоритма будет собрана база из n объектов, где n = количеству кадров, захваченных кинектом. Робота можно при этом даже с места не двигать. При формате камеры 640x480 удастся получить 2^(640*480) различных изображений одного объекта с одного ракурса съемки. Повторяем все это для бесконечного количества разных ракурсов и имеем наконец нормальное представление одного объекта. После этого повторяем для каждого объекта.
Самое сложное позади.
Я понял. Заумучаешься объект крутить.
dccharacter писал(а):
Теперь когда робот обучен, остается сделать кадр и поискать его по базе.
Это будет немножко затратно по памяти, поэтому сразу предлагаю отказаться от 8-ми битных микроконтроллеров. Возьми сразу STM32. И, возможно, еще память внешнюю - можно USB-брелок или SD-карту. Гига 4 или лучше 8. Я бы остановился на SanDisk, но можно и Transcend. На других флешках ребята пробовали, но они не тянут задачи обучения/распознавания.
Пардон, это прикол такой? Я вообще думал о чем то более мощном, для начала какой нить сервак, благо лежит пока незаюзаный монстр двухголовый на оптронах, а диск... так тут не один ссд не спасет. Для такого быстродействия вижу только саздание виртуального диска в оперативной памяти. Там по крайней мере хоть тормозов не будет. Всю возможную базу конечно туда не загрузить, а использовать только наиболее, часто встречающиеся объекты, ну а остальное подтягивать с HDD по мере необходимости.