берём недорогой проектор, которые кино на стенку показывают.
заставляем его показывать белые точки (или впихнуть туда ИК диод мощный и показывать невидимые точки)
потом камерой фоткаем точки и быстренько строим карту глубины.
тоесть видим например вдалеке на столе некий красный предмет могущий быть чашкой, издалека быстро сканируем комнату с низким разрешением определяя массивные препятствия и определяем как проехать.
подъезжаем.
проецируем точки чисто на предполагаемую чашку чтобы определить её форму и убедиться что это чашка, а не фотография чашки или бутылка кетчупа, определив её 3D изображение, ну и берём аккуратно клешнёй которая может двигаться с высокой скоростью с ускорением/замедлением, так как мы уже знаем конкретные конечные координаты для каждого пальца клешни.
мне видится что удобно будет например используя большие точки и низкое разрешение фото с высокой скорость сканировать сразу всё пространство видимое и быстро двигаться.
а потом проецируя мелкую сетку на интересный объект использовать фото высокого разрешения с вырезанной областью и сканировать подробно объект.
Добавлено спустя 2 минуты 4 секунды:
если боян то ткните пальцем где такое работает