konstantinmirin писал(а):2. Человек справляется на основании большого опыта и еще кучи знаний. За счет того что может определить, какой объект ближе по их материалу, освещенности. И там еще куча других моментов выделено. Я видел это дело в книге по машинному зрению (Шапиро и Стокман), но не помню сейчас потому что читал ознакомительно.
При чем тут материал или освещенность? Гуглите по словам optical-flow, можно еще проект MonoSLAM погуглить. Не обязательно иметь информацию об освещенности или материале.
Спасибо что почистили Я однозначно решил что начинать буду именно со зрения. Конечно, разбираться с ROS и OpenCV можно и с одной камерой. Но заниматься только этим каждый вечер скучновато будет. Поэтому я думаю что возьму две вот такие камеры: http://www.nadavi.com.ua/descr/logitech ... scr-39.php , три сервопривода, дальномер и контроллер OR с расширенной поддержкой серв. Из всего этого счастья, в то время когда мне будет лень копать алгоритмы, сделаю аналог человеческой модели зрения - две камеры на креплении с жесткой базой. По 1 серве на каждую. На эту же планку - дальномер. Саму базу - на третий привод. Таким образом у нас появится возможность "крутить глазами" и "крутить головой". Плюс то чего нет у человека - достаточно точно определять расстояние до ближайшего объекта впереди. Задачей контроллера будет крутить глазами и головой, сохраняя при этом конфигурацию треугольника. Да, камерами и их фокусировкой придется управлять с компа. Было бы прикольно переложить эту задачу на МК, чтобы он автоматически фокусировался на ближайшем предмете (для этого у нас дальномер). Но пока так будет.
Сначала это будет просто "одноглазый джо", пока я не освоюсь с алгоритмами стерео. Потом, надеюсь, станет более "человеческим". Ну а если все же не получится со стерео, то веб-камеры без дела валяться не будут. Ими и так можно пользоваться.
А контроллер с сервами пойдет на игрушку братану
А, да, модель камеры выбрана потому что дает приличное разрешение, больше пока не надо. И при этом идеально совмещается с линуксом (так заявлено на сайте ubuntu). Короче как раз для меня
К баловству со зрением можно еще лазерную указку прикрутить
Добавлено спустя 17 минут 55 секунд: Камеры какие-то дороговатые можно для начала взять наоборот дешевые и научиться с ними работать как надо А есть где-то картинки с них?
Была мысль насет модели 200, она почти вдвое дешевле. Но народ жаловался на качество картинки. Чем лучше картинка, тем проще потом работать с ней. Ну конечно вмеру Поэтому выбрал модель 300. Все что старше - либо только прораммныенавороты, либо мегапиксели. Картинки есть здесь: http://article.techlabs.by/103_8678_4.html Для распознавания углов и геометрии помещения пойдет. А вот с модели 200: http://torg.mail.ru/1154/207820/?tab_id=5 (в правом нижнем углу есть фото) Страшненькая цветопередача. Но при распознавании вообще в серое переделывают для начала, так что цветопередача меня не сильно волнует. Или я про цвета зря.
Но тут такой момент. Если "одноглазый Джо" останется одноглазым (не справлюсь со стерео), то камерой такого качества как С200 пользоваться даже при скайпе не очень хочется. В этом случае цветопередача имеет значение
Лазерную указку можно. Соосную скаждым "глазом" и совмещать точки. Кстати мысль. Я собирался их один раз совместить, а дальше математику использовать для расчета углов и зная удаленность объекта.
А это дорого? Прикручивать их к готовому "прибору" несложно, можно и потом.
Добавлено спустя 3 минуты 11 секунд: А можно две указки тоже на сервах и дальномер упразднить. Указки работают в двух режимах: 1) определение расстояния (светим в точку левым, туда же смотрим правым глазом) 2) совмещение камер на одну точку. Меняем положение камер пока точки лазеров не сместятся. Тут можно и нечеткую логику заюзать, как при автофокусе делают. Но это дальнейшие эксперименты если не получится просто без указателей.
2konstantinmirin, пробовали ROS в железе? всё никак не решусь попробовать, смущает только, что фрейморки под С++ и питон, от синтаксиса первого блевать хотется, а питон не очень люблю