roboforum.ru

**=DeaD=** » 02 июн 2009, 20:09

В общем в ЛС обещал изложить свои мысли по развитию кластерного подхода в сторону распознавания образов, вот излагаю:

1. Разбиваем изображение на кластеры по цветам (это уже сейчас есть).
2. Каждый кластер описываем как точку в многомерном пространстве (первые три координаты (включая расстояние до объекта), скажем, центр масс, следующие 3 координаты - средний цвет, а остальные - всякие инварианты - типа момент инерции вращения и т.п. прелести).
3. Задача распознавания образов сводится к выявлению среди имеющегося в кадре множества таких многомерных точек, известных нам паттернов.

Добавлено спустя 3 минуты 37 секунд:
При обучении тыкаем в какую-то область и замеряем все точки имеющиеся там. Скажем по признаку близкого расположения друг к другу в 3д.

При распознавании надо будет делать какой-то иерархический классификатор.

Бонусы - полученный метод распознавания скорее всего будет инвариантен относительно поворотов и масштаба в значительной степени.

**executer** » 02 июн 2009, 20:27

Пойду я наверно на "В контакте.RU" - там понятней

**=DeaD=** » 03 июн 2009, 08:04

Еще мысль появилась - крупные сегменты в образе в обязательном порядке разбиваем на более мелкие, не более 0.2 ... 0.33 по линейным размерам от размера образа.

**Vorral** » 03 июн 2009, 11:02

Чтобы было понятней, как выглядит кластер выкладываю наглядную картинку. Там эти фрагменты окрашены в одинаковый цвет на разных ракурсах.
Кстати центр масс уже просчитан для каждого кластера(причём алгоритм прост и быстр). А вот, что такое момент инерции вращения и как его просчитать? Я предполагал давать каждому кластеру некие цифровые значения, например подход описанный в теме "Распознавание трёхмерных объектов на сложном фоне":

"Первой характерной точкой, как и в литературе [L.Gupta and M.R.Sayeh. Neural networks for planar shape classification. IEEE. 1988. P.936], является наиболее удаленная точка от центра тяжести контура, второй характерной точкой является точка контура, наиболее далеко отстоящая от первой. Третья точка и последующие определяются как наиболее удаленные от двух точек, между которыми они находятся. Процесс нахождения характерных точек продолжается до тех пор, пока отношение расстояния от искомой точки до прямой, соединяющей эти две точки, к длине отрезка между ними не станет меньше некоторой, заранее заданной величины EPS. Эта величина является одним из немногих настроечных параметров программы, она подбирается экспериментально таким образом, чтобы программа различала два наиболее близких друг к другу контура двух разных предметов из всей группы."

Добавлено спустя 25 минут 2 секунды:
А идея "описываем как точку в многомерном пространстве" однозначно привлекательная.

**=DeaD=** » 03 июн 2009, 11:15

Vorral писал(а):наиболее удаленная точка

ИМХО - отвратительный метод, пролетающий, как фанера над Парижем, при добавлении всего 1 битого пикселя

А вот момент инерции чтобы сдвинуть - нужно не слабо точек добавить

Момент инерции - берём и вычисляем сумму расстояний от центра тяжести до каждого пикселя кластера.

Добавлено спустя 7 минут:
Еще можно складывать сумму квадратов расстояний.

Еще можно найти "основную ось" (не помню как называется по научному) объекта и умножить её на уровень выраженности этой оси, получить некий вектор (Х).

"Основная ось" - такая прямая, проходящая через центр тяжести объекта, относительно которой момент инерции вращения объекта минимален.

Момент инерции вращения объекта относительно прямой - сумма расстояний от точек объекта до прямой.

Уровень выраженности этой оси - не помню уже как считается, по моему у этого вектора (Х) какое-то научное название есть.

Короче тоже очень устойчивая величина получится.

**Vorral** » 03 июн 2009, 11:47

>ИМХО - отвратительный метод, пролетающий, как фанера над Парижем, при добавлении всего 1 битого пикселя
Мне тоже так показалось.

Именно из-за этого даже не пытался его реализовать.

Отлично! Момент инерции значит как-нибудь протестирую. Дабы это не так сложно.

**Виталий** » 03 июн 2009, 16:54

А чем не устраивает SIFT и прочие подобные?

**=DeaD=** » 03 июн 2009, 17:18

Наверное тем, что SIFT детектит точки изменения цвета, а тут речь наоборот о целостных кластерах.

SIFT не позволяет сопоставлять эффективно большие монотонные области, скажем в 3Д-реконструкции, а тут наоборот.

Если я правильно понял, чего SIFT делает, конечно

**Vorral** » 07 июн 2009, 16:12

В общем сейчас уже почти дописал логический блок системы(там куча процентных критериев, которые зависят друг от друга и влияют на качество результата), но вот пришлось задуматься о предварительной обработке двух изображений. Вот почему, я похоже плохо разместил камеры или они имеют эффект рыбьего глаза, но результат такой:
На первом изображении , левый ракурс поднят выше правого на 1 пиксель, на втором на 2. Сразу видно, что части сцены отрисовались по разному. А лёва уже не плохо отображается, но не без ошибок. Придётся делать постобработку.

Добавлено спустя 13 минут 36 секунд:
Вот думаю как предварительно редактировать один из ракурсов или даже оба. Какие алгоритмы обработки(поворот, наклон, круговые искажения) изображения существуют?

**=DeaD=** » 07 июн 2009, 17:53

Где-то тут вроде основные аберрации есть:
[[:ru:Аберрации_оптических_систем]]

SI - сферическая аберрация
SII - кома
SIII - астигматизм
SVI - кривизна поля (поверхности) изображения
SV - дисторсия.

**Виталий** » 08 июн 2009, 09:43

То что вам надо сделать с камерами - это откалибровать их.

**Vorral** » 08 июн 2009, 14:27

Да я так и хочу сделать, на сегодня успел испробовать только один алгоритм, забыл как робот называется, русский делал, на гусеницах с двумя "руками" и веб камерой(примеры на Дельфи, так что я их легко интегрировал). На текущий момент, мне придётся отложить библиотеку стереозрения недели на три. Две недели отпуск резко взять пришлось, сын родился. Так что как только, так сразу выложу вместе с примером использования(правда на Дельфи). Хочется провести тестирование. Сам только один раз подключал камеры, сделал к сожалению всего две стереопары(кстати потом могу выложить исходники для работы с двумя веб камерами в Delphi, там я создал два потока(для каждой камеры), чтобы снимать изображения на многопроцессорных машинах в один момент времени). Подключал камеры не жёстко и на глазок, вполне возможно, что сам не правильно разместил.

P.S. Я работаю, пока только со стереопарами 320х240. Так что и библиотека будет воспринимать только такое разрешение. Это связанно с тем, что хочу научится работать с низким разрешением. А уж в высоком, характеристики определения дальности возрастут в два раза(320х240->640x480), правда время обработки возрастёт на 4 (хотя тут много мыслей)

**=DeaD=** » 08 июн 2009, 15:22

Подздравлям с рождением дитя!!! :beer:

**Vorral** » 08 июн 2009, 15:29

Спасибо!

**setar** » 08 июн 2009, 17:24

Vorral писал(а):На текущий момент, мне придётся отложить библиотеку стереозрения недели на три. Две недели отпуск резко взять пришлось, сын родился.

наивный надеется через 3 недели освободиться... все только начинается!
:beer:

Мои поздравления. Сына воспитывай правильно, чтобы когда подрастет, всех нас учил как работать с современными роботами

roboforum.ru

Special for Vorral's computer vision :)

Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Re: Special for Vorral's computer vision :)

Кто сейчас на конференции