roboforum.ru

Технический форум по робототехнике.

Тупое распознавание образа

Re: Тупое распознавание образа

GraphD » 13 дек 2007, 23:31

=DeaD= писал(а):...и дать оценку в этом случае попиксельному СКО, ведь оно должно быть гарантированно больше некоторого значения, иначе вы с большой вероятностью пропустили искомый вами фрагмент...

Странное желание у вас все свести к попиксельному СКО...

Еще раз галопом по определениям.
Разность усредненных яркостей образцов - есть мера различия всех пикселей как целое (т.е. смешали все краски и смотрим в чем отличие).

Попиксельное СКО служит мерой различия яркостей пикселей в образцах, причем когда мы можем сопоставить их позиции в точности!

А евклидова норма г-мы - есть СКО, которое является уже мерой различия плотностей распределения яркостей в образцах.

Отсюда делаем вывод: эти две меры не имеют аналитической взаимосвязи.
Их имеет смысл сравнивать лишь по тому, сколько всевозможных пар образцов будут "похожи" и сколько "не похожи". За эталон "похожести/не похожести" выбирается какая-то другая мера, лучше конечно человек со своим зрением. Т.е. иногда это можно сделать экспериментально. Эксперимент должен запускаться в режимах счетчиков ложных/истинных отождествлений, а потом смотрим у кого счетчик оказался больше. Нечто похожее я делал в дипломе, там был эксперимент с двумя дескрипторами (sift и норм.корреляция), оценивалась достоверность отождествления по принципу "второго ближайшего соседа", но не на счетчиках, а вручную визуально, т.к. все это базировалось на стереокомпараторе, и в отснятой стереопаре руками отсеивались недостоверные дескрипторы...

Re: Тупое распознавание образа

=DeaD= » 14 дек 2007, 00:14

GraphD писал(а):
=DeaD= писал(а):...и дать оценку в этом случае попиксельному СКО, ведь оно должно быть гарантированно больше некоторого значения, иначе вы с большой вероятностью пропустили искомый вами фрагмент...

Странное желание у вас все свести к попиксельному СКО...

...skipped...

За эталон "похожести/не похожести" выбирается какая-то другая мера, лучше конечно человек со своим зрением.

Понимаете в чем проблема, - мы ведь не человека пытаемся эмулировать, а образы в окружающем мире распознавать, поэтому понятно, что система распознавания должна быть устойчива к общеизвестным естественным искажениям, - как минимум к незначительному изменению освещения.

Поэтому у меня к вам два вопроса:
1. Чем вас не устроило попиксельное СКО как общепризнанная норма похожести в любых сравнениях?
2. В чем конкретно заключается ваше предложение, кроме как провести эксперимент?

Re: Тупое распознавание образа

GraphD » 17 дек 2007, 20:41

Какие есть ограничения у СКО?.. Вот что бросается в глаза сразу:
а. Чувствительность к взаимному положению каждого пикселя (в идеале).
б. Для хранения эталона в БД нужно выделять память под каждый фрагмент изобр-ия.

PS: На базе того же sift и БД признаков уже есть алгоритм ориентации моб.робота в незнакомой обстановке при любом начальном положении. В реализации еще использовалась одометрия для более точного позиционирования. Исходя из очень меняющейся обстановки в изображении сцены, СКО просто проиграл бы sift-у в поиске соответствий.

На основе эксперимента так или иначе будет ясно что лучше.

Re: Тупое распознавание образа

=DeaD= » 17 дек 2007, 21:44

Вообще я вас спрашивал про общепринятые нормы похожести, а не про способы отсечки, но раз уж вы про них начали, давайте про них (хотя вопрос с общепризнанными нормами отсечки остался - вас же СКО не устраивает вроде?):

GraphD писал(а):Какие есть ограничения у СКО?.. Вот что бросается в глаза сразу:
а. Чувствительность к взаимному положению каждого пикселя (в идеале).

Тут вроде насколько ограничение, настолько и преимущество - зато позволяет точно находить координаты. Не нужно точно - уменьшите размер изображения и ищите так.

GraphD писал(а):б. Для хранения эталона в БД нужно выделять память под каждый фрагмент изобр-ия.

Это пока вообще не понял.

GraphD писал(а):PS: На базе того же sift и БД признаков уже есть алгоритм ориентации моб.робота в незнакомой обстановке при любом начальном положении. В реализации еще использовалась одометрия для более точного позиционирования. Исходя из очень меняющейся обстановки в изображении сцены, СКО просто проиграл бы sift-у в поиске соответствий.

Какое имеет отношение sift к вашему предложению сравнивать гистограммы? Я разве сказал, что СКО круче произвольных дескрипторов для отсечек? Более того мне пока не ясно почему СКО бы обязательно с ходу проиграл бы?

GraphD писал(а):На основе эксперимента так или иначе будет ясно что лучше.

Это-то понятно, только не ясно что с чем сравнивать - мой предложенный метод описан почти полностью, а ваши гистограммы как-то технично превратились в чужой sift, если я ничего не пропустил? :roll:

Добавлено спустя 42 минуты 39 секунд:
Прочитал про SIFT немного (не полностью), метод конечно крут, хотя на части случаев, думаю, не прокатит. И совсем не понял, какое он имеет отношение к предложенным вами гистограммам? Только тем, что там тоже некоторые вектора на выходе получаются? Так у них векторов очень мало получается и значения между измерениями вроде не прыгают ни в коем разе.

Re: Тупое распознавание образа

GraphD » 17 дек 2007, 22:56

=DeaD= писал(а):Тут вроде насколько ограничение, настолько и преимущество - зато позволяет точно находить координаты. Не нужно точно - уменьшите размер изображения и ищите так.

Вы говорите про какую-то более сложную схему поиска, в котором СКО считается для нескольких масштабированных изобр-ий исходного (?), т.е. как я понял это эквивалентно увеличению размерности.

=DeaD= писал(а):
GraphD писал(а):б. Для хранения эталона в БД нужно выделять память под каждый фрагмент изобр-ия.

Это пока вообще не понял.

БД из того, что ищем. (Если конечно не одну картинку в другой.)

=DeaD= писал(а):Какое имеет отношение sift к вашему предложению сравнивать гистограммы? Я разве сказал, что СКО круче произвольных дескрипторов для отсечек? Более того мне пока не ясно почему СКО бы обязательно с ходу проиграл бы?

Думаю проиграл бы в уровне стабильности при сменах ракурсов одних и тех же областей, т.е. по ошибке идентификации, которую вообще желательно исключить на 99,9%.

=DeaD= писал(а):Это-то понятно, только не ясно что с чем сравнивать - мой предложенный метод описан почти полностью, а ваши гистограммы как-то технично превратились в чужой sift, если я ничего не пропустил? :roll:

Ну например сравнить между собой ср.яркость, СКО, корреляцию, sift, гистограмму яркостей, гистограмму градиентов. Чего тут описывать? :) Тут надо писать (программу)!

=DeaD= писал(а):Прочитал про SIFT немного (не полностью), метод конечно крут, хотя на части случаев, думаю, не прокатит. И совсем не понял, какое он имеет отношение к предложенным вами гистограммам? Только тем, что там тоже некоторые вектора на выходе получаются? Так у них векторов очень мало получается и значения между измерениями вроде не прыгают ни в коем разе.

Какое отношение имеет sift к гистограмме яркости? Никакого абсолютно. А про то, что там в нем есть гистограммы направления градиентов - дак это да, причем инвариантность достигается как к масштабу, так и к повороту. А это и нужно при тряске и движении по заранее неизвестной местности.

Re: Тупое распознавание образа

=DeaD= » 18 дек 2007, 16:27

GraphD писал(а):
=DeaD= писал(а):Тут вроде насколько ограничение, настолько и преимущество - зато позволяет точно находить координаты. Не нужно точно - уменьшите размер изображения и ищите так.

Вы говорите про какую-то более сложную схему поиска, в котором СКО считается для нескольких масштабированных изобр-ий исходного (?), т.е. как я понял это эквивалентно увеличению размерности.

Чему-чему эквивалентно?

GraphD писал(а):
=DeaD= писал(а):
GraphD писал(а):б. Для хранения эталона в БД нужно выделять память под каждый фрагмент изобр-ия.

Это пока вообще не понял.

БД из того, что ищем. (Если конечно не одну картинку в другой.)

Вообще конечно искали одну картинку в другой, а вы что ищете?

GraphD писал(а):
=DeaD= писал(а):Какое имеет отношение sift к вашему предложению сравнивать гистограммы? Я разве сказал, что СКО круче произвольных дескрипторов для отсечек? Более того мне пока не ясно почему СКО бы обязательно с ходу проиграл бы?

Думаю проиграл бы в уровне стабильности при сменах ракурсов одних и тех же областей, т.е. по ошибке идентификации, которую вообще желательно исключить на 99,9%.

Да не исключить ошибку идентификации на 99.9% при разных ракурсах. Вы сами столовую ложку не узнаете с необычного ракурса.
И вы как-то пропустили про гистограммы вопрос.

GraphD писал(а):
=DeaD= писал(а):Это-то понятно, только не ясно что с чем сравнивать - мой предложенный метод описан почти полностью, а ваши гистограммы как-то технично превратились в чужой sift, если я ничего не пропустил? :roll:

Ну например сравнить между собой ср.яркость, СКО, корреляцию, sift, гистограмму яркостей, гистограмму градиентов. Чего тут описывать? :) Тут надо писать (программу)!

Напишете?

GraphD писал(а):
=DeaD= писал(а):Прочитал про SIFT немного (не полностью), метод конечно крут, хотя на части случаев, думаю, не прокатит. И совсем не понял, какое он имеет отношение к предложенным вами гистограммам? Только тем, что там тоже некоторые вектора на выходе получаются? Так у них векторов очень мало получается и значения между измерениями вроде не прыгают ни в коем разе.

Какое отношение имеет sift к гистограмме яркости? Никакого абсолютно. А про то, что там в нем есть гистограммы направления градиентов - дак это да, причем инвариантность достигается как к масштабу, так и к повороту. А это и нужно при тряске и движении по заранее неизвестной местности.

Ну то есть вы решили просто сменить тему на SIFT, ну ясно...

Re: Тупое распознавание образа

GraphD » 18 дек 2007, 21:38

=DeaD= писал(а):Да не исключить ошибку идентификации на 99.9% при разных ракурсах. Вы сами столовую ложку не узнаете с необычного ракурса.
И вы как-то пропустили про гистограммы вопрос.

Ок. По-порядку.
Не... ну вот прикиньте, они же уже исключили эту ошибку, зачем нам тормозить самих себя при этом?
Вобщем два ракурса, с которых объект виден совершенно иначе,
т.е. участки со старого ракурса стали менее видны, чем участки с нового,
должны иметь четко раздельные дескрипторы, относящиеся к разным ракурсам. Как этого достигнуть? Нам нужно свойство стабильности деск-ра, когда при некоторой смене ракурса, когда самоперекрытия еще не достаточно сильны, деск-р четко идентифицировался как принадлежащий текущему ракурсу. А при значительных самоперекрытиях, возможно будет некоторая мертвая зона, а потом происходила скачкообразная переидентификация на новый ракурс. Если же, как в случае СКО или корреляции, такая четкость поведения будет нестабильной и в большей степени носить случайный характер, то цифру 99 нам не достигнуть. А такие результаты уже получены, я же не с потолка ее взял.

"Какое имеет отношение sift к вашему предложению сравнивать гистограммы?"
Его я пропустил? :)
Никакого!
PS: Конкретные вопросы про г-ммы и СКО уже частично обсудили, повторяться не охото. Ну вот и sift как вариант был подсунут.

Re: Тупое распознавание образа

=DeaD= » 19 дек 2007, 17:20

GraphD писал(а):
=DeaD= писал(а):Да не исключить ошибку идентификации на 99.9% при разных ракурсах. Вы сами столовую ложку не узнаете с необычного ракурса.

Не... ну вот прикиньте, они же уже исключили эту ошибку, зачем нам тормозить самих себя при этом?

Цифру 99 нам не достигнуть. А такие результаты уже получены, я же не с потолка ее взял.

Давайте конкретный источник с идентификацией на 99%. Будет интересно почитать.

GraphD писал(а):"Какое имеет отношение sift к вашему предложению сравнивать гистограммы?"
Никакого!
PS: Конкретные вопросы про г-ммы и СКО уже частично обсудили, повторяться не охото. Ну вот и sift как вариант был подсунут.

Разве что подсунут. То есть попытки доказать эффективность гистограммы мы оставляем полностью?

Re: Тупое распознавание образа

GraphD » 20 дек 2007, 14:41

=DeaD= писал(а):Давайте конкретный источник с идентификацией на 99%. Будет интересно почитать.

В той статье (Distinctive Image Features from Scale-Invariant Keypoints) есть график с вероятностями истинного и ложного отождествления. Где отношение этих вероятностей приближается к 100/1 (и растет дальше), и возникает эта цифра. Результат уже моего эксперимента в виде процентного графика ложных - на рис. (начало графика).

GraphD писал(а):Разве что подсунут. То есть попытки доказать эффективность гистограммы мы оставляем полностью?

Эффективность можно доказать лишь в конкретном эксперименте, а теоритически только предсказать. В тесте, что уже постил, показывается хотябы то, что она "не хуже".
Вложения
Capt.jpg
Capt.jpg (21.51 КиБ) Просмотров: 2334

Re: Тупое распознавание образа

=DeaD= » 20 дек 2007, 16:57

GraphD писал(а):
=DeaD= писал(а):Давайте конкретный источник с идентификацией на 99%. Будет интересно почитать.

В той статье (Distinctive Image Features from Scale-Invariant Keypoints) есть график с вероятностями истинного и ложного отождествления. Где отношение этих вероятностей приближается к 100/1 (и растет дальше), и возникает эта цифра. Результат уже моего эксперимента в виде процентного графика ложных - на рис. (начало графика).

Дык а где гарантия 99% распознавания то? Я к ошибке идентификации отношу не только неверную идентификацию, но и отсутствие этой самой идентификации. А вы похоже нет?

GraphD писал(а):
=DeaD= писал(а):Разве что подсунут. То есть попытки доказать эффективность гистограммы мы оставляем полностью?

Эффективность можно доказать лишь в конкретном эксперименте, а теоритически только предсказать. В тесте, что уже постил, показывается хотябы то, что она "не хуже".

Не хуже в каком смысле? Времени или качества распознавания?

Re: Тупое распознавание образа

GraphD » 24 дек 2007, 12:34

=DeaD= писал(а):Дык а где гарантия 99% распознавания то? Я к ошибке идентификации отношу не только неверную идентификацию, но и отсутствие этой самой идентификации. А вы похоже нет?

Можно считать, что 1% дают неверную и пр. идентификации и их отсутствие.

GraphD писал(а):Не хуже в каком смысле? Времени или качества распознавания?

Не хуже в качестве меры. Время распознавания - т.е. сложность алгоритмов? расчет г-ммы - это O(N) N-число пикселей, на гистограмму я брал M=20-40 ячеек доп. памяти (int), т.е. их сравнение фактически O(M). :pardon:

Re: Тупое распознавание образа

=DeaD= » 24 дек 2007, 16:13

GraphD писал(а):
=DeaD= писал(а):Дык а где гарантия 99% распознавания то? Я к ошибке идентификации отношу не только неверную идентификацию, но и отсутствие этой самой идентификации. А вы похоже нет?

Можно считать, что 1% дают неверную и пр. идентификации и их отсутствие.

Я вас не понял, вы хотите сказать что эта система распознавания не дает распознавания объекта только в 1% случаев, когда он есть в кадре под любым небольшим углом?

GraphD писал(а):
=DeaD= писал(а):Не хуже в каком смысле? Времени или качества распознавания?

Не хуже в качестве меры. Время распознавания - т.е. сложность алгоритмов? расчет г-ммы - это O(N) N-число пикселей, на гистограмму я брал M=20-40 ячеек доп. памяти (int), т.е. их сравнение фактически O(M). :pardon:

Так вы только их сравниваете и не двигаете друг относительно друга?

Re: Тупое распознавание образа

GraphD » 24 дек 2007, 17:17

=DeaD= писал(а):Я вас не понял, вы хотите сказать что эта система распознавания не дает распознавания объекта только в 1% случаев, когда он есть в кадре под любым небольшим углом?

Да, только идентификация отдельно полученных дескр-ов. В этот процент входят все виды ошибки, включая ложные отождествления и неидентифицированные (не нашли, хотя в кадре есть). Эта цифра лишь моя, по тому, что у Lowe в статье по реализации СТЗ на роботе, он вообще ничего не говорит, по картинкам ошибки вроде как отсутствуют...

=DeaD= писал(а):Так вы только их сравниваете и не двигаете друг относительно друга?

O(M) - это сложность евклидовой нормы разности, что бралась в тесте

Re: Тупое распознавание образа

=DeaD= » 24 дек 2007, 17:32

GraphD писал(а):
=DeaD= писал(а):Я вас не понял, вы хотите сказать что эта система распознавания не дает распознавания объекта только в 1% случаев, когда он есть в кадре под любым небольшим углом?

Да, только идентификация отдельно полученных дескр-ов. В этот процент входят все виды ошибки, включая ложные отождествления и неидентифицированные (не нашли, хотя в кадре есть). Эта цифра лишь моя, по тому, что у Lowe в статье по реализации СТЗ на роботе, он вообще ничего не говорит, по картинкам ошибки вроде как отсутствуют...

Вы будете смеяться, но я этой цифре не верю. По картинкам из статьи всегда ошибки отсутствуют, еще бы он выкладывал картинки где видно, что его метод не так крут :)

GraphD писал(а):
=DeaD= писал(а):Так вы только их сравниваете и не двигаете друг относительно друга?

O(M) - это сложность евклидовой нормы разности, что бралась в тесте

Вы в тесте вроде двигали гистограммы относительно друг друга, в том примере реальном, который я приводил.
Или вы про что сейчас?

Re: Тупое распознавание образа

GraphD » 24 дек 2007, 19:30

=DeaD= писал(а):Вы будете смеяться, но я этой цифре не верю. По картинкам из статьи всегда ошибки отсутствуют, еще бы он выкладывал картинки где видно, что его метод не так крут :)

Не верите в цифру 1%? Ну, тогда есть версия, что звезды и Луна таким образом осветили и подействовали на Ексцель, в результате чего этот график есть послание нам свыше, и на самом деле не является достоверностью отождествлений дескр-ов, а есть график размножения китайцев на 2008 г. :D

=DeaD= писал(а):Вы в тесте вроде двигали гистограммы относительно друг друга, в том примере реальном, который я приводил.
Или вы про что сейчас?

Двигались фрагменты с разными по цвету рамками! правый неподвижен, а левый от края к краю, и в результате два графика - один это разность ср. цвета, а др. - разность г-мм!


Rambler\'s Top100 Mail.ru counter