В общем в ЛС обещал изложить свои мысли по развитию кластерного подхода в сторону распознавания образов, вот излагаю:
1. Разбиваем изображение на кластеры по цветам (это уже сейчас есть).
2. Каждый кластер описываем как точку в многомерном пространстве (первые три координаты (включая расстояние до объекта), скажем, центр масс, следующие 3 координаты - средний цвет, а остальные - всякие инварианты - типа момент инерции вращения и т.п. прелести).
3. Задача распознавания образов сводится к выявлению среди имеющегося в кадре множества таких многомерных точек, известных нам паттернов.
Добавлено спустя 3 минуты 37 секунд:
При обучении тыкаем в какую-то область и замеряем все точки имеющиеся там. Скажем по признаку близкого расположения друг к другу в 3д.
При распознавании надо будет делать какой-то иерархический классификатор.
Бонусы - полученный метод распознавания скорее всего будет инвариантен относительно поворотов и масштаба в значительной степени.