Итак - можем ли мы считать, что есть некоторая функция, по которой можно определить на изображении, насколько "цепляет" данное место наше внимание.
Мысли на эту тему, чего она должна включать:
1. Яркость значительно выше среднего по изображению;
2. Сильно-контрастные участки;
3. Быстро изменяющиеся участки (если есть последовательность кадров);
4. Определенные цвета (здесь возможно обучение по предыдущей истории - какой цвет наиболее полезен, какой наименее);
Как она должна работать - производится вычисление функции для каждой точки изображения, затем находятся области с наибольшим значением этой функции, определяются кластеры со схожими признаками и высоким значением нашей функции.
В принципе для монолитных и не камуфлированных объектов все будет просто, а вот если объект окрашен во что-то типа "камуфляж", то все ужастно
PS: Например если мы попробуем обработать таким алгоритмом зебру, то есть 3 варианта, чего мы можем получить:
Вариант 1 - один кластер - вся зебра, однако непонятно как мы получим этот кластер и не факт что мы его получим не зацепив еще что-то;
Вариант 2 - два кластера - белые полоски зебры и черные полоски зебры - вероятность этого есть, если функция объединения в кластер сможет пропускать какие-то пробелы и объединять близко расположенные кластеры в один;
Вариант 3 - много кластеров - по одному на каждую полоску - наиболее вероятный и легко получаемый вариант, однако .
У кого какие мысли как это можно обработать в третьем варианте?