roboforum.ru

Технический форум по робототехнике.

Машинное видение, работающее на графическом процессоре.

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Тиамо » 20 июн 2012, 00:34

А Вы знаете с какой проблемой сталкивается человек, ослепший на 1 глаз? Правильно, с проблемой потери бинокулярного зрения. Серьёзна ли эта проблема для человека? Очень серьёзна, также серьёзна как и для любого хищника. То, что человек хищник доказывать, я полагаю, необходимости нет. Зачем человеку, волку, кошке и орлу бинокулярное зрение? Правильно, чтобы выделять на любом фоне любые объекты и оценивать расстояние до них.

Решение очевидно: бинокулярное зрение позволит очень легко выделять объекты почти на любом фоне вне зависимости от фактур их поверхности, наличия теней и прочих псевдопомех, очень актуальных при анализе монокулярного изображения и почти ничтожных при анализе 2 парных бинокулярных изображений одного и того же участка пространства. Возникает информационный массив, позволяющий присвоить каждой точке изображения 3 координаты. Непрерывность объекта будет основным критерием для выделения его "отдельности" на фоне чего бы то ни было. Убедиться в отделённости объекта от фона можно обойдя его, что будет элементом изучения доступного окружающего мира.

Помните, я задавал Вам свой вопрос о том, описали ли Вы своему ИИ его существование (бытиё) в 4х-мерном реальном мире? Как говорил Винни-Пух, "это ж-ж-ж неспроста!" Предоставьте своему ИИ (роботу и т.д.) эгоцентрическую систему координат, пусть он расположится в 0 по x,y,z и t. Если он будет физически находиться в пустыне Калахари то длина его осей равна условной бесконечности. Но если он будет включен в комнате, которая на первых порах развития его мозга составит весь известный и доступный ему мир, то на осях координат возникнут пределы, которые очень легко объяснить ему математически. Стены, пол, потолок. Длящаяся непрерывность, имеющая свои экстремумы, т.е. углы.
Тиамо
 
Сообщения: 53
Зарегистрирован: 21 сен 2009, 16:14
Откуда: москва

Re: Машинное видение, работающее на графическом процессоре.

Сообщение AndreiSk » 20 июн 2012, 00:46

Тиамо писал(а):А Вы знаете с какой проблемой сталкивается человек, ослепший на 1 глаз? Правильно, с проблемой потери бинокулярного зрения. Серьёзна ли эта проблема для человека? Очень серьёзна, также серьёзна как и для любого хищника.

Не серьезная проблема :)
Попробуйте закрыть один глаз повязкой,
вы не перестанете точно оценивать расстояния.
Пара глаз, пара ушей, пара ноздрей, пара рук, пара ног, это симметрия.
Очень часто встречается в живой природе.
Бинокулярное зрение это опция, есть-хорошо, нету-переживем.
Аватара пользователя
AndreiSk
 
Сообщения: 2639
Зарегистрирован: 23 апр 2009, 17:03
Откуда: Москва, Самара
прог. языки: C#

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Тиамо » 20 июн 2012, 01:17

Виктор Казаринов писал(а):... Вам EDV может наверное рассказать, что хранить множество изображений в RAM и сравнивать их - нетривиальная задача даже для не очень большого количества изображений.

А я не ставлю перед собой задачи научить робота распознавать любой предмет из существующих на планете Земля. Меня вполне устроят предметы, находящиеся в моей квартире. О каком объёме памяти идёт речь? 64 ГБ ОЗУ будет достаточно? Плюс твёрдотельный накопитель примерно на 256 ГБ. Плюс 2 ТБ жёсткого диска.

Виктор Казаринов писал(а):И вообще - что такое объекты на изображении и их свойства, о которых вы пишете? Вы таким вопросом задавались?

Объекты и субъекты определены немецкими основоположниками марксистско-ленинской философии диалектического материализма и отказываться от этих определений нужды я не нахожу. Категорий свойств для всей совокупности запоминаемых объектов можно напридумывать сколько угодно много, главное чтобы они помогали роботу опознавать объекты и оперировать ими. Например такое свойство как "название объекта", при том что название может иметь и буквенное выражение и звуковое. Польза от знания этого свойства очевидна. Далее по списку: цвет, размер, вес, центр масс, прочность на сжатие, прочность на растяжение, прочность на изгиб, допустимое ускорение при манипулировании и множество других свойств. При этом некоторые свойства будут необходимы на этапе опознавания (идентификации), например цвет и форма при выполнении задания по поиску оранжевого мяча (шара), помните? Знание других свойств важно для манипулирования объектами. Табличка, много табличек со связями между ними, т.е. база данных об объектах и субъектах. Это я называю пониманием того, что робот видит сейчас. Идентифицировать и вспомнить свойства предмета.

Добавлено спустя 3 минуты 12 секунд:
AndreiSk писал(а):Не серьезная проблема :)
Попробуйте закрыть один глаз повязкой,
вы не перестанете точно оценивать расстояния.
Пара глаз, пара ушей, пара ноздрей, пара рук, пара ног, это симметрия.
Очень часто встречается в живой природе.
Бинокулярное зрение это опция, есть-хорошо, нету-переживем.


Вынужден с Вами не согласиться на том основании что я - врач и физиологию высшей нервной деятельности знаю неплохо. не говорю "отлично" только из скромности, на самом деле в зачётке именно такая оценка и стояла.
Одноглазые люди могут оценивать расстояние при взгляде одним глазом, но делают это иначе чем остальные люди. Они слегка покачивают головой из стороны в сторону, формируя параллакс при наблюдении.

С уважением.

Добавлено спустя 6 минут 21 секунду:
Не пытайтесь изучить тему сидя в комнате.
Выйдите в поле, пользуясь бинокулярным зрением покидайте камешки в различные предметы, находящиеся на различном от Вас расстоянии.
Отвернитесь, попросите ассистента изменить значительно положение предметов, завяжите 1 глаз, повернитесь к предметам лицом и повторите опыт с киданием камешков.
Во время опыта ведите статистику, помните о том что 1 результат это не результат.

Добавлено спустя 6 минут 54 секунды:
Ототопика Вам безусловно также знакома. Это греческое словосочетание означает способность определять наслух положение источника звука относительно головы определяющего.
Уверен что именно Вы легко это сделаете пользуясь только 1 ухом. А вот весь остальной животный мир сделать этого не сумеет.

С уважением.
Тиамо
 
Сообщения: 53
Зарегистрирован: 21 сен 2009, 16:14
Откуда: москва

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Dmitry__ » 20 июн 2012, 01:22

с монозрением, адназначна хрень.
Не делала бы природа стерео зрение, если оно не нужно, или по Дарвину: все одноглазое было сьедено уродцами с глазами >1 :pardon:
А то что некоторый вид разучился пользоваться стерео, так ведь и шерсть отвалилась за ненадобностью, но на снегу уже не поспишь
Аватара пользователя
Dmitry__
 
Сообщения: 8033
Зарегистрирован: 13 янв 2011, 15:25
Откуда: Санкт-Петербург

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Тиамо » 20 июн 2012, 01:39

Бинокулярное зрение возникло гораздо раньше чем появился род людей (Homo). Уже амфибии (земноводные, жабы например), наследники рыб и предки рептилий (пресмыкающихся), способны к бинокулярному зрению. Но оно у них не постоянно, а "включается" при необходимости, например в момент перед решающим прыжком или выбросом языка.
Тиамо
 
Сообщения: 53
Зарегистрирован: 21 сен 2009, 16:14
Откуда: москва

Re: Машинное видение, работающее на графическом процессоре.

Сообщение RootAdmin » 20 июн 2012, 01:47

Я б десыть раз подумал о том, стоит ли ставить НА мобильного робота GPU Первая причина - потребление. Ладно, сам чип - пусть 18 ватт. А материнка, куда он воткнут? А CPU? Множим потребление всего этого табора на обратное значение КПД преобразователя питания. Наблюдаем 4-10 ампер от 12 вольт... минимум. Пробовал на автомобиле, знаю.
я лучше либо вынесу обработку видео на сервер, которому видеокарта в общем ни к чему либо (если надо обрабатывать локально) построю "кластер" на тех же распберри. И буду отключать неиспользуемые элементы динамически.
Дым, идущий из всех устройств в помещении предвещает появление электрика.
RootAdmin
 
Сообщения: 1725
Зарегистрирован: 07 авг 2010, 21:29
Откуда: КМВ
прог. языки: C
ФИО: Андрей

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Тиамо » 20 июн 2012, 01:58

Атом с Ионом2 совокупно со всей материнкой потребляют не более 40 Ватт в пике. Аналогичная приблуда от АМД потребляет совокупно 18 Ватт и имеет бОльшую производительность как графики, так и ЦП. Но юниксоиды считают АТИ дрова некошерными.
В целом я тоже думаю о выносе распознавалки на стационарный сервер, но возникает вопрос, будет ли достаточно ширины и задержек вай-фай-канала для работы распознавалки в реальном времени? можно установить в каждом помещении квартиры камеры и точно знать кто где находится, не надо роботу искать людей по комнатам.
Последний раз редактировалось Тиамо 20 июн 2012, 02:00, всего редактировалось 1 раз.
Тиамо
 
Сообщения: 53
Зарегистрирован: 21 сен 2009, 16:14
Откуда: москва

Re: Машинное видение, работающее на графическом процессоре.

Сообщение AndreiSk » 20 июн 2012, 02:00

Я прикидывал возможности установки GTX580 на робота.
И запитать ее думаю не было бы проблемой,
там основное потребление идет по шине +12В,
для чего и делают 6+8 штыри питания.
Думаю можно было бы скоммутировать +12в для GPU напрямую
от аккумулятора, там же все равно не точно +12,
а +12в +/-5%, но, думаю падение до +10в не будет фатальным... хотя проверить конечно надо.
Но пока почему-то GPU не потребовалось :pardon:
Аватара пользователя
AndreiSk
 
Сообщения: 2639
Зарегистрирован: 23 апр 2009, 17:03
Откуда: Москва, Самара
прог. языки: C#

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Тиамо » 20 июн 2012, 02:02

А что он у вас распознаёт? в квартире ориентироваться он умеет?
Тиамо
 
Сообщения: 53
Зарегистрирован: 21 сен 2009, 16:14
Откуда: москва

Re: Машинное видение, работающее на графическом процессоре.

Сообщение AndreiSk » 20 июн 2012, 02:05

Тиамо писал(а):А что он у вас распознаёт? в квартире ориентироваться он умеет?

Нет еще, не все сразу. Просто видеообработка это трудоемкие задачи,
а для меня хобби. Сейчас решил более плотно заняться этой областью.
Ну вот здесь пока все собрано http://www.youtube.com/AndreiSkRover/
Аватара пользователя
AndreiSk
 
Сообщения: 2639
Зарегистрирован: 23 апр 2009, 17:03
Откуда: Москва, Самара
прог. языки: C#

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Тиамо » 20 июн 2012, 02:24

Посмотрел, забавно.
Особенно носочки на барышне. Так ведь распознавания особого я там не заметил. Потому GPU и не потребовалось. Для Вас это хобби, учебное задание или коммерческий проект?
Тиамо
 
Сообщения: 53
Зарегистрирован: 21 сен 2009, 16:14
Откуда: москва

Re: Машинное видение, работающее на графическом процессоре.

Сообщение RootAdmin » 20 июн 2012, 02:26

В идео по вайфаю гонять можно. В пределах 50 метров можно рассчитывать на стабильные 20 мегабит. Задержка для простых wi-fi камер - около 0.1 сек.
Эх, еслиб увидеть пример работы на гпу алгоритма, повторяющего Эдовский - можно было б сравнивать...
Некстати, вот разговор зашел про базы данных. Про объемы памяти. Чем гпу поможет при выполнении запроса к базе? Основная сложность при опознании объекта - разделить изображерие (моно, стерео, хоть квадро с лидарной сеткой расстояний) на разные объекты.
Дым, идущий из всех устройств в помещении предвещает появление электрика.
RootAdmin
 
Сообщения: 1725
Зарегистрирован: 07 авг 2010, 21:29
Откуда: КМВ
прог. языки: C
ФИО: Андрей

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Тиамо » 20 июн 2012, 02:39

Выделение объекта на моноизображении представляется гораздо более сложной задачей чем на стереоизображении.
С точки зрения физиологии восприятия необученный мозг выделяет объекты в обозреваемом пространстве на основании критерия монолитности, нераздельности их. Оценку монолитности мозг производит на основании оценки расстояний до каждой точки, формирующей видимую поверхность объекта наблюдения. Если координаты образуют непрерывную поверхность, то мозг делает заключение о том что вся эта поверхность принадлежит этому объекту, она является его границами в пространстве.
Вычислять координаты точек при анализе стереокартинки гораздо проще чем при анализе моно. Мало того, существуют системы дистанционного измерения расстояний, которые работают на сходном принципе: на объект (например каретку станка) фиксируют светодиод, а на станину станка с некоторым смещением относительно линии параллельной оси перемещения каретки и проходящей через светодиод устанавливают фотодатчик, в простом случае обычную камеру. При перемещении каретки с горящим светодиодом фотодатчик регистрирует перемещение луча света от светодиода от одного его конца до другого, положение луча является исходными данными для вычисления расстояния между станиной и кареткой.

Сетку, которую можно наблюдать при работе некоторых программ лидарной называть не стоит. Её не всегда формирует сканирующий лидар. лазерный локатор. Это топологическая сетка, которая обозначает непрерывность координат точек поверхности выделенных объектов с некоторым шагом развёртки, как раз абстрагированная от цвета, освещённости, произвольных складок, фактуры поверхности, глянца и прочих свойств и помех, только координаты. Из этой непрерывности программа делает вывод о том что множество этих координат, отображаемое этими линиями, очерчивает единую поверхность формируя границы отдельного объекта в обозреваемом пространстве.

Как то так.
Последний раз редактировалось Тиамо 20 июн 2012, 03:31, всего редактировалось 6 раз(а).
Тиамо
 
Сообщения: 53
Зарегистрирован: 21 сен 2009, 16:14
Откуда: москва

Re: Машинное видение, работающее на графическом процессоре.

Сообщение AndreiSk » 20 июн 2012, 02:47

>Кстати, обмен с видеопамятью GPU идет очень резво, несколько гигабайт в секунду.
>Если есть интерес, завтра могу сказать точно для GTX580.

Выделил и скопировал 1ГБайт в память видеокарты.
Обмен ~3ГБ/сек.
Последний раз редактировалось AndreiSk 20 июн 2012, 14:27, всего редактировалось 1 раз.
Аватара пользователя
AndreiSk
 
Сообщения: 2639
Зарегистрирован: 23 апр 2009, 17:03
Откуда: Москва, Самара
прог. языки: C#

Re: Машинное видение, работающее на графическом процессоре.

Сообщение Angel71 » 20 июн 2012, 03:37

если не запамятовал, максиамльная пропускная pci-ex 16х примерно 4гб. на сэнди с памятью 9-9-9-24 1600мгц пропускная 20гб+-, ниже 18гб (процы хилые и память на 1333, тайминги не помню) пока ни на одной конфигурации не видел. у gtx580 пропускная памяти сотни гб.

Добавлено спустя 26 минут 3 секунды:
ан нет, у pci-ex 2.0 x16 по стандарту получается максимум 8гб (5*16*0.8/8) в одном направлении. на платах с атомами по пропускной всё совсем печально.
Аватара пользователя
Angel71
 
Сообщения: 10668
Зарегистрирован: 18 апр 2009, 22:18
Предупреждения: -1

Пред.След.

Вернуться в Компьютерное зрение

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2