я попытался опровергнуть только утверждение "там вызов ядра (например из C#), занимает не меньше 1мс.", про остальное спорить нет смысла для каждой задачи свой инструмент.
Добавлено спустя 1 час 17 минут 52 секунды:Прошу прощения за простыню, но как то просто выразить мысль не получается.
Андрей, пожалуй можно выразить наш "спор" как спор о вере, но независимо от того верить или не верить в cuda , технология уже прижилась и есть готовые
полезные приложения, это я и хотел показать приведённым выше роликом.
И со временем приложений будет только больше, поскольку количество информации постоянно растёт и потребность в обработке постоянно возрастает.
Готов поспорить что в течение следующих 5 лет вы так или иначе начнёте использовать cuda/opencl для решения своих задач, возможно это будет отдельное приложение или библиотека.
На мой взгляд сейчас более интересно противостояние стандарта cuda vs opencl, это что то типа amd64 vs IA64
CUDA выигрывает за счёт производительности, но в тоже время она доступна только на чипах nvida (аналог IA64), однако подход - использование gpu для ускорения некоторых вычислений уже прижился осталось только окончательно определиться со стандартом. Сейчас приходится писать две разные программы для работы повех CUDA и OpenCL долго так продолжаться не может.
Nvidia всеми правдами и неправдами отстаивает свою технологию, например процессор Terga K1 поддерживает OpenCL 1.2 но nvidia не выпускает библиотеку поддержки opencl для линукса, при том что линукс официальная платформа для jetson tk1.
Таким образом появляются готовые приложения которые работают только на CUDA.
Справедливости ради стоит признать что nvidia оказывает техническую поддержку на должном уровне, постоянно совершенствуя дрейвера и библиотеки под линукс, такое редкость в мире arm+linux, хотя в общем ситуация постепенно меняется в лучшую сторону.
Стоит отметить что если на рынке PC объединение amd+ati обладает преимуществом, то Nvidia получила аналогичные возможности в мире arm , для них это прорыв и конкурентов пока невидно, остальные видео чипы для arm сильно ограничены по возможностям по сравнению с миром PC.
Оно и понятно, для планшета вовсе не обязательно быть супер компьютером, от него этого никто не ждёт, поэтому те решения что есть на рынке это компромис между производительностью/возможностям и энергопотреблением причём чаще в не в пользу первого.
Однако в мире arm пока другие ценности, андроиду фишки tegra k1 как то побоку, за год мало производителей зацепились за этот камень, поэтому от производительности уровня PC на arm пока выигрывает только линукс, как ни странно
Nvidia смогла поднять планку в мире arm, хромбук на базе tegra k1 с установленным линуксом (ubuntu unity (требует 3D)) по отзывчивости и производительности не уступает современным ноутбукам на базе Атом, ни один другой чип на базе arm таким похвастаться не может, при том что может работать целый день без подзарядки, проц N2807 близок по энергопотреблению но там нет такого GPU.
Автономное построение 3D карты или распознавание из коллекции в 1000 образов с частотой 30 кадров в секунду уже реальность, и люди не задумываются нравится им куда или нет, свою задачу они смогли решить при помощи куда.
Таким образом все кто заинтересован в решении аналогичной задачи волей неволей переходят на cuda.
Как пример
https://www.stereolabs.com/http://www.stereolabs.com/developers/в зависимостях Nvidia GPU with Compute Capability > 2.0
Добавлю ссылки может кому пригодится (сам пока не читал, ничего посоветовать не могу)
http://www.nvidia.ru/object/cuda-parall ... ks-ru.html