На сайте NVidia появилась интересная штука, проект CUDA который позволяет повысить производительность работы с большими массивами данных в несколько, а то и несколько десятков раз. По адресу:
Выложено 144 примера программ, многие с исходниками, например такая нужная в машинном зрении вещь, как расчет оптического потока, с очень высокой скоростью. Или проект одного француза - GPUCv который по интерфейсу полностью повторяет OpenCV только использует для вычислений видеокарту. Еще там - же на сайте Nvidia есть физический движок PhysiX использующий CUDA. Очень стабильно работающий.
Да и еще по теме, есть железка от NVidia - Tesla ($600) которая.. ну сами посмотрите...

вам поди и под винду интересней на асме программить? 