sosiska, для ориентации платформы в пространстве необходимость в простой камере или камере глубины пока под большушим вопросом. без платформы на первое время можно и обойтись. а когда/если дойдёт до платформы, хорошо подумать, может можно не усложнять. если это не громадное поле, которое сплошняком засеяно, так растишки в основном высаживают грядками и задача перемещения между ними из-за этого сильно упрощается. начиная с варианта передвижения по рельсам. можно реализовать локальное позиционирование на радиомодулях (как минимум dwm1000). распознование визуальных меток, расположеных через определённый интервал или протянуть сплошную ленту. и т.д.
esp32 с камерой наверно не актуален, уж очень у вас далеко идущие планы. начинать вникать можно хоть с простых k210 c одной или двумя камерами. ножками походить, фотографии поделать или видео на карту записывать или по вайфаю передавать (на maxduino есть esp32) на более мощное железо. обучится сеть, опять походить и посмотреть, как распознаёт. как очень бюджетный вариант для попробовать, вполне сойдёт. может перехочется этим заниматься или вообще поймёте, что не тянете (хотя это только часть, ещё же платформа с манипулятором в планах).
можно и сразу помодней железо взять (raspberry, jetson или ноутбук). камера глубины или 1-2 обычных. юсб нейроускоритель он как бы не про обучение (для этого сильно лучше подходит мощный процессор, видеокарта или облако). а для работы обученной сети вполне. что-то сразу на грядках пробовать или опять же записывать или по вайфаю передавать.
для получения иноформации о растениях камера глубины очень полезна - совмещаете данные о глубине с изображением и можете пробовать определять, видит ли какие растения, где у него листики и т.д. если realsense или подобную камеру, так из своих условий исходите. могу только предположить, что должна работа на небольших расстояниях + что бы на улице нормально работала, достатачная детализация была на нужном диапазоне расстояний. естественно что бы существовал нормальный sdk, официальная документация или достаточно статей в сети, примеры кода или проектов + с выбранным железом и операционной системой работало.
нейронку со временем вообще можно попытаться обучить по только по изображению определять глубину. но это потом, скорей всего что бы просто поэксперементировать и не факт, что в нужных условиях хорошо получится.