по железному уровню - параллельная шина 32-64 бит. От арбитра к каждому вычислительному модулю отдельная. И так же между смежными модулями. Плюс я бы из каждого модуля вывел шину просто наружу, чтобы можно было подключить внешний ввод-вывод.
Нужно почитать даташит на потенциально подходящие процессоры, как в них сделано чтение из параллельного порта. И как обеспечить синхронизацию всех модулей.
Получается процессор с оперативной памятью и СПИ-флешкой, из него идёт 32 бита на арбитр шины, 32 соседу справа, 32 соседу слева и 32 (или всё что останется) просто наружу. Причём нужно предусмотреть чтобы на тех ногах, которые идут просто наружу оказались внешние интерфейсы: USB, Ethernet....
На этот наружний интерфейс можно подвесить большую флешку, камеру и прочее...
Каждый вычислительный модуль как законченное изделие с возможностью автономной работы. То есть всё как полагается: питание, джейтаг... Пусть дороже будет за счёт индивидуальных стабилизаторов на каждой плате, но зато универсально. Таких вычислительных модулей несколько вариантов разной производительности и стоимости. Соответственно с урезанием шин и прочего.
Сами платки с плотным монтажом 0402 для минимизации габаритов.
Вообще где-то я уже такое видел
.
В материнке:
Арбитр шины - пока никаких идей, кроме ПЛИС. Какой-нибудь Спартан-6 с подходящим количеством ног и ценой. Есть мысли по этому поводу?
На ПЛИС повесить пару модулей оперативной памяти. Но вообще использовать её только как коммутатор между вычислительными блоками. То есть свести к минимуму обращение к её памяти, чтобы не делать узких мест.
Всем этим делом управляет АРМ с операционкой и возможностью подключения человеческого интерфейса (клава, мышка, мониторчик, звук).
От АРМа к ПЛИС тоже параллельный интерфейс для передачи данных.
Также от АРМа к ПЛИС и вычислительным модулям последовательный интерфейс (СПИ, ЮАРТ, И2С) для загрузки прошивок.
Пока вижу как-то так.