Angel71, ты проверял? или по рекламным проспектам судишь? Я на работе занимаюсь нейросетями и программированием их на цпу и видеокартах, так что приблизительно представляю, о чём говорю.
Да и вообще, изначально же было ясно, что целесообразность не обсуждаем, обсуждаем вариант изготовления. Я думаю, никто и не будет спорить, что какая-нибудь Ферми разорвёт этот самодельный суперкомп. Но тему создали вроде бы не для того, чтобы купить видуху и успокоиться.
Теоретически, ничто не мишает И7 повесить, но на практике даташит на него не найдёшь. Но если И7 брать, то чего мелочить тогда, надо брать PLX, делать на ней ПСИ-Е свич и вешать сразу видухи.
Duhas писал(а):откуда у 12-ти поточного АЙ7 на 3.4 ГГц 147к MIPS...
они суперскалярные.
можно урлом или парой слов ? ну или гуглить по суперскалярности ? )
EIN_ENGEL писал(а):Я думаю, никто и не будет спорить, что какая-нибудь Ферми разорвёт этот самодельный суперкомп.
ну а с этим никто и не собирался спорить, однако цель не только получить какую-то производительность, но и попробовать кодить под параллельные системы.. может быть когда нибудь и будем делать "суперкомп" на тех же ферми )
AT91SAM9G20 очень не удачный девайс для такой задачи. Процессор или SoC должен удовлетворять следующим требованиям (по мере убывания важности): 1 Контроллер какой либо стандартной внутренней шины: PCI, PCI-E 2 Иметь встроенный контроллер локальной памяти RAM+Flash 3 Иметь возможность доступа к внутренней памяти через шину указанную в п.1 4 Иметь альтернативные шины для управления вычислительными модулями: Ethernet, USB и т.п 5 Минимальная цена
Для примера смотрим R8610 SoC он удовлетворяет требованиям, но из даташита не ясно выполняется ли условие 3. А для большей перспективы нужно смотреть чипы от Marvell там есть SoC с поддержкой PCI-e. Частоты хорошие от 200 МГц. И сейчас уже есть в доступе pci-e свитчи на 32-48 портов.
Я понимаю, что это ветка Крейзи Проджектс и тут можно писать что угодно, но лучше бы всё таки задать более точное направление мысли. Автор, может напишешь что-нибудь типа:
Я хочу сделать свой СуперКомп. СУПЕР! КОМП! СВОЙ! Не купить поделки заморских радиолюбителей, а СДЕЛАТЬ СВОЙ! (пси-е свичи, материнки, видухи... отпадают) Плату буду делать сам, ЛУТом, паять советским ЭПСН-40. (извращения вроде бга корпусов отпадают)
По делу: AT91SAM9G20 пойдёт, но он в бга. Соответственно плата сразу в несколько раз дороже будет. Вообще пойдёт любой, у которого есть достаточно ног для параллельного интерфейса и который потом тебе пригодится в хозяйстве. Арбитр шины для большей свободы конфигурации, скорее всего только ПЛИС. Выбирай любую по цене и личным предпочтениям. На мой вкус я бы взял 3-й Спартан.
Я думаю, на ПСИ Экспресс смысла нет даже смотреть. Эту шину поддерживают мощные процессоры, для которых требуется быстрая память и соответствующие печатные платы. Всё это влетит в такие суммы, что дешевле купить готовое.
WickedGoblin, что подразумевается под локальной памятью? Бортовая внутри кристалла, или внешняя микросхема? На вскидку можешь привести пример процессора, у которого нет контроллера памяти? (всякие АВР тини, а также узкоспециализированную экзотику не считаем) Что подразумевается под доступом к внутренней памяти? DMA? Опять же, пример процессора, у которого нет ДМА? Особенно у тех, у которых есть ПСИ-Е. зачем нужен п.4. вычислительным модулям, если есть ПСИ-Е? п.5 стыкуется с п.1 ?
В каждом проекте должна быть конкретная и цель. Она должна быть конкретна, измерима, достижима, значима и иметь срок. Если цель просто многопроцессорная вычислялака то берем любую atmega соединяем их как Token ring через SPI c одним инджект узлом и все вперед разрабатываем свое ПО и колбасимся. Но поверь это тупик т.к. ни один и ни два человека не потянут написать такое ПО, а оно должно уметь: передать данные, код (как же грузить то алгоритм?) между узлами и инджект узлом. Иметь объекты синхронизации. Да в конце концов иметь хоть какой то более высокий уровень програмирования. Это задача просто не достижима. Поэтому надо опираться на максимально готовые элементы. Была и есть идея сделать домашний расширяемый NAS-router на основе многопроцессорной системы. Где каждый бы модуль (процессор) был заточен под свои задачи: сеть, дисковый ввод вывод и д.р. Чтобы система была расширяемой не паяльником, а вставил модуль Х получил функционал Х, вставил У- получил У функции. Как для примера я приводил R8610. Видилось это так каждый R8610 имеет на себе локальную память RAM+flash. Это модуль имеет pci шину и 4 таких модуля могут быть соединены между собой без каких либо дополнительных затрат на свичи. R8610 был выбран из предпосылок совместимость x86, есть USB, Ethernet и еще куча чего. На R8610. запускается linux. Взять готовую PCI расширялку на 4 порта не проблема (4 мамы -1 папа). PCI монтажные платы тоже можно найти. Даже LQFP216 можно аккуратно через переходник обычным паяльником напаять. После анализа были выявлены слабые стороны проекта очень маленькая скорость 133-150 МГц процессора. Реально после арбитража и накладных расходов в распоряжении прикладной программы останется от этого 70%,а 100 МГц это очень мало на архитектуре х86 (i486-sx). Поэтому и надо смотреть в сторону более современных процессоров и все что они могут с собой привнести. с одной сторнs pci это довольно просто- можно отладить даже 8 канальным даталогером, но это || шина. PCI-e это последовательная шина. но сразу требования к разводке выше. Но все это лирика. А жизнь состоит из того что в этом проекте надо расписать все что хочешь от него и что из этого придется делать ручками. P.S. Это не попытка отговорить, а показать горизонты проекта. А если просто так поиграться то действительно надо брать обычные atmegi. Делать простой token ring или свитч звезду на FPGA и думать как это загрузить.(говорят что с внешним тактированием есть экземпляры которые гонятся до 30-45 МГц)
Duhas писал(а):но больше чем 4-х слойка ой как не хотелось бы )
тогда бга отпадает. Для них нужно 6-8 слоёв. Причём по высокому классу точности, потому что там переходные будут 0.1-0.2 мм.
WickedGoblin, если на горизонты смотреть, то чего мелочиться? Берём материнку, заточеную под суперкомп (6 штук двойных 16х ПСИ-Е слотов, то есть позволяющих воткнуть 6 видеокарт) берём Ферми от НВидиа, пихаем несколько таких штук в 19" стойку, объединяем всё через ПСИ-Е свичи.