setar писал(а):во первых такое направление есть, (когда задачу решает много низкоскоростных процессоров)
Да я сам транспьютеры парситековские в аспирантуре гонял. (только не такие большие - тогда еще речь не шла о петафлопах
Странно другое - почему чипов таких нет монолитных. Понятно, что реализовать ядра на плисах - не очень эффективно (и по потреблению, и по степени интеграции, и по связности сетей). Пожалуй, единственное, что видел - это парситековские кристаллы старинные, ну еще читал о парочке...
Как-то они на том же уровне и застряли, что и 20 лет назад Грустно.
Duhas писал(а):какие там ключи вы подбираете на работе. а еще интереснее чьи )))
Прикол в том что никто не знает ни заказчика ни где ЭТО работает ни чем занимается, могу сказать что экпортные ограничения США по поводу запрещения ввоза в россию супервычислителей нервно курят в сторонке
Добавлено спустя 3 минуты 14 секунд:
Michael_K писал(а):Странно другое - почему чипов таких нет монолитных. Понятно, что реализовать ядра на плисах - не очень эффективно (и по потреблению, и по степени интеграции, и по связности сетей). Пожалуй, единственное, что видел - это парситековские кристаллы старинные, ну еще читал о парочке...
Ты путаешь маленькую вещь - полнофункциональный процессор и аппаратную связку за один такт реализующую серию вычислений по жесткой логике Плисы это очень эффективно. ну представь например операцию возведения в степень двух байтовых чисел в один такт
Michael_K писал(а):А шесть процов - это ни то, ни се...
в корне не согласен.
А зачем они? В роботе? А на шести корпусах и ног будет много и периферии встроенной - поуправлять там сервами, дисплеями, мостами, датчиками и т.д. )) И еще на шести процах хорошо получается модульная конструкция, плюс можно подобрать конкретный оптимальный проц для конкретной задачи.
в том-то и дело, что от задачи танцевать нужно, а не от проца и тем более не говорить обобщённо, что категорически нужно или ненужно. я это имел в виду. +для для многопроцессорности/многоядерности далеко не малозначимые вещи это "узкое горлышко" при передачи информации между процами/ядрами и общая память. а на роботе... да много можно придумать, где будет эффективней один многоядерный или где несколько одноядерных.
setar писал(а):Питать вот только сложно при работе потребляет порядка 25
завидую черной завистью.. я для своих убогих гражданских нужд не нашел места, где можно было бы запитать стойку больше, чем 7кВт... с охлаждением у них, видите-ли, проблемы.. а надо как раз на 25-30кВт в пике... =(
EdGull писал(а):а какая обычно применяется шина для связи процессоров?
обычно самая быстрая доступная, как правило не меньше 20Gbps и с минимальной латентностью (пингом/ответом не в разрезе ip) Infiniband или Гипертранспорт
Я думаю основной причиной по которой не делают один чип с очень большим количеством ядер является то, что никто не умеет правильно писать параллельные программы. Т.е. да есть какие-то методы и т.д., но технологии создания параллельных программ все еще нет.
Есть еще один момент, мне кажется, что перспективной обласьтю является создание компьютеров с перестраиваемой архитектурой. По сути для каждой задачи необходима своя внутренняя архитектура, иначе все быстро упирается в закон Амдала.
Так в видеоускорителях давно применяют многопроцессорность Видеочип: RV770 XT (55-нм техпроцесс); Рабочая частота графического ядра: 850 МГц; Число потоковых процессоров: 480;
На примере NVIDIA - http://media.bestofmicro.com/nvidia-CUD ... 131-13.jpg Есть блоки процессорных кластеров, в них располагаются собственно сами кластеры, в которых по два потоковых мультипроцессора, у каждого из которых есть все, что нужно процессору + много АЛУ. То есть, если судить по картинке, предположить, что у NVIDIA и ATI все похоже, то выходит у RV770 XT 480 потоковых процев и 480*8 = 3840 АЛУ.
Как-то так. То есть это все-таки многопроцессорный чип, в котором каждое ядро еще и содержит кучу АЛУ.
имхо, intel Larrabee как раз таки и есть набор транспьютеров на чипе. а вот и расшифровка пикчи:
Streaming Multiprocessor (SM) содержит 8 Streaming Processors (SP), делающих простые операции (FMUL, FMAD и т.п.) и два Super Function Units (SFU), делающих сложные операции (RCP, RSQ и т.п.).
SP выполняет инструкцию за цикл.
SFU выполняет инструкцию за 4 цикла.
Два SM, один текстурный юнит и кэши для текстур, инструкций и констант объединяются в один Texture Processing Cluster (TPC).
АЛУ-то много, но они работают по принципу "одна команда,много данных", в отличие от larabee.