Суперкомпьютеры

Конкурирующие в очень узком сегменте, выполнении Linpack.
И создать топовый компьютер в Linpack совсем не то же самое, что создать эффективный суперкомпьютер.
Это почему? Cуть тестов LINPACK - это решение систем линейных алгебраических уравнений. В этом "очень узком сегменте" и работают суперкомпьютеры, и именно поэтому для наибольшей репрезентативности их производительности выбран данный пакет тестов. Странно предъявлять это, как претензию. Тем более, у китайцев в топе 2 суперкомптютера (первое и второе места), ради фаллометрии могли бы обойтись и одним-единственным.

Погуглите количество транзисторов в одном ядре Apple A9 и одном Core i7 последнего поколения.
около 2 млрд и там, и там (i7-5960X). Только зачем такое сравнивать, мне не очень понятно: A9 - это система на чипе (SoC), включающая в себя 2 ядра процессора и 6 ядер GPU, а i7 - это отдельный 8-ядерный процессор. Соответственно, и потребляемая мощность отличается чуть ли не в 50 раз - единицы ватт и полторы сотни.

Преимущество RISC в быстром выполнении простейших команд.
правда, эти простейшие команды являются и наиболее частоиспользуемыми. Поэтому производительность ARM2 с 30 тысячами транзисторов была в несколько раз выше, чем производительность Motorola 68000 c 70 тыс. транзисторов.
 
Реклама
Еще в 80486 появилась трансляция внешних длинных (CISC) инструкций во внутренние короткие (RISC).

Эээ, нет. Трансляция появилась на Pentium Pro, для оптимальной загрузки исполнительных устройств. До этого были стандартные конвейеры с простым декодированием. Просто на Pentium конвейеров было уже два (один из них - укороченный, выполняющий только простые инструкции), а на 80486 появилось выполнение инструкций (не всех, конечно) за один такт.
 
Это почему? Cуть тестов LINPACK - это решение систем линейных алгебраических уравнений. В этом "очень узком сегменте" и работают суперкомпьютеры, и именно поэтому для наибольшей репрезентативности их производительности выбран данный пакет тестов. Странно предъявлять это, как претензию. Тем более, у китайцев в топе 2 суперкомптютера (первое и второе места), ради фаллометрии могли бы обойтись и одним-единственным.
Это решение рандомной системы уравнений одним конкретным методом. Чтобы можно было судить о реальной производительности, нужно как минимум знать о качестве рандомизатора. И то, проверяется работа 1 конкретного алгоритма. Поэтому сегмент очень узкий. "Самый мощный кластер в мире находится в Китае" и "Самый мощный кластер построен на элементной базе, разработанной китайскими инженерами" это несколько разные степени развития науки и техники. Неудивительно, что они решили заработать оба достижения. Ну и + для запуска липака должны быть реализации MPI

около 2 млрд и там, и там (i7-5960X). Только зачем такое сравнивать, мне не очень понятно: A9 - это система на чипе (SoC), включающая в себя 2 ядра процессора и 6 ядер GPU, а i7 - это отдельный 8-ядерный процессор. Соответственно, и потребляемая мощность отличается чуть ли не в 50 раз - единицы ватт и полторы сотни.
Так ведь 8 ядер-то, потому и количество транзисторов сравнимо. Возьмём i7-6700K, как представителя последнего поколения. Это 4 ядра CPU + 24 "ядра" Intel HD Graphics 530. Количество транзисторов меньше 2 млрд. А TDP это не потребляемая мощность, строго говоря. И TDP рассчитывается для полной загрузки, поэтому вообще не очень ясно как связано то, что A9 это SoC с его малым TDP.

правда, эти простейшие команды являются и наиболее частоиспользуемыми. Поэтому производительность ARM2 с 30 тысячами транзисторов была в несколько раз выше, чем производительность Motorola 68000 c 70 тыс. транзисторов.
Я ничего не знаю про производительность ARM 2. Но если это так, ARM 2 и появился на 6 лет позже, и проектировался как раз под наиболее часто используемые команды. И задачи у них так и остались разными, и потомки 68k до сих пор трудятся в относительно новых устройствах. А еще у ARM 2 шире шина, больше GPR итп... В общем связь между набором инструкций, количеством транзисторов и производительностью далеко не такая простая )

P.S. а от Motorola 68000 часто отказывались в пользу MIPS, а не ARM 2, и то намного позже )
 
Это решение рандомной системы уравнений одним конкретным методом.
Можно долго спорить о репрезентативности LINPACK, но нет никакой вины китайцев в том, что рейтинг TOP500 строится на основе результатов этого теста. Поэтому следует либо смириться и принять, либо создать рейтинг по более репрезентативным тестам. Напр., есть рейтинг http://www.graph500.org/results_jun_2016, там китайцы на 2-м месте, американцы на 3-м.

А TDP это не потребляемая мощность, строго говоря. И TDP рассчитывается для полной загрузки
Даже в простое любой i7 кушает на порядок больше A9.
А9 имело бы смысл сравнивать с Intel Atom, они хотя бы одноклассники.

ARM 2 и появился на 6 лет позже, и проектировался как раз под наиболее часто используемые команды
в этом и заключается смысл RISC-архитектуры - процессоры проектируются под наиболее часто используемые команды, поэтому они оказываются экономичней/быстрее.

P.S. а от Motorola 68000 часто отказывались в пользу MIPS
... который тоже на RISC-архитектуре))

Ну и возвращаясь непосредственно к развитию китайцев. В 2001 году в Топ500 вообще не было китайских суперкомпьютеров. Ни одного. На данный момент из 500 систем, 167 находятся в Китае. Для сравнения, в Штатах - 165.
 
xoid,
Так никто не спорит же с тем, что китайцы молодцы. Огромные деньги вкладываются в науку, одним из проявлений является количество суперкомпьютеров.
И тем более китайцы молодцы, что при отсутствии нескольких десятилетий исследований в полупроводниковой промышленности смогли сделать ШэнВэй. Да, они схитрили, сделав намного более простой процессор, чем интеловские зеоны. Да, в большом количестве задач на распространенном ПО он будет не так эффективен, как обычные х86 суперкомпьютеры, но им дешевле будет перелопатить код под набор команд и структуру их процессора, чем параллельно вкладывать в развитие тонких норм и проектирование конкурентов х86.
И формально китайцы чемпионы. И в части задач у них будет более быстрый компьютер.
Но ведь ПО сейчас тоже пишется под существующие системы. И что, как Вы думаете, будет быстрее? Решить задачу 5-ю сложными командами, которые умеют х86 последнего поколения, или 200-ми, которые умеет риск?
Наверняка китайцы на этом не остановятся и будут разрабатывать процессоры х86, поэтому лет через 10-20 ситуация в процессоростроении может значительно измениться.
 
Можно долго спорить о репрезентативности LINPACK, но нет никакой вины китайцев в том, что рейтинг TOP500 строится на основе результатов этого теста. Поэтому следует либо смириться и принять, либо создать рейтинг по более репрезентативным тестам. Напр., есть рейтинг http://www.graph500.org/results_jun_2016, там китайцы на 2-м месте, американцы на 3-м.
Если вскроется, что китайцы умышленно создали процессор, заточенный именно про LINPACK, то набор тестов должен быть как минимум расширен.

Даже в простое любой i7 кушает на порядок больше A9.
А9 имело бы смысл сравнивать с Intel Atom, они хотя бы одноклассники.
Что в простое, что при полной загрузке Core i7 будет потреблять больше. При сравнимом количестве транзисторов. Моё предложение сравнить их было вызвано вашей репликой "Меньше транзисторов - ниже энергопотребление."

в этом и заключается смысл RISC-архитектуры - процессоры проектируются под наиболее часто используемые команды, поэтому они оказываются экономичней/быстрее.
Смысл RISC архитектуры в данный момент в том чтобы ускорить темп разработки процессоров. Разница, которая существовала много лет назад, была обусловлена технологическими проблемами и стоимостью памяти. Там где это было важно использовались CISC процессоры, там где выполнялось огромное количество однотипных простых операций какие-то варианты RISC. Сейчас performance/watt очень близка, так что уже не существует никакого огромного превосходства ARM/MIPS/других RISC с точки зрения энергопотребления. Есть небольшая статья:
http://www.extremetech.com/extreme/...86-or-mips-intrinsically-more-power-efficient
Нужно учитывать, что мы говорим все таки о вычислениях общего назначения. Любое ASIC решение будет намного эффективнее. И да, ASIC farm


... который тоже на RISC-архитектуре))
Естественно, только сравнивать процессоры разных поколений вообще нет смысла в данном контексте. Был старый 68k, были новые MIPS и ARM решения. Не было выбора между чипами одного поколения, но разных архитектур.

Ну и возвращаясь непосредственно к развитию китайцев. В 2001 году в Топ500 вообще не было китайских суперкомпьютеров. Ни одного. На данный момент из 500 систем, 167 находятся в Китае. Для сравнения, в Штатах - 165.
Это говорит о том, что у китайцев есть деньги и желание быть впереди планеты всей. Серьезно, если бы в России правительство поставило задачу, например, получить 5 из 10 мест в топе, то особых проблем бы не возникло. Несмотря на то, что отрасль создания микроэлектроники здесь мертва.


А с тем, что китайцы в целом молодцы, правда никто не спорит. Нам ничего неизвестно о том что же это они за процессоры разработали, соотвественно никакой информации о реальных технических характеристиках и лицензионной чистоте. Более того, нам неизвестно даже реально ли китайцы разработали этот процессор. Аутсорсинг, знаете ли...
 
Назад