Top 500: новый рейтинг суперкомпьютеров. Топ 500 суперкомпьютеров
новый рейтинг суперкомпьютеров / Блог компании ua-hosting.company / Хабр
Intel Xeon Phi 31S1P в суперкомпьютере Tianhe-2
Tianhe-2 работает под управлением специализированной ОС Kylin Linux и демонстрирует в тесте HPL Linpack пиковую производительность на уровне 33,86 (33,86 квадриллионов операций в секунду). Разработчики продолжают оптимизировать алгоритмы управления нагрузкой. Они подчеркивают тот факт, что за счёт чисто софтверных решений производительность может быть увеличена ещё на 50 – 60%.
Tianhe-2 был разработан командой из 1300 учёных и инженеров и располагается в Национальном суперкомпьютерном центре в Гуанчжоу (Guangzhou). Начиная с 2013 года, он постоянно занимает первое место в списке TOP 500 самых быстрых суперкомпьютеров в мире. Создание Tianhe-2 было спонсировано и инициировано китайским правительством и администрацией провинции Гуанчжоу в рамках программы «863 High Technology Program». Он был построен китайским Оборонным научно-техническим университетом Народно-освободительной армии Китая (National University of Defense Technology) после того как правительство США отклонило просьбу компании Intel на получение лицензии на экспорт центральных процессоров и сопроцессорных плат. Это решение правительства США нанесло существенный удар по компании Intel и их поставщикам, а также вызвало затор в развитии информационных технологий страны, дав толчок китайской индустрии разработки процессоров.Россию на данный момент представляют семь суперкомпьютеров. Из них только два входят в первую сотню — Ломоносов и Ломоносов-2, производства компании Т-Платформа. В настоящее время он содержит 6654 вычислительных узла, более 94000 процессорных ядер, обладает пиковой производительностью 1,37 Пфлоп/с. Реальная производительность системы на тесте Linpack равна 674 Тфлоп/с
Если говорить о топовых позициях, то они изменились незначительно. В первую десятку вошли только два новых суперкомпьютера – Trinity и Hazel-Hen, соответственно занявшие шестое и восьмое место. Это системы Cray XС40 на процессорах Xeon E5-26xx и без ускорителей вычислений с плавающей запятой. Их производительность составляет 8,1 для первого и 5,6 Пфлоп/с для второго.
Учитывая то, для чего он используется, можно было бы ожидать, что суперкомпьютер Trinity будет ещё более дорогим. Однако благодаря более современным и мощным технологиям стало возможным параллельное снижение цены, связанной с созданием более новых и мощных суперкомпьютеров. Правительство США предложило производителю суперкомпьютеров Cray контракт на сумму в 174 миллиона долларов на создание этого суперкомпьютера Cray XC, а также системы хранения Cray Sonexion для Национальной администрации по ядерной безопасности. Trinity будет использоваться для того, чтобы поддерживать эффективность ядерного арсенала США и для содержания его в целости и сохранности.
Hazel-HenСуперкомпьютер Shaheen II, который установлен в Научно-технологическом университете имени короля Абдаллы (Саудовская Аравия) и этим летом занявший седьмое место, переместился на девятое место.
Все остальные создавались и модернизировались до II квартала 2015 года. Корейский TachyonII (Sun Blade x6048) и канадский GPC (xSeries iDataPlex) — самые старые из них и работают начиная с 2009 года. Они до сих пор находятся в рейтинге 500 лучших суперкомпьютеров и занимают 372 и 392 места.
Всего лишь полгода назад 90 систем в списке использовали математические сопроцессоры, сейчас же их число выросло до 104. 66 из них используют GPU Nvidia, три – AMD/ATI Radeon, а 27 – Intel Xeon Phi. В четырёх суперкомпьютерах использованы гибридные архитектуры Nvidia Kxx и Intel Xeon Phi.
Интел продолжает удерживать лидерство: его процессоры используются в 89% суперкомпьютеров из рейтинга TOP 500, в то время как доля AMD Opteron составляет только 4,2%. Интерес к процессорам IBM Power также снижается несмотря на их архитектурные преимущества. Сейчас их продолжают использовать только в 26 системах, а полгода назад их было 38. Серия Cray XC теперь самая популярная в TOP 10.
Ведущая роль в сегменте высокопроизводительных систем отведена Hewlett-Packard. HP создано почти треть всех лучших суперкомпьютеров мира (155 или 31,2%). Второе место — Cray (69 систем), а третье – IBM (45 суперкомпьютеров). Китайский вендор Sugon обогнал IBM. Ему принадлежит 49 систем из обновлённого рейтинга TOP 500.
Если еще полгода назад петафлосный барьер преодолели 68 машин, то сейчас их количество равно 81.
Можно сделать выводы: общая производительность суперкомпьютеров растёт гораздо медленнее, чем в предыдущие годы. С 1994 до 2008 тем прироста составлял 90% в год. С 2008 года – 55% и менее.
Инвестиции в высокопроизводительные вычисления в целом растут, но основной их поток теперь направлен на кластеры средней мощности.
habr.com
Более ста суперкомпьютеров из Top 500 используют ускорители вычислений
Не секрет, что всё больше суперкомпьютеров используют вычислительные ускорители на базе графических процессоров, или же специальные сопроцессоры, чтобы достигнуть невиданной мощности при относительно небольшом энергопотреблении. Согласно данным из нового списка пятисот самых мощных суперкомпьютеров в мире, более сотни уже использует GPU-ускорители. Карты NVIDIA Tesla продолжают оставаться самыми популярными ускорителями для высокопроизводительных вычислений (high-performance computing, HPC).
Рост производительности суперкомпьютеров замедляется
Согласно обновлённому списку Top 500, опубликованному на этой неделе, общая вычислительная мощность всех самых мощных суперкомпьютеров в мире выросла до 420 квадриллионов операций с плавающей запятой в секунду (420 петафлопс – PetaFLOPS [floating point operations per second]) с 361 петафлопс год назад. 80 HPC-систем имеют производительность в один петафлопс, по сравнению с 67 машинами в июле этого года года. Наименее мощный суперкомпьютер из Top 500 может выполнять 204,3 триллионов операций в секунду (терафлопс), тогда как ранее мощность самой медленной Top 500 системы в мире была 164 терафлопс.
Суперкопьютер Cray XK7
Авторы рейтинга Top 500 отмечают, что рост производительности самых быстрых суперкомпьютеров замедляется. Во многом это происходит вследствие замедления роста производительности центральных процессоров, а также некоторых задержек с выходом в свет новейших ускорителей и сопроцессоров для супервычислений.
Количество GPU в суперкомпьютерах растёт
В общей сложности 104 системы в списке пятисот самых мощных суперкомпьютеров в мире используют вычислительные ускорители AMD FirePro S, NVIDIA Tesla или сопроцессоры Intel Xeon Phi. А еще в июле этого года лишь 90 систем использовали подобные устройства. 66 систем из 104 использует NVIDIA Tesla, 27 используют Intel Xeon Phi и три используют AMD FirePro. Четыре системы используют комбинацию из NVIDIA Tesla и Intel Xeon Phi. NVIDIA продолжает доминировать на рынке суперкомпьютерных ускорителей, однако успех Intel Xeon Phi налицо. Примечательно, что, по данным NVIDIA, 23 из 24 новых GPU-ускоренных систем в списке построенным на базе Tesla.
NVIDIA Tesla K80
«Я верю, что в один прекрасный день GPU-ускорение будет доступно у всех суперкомпьютеров мира», — сказал Дженсен Хуанг (Jen-Hsun Huang), соучредитель и генеральный директор NVIDIA. «К GPU-ускоряемым вычислениям уже обратились ведущие суперкомпьютерные центры мира, что нашло отражение в актуальной версии списка TOP500. Учитывая, что темп научных открытий растет и ученые все чаще обращаются к вычислениям, машинному обучению и визуализации, в будущем эта тенденция только усилится».
Intel Xeon Phi в составе Tianhe 2
Согласно данным последнего исследования компании Intersect360 Research, почти 70 % из 50 самых популярных HPC-приложений — и 90% из 10 ведущих — поддерживают GPU-ускоренные вычисления. Таким образом, всё указывает на то, что доля графических процессоров в суперкомпьютерах продолжит расти в ближайшие годы.
«Ландшафт индустрии HPC сегодня серьезно изменился, и произошло это благодаря графическим процессорам NVIDIA Tesla», — отметил Эддисон Снелл (Addison Snell), один из авторов исследования, генеральный директор Intersect360 Research. «Применение ускорителей и число GPU-ускоренных версий ведущих HPC кодов неуклонно растет».
Tianhe 2 остаётся самым мощным суперкомпьютером
В верхней части нового списка из пятисот самых мощных суперкомпьютеров в мире, который был выпущен на этой неделе, не произошло существенных изменений.
Самым мощным суперкомпьютером на планете по-прежнему является китайский Tianhe 2, спроектированный оборонным научно-техническим университетом народно-освободительной армии Китайской Народной Республики и компанией Inspur. Он способен выполнять 33,86 квадриллионов операций с плавающей запятой в секунду (33,86 петафлопс). Данная система базируется на процессорах Intel Xeon E5-2692v2 (двенадцать ядер, тактовая частота 2,2 ГГц), а также использует 48 тысяч сопроцессоров Xeon Phi Intel 31S1P. В общей сложности, Tianhe 2 располагает 3,12 миллионами x86-ядер.
Суперкомпьютер Tianhe 2
На втором месте находится суперкомпьютер Titan, который установлен в национальной лаборатории Ок-Ридж (Oak Ridge) министерства энергетики США, и обладает мощностью 17,59 петафлопс. Данная система представляет собой кластер Cray XK7 c шестнадцатиядерными AMD Opteron и ускорителями NVIDIA Tesla K20X.
Третья по мощности HPC-система в мире — Sequoia — может выполнять 17,173 квадриллионов операций с плавающей запятой в секунду и принадлежит Ливерморской национальной лаборатории министерства энергетики США имени Э. Лоуренса (Lawrence Livermore National Laboratory, LLNL). Система использует 98 304 процессора IBM Power BQC (шестнадцать ядер, частота 1,60 ГГц) и была построена IBM.
Суперкомпьютер Ломоносов 2
Самым мощным суперкомпьютером в России остался Ломоносов 2, который имеет мощность 1,849 петафлопс (36 место в рейтинге). Данная система была построена компанией T-Platforms для МГУ имени М.В. Ломоносова на базе процессоров Intel Xeon E5-2697v3 (14 ядер, 2,60 ГГц) и ускорителей NVIDIA Tesla K40m.
Источник: https://3dnews.ru/923799
csef.ru
Опубликован рейтинг суперкомпьютеров Top500 на июнь 2016 года, Китай представил 100 ПФлопс суперкомпьютер
Новый суперкомпьютер разработан Национальным исследовательским центром параллельной вычислительной техники и технологий КНР (National Research Center of Parallel Computer Engineering & Technology). Размещена система в Национальном центре суперкомпьютеров в городе Уси провинции Цзянсу на востоке Китая.
В основе суперкомпьютера лежат новые китайские процессоры семейства ShenWei — SW26010 с оригинальной 64-битной RISC-архитектурой, предположительно изготовленные по технологии 28 нм. Каждый процессор оснащен 260 ядрами, работает на частоте 1.45 ГГц и имеет производительность 3.06 терафлопс. Процессор был разработан в Shanghai High Performance IC Design Center. Процессор состоит из 4 сходных блоков ядер (core groups), соединенных встроенной сетью на кристалле. В каждом блоке имеется одно управляющее ядро (Management Processing Element, MPE), контроллер памяти DDR3 (128 бит) и 64 вычислительных ядра (Computing Processing Elements, CPE) в массиве 8x8. Оба типа ядер имеют микроархитектуру с внеочередным исполнением команд. Управляющие MPE-ядра поддерживает исполнение как операционной системы, так и пользовательского кода, использует 264-битные векторные операции, содержит по 32 КБ кеш-памяти первого уровня инструкций и данных и 256 КБ кеш-памяти второго уровня. Вычислительные CPE-ядра могут исполнять лишь пользовательский код с 264-битными векторами, они используют 16 КБ кеш-памяти инструкций и 64 КБ временной памяти (Scratch Pad Memory). Каждый из 4 блоков ядер имеет доступ к 8 ГБ оперативной памяти DDR3-2133, таким образом, в узле установлено 32 ГБ ОЗУ с общей пропускной способностью до 136,5 ГБ/с.
Производительность SIMD-вычислений на ядрах MPE составляет 16 плавающих операций двойной точности (64-бита) за такт, на ядрах CPE — 8 операций за такт. Общая производительность MPE-ядер на частоте 1.45 ГГц может достигать 23.2 гигафлопсов, CPE-ядер — 11,6 гфлопс.
Всего в суперкомпьютере используется более 10,6 миллионов ядер в составе 40960 однопроцессорных узлов в 40 вычислительных стойках. В каждой стойке установлено 4 суперузла, суперузел состоит из 32 модулей по 8 узлов на каждом. Модули имеют водяное охлаждение. Подробностей об основной сети суперкомпьютера немного, известно, что каждый чип SW26010 имеет PCI Express 3 (16x) подключение к трёхуровневой сети «Sunway Network». Диаметр сети — 7, «bisection bandwidth» — 70 ТБ/с. Донгарра сообщил, что используются чипы Host Channel Adapter и коммутаторов компании Mellanox, с пропускной способностью канала на уровне около 12 ГБ/с (100 Гбит/с) и задержками порядка 1 мкс.
Вычислительная эффективность на тесте HPL (Linpack) составила 74% от теоретической производительности. В то же время на более сложном тесте HPCG система показала лишь 0.3% от пикового уровня (некоторые системы достигают 1-3%), что свидетельствует об относительно медленной памяти и недостаточной пропускной способности сети. Для SW26010 соотношение пиковых флопсов к пропускной способности памяти составляет 22.4 флоп/байт (для сравнения, у Intel Knights Landing 7.2 флоп/байт). Также Донгарра отметил, что в системе сравнительно немного оперативной памяти, всего 1.3 ПБ (у Tianhe-2 — 1.4 ПБ, у американского Titan, занимающего уже 3-е место в Top500 — 0.71 ПБ).
Среднее энергопотребление суперкомпьютера во время исполнения теста HPL составляло 15,3 МВт (что несколько меньше чем 17 МВт у Tianhe-2), максимальное — чуть менее 18 МВт. По оценкам Донгарры, энергоэффективность составила 6 гигафлопс на Ватт (учитывалось потребление процессора, памяти и сети). Новый суперкомпьютер занял третье место в рейтинге green500.org (более энергоэффективны RIKEN Shoubu c 6,6 гфлопс/Вт и RIKEN Satsuki с 6,2 гфлопс/Вт).
Операционная система суперкомпьютера, Sunway Raise OS 2.0.5, основана на Linux. Пользователям предлагаются компиляторы C/C++, Fortran, утилиты автоматической векторизации, математические библиотеки. Утилита Sunway OpenACC предлагает поддержку стандарта OpenACC 2.0 для упрощения программирования многоядерных процессоров.
Стоимость создания суперкомпьютера — 1.8 млрд юаней, около 270 миллионов долларов США.
Наиболее подробная информация о суперкомпьютере доступна в статье основателя рейтинга Джека Донгарры: Jack Dongarra, Report on the Sunway TaihuLight System, June 2016, http://www.netlib.org/utk/people/JackDongarra/PAPERS/sunway-report-2016.pdf; иллюстрации из статьи «The Sunway TaihuLight Supercomputer: System and Applications», by Fu H H, Liao J F, Yang J Z, et al., принятой к публикации в Sci. China Inf. Sci., 2016, 59(7): 072001, doi: 10.1007/s11432-016-5588-7. Также опубликовано несколько слайдов из презентации TOP500 & Green500 Awards на ISC 2016:
habr.com
Рейтинг суперкомпьютеров TOP500: самые интересные факты / ServerNews
В ходе конференции SC16, проходящей в Солт-Лейк-Сити, представлена сорок восьмая редакция списка самых быстрых суперкомпьютеров мира TOP500. Интересно наблюдать за сражением двух лидеров отрасли — Китая и США. В этом году они идут практически на равных по количеству систем в списке и их совокупной мощности, но с точки зрения престижа Китай выигрывает, занимая первую и вторую строчки рейтинга.
Самый быстрый суперкомпьютер в мире Sunway TaihuLight
По-прежнему недосягаемым лидером остаётся Sunway TaihuLight с производительностью 93 петафлопс. Эта монструозная система включает почти 11 миллионов вычислительных ядер, а её потребляемая мощность достигает 15,4 МВт. За ней следует Tianhe-2 с производительностью 34 петафлопс. По энергоэффективности она существенно уступает лидеру. При количестве ядер 3,1 млн и в три раза меньшей производительности Tianhe-2 потребляет 17,8 МВт электроэнергии. Третью позицию занял суперкомпьютер Titan из США с производительностью 17,6 петафлопс. Также системы США завоевали четвёртую и пятую строчки рейтинга — Sequoia и Cori. Шестое и седьмое места удерживает Япония со своими системами Oakforest-PACS и легендарным K Computer, который, напомним, был построен ещё в 2011 году и стал первым в истории компьютером, преодолевшим рубеж 10 петафлопс. Далее в рейтинге следуют шведская разработка Piz Daint и две системы из США — Mira и Trinity.
Другой суперкомпьютер из Китая Tianhe-2 в этом году занял вторую позицию
По количеству суперкомпьютеров с списке TOP500 вслед за Китаем и США следует Германия с показателем 31. Япония занимает четвёртую позицию с количеством систем 27. Далее следуют Франция (20), Великобритания (13). Китай и США теперь включают по 171 суперкомпьютеру, хотя ещё год назад США были явным лидером, имея в TOP500 200 систем против 108 у Китая.
Совокупная производительность всех систем в списке составила 672 петафлопс, что на 60 % выше по сравнению с прошлым годом. Вклад суперкомпьютеров США в этот результат составляет 33,9 %, Китая — 33,3 %. Интересно отметить, что в рейтинге уже насчитывается 117 систем, преодолевших рубеж в 1 петафлопс.
Что касается энергоэффективности, то лидером здесь является система DXG SATURNV, разработанная компанией NVIDIA. Её особенностью являются новые ускорители P100, которые обеспечили 3,3-петафлопсному кластеру энергоэффективность 9,46 гигафлопс на ватт. Второе место занимает уже упомянутая выше система Piz Daint с показателем 7,45 гигафлопс на ватт.
Из 86 систем, использующих сопроцессоры в виде видеочипов, 60 оснащены NVIDIA GPU, 21 — Intel Xeon Phi, 1 — AMD FirePro, 1 — PEZY-технологией, 3 — одновременно используют NVIDIA GPU и Xeon Phi. Процессоры Intel используются в 92,4 % суперкомпьютеров. Количество систем на базе IBM Power составило 22. Доля AMD продолжает снижаться — теперь на её процессорах построено всего 7 систем из списка TOP500. Что касается коммуникационных технологий, то наиболее активно используются InfiniBand (187 систем), Gigabit Ethernet (206 систем), 10G Ethernet (178 систем), Intel Omni-Path (28 систем).
Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Источник:
servernews.ru