Мир: Китай догнал США по количеству суперкомпьютеров, представленных в рейтинге TOP500

0

На днях в Солт-Лейк-Сити прошла конференция SC16, посвященная суперкомпьютерам. Частью мероприятия стала публикация очередной, 48 по счету, редакции рейтинга суперкомпьютеров TOP500, обновляемого каждые полгода.

На первом месте находится китайский суперкомпьютер Sunway TaihuLight, разработанной научным центром NRCPC (National Research Center of Parallel Computer Engineering & Technology) для китайского национального суперкомпьютерного центра в городе Уси, которая в этом году сместила своего “соотечественника” – шестикратного чемпиона Tianhe-2. Итоговая производительность Sunway TaihuLight в тесте Linpack составляет 93 PFLOPS (1015 вычислений с плавающей запятой в секунду), а пиковая – 125 PFLOPS. В активе Sunway TaihuLight, построенном на базе 260-ядерных процессоров ShenWei SW26010, суммарно насчитывается 10 649 600 ядер.


Обладатель второго места списка – хорошо известный по предыдущим редакциям рейтинга “Млечный путь-2” – демонстрирует в тесте Linpack результат 33,86 PFLOPS. В нем установлены 12-ядерные процессоры Intel Xeon E5-2692 и ускорители Intel Xeon Phi 31S1P, а общее число ядер составляет 3 120 000.

Третье место закреплено за американским суперкомпьютером Titan (Cray XK7), в котором используются 16-ядерные процессоры AMD Opteron 6274 и ускорители NVIDIA K20x. Всего суперкопьютер содержит 560 640 ядер, демонстрируя производительность в 17,6 PFLOPS.

По сравнению с предыдущей редакцией списка в первой десятке есть две новые системы: это Cori (Cray XC40, 14 PFLOPS, США) и Oakforest-PACS – PRIMERGY (CX1640 M1, 13,6 PFLOPS, Япония) на пятой и шестой позициях соответственно.

Любимчик публики – суперкомпьютер с забавным названием Piz Daint, установленный в швейцарском Национальном центре суперкомпьютерных вычислений в Лугано, недавно пережил модернизацию в виде ускорителей нового поколения NVIDIA P100 Tesla, в результате чего его производительность возросла на 3,5 PFLOPS, достигнув 9,8 PFLOPS. Именно это и помогло Piz Daint удержать 8 место. К слову, этот суперкомпьютер является вторым по показателю энергоэффективности (удельная производительность на 1 ватт энергии) в рейтинге TOP500 и проигрывает только системе DGX SATURNV, принадлежащей NVIDIA, в которой используются новые ускорители NVIDIA P100 Tesla, – 7,45 GFLOPS на 1 Вт против 9,46 GFLOPS на 1 Вт. К слову, ожидается, что первые эксафлопсные системы будут демонстрировать по меньшей мере 50 GFLOPS на 1 Вт, улавливаете разницу?

За год количество китайских суперкомпьютеров в списке увеличилось со 109 до 171. Таким образом, по количеству суперкомпьютеров Китай сравнялся с США. Интересно, что год назад американских суперкомпьютеров в списке было ощутимо больше – 200. Таким образом, суммарно на США и Китай приходится две трети списка. Паритет между США и Китаем наблюдается не только в абсолютном выражении, но и по суммарной производительности. Так, на американские суперкомпьютеры приходится 33,9% производительности всех систем в списке, на китайские – 33,3%. Следом самыми суперкомпьютерными странами идут Германия (31 суперкомпьютер), Япония (27), Франция (20) и Великобритания (13).

Почти четверть списка систем – 117 штук – характеризуются производительностью свыше одного PFLOPS. Это на 36 больше, чем было в прошлом году.

В общей сложности 96 систем используют многоядерные процессоры с ядрами общего и специального назначения. В прошлом году таких систем было 104. Из 86 систем списка TOP500, в конфигурации которых используются сопроцессоры, 60 основаны на GPU NVIDIA, еще 21 используют Intel Xeon Phi, один полагается на AMD FirePro, один – на PEZY и три сочетают в себе GPU NVIDIA и Intel Xeon Phi. Еще 10 систем в качестве основы используют новейшие сопроцессоры Xeon Phi поколения Knights Landing.

Компания Intel продолжает удерживать титул главного поставщика процессоров для суперкомпьютера – решения этой компании используют 462 системы (92,4% списка). Еще 22 системы построены на процессорах IBM Power. Доля AMD продолжает снижаться – за полгода количество систем с процессорами AMD сократилось с 13 до 7.

И в заключение отметим, что за год общая производительность всех систем в списке выросла на 60%, достигнув 672 PFLOPS, а минимальный порог попадания в список поднялся с 206,3 TFLOPS до 349,3 TFLOPS. (Новости/NovostIT)