Szerző: Asztalos Olivér

2018. június 26. 14:41

TOP500: Amerika átvette a vezetést

Sokat kellett várni a szuperszámítógépes trónfosztásra, ami az IBM és az Nvidia fejlesztéseinek hála a korábbi listavezető Amerika nevéhez fűződik.

Körülbelül két évre volt szükség, hogy az USA átvegye (vagy visszavegye) a vezetést a szuperszámítógépek 500-as nemzetközi rangsorában, amely pozícióban legutóbb 2012 novemberében volt. Az Egyesült Államok ehhez egy teljesen új, Summit névre keresztelt rendszert épített, amely IBM POWER9 processzorokból, illetve Nvidia Volta V100 gyorsítókból áll. Ezzel a TOP500 listát nagyjából 24 hónapig vezető Sunway TaihuLight a második helyre csúszott vissza, a korábban ezt a helyet elfoglaló Tianhe-2 pedig már csak a negyedik, köszönhetően az ugyancsak a hetekben csatasorba állt másik amerikai fejlesztésnek, a Sierrának. A két gép mellett több más amerikai rendszer is beférkőzött az első tízbe, amelyek mellé két kínai, egy japán, illetve egy svájci szuperszámítógép található.

top500_15

A vadiúj listavezető Summit nem a semmiből ugrott elő, hisz a rendszerről, illetve az alap összetevőknek számító POWER9 processzorokról és Volta gyorsítókról már bő két éve is lehetett hallani, akárcsak az ambiciózus 200 petaflopsos elméleti csúcsteljesítményről. A szuperszámítógép az IBM AC922 architektúráját használja és összesen 4356 node-ból áll, amelyek mindegyike két 22 magos POWER9 processzort és hat Nvidia Tesla V100-as gyorsítót tartalmaz. Előbbiekből összesen 9216 darab található a Summitban, amely 202 752 processzormagot jelent. A node-ok közötti kommunikációt a Mellanox-féle dual-rail EDR InfiniBand biztosítja, ami brutális, 200 gigabites sávszélességet ad minden szervernek.

A node-ok mintegy fél terabájtnyi memóriát használnak, amelyhez az koherens NVLink 2.0 összeköttetésnek hála mind a CPU-k, mind a GPU-k egységesen hozzá tudnak férni. Ezt egészíti ki 1600 gigabájt NVRAM (nem-volatilis memória) amely pufferként működik. A Summit teljes memóriakapacitása 10 petabájt, fogyasztása pedig papíron mintegy 13 megawatt. A TOP500 saját HPL (High Performance Linpack) mérése során utóbbi értéket nem érte el a rendszer, "csupán" 8,8 megawattig kúszott fel a mutató. Eközben a rendszer 122,3 petaflopsos (Rmax) eredményt produkált, amely 31,5 százalékkal múlja felül a korábbi listavezető Sunway TaihuLightot. Az Nvidia Tesla gyorsítóinak hála egyébként a Summit exaflops feletti teljesítményre is képes, ha nincs szükség az iparági szabványnak számító dupla pontosságú (FP64) műveletekre.

summit1

Toxikus vezetők szivárványa

Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

Toxikus vezetők szivárványa Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

Amennyiben ugyanis a Teslák egyedi Tensor Core 8 bites egészszámos utasításait használja a kód, akkor egy-egy lapka elméleti maximális sebessége a 125 teraopsot (TOPS) is eléri, amivel az egész gép akár 3,3 exaopsig is skálázódhat. A TOP500 Thomas Zachariát idézi, a szuperszámítógépet használó Oak Ridge National Laboratory igazgatója szerint a tesztüzemben a gépből sikerült már 1,88 exaopsot kisajtolni valós körülmények között. Ráadásul nem csak benchmarkokkal, hanem valódi számítási feladattal: a futó szoftver genom-adatokon futtatott mintázatfelismerést, kihasználva a Tesla tensorfeldolgozó képességét. "Ez az első alkalom, hogy bárki áttörte volna az exascale határt" - mondja Zacharia.

Ugyancsak említést érdemel a harmadik helyre beparkoló Sierra, amely gyakorlatilag a Summit kistestvérnek tekinthető. A 4320 node-ból felépülő szuperszámítógép ugyancsak 22 magos, ám valamivel magasabb, 3,1 GHz-es órajelű POWER9 processzorokra épül, a gyorsítók szerepét pedig ebben az esetben is Nvidia Teslák töltik be. Előbbiekből a rendszer 8640 darabot vonultat fel, amely 190 080 processzormagot jelent, amelyek számítási teljesítményét 17 280 darab V100 egészíti ki. Mindezzel a Sierra 71,6 petaflopsos (Rmax) eredményt ért el a TOP500 tesztjében, amivel körülbelül 41 százalékkal marad el a Summit tempójától.

Amerika vs. Kína: sokadik meccs

Bár a dobogón, illetve az első tízben is Amerika került az élre, a komplett 500-as listát nézve közel sem áll ilyen jól az ország, sőt, részesedését tekintve új mélypontot regisztráltak a készítők. Egy éve még az USA vezetett 169 rendszerrel, amely szám fél évvel később 145-re csökkent, mostanra pedig már csak 124 szuperszámítógépet regisztráltak az országban. Eközben Kínában továbbra is növekvő tendencia figyelhető meg. Egy éve még 160 darab rendszerrel rendelkezett a távol-keleti nagyhatalom, amely szám tavaly novemberre 202-re, mostanra pedig 206-ra nőtt.

top500_perfdev

A harmadik helyen Japán áll 36 rendszerrel, amely országnak ambiciózus szuperszámítógépes tervei vannak az következő néhány évre. Európai országot a negyedik pozícióban találni, ahol az Egyesül Királyság áll 22 rendszerrel, amelyet Németország és Franciaország követ 21, illetve 18 szuperszámítógéppel. A lista készítői kiemelik, hogy az 500 rendszer összteljesítménye először érte el az exaflopos tempót. A végeredmény egészen pontosan 1,22 exaflop lett, amely bár 44 százalékkal múlja felül a fél évvel ezelőtti 845 petaflopsot, a 2013-ig látott növekedési ütemtől ez továbbra is elmarad. Ugyancsak érdekes adat, hogy a rendszerek több mint felének teljesítménye lépi át a petaflopsos küszöböt, számszerűen 273 szuperszámítógép képes ilyen tempóra.

A gyártók versenye

Az 500 rendszerből 122 darabot (23,8 százalék) a Lenovo szállított le, amivel a kínai vállalat kiütötte korábbi vezető pozíciójából a HPE-t. Ezzel utóbbinak be kell érnie a második hellyel, a 79 listán lévő HPE szerver 15,8 százalékos részesedést jelent. Kína térnyerését mutatja, hogy a harmadik helyen az Inspur jár 68 leszállított rendszerével, a szuperszámítógépekre specializálódott Cray pedig 56 rendszerével csak az ötödik helyre volt jó. Bár önálló rendszerek tekintetében az IBM vette át a vezetést, a Nagy Kék mindössze 19 rendszerrel fért fel a listára, igaz ezek az 500 szuperszámítógép összteljesítményének 19,9 százalékát szolgáltatják.

top500_vendors

Processzorok tekintetében az Intel továbbra is toronymagasan vezet, sőt, a gyártó tovább növelte előnyét, ugyanis immár 476 rendszerben van Xeon processzor, amely 95,2 százalékos részesedést jelent. A második helyen az IBM POWER-ek állnak, és bár a három leggyorsabb rendszer közül kettő is a Nagy Kék fejlesztéseire épül, a részesedésen ez nem sokat változtatott, az egy évvel ezelőtti 14 darab szuperszámítógép helyett már csak 13-at hajt IBM fejlesztés.

top500_acc

Az Intel processzoros kvázi egyeduralma nem egyedülálló, a gyorsítókat tekintve ugyanis hasonlón erős pozícióban van a konkurens Nvidia. Az 500 rendszerből 110 darab tartalmaz dedikált gyorsítókat, amelyek közül 96 darab Tesla, ami 87,3 százalékos részesedést jelent. Xeon Phi csupán hét, PEZY pedig négy rendszerben van jelen, amely számok közül főleg előbbi részesedése lehet árulkodó. A Xeon Phi mellett ugyanis elhúztak a Teslák, a Volta megjelenése óta jóformán mindenki az Nvidia fejlesztéseit választja. Az Intelt vélhetően az sem vigasztalja, hogy a processzoros konkurens AMD sem áll jól a rangsorban, hisz mostanra gyakorlatilag teljesen kiestek a FirePro és Radeon kártyák az TOP500-as klubból.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról