Mellékleteink: HUP | Gamekapocs
Keres

Green500: kiütötte a PEZY-t a Pascal

Asztalos Olivér, 2016. november 25. 12:51
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

Az Nvidia tette még zöldebbé a szuperszámítógépeket, a tervezőcég Pascal-alapú Tesla gyorsítójának hála nagyot ugrott a hatékonyság. A cég ugyanakkor nem lehet teljesen nyugodt, ugyanis a legújabb Xeon Phi gyorsítók is jó rajtot vettek.

Visszanézve vihar előtti csendnek tűnik az év eddigi része, ugyanis az elmúlt hónapok stagnálása után nagyot ugrott szuperszámítógépek hatékonysága az év végéhez közeledve - derült ki a friss Green500 jelentésből. A növekedés nagy részét az Nvidia korábban bejelentett csúcs gyorsítója, a Pascal-alapú Tesla P100 generálta, az új éllovas mellett már a második helyezettet is ezekkel látta el a tulajdonos.

A lista első helyét elfoglaló DGX Saturn V rendszerbe nem csak a saját gyorsítókat építette be az Nvidia, a komplett gépet a cég tervezte, illetve üzemelteti, elsősorban gépi tanuláshoz. A korábbi specifikációkkal ellentétben a rendszerbe Haswell-EP helyett Broadwell-EP processzorok kerültek, a húszmagos E5-2698v4 CPU-kból két darab dolgozik a 3U magas DGX-1 építőelemben, melyekhez összesen 512 gigabájt DDR4-2133 memória társul. A háttértár szerepét négy 1,92 terabájtos SSD látja el RAID 0-ban, a hálózati kapcsolatokért pedig két 10 gigabites Ethernet vezérlő felel.

Teslák szülőatyjai a DGX-1-gyel

Mindezek mellé összesen nyolc darab, mezzanine csatlakozós Tesla P100 gyorsítót sikerült beépíteni, az apró kártyák két sorban ülnek a foglalatokban. Ezzel félpontosságú műveleteknél közel 170, egyszeres pontosság esetében pedig 80 TFLOPS feletti tempó érhető el az összesen 28 672 CUDA-egységet felvonultató rendszerrel. A komplett DGX Saturn V szuperszámítógép összesen 124 darab, amúgy bárki számára elérhető DGX-1-et köt össze 100 Gb/s-es InfiniBand kapcsolattal, amihez a Mellanox szállítja az hálózati lapkákat. Az Nvidia korábban 129 000 dolláros árat ígért a valamivel olcsóbb Xeonokkal szerelt DGX-1-re, tehát DGX Saturn V teljes paici értéke bőven 16 millió dollár fölött lehet.

Saját részére összeállított szuperszámítógépével az Nvidia majd 42 százalékot vert rá teljesítmény/fogyasztás mutatóban a listát egy évig vezető, PEZY-SC gyorsítókra építő Shoubura. Míg utóbbi rendszer 6,67 GFLOPS/wattos értékkel rendelkezik, addig az új listavezető 9,46 GFLOPS/wattra képes, az előny tehát jelentős.

Az Nvidia rendszerét nagyobb lemaradással követi a svájci Piz Daint. A CSCS-ben (Swiss National Supercomputing Center) található Cray XC50 rendszer ugyancsak az Nvidia Tesla P100-aknak köszönhető új pozícióját. Az inézmény már nyár elején bejelentette, hogy a rendszerükben dolgozó 4500 darab Tesla K20X-et PCI Express csatolós Tesla P100-akra cserélteti. A fejlesztés mostanra lezárult, melynek eredménye nem csak egy nagyjából 3 petaflops-os gyorsulát lett, de a hatékonyság is nagyot nőtt, mutatója 3,19-ről 7,45 GFLOPS/wattra ugrott.

Az eddigi listavezető Shoubu változatlan értékekkel áll a dobogó legalsó fokán, a japán szuperszámítógép továbbra is Haswell-EP Xeon processzorokat és PEZY-SC gyorsítókat vonultat fel, melyek kombinációjával 6,67 GFLOPS/watt eredményre képes. A negyedik helyre a nyár során bemutatott Sunway TaihuLight hatékonysága volt elég, a kínai fejlesztésű gép 6,05 GFLOPS/watt eredményénél nagyjából 56 százalékkal jobb a DGX Saturn V értéke.

Homogén reneszánsz jön?

Érdekes irányt rajzol ki az első tíz helyezett, ugyanis az élmezőny szuperszámítógépeiből hat darab homogén, az első hármon túl csak a nyolcadik tekinthető heterogén rendszernek. A Sunway TaihuLight mellett ez öt darab Xeon Phire épülő gépet jelent, a Knights Landig ugyanis a CPU feladatát is képes ellátni, tehát a processzor az általános számításokkal is elboldogul, ezért hagyományos központi egység nem szükséges a rendszerbe. Ezzel együtt a hatékonyság is jó, az érték 3,84 and 5,61 GFLOPS/watt között mozog. Ez egyelőre odébb van a dobogós heterogén rendszerek értékétől, de érdekes lesz látni hogyan alakul homogén-heterogén csata a következő pár évben, sikerül-e még közelebb kerülni a gyorsítós rendszerekhez.

Ugyancsak említésre méltó, hogy a Green500 lista egy évtizedes történelmében először csökkent az 500 rendszer átlagfogyasztása. Ez azt jelenti, hogy miközben a rendszerek energiahatékonysága folyamatosan nő, azok mérete már nem változik számottevően, remélhetőleg ez a tendencia hosszabb távon is megmarad.

Utóbbi azért is kérdéses, mert a következő nagyjából egy évben nem várható nagyobb ugrás, a következő generációs GPU-k és Xeon Phi gyorsítók legkorábban jövő év második felében jelenhetnek meg, egyes fejlesztések piacra kerülése pedig 2018-ra is átcsúszhat.

Ez az első exascale rendszer(ek) megjelenésére is komoly hatással van, amihez a jelenlegi listavezető, egy MFLOPS-ra eső 105,7 milliwattos értékét kevesebb mint ötödére, 20 milliwattra kellene csökkenteni. Eközben Kína azon a véleményen van, hogy az érték duplájával, azaz 40 milliwattal is el lehet érni az az 1000 petaflopsos célt, amit Japánhoz hasonlóan 2020-ra szeretnének véghez vinni.