Szerző: Asztalos Olivér

2015. november 25. 17:10

Az Imagination partnereként menetel tovább a PEZY

A PEZY-SC sikerei után magasabbra törnének a japánok. A PEZY-SC2 négyszer több végrehajtót és 64 bites MIPS processzormagokat fog tartalmazni, így a többszörös tempó mellett már az operációs rendszer futtatása is megoldott lesz.

A japán PEZY Computing szinte a semmiből bukkant fel néhány évvel ezelőtt. Az alig két tucat mérnökkel dolgozó cég a második generációs HPC-s gyorsítójával rukkolt elő bő egy éve. A PEZY-SC közeli rokonságot ápol a GPU-kkal, ugyanakkor grafikai megjelenítéshez szükséges, HPC esetében kvázi felesleges részegységek kimaradtak, így shader, textúrázó, vagy éppen tesszelátor sem kapott helyet benne. A rendszer a grafikus processzorokhoz hasonlóan a magas szintű párhuzamosításra alapoz.

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

A HPC gyorsítás szempontjából nem szükséges áramkörök helyére RISC mag (PE, processor element) kerülhetett, egyetlen lapkába összesen 1024 darab. Ezek négy, úgynevezett prefektúrába csoportosulnak, melyekhez egyenként tartozik 2 megabájtos L3 adatgyorsítótár, és egy 128 kilobájtos utasítás-gyorsítótár. A prefektúrák 16 darab alegységét városoknak hívja a PEZY. Ezekben a 4 darab "falu" mellett egy speciális végrehajtóegység, 64 kB L2 adatcache, és 32 kilobájt utasításcache található. A falukon belül, azaz a legalacsonyabb szinten négy darab, két blokkra osztott, 2-2 kilobájt L2 adatgyorsítótárral rendelkező feldolgozó lapul, melyek nyolc szálon képesek utasításokat végrehajtani. A sok feldolgozóhoz masszív memóriasávszélesség dukál. Az 512 bites vezérlővel szerelt alapverzió DDR3 vagy DDR4 memória segítéségével 153,36 GB/s-os átviteli tempóra képes.

A PEZY-SC-re épülő, négy chipet tartalmazó gyorsítókártyák képességét, illetve elsősorban energiahatékonyságát jól szemlélteti, hogy idén a GPGPU-k már nem tudtak labdába rúgni a zöld szuperszámítógépek versenyében. A rangsort vezető Green500-at továbbra is a Shoubu uralja 7031,58 MFLOPS/W-os hatékonyságával, mely gép PCI Express 3.0-s csatolóba illeszthető PEZY-SC gyorsítókártyákból és Xeon E5-2618Lv3 processzorokból épült fel.

PEZY-SC2: a Knights Landing nyomdokain

A PEZY már javában dolgozik harmadik generációs, PEZY-SC2 nevű gyorsítóján. A lapka pontos részleteiről egyelőre nem sok információt tudni, ugyanakkor az borítékolható, hogy a magok száma jelentősen nőni fog. A hírek szerint az új modell nem kevesebb mint 4096 darab PE-t fog felvonultatni, ami négyszer több egységet jelentene a PEZY-SC-hez képest. Ehhez a számhoz ugyanakkor már fejlettebb gyártástechnológiára is szükség lesz. Az aktuális generáció a TSMC 28 nm-es csíkszélességével készül, a PEZY-SC2 viszont bizonyára a tajvaniak 16 nanométeres FinFET eljárását fogja alkalmazni.

A legnagyobb újítás mégsem ez lesz. A PEZY-SC a teljes lapka vezérléséhez két darab belépőszintű, ARM926-os processzormagot alkalmaz. A fejlesztés alatt álló verzió ezeket erősebb, 64 bites MIPS magokra cseréli. Az Imaginationnel kötött együttműködés alapján a PEZY-SC2 az "I" kategóriás Warrior processzorcsalád I6400 nevű magjait fogja alkalmazni. Ez ideális választás, hisz az utasításarchitektúra megfelelően illeszkedik a HPC szegmens igényeihez. A 128 bites SIMD egység mellett az SMT (simultaneous multi-threading) segítségével akár négy végrehajtószállal is operálhat egyetlen mag, valamint a hardveres virtualizáció is támogatott. Egyetlen koherens I6400 klaszterben hat mag kaphat helyet, míg egy lapkában akár 64 ilyen klaszter is elhelyezhető.

A MIPS I6400 magok segítségével a PEZY-SC2 egymagában képes lesz az operációs rendszer futtatására, ergo akár gazdaprocesszor nélkül is működőképes lesz. A CPU magok és a végrehajtók egyazon lapkán való elhelyezésének további előnye a nagyobb sávszélességet, illetve alacsonyabb késleltetést nyújtó kapcsolat lehetősége.

Nem véletlen, hogy az irány a Knights Landing esetében látottakra hajaz. Az új Xeon Phi hasonló módon, akár egymagában is alkalmazható lesz a fejlett x86-os processzormagoknak köszönhetően, ami előrevetíti a HPC-s gyorsítók jövőjét.

Kubernetes képzéseinket már közel 300 szakember végezte el. A nagy sikerre való tekintettel a tanfolyamot aktualizált tananyaggal június 18-án újra elindítjuk! A 8 alkalmas, élő képzés képzés órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról