Szerző: Asztalos Olivér

2015. november 25. 17:10

Az Imagination partnereként menetel tovább a PEZY

A PEZY-SC sikerei után magasabbra törnének a japánok. A PEZY-SC2 négyszer több végrehajtót és 64 bites MIPS processzormagokat fog tartalmazni, így a többszörös tempó mellett már az operációs rendszer futtatása is megoldott lesz.

A japán PEZY Computing szinte a semmiből bukkant fel néhány évvel ezelőtt. Az alig két tucat mérnökkel dolgozó cég a második generációs HPC-s gyorsítójával rukkolt elő bő egy éve. A PEZY-SC közeli rokonságot ápol a GPU-kkal, ugyanakkor grafikai megjelenítéshez szükséges, HPC esetében kvázi felesleges részegységek kimaradtak, így shader, textúrázó, vagy éppen tesszelátor sem kapott helyet benne. A rendszer a grafikus processzorokhoz hasonlóan a magas szintű párhuzamosításra alapoz.

Nagy pénz, nagy szívás: útravaló csúcstámadó IT-soknak

Az informatikai vezetősködés sokak álma, de az árnyoldalaival kevesen vannak tisztában.

Nagy pénz, nagy szívás: útravaló csúcstámadó IT-soknak Az informatikai vezetősködés sokak álma, de az árnyoldalaival kevesen vannak tisztában.

A HPC gyorsítás szempontjából nem szükséges áramkörök helyére RISC mag (PE, processor element) kerülhetett, egyetlen lapkába összesen 1024 darab. Ezek négy, úgynevezett prefektúrába csoportosulnak, melyekhez egyenként tartozik 2 megabájtos L3 adatgyorsítótár, és egy 128 kilobájtos utasítás-gyorsítótár. A prefektúrák 16 darab alegységét városoknak hívja a PEZY. Ezekben a 4 darab "falu" mellett egy speciális végrehajtóegység, 64 kB L2 adatcache, és 32 kilobájt utasításcache található. A falukon belül, azaz a legalacsonyabb szinten négy darab, két blokkra osztott, 2-2 kilobájt L2 adatgyorsítótárral rendelkező feldolgozó lapul, melyek nyolc szálon képesek utasításokat végrehajtani. A sok feldolgozóhoz masszív memóriasávszélesség dukál. Az 512 bites vezérlővel szerelt alapverzió DDR3 vagy DDR4 memória segítéségével 153,36 GB/s-os átviteli tempóra képes.

A PEZY-SC-re épülő, négy chipet tartalmazó gyorsítókártyák képességét, illetve elsősorban energiahatékonyságát jól szemlélteti, hogy idén a GPGPU-k már nem tudtak labdába rúgni a zöld szuperszámítógépek versenyében. A rangsort vezető Green500-at továbbra is a Shoubu uralja 7031,58 MFLOPS/W-os hatékonyságával, mely gép PCI Express 3.0-s csatolóba illeszthető PEZY-SC gyorsítókártyákból és Xeon E5-2618Lv3 processzorokból épült fel.

PEZY-SC2: a Knights Landing nyomdokain

A PEZY már javában dolgozik harmadik generációs, PEZY-SC2 nevű gyorsítóján. A lapka pontos részleteiről egyelőre nem sok információt tudni, ugyanakkor az borítékolható, hogy a magok száma jelentősen nőni fog. A hírek szerint az új modell nem kevesebb mint 4096 darab PE-t fog felvonultatni, ami négyszer több egységet jelentene a PEZY-SC-hez képest. Ehhez a számhoz ugyanakkor már fejlettebb gyártástechnológiára is szükség lesz. Az aktuális generáció a TSMC 28 nm-es csíkszélességével készül, a PEZY-SC2 viszont bizonyára a tajvaniak 16 nanométeres FinFET eljárását fogja alkalmazni.

A legnagyobb újítás mégsem ez lesz. A PEZY-SC a teljes lapka vezérléséhez két darab belépőszintű, ARM926-os processzormagot alkalmaz. A fejlesztés alatt álló verzió ezeket erősebb, 64 bites MIPS magokra cseréli. Az Imaginationnel kötött együttműködés alapján a PEZY-SC2 az "I" kategóriás Warrior processzorcsalád I6400 nevű magjait fogja alkalmazni. Ez ideális választás, hisz az utasításarchitektúra megfelelően illeszkedik a HPC szegmens igényeihez. A 128 bites SIMD egység mellett az SMT (simultaneous multi-threading) segítségével akár négy végrehajtószállal is operálhat egyetlen mag, valamint a hardveres virtualizáció is támogatott. Egyetlen koherens I6400 klaszterben hat mag kaphat helyet, míg egy lapkában akár 64 ilyen klaszter is elhelyezhető.

A MIPS I6400 magok segítségével a PEZY-SC2 egymagában képes lesz az operációs rendszer futtatására, ergo akár gazdaprocesszor nélkül is működőképes lesz. A CPU magok és a végrehajtók egyazon lapkán való elhelyezésének további előnye a nagyobb sávszélességet, illetve alacsonyabb késleltetést nyújtó kapcsolat lehetősége.

Nem véletlen, hogy az irány a Knights Landing esetében látottakra hajaz. Az új Xeon Phi hasonló módon, akár egymagában is alkalmazható lesz a fejlett x86-os processzormagoknak köszönhetően, ami előrevetíti a HPC-s gyorsítók jövőjét.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról