Szerző: Bodnár Ádám

2014. október 7. 13:25

Megjöttek a nagyobb POWER8 szerverek is

A POWER8 tavaszi premierjét követően az IBM most kiadta a nagyobb, négy- és nyolcfoglalatos rendszereit. A Power System E870 teljesítménye lenyűgöző.

Új gépekkel bővítette ki POWER8 processzoros szervereinek családját az IBM. A vállalat még áprilisban jelentette be az új processzor érkezését és akkor mutatta be az első szervereket, azonban akkor még csak egy- és kétfoglalatos rendszerek érkeztek. Most nagyobb konfigurációkkal bővült a kínálat.

A POWER8-ról dióhéjban

A POWER8 az IBM legújabb generációs RISC processzora, amely a tavaly őszi Hot Chips konferencián elhangzottak alapján számos területen képvisel nagy előrelépést az elődökhöz képest. A POWER8 már tizenkét magot állít csatasorba, amelyek egyenként 8 párhuzamos szálat futtatnak - az előd POWER7 legfeljebb 8 magot tartalmazott, amelyek 4 szálat kezeltek. A vállalat korábban nyilvánosságra hozott becslései szerint a POWER8 magjai egyszálú végrehajtás esetén a POWER7-hez képest 1,6-szoros, többszálú végrehajtás esetén pedig kétszeres teljesítménnyel rendelkeznek, az új processzor így összességében két és félszeres gyorsulást hoz a POWER7-hez képest egy foglalatra vetítve.

A POWER8 bevezeti a negyedszintű gyorsítótárat, amely az off-chip memóriavezérlő áramkörben kap helyet. A Centaur kódnéven fejlesztett lapka 16 megabájt L4 cache-t tartalmaz, egy processzorhoz legfeljebb 8 ilyen külső memóriavezérlő kapcsolódhat, egyenként 9,6 GBps sávszélességgel. A Centaur kezdetben DDR3 memóriát támogat, de később várhatók DDR4-et kezelő verziók is, az IBM ezzel úgy tudja a POWER8 memóriaarchitektúráját módosítani, hogy magához a processzorhoz nem kell hozzányúlnia. Egy processzor 1 terabájt operatív tárat kezel legfeljebb, de ez a hardveresen gyorsított memóriatömörítés segítségével hozzávetőleg kétszeres használható méretet jelent.

Nyolcfoglalatos POWER8 szerver relatív teljesítménye (100% = 8x Intel Xeon E7-8890 v2)

Az új enterprise gépek: E870 és E880

A most bemutatott gépek között a kisebbik a Power System 870. Ezek szerverek kiviteltől függően négy vagy nyolc foglalatosak, amelyekben 4,02 vagy 4,19 GHz-es processzorok kerülnek. A négyfoglalatos kivitelekben 32 vagy 40 processzormag lehet aktív, a nagyobb, nyolcmagos konfigurációban pedig 64 vagy 80 mag dolgozhat. A negyedszintű gyorsítótár foglalatonként 128 megabájt lehet legfeljebb, az operatív tár pedig a négyfoglalatos kivitel esetében 2 terabájt, a nyolcfoglalatos konfigurációnál 4 terabájt jelenleg, de 2015-ben a maximális kapacitás duplázódik a nagyobb memóriamodulok támogatásával. A bővíthetőségről a kisebb rendszer esetén 8, a nagyobbnál pedig 16 darab PCI Express Gen3 x16 aljzat biztosítja.

A másik új "enterprise" kategóriás gép a Power System E880, amely négy, nyolc vagy tizenhat foglalatig nyújtózhat, a csúcskivitel 192 processzormagig és 16 terabájt memóriáig skálázódik - igaz, ez a verzió csak 2015-ben lesz elérhető, a vevőknek egyelőre be kell érniük a nyolcfoglalatos kivitellel. Ebben a gépben is 16 PCI Express Gen3 x16 bővítősín áll rendelkezésre, emellett említésre méltó paraméter még bővíthetőség szempontjából az akár 256 DASD/SSD bővítőfiók, amelyekbe egyenként 24 darab SFF meghajtó építhető be. Az E870 és az E880 egyaránt 12U kivitelű, a gépeken AIX, IBM i vagy Linux operációs rendszer futtatható.

Az új gépek teljesítményadatait is publikálta az IBM. A tavaszi premier idején csak a kétfoglalatos gépek sebességadatai voltak hozzáférhetők, most a cég előállt a nyolcfoglalatos konfigurációk benchmarkeredményeivel is, megmutatva azt, hogy az alapvetően enterprise feladatok alá tervezett processzor mire képes egy nagy, enterprise kategóriás gépben.

Ezek alapján nagyon ütős a POWER8, az iparági szabványos tesztekben, nyolcfoglalatos konfigurációban rendre látványosan felülkerekedik a legerősebb Intel Xeonokon. Integer feladatvégrehajtás és Java feladatok futtatása alatt az előnye megközelíti a 40 százalékot, lebegőpontos feladatok alatt több mint 50 százalék, SAP SD benchmarkban pedig bő 60 százalék a POWER8 fölénye a legújabb azonos kategóriás Xeonhoz, az E7-8890 v2-höz mérve.

Magonkénti relatív teljesítmény. (100%= Intel Xeon E7-8890 v2)

Ráadásul az IBM gépe ezeket a teszteredményeket 80 maggal éri el, miközben a nyolcfoglalatos Xeon gépekben 120 mag dolgozik. Ezek alapján (a megadott tesztekben) a POWER8 magonkénti teljesítménye 200-240 százalékkal magasabb a Xeonnál. Tavasszal azt írtuk, ha a futtatott szoftver processzormagok alapján licencelt, felértékelődik a magonkénti teljesítmény szerepe a gazdaságossági számításoknál, az új POWER8 rendszerek pedig alaposan leiskolázzák a konkurenseket ebben a versenyszámban. Az IBM már korábban is megmutatta, nem fél agresszíven árazni a RISC/UNIX szervereit a Xeon-alapú szerverek ellen, és ez a jövőben valószínűleg még inkább így lesz, miután a vállalat a Lenovónak adta el x86 szerverbizniszét, megszabadulva a házon belüli konkurenciától.

Kétfoglalatos scale-out szerver Linuxszal, GPU-gyorsítással

A vállalat bemutatott egy Power System S824L jelű rendszert is, amelyet kifejezetten "scale out" feladatokra ajánl. Ebben a konfigurációban két processzor található (10 vagy 12 aktív maggal), a maximális memóriakapacitás pedig 1 terabájt. A szervert Ubuntu Linux operációs rendszerrel szállítja az IBM - innen ered a modellszám végén az L betű. A gép legnagyobb érdekessége azonban nem ez, hanem hogy a POWER processzoros rendszerek történetében először lehet bele NVIDIA GPU-kat építeni az arra alkalmas feladatok gyorsításához. Az IBM azt is bejelentette, számos alkalmazását kezdi el felkészíteni a GPU-k erejének kihasználására, köztük a DB2 adatbázist, illetve mérnöki-tudományos alkalmazásokat és könyvtárakat (SOAP3, NAMD, GROMACS, FFTW library,  Quantum Espresso).

Sőt, az IBM tájékoztatása alapján a jövőben olyan Power System rendszerek is érkeznek majd, amelyek NVIDIA NVlink segítségével kiküszöbölik a PCI Express skálázódási problémáit. Az NVLink lehetővé teszi a CPU és a GPU közvetlen összekapcsolását egy nagy sávszélességű interfészen keresztül, közvetítőlapkák és elosztók nélkül. Az NVIDIA ígérete szerint az NVLink elképesztően gyors lesz, egy blokk (8 sáv) 160 gigabites átvitelt tesz lehetővé, 20 gigatranszfer/másodperc sebesség mellett. A blokkok kombinálhatóak is, amivel az elméleti sávszélesség tovább skálázható. Az első, NVLinket támogató IBM szerverek 2016-ban érkeznek majd.

a címlapról