Szerző: Asztalos Olivér

2021. április 28. 12:33

Az ARM új magokkal harapna nagyobbat a szerverpiacból

Legújabb adatközpontos fejlesztéseiről beszélt az ARM. Az angliai központú tervezőcég két fontos terméket is bejelentett, melyek nyilvánvaló célja, hogy szabad szemmel látható mértékűre növeljék az ARM szerverpiaci részesedését.

A processzortervező két új platformmal igyekszik mélyebb nyomot hagyni az kiszolgálók piacán. Míg a Neoverse V1-et elsősorban HPC-s, azaz szuperszámítógépes munkafolyamatokhoz igazítja az ARM, addig Neoverse N1 közvetlen utódjaként érkező, scale-out filozófiára épülő N2-t leginkább felhős adatközpontokba szánja.

Hogyan gyárt egy fejlesztő backdoort akár egy PDF exporttal?

Gyere el május 19-én biztonságos szoftverfejlesztés meetupunkra, és ott kiderül.

Hogyan gyárt egy fejlesztő backdoort akár egy PDF exporttal? Gyere el május 19-én biztonságos szoftverfejlesztés meetupunkra, és ott kiderül.

Az eltérő célpiac elsősorban különböző processzormagokat jelent majd. A Neoverse N1 az okostelefonos alkalmazásprocesszorokból jól ismert Cortex-A76-ra épített, amelyet az A77, végül pedig az Cortex-A78 követett a közelmúltban. Az N2 épp az A78, vélhetően A79 néven érkező utódjára alapozik. A mag érdekessége, hogy elsőként épít a közelmúltban bejelentett Armv9 utasításarchitektúrára, amely több, elsősorban kiszolgálós környezetben kiaknázható fejlesztést is tartalmaz.

rmap1

Az egyik ilyen a vektoros műveletek gyorsabb és hatékonyabb végrehajtásához beépített SVE (Scalable Vector Extensions) második iterációja, amely többek között adatpárhuzamosság terén jelent előrelépést. Az elődhöz hasonlóan a SVE2-nél a vektorok hossza az aktuális igényeknek megfelelően rugalmasan, 128 bites lépcsőkben variálható a 128 és 2048 bit közötti tartományban. A Neoverse N2-be két darab 128 bites pipeline hajtja majd végre a műveleteket, amely a felhős célpiacot tekintve logikus, hisz ilyen környezetben jellemzően nincsenek hatalmas vektorokat megmozgató alkalmazások. Az ARM számításai szerint ezen a téren 20-90 százalékos gyorsulást hozhat majd az N2, megfelelő optimalizáció mellett.

A Neoverse N2 ezzel együtt a PPA-ra, vagyis a "Performance, Power, Area" hármasra, illetve azok egyensúlyára helyezi a hangsúlyt. Mindez ugyanakkor nem jelenti azt, hogy az N1-hez képest ne hozna jelentős előrelépést az utód. Az ARM kifejezetten nagy, 40 százalékos IPC növekedésről beszél, vagyis elméletben ekkora gyorsulást hozhat az N2 azonos magszámot és órajelet alapul véve. Az érték kifejezetten magas, ám érdemes figyelembe venni, hogy az N1-hez képest egy három generációval újabb mag adja majd az alapokat. Szintén számításba kell venni, hogy az N2 5 nanométeres eljárással készül majd, amely minden bizonnyal több, akér 128 darab magot és magasabb órajelet is jelent majd.

rmap2

A kiegyensúlyozottság jegyében tervezett Neoverse N2-vel szemben a HPC-hez igazított Neoverse V1-nél a teljesítménymaximalizálást tűzte ki célul az ARM. Ennek megfelelően a V1 a tavaly bemutatott Cortex-X1-re épül. Az X1 alapvető dizájnja sokban hasonlít az Cortex-A78-éra, ám fontos különbség, hogy fentebb már említett teljesítmény-fogyasztás-méret triónak szinte csak az első tagjára fókuszál. Ez persze már az alapvető teljesítmény-paraméterekben is tükröződik, hisz például azonos órajel mellett az X1 22 százalékos teljesítménybeli előrelépést ígér a Cortex-A78-hoz képest egészszámos (integer) műveleteknél.

A Neoverse V1 esetében mindezt erősebb SVE végrehajtással fejeli meg, a magok ugyanis kettő darab 256 bites SIMD futószalagon számolhatják majd ki a vektoros műveleteket. A célpiacot, vagyis a szuperszámítógépes rendszereket tekintve ez tökéletesen érthető, hisz a különféle, komplexebb lebegőpontos műveletek előfordulása ilyen környezetben a leggyakoribb. A nagy pontosságot kívánó végrehajtás mellett a mindössze 16 bites bFloat16 utasítás támogatása is bekerült V1-be, amivel elsősorban különféle gépi tanulásos kódokat képest gyorsabban végrehajtani a CPU.

neov_bench

A Neoverse V1 egyébként 8 utasítás széles, amely még az ARM, jellemzően szélesebb mikroarchitektúrái között is kiemelkedőnek számít. A tervezőcég ígérete szerint a V1 nagyjából 50 százalékos gyorsulást hozhat a kvázi előd N1-hez képest. Az ARM 5 nanométeres referenciadizájnja 96 darab processzormagot kínál 2,7 GHz mellett, amely ütőképes számítási teljesítményt sejtet.

Az ARM előzetes kalkulációi szerint mind a Neoverse V1, mind pedig az N2 versenyképes lesz. A teljes képhez ugyanakkor érdemes hozzávenni, hogy a tervezőcég a már piacon lévő Intel és AMD processzorokhoz mérte fejlesztéseit, miközben azok csak valamikor 2022-ben jelennek meg. Jövőre mindkét x86-os konkurens újabb szerverprocesszorokat hoz, így a következő generációs Neoverse fejlesztések pontos versenyképességére csak ekkor derülhet majd fény.

graviton2_exp

Utóbbitól függetlenül az ARM friss szerveres fejlesztéseinek bőven lehet létjogosultságuk, amit többek között az első generáció, vagyis a Neoverse N1 iránti érdeklődés is megerősíti. Az N1 az Amazon adatközpontjába is bekerült, nem is kis mennyiségben. Az ARM adatai szerint a tavalyi évben az N1-re épülő Graviton2 tette ki az adatközpontos bővítések 49 százalékát, miközben a másik két gyártónak (Intel és AMD) már csak 35 és 19 százalék jutott.

a címlapról