Szerző: Bodnár Ádám

2011. április 6. 13:00

Elrajtolt a skálázódó Xeonok új generációja

Megérkezett a Xeon E7, kódnevén Westmere-EX processzorcsalád, amely a gyártástechnológiai fejlesztéseknek köszönhetően jelentős teljesítményfölényt mutat az előző generációhoz képest. A chipek ráadásul foglalatkompatibilisek a Xeon 7500 sorozattal, így gyorsan elterjedhetnek.

A vártnál korábban, szinte napra pontosan egy évvel a Nehalem-EX után megérkezett a skálázódó szerverekbe szánt Intel Xeonok legújabb generációja, a Westmere-EX - a vállalat tegnap nem kevesebb mint 18 új chipet dobott piacra. Ebben a piaci szegmensben viszonylag ritka az egy éves termékciklus, a tavaly áprilisban bemutatott Nehalem-EX (Xeon 7500) másfél évvel követte elődjét, a Dunningtont (Xeon 7400). Az Intel időzítése valószínűleg megelőző csapás az AMD-re, amely az év közepén kezdi el bevezetni teljesen megújult mikroarchitektúrára épülő Bulldozer processzorait.

Kis architekturális előny

Amint az ismert, a Westmere a Nehalem 32 nanométeres implementációjának tekinthető, a két chipgeneráció között a mikroarchitektúra szintjén minimálisak a különbségek, de ezek szerverfeladatok esetén jelentős hatással bírnak. A Westmere EX chipekbe bekerültek új utasítások, amelyek az AES kriptográfiai műveletek gyorsítására szolgálnak, ez tranzakcionális üzleti feladatok alatt jelenthet látványos teljesítménynövekedést - az Oracle szerint 11g R2 adatbázis alatt "egy nagyságrenddel" emelkedik a titkosítás sebessége az AES-NI utasítások használata esetén.

Javult a virtualizációs teljesítmény a virtuális gépek közötti gyorsabb váltás és az I/O megszakítások hatékonyabb kezelésének következtében , a "VMX Unrestricted mode" révén pedig akár 16 bites vendég operációs rendszerek is futhatnak és akár 1 gigabájtos memórialapok is támogatottak. A Westmere-EX megkapta a Tukwilában debütált DDDC (Double Device Data Collection) technológiát is, ami lehetővé teszi akár két egyidejű memóriahiba összeomlás nélküli kivédését is - a cél egyértelműen az üzleti kritikus feladatok kiszolgálása.

A mikroarchitektúra kisebb módosításai mellett a 32 nanométeres gyártástechnológia bevezetése  lehetővé tette a magok számának és a harmadszintű gyorsítótár méretének látványos növelését, illetve az órajelek emelését - ebben rejlik a Westmere-EX igazi ereje. A chipek kiviteltől függően 6, 8 vagy 10 két szál párhuzamos futtatására képes magot tartalmaznak, és 18, 24 vagy 30 megabájt L3 cache-t tartalmaznak. A magok és az L3 cache a Nehalem esetében megismert, chipre integrált full-duplex belső körbuszon kapcsolódnak össze.

A széleken a 2x5 mag, középen a hatalmas L3 cache

A Westmere-EX csúcsváltozatai 10 maggal és 30 megabájt L3 cache-sel rendelkeznek, így összesen 2,6 milliárd tranzisztorból állnak, ami 513 négyzetmilliméteren fér el. A chipek két darab kétcsatornás memóriavezérlőt integrálnak, azaz összesen négy memóriavezérlő-csatornával rendelkeznek, amelyekre legfeljebb 32 gigabájtnyi DDR3-1333 modul illeszthető. Az új processzorok mellé két memóriapuffer-chipet is piacra dobott az Intel (7510, 7512), amelyek használatával egy négyprocesszoros szerver 64 memóriafoglalatot is képes kiszolgálni és így akár 2 terabájt memóriát is fogadhat.

Jobb skálázódás

Az Intel az új Xeonokkal együtt új modellszámozást is bevezetett, a Westmere-EX processzorok Xeon E7 néven debütáltak. Az E7 család három sorozatból áll, a 28xx jelű chipeket kétfoglalatos, a 48xx jelűeket négyfoglalatos, a 88xx jelűeket pedig nyolc (vagy több) foglalatos gépekbe ajánlja a vállalat. A Xeon E7 sorozat tagjai egyenként négy QPI interfésszel rendelkeznek és nyolc foglalatig "glueless", vagyis külön vezérlőchip nélkül skálázódnak.

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A hatékony skálázódást segíti a Directory Assisted Snoopy (DAS), amelyet az Intel mérnökei már a Nehalem-EX sorozatba terveztek, de végül csak a Westmere-EX lapkákba került be. A DAS egy címtárral támogatott koherenciaprotokoll, amely nyilvántartást vezet arról, hogy a gyorstárba került egyes adatoknak melyik chipen melyik processzormag a gazdája, és ha vannak, melyeknél találhatóak még másolatok.

A DAS miatt csökken a processzorok közötti koherenciaforgalom, vagyis "hasznos" sávszélesség szabadul fel, valamint felgyorsul a közös adatokkal végzett munka is, mivel nem kell várni a lekérdezések feloldására, az adat elhelyezkedéséről, tulajdonosáról és használóiról szóló információk megtalálhatók a címtárban. A DAS bevezetésének köszönhetően nem romlik jelentősen a nyolc vagy ennél több Xeon E7-et tartalmazó szerverek skálázódása - ezt látszik alátámasztani, hogy a SPECjbb 2005 benchmarkban a nyolc Xeon E7-8870 chipet tartalmazó Fujitsu Primergy RX900 S2 teljesítménye 77 százalékkal múlja felül a négy E7-4870 processzorral szerelt Oracle Sun Fire X4470 M2-ét.

Az új Xeon E7 sorozat (kép forrás: The Register)

Nagyobb teljesítmény

A Xeon E7 processzorsorozat teljesítménye az Intel szerint átlagosan 40 százalékkal növekedett az előző generációhoz (Nehalem-EX, Xeon 7500) képest, ami leginkább a több magnak, a nagyobb cache-nek és a magasabb órajelnek a következménye. A pontos teljesítményadatok persze tesztről tesztre változnak, a tranzakciófeldolgozási képességet vizsgáló, I/O intenzív TPC-E benchmarkban a Xeon E7-4870 például "csak" 20 százalékkal előzte meg a Xeon 7560-at, a kétrétegű SAP S/D tesztben viszont pont 40 százalék az új Xeon előnye a régivel szemben négyfoglalatos konfigurációban.

Az eddig publikált SAP S/D teszteredmények egyébként jó lehetőséget adnak arra, hogy a Xeon E7 teljesítményét összehasonlítsuk néhány versenytárssal. A négyfoglalatos, 2,4 GHz-es, tízmagos E7-4870 processzorokkal felvértezett IBM System x3850 X5 közel másfélszeres teljesítményt nyújt a négy darab, 2,5 GHz-es tizenkét magos magos Opteron 6180SE-vel felszerelt HP DL585 G7 szerverrel összevetve és nem sokkal kap ki a szintén négyfoglalatos IBM Power System 750-től, amely 3,55 GHz-es nyolcmagos Power7 processzorokat vonultat fel - a különbség 11 százalék a Power7 javára.

Rövidesen piacon

A Westmere-EX generáció az elődjével azonos (LGA1567) foglalatba illeszkedik, vagyis a használatához nem kell áttervezni a szervereket, legfeljebb egy BIOS-frissítés szükséges. Az Intel már régóta szállítja az új Xeonokat, így azok a következő hónapok során, még a teljesen új mikroarchitektúrát felvonultató AMD Bulldozer kereskedelmi rajtja előtt megjelenhetnek a nagy szervergyártók kínálatában. Az Intel közleménye szerint a  HP, Dell, IBM, Fujitsu, SGI, Oracle, Cisco és más vállalatok már 35 különféle szervermodellt jelentettek be, amelyekben Xeon E7 processzorok dolgoznak.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról