Szerző: Bodnár Ádám

2011. április 6. 13:00

Elrajtolt a skálázódó Xeonok új generációja

Megérkezett a Xeon E7, kódnevén Westmere-EX processzorcsalád, amely a gyártástechnológiai fejlesztéseknek köszönhetően jelentős teljesítményfölényt mutat az előző generációhoz képest. A chipek ráadásul foglalatkompatibilisek a Xeon 7500 sorozattal, így gyorsan elterjedhetnek.

A vártnál korábban, szinte napra pontosan egy évvel a Nehalem-EX után megérkezett a skálázódó szerverekbe szánt Intel Xeonok legújabb generációja, a Westmere-EX - a vállalat tegnap nem kevesebb mint 18 új chipet dobott piacra. Ebben a piaci szegmensben viszonylag ritka az egy éves termékciklus, a tavaly áprilisban bemutatott Nehalem-EX (Xeon 7500) másfél évvel követte elődjét, a Dunningtont (Xeon 7400). Az Intel időzítése valószínűleg megelőző csapás az AMD-re, amely az év közepén kezdi el bevezetni teljesen megújult mikroarchitektúrára épülő Bulldozer processzorait.

Kis architekturális előny

Amint az ismert, a Westmere a Nehalem 32 nanométeres implementációjának tekinthető, a két chipgeneráció között a mikroarchitektúra szintjén minimálisak a különbségek, de ezek szerverfeladatok esetén jelentős hatással bírnak. A Westmere EX chipekbe bekerültek új utasítások, amelyek az AES kriptográfiai műveletek gyorsítására szolgálnak, ez tranzakcionális üzleti feladatok alatt jelenthet látványos teljesítménynövekedést - az Oracle szerint 11g R2 adatbázis alatt "egy nagyságrenddel" emelkedik a titkosítás sebessége az AES-NI utasítások használata esetén.

Javult a virtualizációs teljesítmény a virtuális gépek közötti gyorsabb váltás és az I/O megszakítások hatékonyabb kezelésének következtében , a "VMX Unrestricted mode" révén pedig akár 16 bites vendég operációs rendszerek is futhatnak és akár 1 gigabájtos memórialapok is támogatottak. A Westmere-EX megkapta a Tukwilában debütált DDDC (Double Device Data Collection) technológiát is, ami lehetővé teszi akár két egyidejű memóriahiba összeomlás nélküli kivédését is - a cél egyértelműen az üzleti kritikus feladatok kiszolgálása.

A mikroarchitektúra kisebb módosításai mellett a 32 nanométeres gyártástechnológia bevezetése  lehetővé tette a magok számának és a harmadszintű gyorsítótár méretének látványos növelését, illetve az órajelek emelését - ebben rejlik a Westmere-EX igazi ereje. A chipek kiviteltől függően 6, 8 vagy 10 két szál párhuzamos futtatására képes magot tartalmaznak, és 18, 24 vagy 30 megabájt L3 cache-t tartalmaznak. A magok és az L3 cache a Nehalem esetében megismert, chipre integrált full-duplex belső körbuszon kapcsolódnak össze.

A széleken a 2x5 mag, középen a hatalmas L3 cache

A Westmere-EX csúcsváltozatai 10 maggal és 30 megabájt L3 cache-sel rendelkeznek, így összesen 2,6 milliárd tranzisztorból állnak, ami 513 négyzetmilliméteren fér el. A chipek két darab kétcsatornás memóriavezérlőt integrálnak, azaz összesen négy memóriavezérlő-csatornával rendelkeznek, amelyekre legfeljebb 32 gigabájtnyi DDR3-1333 modul illeszthető. Az új processzorok mellé két memóriapuffer-chipet is piacra dobott az Intel (7510, 7512), amelyek használatával egy négyprocesszoros szerver 64 memóriafoglalatot is képes kiszolgálni és így akár 2 terabájt memóriát is fogadhat.

Jobb skálázódás

Az Intel az új Xeonokkal együtt új modellszámozást is bevezetett, a Westmere-EX processzorok Xeon E7 néven debütáltak. Az E7 család három sorozatból áll, a 28xx jelű chipeket kétfoglalatos, a 48xx jelűeket négyfoglalatos, a 88xx jelűeket pedig nyolc (vagy több) foglalatos gépekbe ajánlja a vállalat. A Xeon E7 sorozat tagjai egyenként négy QPI interfésszel rendelkeznek és nyolc foglalatig "glueless", vagyis külön vezérlőchip nélkül skálázódnak.

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

A hatékony skálázódást segíti a Directory Assisted Snoopy (DAS), amelyet az Intel mérnökei már a Nehalem-EX sorozatba terveztek, de végül csak a Westmere-EX lapkákba került be. A DAS egy címtárral támogatott koherenciaprotokoll, amely nyilvántartást vezet arról, hogy a gyorstárba került egyes adatoknak melyik chipen melyik processzormag a gazdája, és ha vannak, melyeknél találhatóak még másolatok.

A DAS miatt csökken a processzorok közötti koherenciaforgalom, vagyis "hasznos" sávszélesség szabadul fel, valamint felgyorsul a közös adatokkal végzett munka is, mivel nem kell várni a lekérdezések feloldására, az adat elhelyezkedéséről, tulajdonosáról és használóiról szóló információk megtalálhatók a címtárban. A DAS bevezetésének köszönhetően nem romlik jelentősen a nyolc vagy ennél több Xeon E7-et tartalmazó szerverek skálázódása - ezt látszik alátámasztani, hogy a SPECjbb 2005 benchmarkban a nyolc Xeon E7-8870 chipet tartalmazó Fujitsu Primergy RX900 S2 teljesítménye 77 százalékkal múlja felül a négy E7-4870 processzorral szerelt Oracle Sun Fire X4470 M2-ét.

Az új Xeon E7 sorozat (kép forrás: The Register)

Nagyobb teljesítmény

A Xeon E7 processzorsorozat teljesítménye az Intel szerint átlagosan 40 százalékkal növekedett az előző generációhoz (Nehalem-EX, Xeon 7500) képest, ami leginkább a több magnak, a nagyobb cache-nek és a magasabb órajelnek a következménye. A pontos teljesítményadatok persze tesztről tesztre változnak, a tranzakciófeldolgozási képességet vizsgáló, I/O intenzív TPC-E benchmarkban a Xeon E7-4870 például "csak" 20 százalékkal előzte meg a Xeon 7560-at, a kétrétegű SAP S/D tesztben viszont pont 40 százalék az új Xeon előnye a régivel szemben négyfoglalatos konfigurációban.

Az eddig publikált SAP S/D teszteredmények egyébként jó lehetőséget adnak arra, hogy a Xeon E7 teljesítményét összehasonlítsuk néhány versenytárssal. A négyfoglalatos, 2,4 GHz-es, tízmagos E7-4870 processzorokkal felvértezett IBM System x3850 X5 közel másfélszeres teljesítményt nyújt a négy darab, 2,5 GHz-es tizenkét magos magos Opteron 6180SE-vel felszerelt HP DL585 G7 szerverrel összevetve és nem sokkal kap ki a szintén négyfoglalatos IBM Power System 750-től, amely 3,55 GHz-es nyolcmagos Power7 processzorokat vonultat fel - a különbség 11 százalék a Power7 javára.

Rövidesen piacon

A Westmere-EX generáció az elődjével azonos (LGA1567) foglalatba illeszkedik, vagyis a használatához nem kell áttervezni a szervereket, legfeljebb egy BIOS-frissítés szükséges. Az Intel már régóta szállítja az új Xeonokat, így azok a következő hónapok során, még a teljesen új mikroarchitektúrát felvonultató AMD Bulldozer kereskedelmi rajtja előtt megjelenhetnek a nagy szervergyártók kínálatában. Az Intel közleménye szerint a  HP, Dell, IBM, Fujitsu, SGI, Oracle, Cisco és más vállalatok már 35 különféle szervermodellt jelentettek be, amelyekben Xeon E7 processzorok dolgoznak.

Kubernetes képzéseinket már közel 300 szakember végezte el. A nagy sikerre való tekintettel a tanfolyamot aktualizált tananyaggal június 18-án újra elindítjuk! A 8 alkalmas, élő képzés képzés órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról