Szerző: Gálffy Csaba

2015. május 11. 13:45

Xeon E7 v3: gyorsabb, nagyobb, megbízhatóbb

Ideális esetben, TSX-kompatibilis szoftverek esetében akár háromszoros gyorsulást is el tud érni az új csúcs-Xeon az előző generációhoz képest.

Lerántotta a leplet a múlt héten az Intel processzorkínálatának új királyáról, az abszolút csúcsot képező Xeon E7 v3 családról.  A Xeon E7 családot az Intel egyértelműen a RISC processzorokkal, a Powerrel és a SPARC-kal szemben pozicionálja, a legnagyobb, négy vagy még több foglalatos szerverek piacán. Jelen állás szerint ezen a területen az Intel már most is toronymagasan vezet a darabszámot tekintve, a cég által idézett IDC adatok szerint részesedése 94 százalék. A bevételt tekintve azonban még mindig igen komoly szereplő a RISC, ebben a dimenzióban az alternatív gyártók lapkáira épülő gépek még mindig mintegy ötödét viszik el a piacnak - ráadásul az IBM az x86-os részleg eladásával most újult erővel fogott a Power-ökoszisztéma kiteljesítésének.

A RISC chipeknek két fontos versenyelőnyük van az Intelhez viszonyítva: ezeket a processzorokat az alapoktól a nagy rendelkezésre álláshoz és scale-up filozófia mentén tervezték. Előbbi olyan képességeket jelent, melyekkel a rendszer és a futó alkalmazás még olyan extrém meghibásodást is túl tud élni, mint egy memóriamodul kiesése. Utóbbi, a scale-up pedig arra vonatkozik, hogy a processzorokat arra optimalizálják a gyártók, hogy adott foglalatszámból hozzák ki a maximumot, mivel a futtatandó szoftverek hagyományosan nem tűrik jól a fürtözést (scale-out), a szerverek számának sokszorozásával számottevően nem gyorsulnak.

A Xeon E7 legfontosabb újdonsága, hogy az előd generáció Ivy Bridge mikroarchitektúráját immár Haswellre cseréli (így kódneve Haswell-EX), annak minden hozadékával, közte a TSX utasításokkal együtt (erről később). A magok száma 15-ről 18-ra emelkedett, a gyártástechnológia azonban maradt az Intel 22 nanométeres FinFET eljárása. További komoly változást kapott a memória alrendszer. Első körben: immár a DDR4-es memóriát is támogatja a processzor, köszönhetően az új Jordan Creek 2 pufferchipnek, amely a memóriamodulok és a processzor között közvetít, de támogatja az eredeti Jordan Creek chipet is, így a DDR3 is elérhető marad. Az E5-ös lapkákhoz képest az E7 jóval több memóriát támogat: processzoronként 24 memóriafoglalat 64 gigabájtos modulokkal szerelve 1,5 terabájt RAM-nak felel meg. A legnagyobb, nyolcutas kiszerelésben 12 terabájt, négyutas szerverekben pedig ennek fele, 6 terabájt memória az elérhető maximum.

Szoftvertesztelés: ütött az óra

A tesztelői szakmát rengeteg friss hatás éri, kifejezetten nehezített pálya ez mostanság.

Szoftvertesztelés: ütött az óra A tesztelői szakmát rengeteg friss hatás éri, kifejezetten nehezített pálya ez mostanság.

A hardveres megbízhatóság és RAS oldalán számos ponton igyekszik előrelépni az E7 v3. A memóriaterületek tükrözése bevett gyakorlat, az új chipek azonban képesek megkülönböztetni a kritikus és nem kritikus memóriaterületeket, és csak ez utóbbit tükrözni. Ez azt jelenti, hogy a hagyományos tükrözéssel ellentétben nem kell lemondani azonnal a nyers kapacitás feléről, miközben az érzékeny adatok is maximális védelmet élveznek. A lapkák támogatják az új "multiple rank sparing" funkciót is, vagyis processzoronként néhány memóriamodul dedikáltan félretehető arra az esetre, ha azonnal át kellene venni egy kieső modul helyét.

Haswell a felső házban - tarolhat végre a TSX

Az Intel Haswell generációs processzorainak egyik legfontosabb műszaki újdonsága egy új utasításkészlet-kiterjesztés, amely a tranzakcionális memóriakezelést hivatott gyorsítani. A TSX (transactional synchronization extension) két új utasításpárral bővíti az x86 ISA-t a többszálú programfuttatás gyorsítása érdekében. A TSX-et itt mutattuk be részletesen, a lényeg, hogy a párhuzamos végrehajtásra komolyan kihegyezett szoftverek hatalmasat tudnak profitálni az új utasításokból - hol lenne tehát fontosabb ez, mint a sokmagos, sokfoglalatos, jellemzően adatbázisok futtatásával foglalkozó szerverek esetében.

A TSX bevezetése ugyan nem volt zökkenőmentes, az első, konzumer Haswell és Broadwell chipekben hibás az implementáció, így annak működését az Intel le is tiltotta. A Xeonokban azonban már működik az utasításkészlet-kiterjesztés, használatához azonban újrafordított, TSX-kompatibilis szoftverre van szükség. Az Intel szerint ez már nem lesz probléma, az SAP például már elvégezte ezt a munkát a HANA in-memory adatbázisok esetében, így azok maximálisan ki tudják használni az új processzorokat.

És mennyivel emeli a TSX a HANA teljesítményét? Az Intel saját mérései szerint az E7-4890 v2-ről E7-8890 v3-ra váltás önmagában mintegy 50 százalékkal növelte a teljesítményt, a TSX aktiválása pedig tovább duplázta azt. Azonos szoftverkörnyezetet és memóriamennyiséget alapul véve a mintegy 3,2-szeres sebességnövekedés generációk között bizony elképesztő előrelépést jelent, különösen ha figyelembe vesszük, hogy a két processzor listaára nagyjából azonos (6600 dollár vs 6800 dollár).

Vékony gyorsulás

A fenti adatokat egyelőre azért érdemes óvatosan fogadni, a publikusan elérhető eredmények ugyanis ilyen gyorsulást nem támasztanak alá. Az SAP oldalán közzétett adatok szerint például az előző generációs Xeont használó négyutas HP Proliant DL580 Gen8 még 133570 SAPS-pontot ért el, ezzel szemben az új verziós Gen9 160720 pontja mintegy 20 százalékos növekedést hoz - igaz, a felhasznált szoftverkörnyezet (Windows Server 2012+SQL Server 2012+SAP ERP 6.0) még nem TSX-kompatibilis.

A TSX hatása az általános célú végrehajtás alatt sem érződik (nyilván), az Intel által ígért háromszoros gyorsulást a SEPCint_rate_base_2006 iparági tesztek sem támasztják alá. A Dell PowerEdge R930, amelyben E7-8890 v3 dolgozik, 2740 pontot ér el a teszt alatt, az előző generációs, E7-4890 v2 ezzel szemben 2320 pontot kapott - egész számos műveletek alatt tehát a sebességnövekedés nagyjából megfelel annak, amit a magszám 15-ről 18-ra emelése amúgy is indokol.

Nincs kétutas E7

Hogy a tulajdonképpeni processzorokról is beszéljünk: az Intel számottevően egyszerűsítette a csúcs-Xeonok felhozatalát. Első lépésként kivezette a kétutas szerverekbe szánt E7-es kiadásokat, a processzorok ezentúl csak négyfoglalatos és nyolcfoglalatos verzióban lesznek elérhetőek, az E7-4XXX és E7-8XXX név alatt. Az alapmodell 2 GHz-es, 8 magos, 20 megabájt gyorsítótárral és 115 wattos TDP-vel, ezzel szemben a csúcsot jelentő E7-8890 v3 már 18 magot kínál (szemben az előd sorozat 15 magjával), a gyorsítótár 45 megabájtra hízik, az órajel 2,5 GHz. Ennek az Intel is megkéri az árát, az alapverzió 1224 dolláros listaárával szemben ez már 7175 dollárba kerül - ez már elég jelentős áremelés az előd 6841 dolláros árához képest is.

Az egyes szegmensekre optimalizált kiadások továbbra is elérhetőek lesznek, így órajelre, fogyasztás/teljesítmény és szuperszámítógépes munkára optimalizált verzió is maradt. Az órajelre kihegyezett E7-eseket elsősorban olyan szoftverek alá kínálja az Intel, ahol a licencdíjat processzormagonként kell fizetni, ezért a magonkénti teljesítmény abszolút kritikus. Ezek a processzorok 4 és 10 magos kiszerelésben is kaphatóak, a maximális órajel pedig 3,2 GHz is lehet, a "normál" csúcsmodell 2,5 GHz-es sebességével szemben, de megtartják annak hatalmas harmadszintű gyorsítótárát és összes egyéb képességét.

Csatlakozz partnerprogramunkhoz, mi pedig ajánlunk ügyfeleinknek, ezenkívül egyedi kedvezményeket is adunk webhosting csomagjainkra. Próbáld ki ingyenesen az Aruba Cloud-ot, most 40 ezer forint értékű vouchert adunk!

a címlapról