Mellékleteink: HUP | Gamekapocs
Keres

Mire képes az új Xeon szerverfeladatok alatt?

Bodnár Ádám, 2013. szeptember 20. 07:44
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

A Xeon E5-2600 v2 az eddig elérhető teszteredmények alapján komoly előrelépést képvisel teljesítményben, amit a megnövekedő cache-méreteknek és a korábbinál nagyobb magszámnak köszönhet. Bizonyos szituációkban a kétfoglalatos gépek a korábbi négyfoglalatos rendszerek sebességét hozzák.

A múlt heti Intel Developer Forumot használta a világ legnagyobb chipgyártója arra, hogy bemutassa a kétfoglalatos gépekbe szánt Xeon processzorainak legújabb generációját. A lapkák továbbra is E5-2600 sorozatként élnek, csak kaptak a modellszámuk mögé egy v2 megkülönböztető jelzést. Ezzel az Intel feltehetően azt az üzenetet próbálja meg erősíteni, hogy a változások a felhasználók szempontjából kicsik, a megelőző generációval foglalatszinten kompatibilisek az új Xeonok, a korábban megtervezett és legyártott szervereket sem kell áttervezni a fogadásukhoz, elég egy firmware-frissítés.

A bemutató idején az Intel nyilvánosságra hozott számos teszteredményt is az új Xeonra épülő rendszerekkel, amelyek ma már megtekinthetők a benchmarkok felett őrködő szervezetek weboldalán is. Ennek kapcsán a HWSW megpróbálja bemutatni, mekkora változás is történt teljesítményben, mennyire rajzolta át a kétfoglalatos szerverek szegmensében uralkodó erőviszonyokat az Ivy Bridge-EP.

Cikkünkben a Xeon E5-2600 v2 sorozat tagjaival készült tesztek eredményeit hasonlítjuk össze a riválisokéval. Amennyiben egy processzorral többször is elvégeztek egy tesztet és több eredmény is elérhető (például eltérő gyártóktól származnak vagy eltérő szoftverkörnyezettel készültek), ott a végeredmény szempontjából legkedvezőbb publikált pontszámot vettük figyelembe. Egy adott processzorgenerációnál mindig a tesztben legjobb eredményt elérő modellt vizsgáltuk, így a lenti táblázatokban nem mindenhol ugyanazok a processzormodellek szerepelnek.

Nyers processzorteljesítmény

A SPEC által fejlesztett, "nyers processzorteljesítményt" különféle integer és lebegőpontos kódok alatt vizsgáló CPU2006 tesztben a legerősebb processzor jelenleg az új Xeon E5, ami a kétfoglalatos rendszereket illeti. Amint azt korábbi cikkünkben is leírtuk, az Ivy Bridge-EP magjai jóformán változatlan formában kerültek át a Sandy Bridge generációs Xeon E5-ből, az Intel mérnökei csak kisebb módosításokat hajtottak végre rajtuk. A SPEC CPU2006 tesztben elért nagy növekedést a magszám emelkedése okozza, az új generációs processzorok csúcsmodellje már 12 magot hordoz egy lapkán, ami kétfoglalatos kiépítés esetén 24 magot és a Hyper-Threading miatt 48 párhuzamos utasításszálat jelent. A teljesítménynövekedés az előző generációs Xeon E5 legerősebb modelljéhez képest 38 százalékos, míg a magszám másfélszeres - viszont az órajel alacsonyabb 10 százalékkal.

Az Intelnek sikerült az, ami mindeddig szinte elképzelhetetlennek tűnt, a korábban a mezőnyt vezető IBM POWER7+ lebegőpontos teljesítményének felülmúlása. Az iparban széles körben ismert, hogy a SPEC lebegőpontos tesztkódjai "szeretik" a nagyméretű cache-eket, hogy a processzormagok ne éhezzenek, az E5-2697 v2 pedig az elődjénél másfélszer nagyobb, 30 megabájtos maximális L3 gyorsítótárral rendelkezik, ami a teszteredményen is meglátszik. A POWER7+ ebben a tekintetben egyébként messze a mezőny előtt jár, a tesztben is szereplő példány magonként 10 megabájt harmadszintű eDRAM L3 gyorsítótárat tartalmaz, vagyis chipenként 80 megabájtot - viszont kevesebb maggal rendelkezik a Xeonnál. Kérdés, a jövő év elején várható 12 magos POWER8 vajon visszaveszi-e ezt a koronát.

A nyers processzorteljesítményt vizsgáló tesztek egyelőre csak az E5-2697 v2 modellel készültek, a tipikusan nagy processzorteljesítményt igénylő feladatok (pl. mérnöki-tudományos alkalmazások) futtatására azonban aligha ezek a méregdrága csúcsváltozatok lesznek a keresettek, hanem a kisebb magszámú, magasabb órajelű verziók. Az ezekkel végrehajtott tesztek eredményeire azonban egyelőre várni kell.

Energiahatékonyság, Java és SAP

A Sandy Bridge generációs lapkák még 32 nanométeres eljáráson készültek, az Ivy Bridge Xeonok előállítására viszont már 22 nanométeres csíkszélességű félvezetőgyártási technológiát vet be az Intel. A fejlesztés lehetővé tette a vállalat számára több processzormag és nagyobb L3 cache beépítését, miközben a lapkák fogyasztási kerete nem változott. Az energiahatékonyságot szerveroldali Java alkalmazásfuttatás alatt vizsgáló SPECpower_ssj2008 tesztben az új Xeon E5 hatalmas fölénnyel vezeti a mezőnyt: a feladatvégrehajtás sebessége nagyot nőtt, miközben a fogyasztás alig változott. Ebben a versenyszámban tipikusan nem a csúcsmodellek szállnak ringbe, hanem az alacsonyabb fogyasztású és kisebb magszámú modellek.

A Java feladatvégrehajtás sebességét a SPECjbb2005 teszt alatt is megadta az Intel. Ennél frissebb Java benchmark is létezik már (SPECjbb2013) a SPEC-nél, azonban azzal nagyon kevés tesztet publikáltak csak, az új processzor teljesítményét így nemigen van mihez mérni - régebbi chipekkel egyáltalán nem készült SPECjbb2013 teszt. A SPECjbb2005-ben vezeti a kétfoglalatos rendszerek mezőnyt az új processzor, az E5-2697 v2-vel készült teszt eredménye pedig a jelenlegi négyutas Xeon E5-nek kétharmada.

Az SAP 2-tier Sales and Distribution (2-tier SD) benchmarkban is a legjobb kétfoglalatos eredményt hozza az új Xeon, ennél azonban sokkal érdekesebb, hogy a jelenlegi legjobb négyfoglalatos eredményekkel is összevethető a teljesítménye. Ezt azért fontos kiemelni, mert a két- és négyfoglalatos szerverek között jelentős az árkülönbség, az új Xeonnal már kétfoglalatos konfigurációban elérhető akkora SAP teljesítmény, amelyhez eddig négyfoglalatos gépre volt szükség. Egy nem dinamikusan növekedő szervezet, amely jelenleg négyfoglalatos rendszeren használja az SAP-t, a jövőben akár kétfoglalatos konfigurációra is visszaválthat az új Xeonoknak köszönhetően, amivel a vételáron és a hardvertámogatási költségen is sokat spórolhat.

Virtualizáció

Itt érdemes megjegyezni, hogy az új Xeonok memóriatámogatás is előreléptek, kétfoglalatos konfigurációban 384 helyett 768 gigabájt a háttértár maximális mérete processzoronként. Ez virtualizált környezetben lehet fontos, az E5-2600 v2 már két processzorral képes annyi memóriát kezelni mint az elődök négyfoglalatos kiépítésben, ami alkalmasabbá teszi őket olyan feladatok futtatására, ahol igazán nagy tárkapacitásra van szükség, például konszolidációs projekteknél. Az Ivy Bridge-EP virtualizációs teljesítményben is javult az Intel által publikált benchmark-eredmények (VMmark, SPECvirt2013) szerint.

Az alábbi táblázat a VMware által fejlesztett VMmark benchmarkkal kapott eredményeit tartalmazza néhány újabb processzornak, kétfoglalatos konfigurációban végezve. A táblázat függőleges tengelyén a futtatott tile-ok számát, a vízszintes tengelyen pedig a teljesítményt ábrázoltuk (a VMmarkról bővebben a gyártó oldalán lehet olvasni, röviden annyit érdemes tudni, hogy minél nagyobb a tile-ok száma és a teljesítmény, az adott processzor virtualizált feladatok alatti sebessége annál nagyobb). A Xeon E5-2697 v2 az Ivy Bridge magokban levő, virtualizációs feladatok gyorsítására szolgáló módosítások miatt nagyobb teljesítményre képes a Sandy Bridge-alapú elődhöz képest, a magasabb magszám miatt pedig több virtuális gépet képes egyszerre futtatni.

Tranzakciófeldolgozás

Az online tranzakciófeldolgozási teljesítményt egyelőre csak a TPC-E tesztben adta meg az Intel - a Xeon E5-2697 v2 a legjobb kétfoglalatos eredményt hozza ebben a tesztben, köszönhetően a megnövekedett magszámnak. Érdemes azonban figyelembe venni, hogy a Windows Server árazása (minden publikus TPC-E teszt ezekkel készült) a 2012-es verzióval foglalatalapúról magalapúra változott, így az eredmények értékelésekor a magszámot mindenképpen figyelembe kell venni, mivel ez a szoftverlicencek költségét és ezen keresztül a rendszer gazdaságossági mutatóit is meghatározza. A licencköltség nem csak az operációs rendszernél fontos, a SQL Server Enterprise verzió is magalapú árazásra váltott a 2012-es kiadással, az Oracle adatbázis (és a DB2) pedig régóta alkalmazza ezt a konstrukciót.

Az adatbázisok esetén különösen felértékelődik a szoftverlicenc-költség, mivel a SQL Server Enterprise és az Oracle ára is megközelíti vagy meghaladja a hardverköltséget. Egy 24 magos konfigurációra a SQL Server Enterprise listaáron közel 170 ezer dollár, Oracle esetén pedig a hivatalos árlista szerint már a Standard verzióra is 210 ezer dollárt kell kifizetni, Enterprise változat választása esetén pedig 564 ezret, plusz az esetleges opciók és az éves követés díja. Ez ugyan megdrágítja a 12 magos csúcs-Xeonokkal szerelt gépek szoftverköltségét a korábbi nyolcmagosokhoz képest, azonban a megnövekedő teljesítmény ezért kárpótol - az új processzor teljesítmény/mag viszonya majdnem olyan jó TPC-E alatt mint a közvetlen elődé, és sokkal jobb mint a jelenleg hozzáférhető, négyfoglalatos gépekbe szánt Xeonoké.

itt is igaz, hogy az E5-2697 v2 teljesítménye a jelenleg elérhető négyfoglalatos rendszerekét közelíti, ami az új Xeon-EX sorozat érkezéséig megnehezítheti a beszerzési döntéseket - dilemmát jelenthet, vajon az adott feladatra két- vagy négyfoglalatos rendszert érdemes-e megvásárolni a hardverköltségek és főleg a szoftverköltségek figyelembe vételével. Ahogy a jövőben érkeznek a szervergyártóktól a többi új Xeon E5-változattal készült teszteredmények, erről pontosabb képet kapunk.

A Xeon-EP sorozatban a 12 magos processzorok révén elérhető magas magszám miatt a RISC/UNIX gyártók is félthetik a pozícióikat tranzakciókezelési feladatok alatt, a Windows Serverrel és SQL Serverrel karöltve az új processzorral szerelt szerverek még ütősebb alternatívát kínálnak a középkategóriás, 4 foglalatos dobozok ellen, a RISC/UNIX-világban megszokott hardver- és szoftverárak töredékéért. Ugyanez a fenyegetés persze az x86-os gyártókra is áll, a Xeon E5-5697 v2 kétfoglalatos kiépítésben a négyfoglalatos Sandy Bridge generációs E5-4650 teljesítményét hozza, lényegesen alacsonyabb hardverköltségen és az alacsonyabb magszám miatt töredék szoftverlicenc-költségen.

A táblázatban is szereplő, 4 darab Xeon E5-4650 chipet felvonultató gépre (Fujitsu Primergy RX 500 S7) a SQL Server Enterprise licencek összesen közel 224 ezer dollárba kerülnek például, Oracle  Enterprise kiadás esetén pedig 750 ezer dollár a számla végösszege (és az éves követés 165 ezer dollár körüli!). Ezt a teljesítményt a kétfoglalatos E5-2697 v2 a tesztek alapján megoldja 168 ezer dollárnyi SQL Server Enterprise licencből, Oracle Database Enterprise verzióban pedig 560 ezer dollárból. Utóbbi esetben csak az éves licenckövetésen több mint 40 ezer dollárnyi (!) megtakarítás érhető el - négyfoglalatos Xeon gépeken Oracle adatbázist futtatók nyugodtan vegyenek most be egy vérnyomás-csökkentőt. (Cikkünk korábban tévesen állította, hogy az Oracle Database Standard is magszám alapján licencelődik, az igazság ezzel szemben az, hogy csak a foglalatok száma alapján, olvasóinktól elnézést kérünk.)

Többet, többért

Az elődöknél nagyobb teljesítményért persze többet is kell fizetni. Az új Xeon E5-2600 v2 sorozatban majdnem minden Sandy Bridge-EP processzornak megvan a "v2" jelölésű párja, amelyek az elődökkel nagyjából azonos áron kaphatók. Amennyiben a két chip között nincs eltérés magszámban és órajelben (ekkor a teljesítménykülönbség is minimális), akkor az ár is közel azonos, de ha van, például mert nagyobb az L3 cache mérete, akkor az ár is változik.

Bekerült ugyanakkor a kínálatba két új modell, amelynek nincs meg a korábbi generációból a közvetlen elődje. A Xeon E5-2695 v2 és az E5-2697 v2 egyaránt 12 magos, 30 megabájt L3 cache-t tartalmazó chipek, előbbi 2,5 GHz-es néveleges órajelen működik, utóbbi pedig 2,7 GHz-en. Áruk 2335, illetve 2618 dollár, ezek a ma megvehető legdrágább Xeon-EP processzorok - viszont kétfoglalatos gépek esetén az abszolút csúcsot képviselik teljesítményben a klasszikus kereskedelmi szerverfeladatok alatt és alkalmasak akár négyfoglalatos gépek kiváltására is, komoly megtakarítást ígérve a magszám alapján licencelt vállalati szoftverlicenceken.

Facebook

Mit gondolsz? Mondd el!

Adatvédelmi okokból az adott hír megosztása előtt mindig aktiválnod kell a gombot! Ezzel a megoldással harmadik fél nem tudja nyomon követni a tevékenységedet a HWSW-n, ez pedig közös érdekünk.