Szerző: Asztalos Olivér

2016. június 16. 08:14:00

Broadwell-EX: Xeonok a számok tükrében

Befutottak a hivatalos teszteredmények, ezért megnéztük mire elég legújabb E7-es Xeon.

Felbukkantak az első publikus mérési eredmények az Intel múlt héten leleplezett, immár negyedik generációját taposó Xeon E7-8800 (és E7-4800) sorozatának egyes tagjairól. A számok alapján megpróbáljuk kideríteni, hogy az elődhöz mérten nagyjából mekkora előrelépést nyújthat az új széria, illetve körülbelül hol áll a konkurensekhez képest.

Nyers processzorteljesítmény

A nyers CPU-teljesítményt vizsgáló benchmarkok között klasszikus a SPEC CPU2006, amely változatos kódok alatt vizsgálja a gépek sebességét. Az integer műveletvégző képességet mérő tesztben olyan feladatok vannak mint kódfordítás, tömörítés, sakkfeladvány megoldása, hálózati szimuláció és XML-konvertálás, a lebegőpontos tesztek pedig mérnöki-tudományos feladatokból állnak például áramlástani modellezésből, végeselem-analízisből, időjárás-modellezésből és beszédfelismerésből.

Az új, Broadwell-EX generációs Xeonok integer és lebegőpontos tesztekben is hozzák a reálisan elvárható előrelépést, a harmadával több mag bőven kompenzálja az alacsonyabb órajelet. Ez az E7-8890 v3 és v4 között nagyjából 27 százalékos előrelépést eredményez integer műveletekben, lebegőpontos számítások esetében viszont ennek már csak valamivel több mint a felével gyorsult Broadwell-EX.

Szervereket azonban ritkán vásárolnak egy évre még számításintenzív feladatok alatt is, érdemes a v4 sebességét a Ivy Bridge-EX Xeonokkal (v2) is összevetni, hisz ebben az esetben már 40-50 százalék körüli az előrelépés. Az Intelek mellett érdemes szót ejteni a közvetlen versenytárs IBM POWER8-ról is, ami lebegőpontos számítások alatt továbbra is verhetetlen, ezen eredményt pedig csupán 80 maggal produkálja a rendszer, bár azok igen magas órajelen üzemelnek. A SPARC M7 is jól szerepel, ugyanakkor a SPEC adatbázisában jelenleg csak egy egyetlen processzoros rendszerről van fent mérési eredmény, de megfelelő skálázódással számolva az Oracle fejlesztése ott lenne a Broadwell-EX nyomában.

ONLINE Scrum és gépi tanulás meetupjaink indulnak! Jelentkezik az ingyenes HWSW free!, immár online formátumban.

Nyers processzorteljesítményt vizsgáló tesztek egyelőre csak az E7-8890 v4 modellel készültek, ugyanakkor a tipikusan nagy magonkénti processzorteljesítményt igénylő feladatok (pl. adatbázisok) futtatására aligha ez a méregdrága csúcsváltozat lesz a keresett, hanem a kisebb magszámú, magasabb órajelű verziók - a kínálatban szerepel például 3,2 GHz-es négymagos, illetve 2,8 GHz-es tízmagos verzió is. Az ezekkel végrehajtott tesztek eredményeire azonban egyelőre várni kell.

Java szerverfeladatok

Lássuk, mire elég ez a nyers teljesítmény klasszikus szerverfeladatok alatt! Az egyik ilyen a Java programok futtatása, az Intel partnerei a mostani Xeon-generáció rajtjakor végleg szakítottak az elavult SPECjbb2013 benchmarkkal és a gépek teljesítményét SPECjbb2015 alatt adták meg. Ennek ugyanakkor hátulütője, hogy a viszonylag friss benchmarkkal egyelőre kevés teszteredményt publikáltak a gyártók, miközben a SPECjbb2013 eredmények publikálására már nem ad lehetőséget a SPEC oldala. Ennek köszönhetően mindössze három versenyzőt tudtunk hasonló körülmények mellett összevetni.

Ilyen körülmények között szinte pontosan 20 százalékos gyorsulást mutatott a max-jOPS mérés alatt elődjéhez képest a Broadwell-EX, mely teszt a rendszer maximális, fenntartható (sustainable) teljesítményét mutatja meg. Itt ismét érdemes kitérni a SPARC M7-re, a legújabb Xeon magszámának harmadával csak nagyjából 37 százalékkal alacsonyabb eredményt produkált az Oracle rendszere.

A critical-jOPS teszt alatt már a válaszidő kapja a főszerepet, illetve a prioritást, itt pedig a Broadwell-EX már majd 30 százalékkal veri a Haswell-EX-et, miközben a SPARC nagyobb hátrányba kerül.

Virtualizáció

A virtualizációs feladatok alatt nyújtott teljesítmény mérésére is van benchmarkja a Standard Performance Evaluation Councilnak (SPEC), a SPECvirt_sc2013 virtualizált környezetben futtat néhány SPEC benchmarkot és azt méri, hogy megadott szolgáltatási szintek (válaszidők) mellett hány virtuális gép képes futni és ezek mekkora teljesítményt érnek el.

Az E7-8890 v4 elődjénél jóval több virtuális géppel megbirkózik, szám szerint 237 VM-et futtatott a teszt, miközben a v3-as rendszer csak 168-at, akárcsak a SPARC M7. Mindez körülbelül 40 százalékos előnyt jelent a Broadwell-EX-nek, ami a több mag mellett a Broadwell mikroarchitektúra virtualizációs fejlesztéseinek tudható be, amiről még az EP processzorok megjelenésekor beszéltünk részletesebben.

SAP 2-tier Sales and Distribution

Az SAP 2-tier Sales and Distribution (SAP SD) tesztje a szervergyártók egyik kedvence és persze az Intel is publikált ilyen teszteredményeket a Haswell-EX Xeonokkal. Itt szinte pontosan 33 százalékkal előzte meg elődjét az E7-8890 v4, ami megfelel a magok számának, illetve a harmad szintű gyorsítótár kapacitásának gyarapodásával, ugyanakkor érdemes észben tartani, hogy az (alap)órajel 12 százalékkal csökkent, ennek fényében pedig határozottan jónak számít a Haswell-EX eredménye.

Ismét érdemes szót ejteni a konkurenciáról. A két foglalatos, de 64 magos SPARC M7 rendszer itt is jól szerepel, hasonló magszám mellett valószínűleg verné a Haswell-EX-et az Oracle megoldása. Emellett a POWER8-nak sincs szégyellnivalója, a mindössze 24 mag ellenére jó eredményt mutat az IBM rendszere.

Összegzés

További eredmények híján a tesztek az E7-4880 v4 processzorral készültek, amely az új, 24 magos, 60 MB L3 cache-es csúcsverzió, ennek megfelelően pedig az ára is igen magas, listaáron 7174 dollár, mely ugyanakkor pontosan egyezik az előd árcédulájával. Az Intel szerint ez a modell nyújtja a legnagyobb gyorsulást, közvetlen elődjéhez mérten átlagosan 22-26 százalékot hozhat, a kisebb modellek előrelépését pedig típustól függően 5-20 százalékra taksálja a gyártó.

Az összevetések szerint az Intel ígérete nem ámítás, valóban elérhető az ígért gyorsulás, mely bizonyos esetekben még akár valamivel nagyobb is lehet. Emellett ugyancsak fontos előrelépés, hogy a maximálisan támogatott memória mennyisége duplázódott, nyolc foglalat esetében már akár 24 terabájt is lehet az operatív tár kapacitása - legalábbis a hiperdrága rétegzett RAM használatával. Mindehhez bizonyos esetben elég lehet csak a processzorokat cserélni, ugyanis az új Broadwell-EX család továbbra is az Ivy Bridge-EX-szel bevezetett R1 foglalatot használja.

a címlapról