Megjelentek az Intel új kétfoglalatos Xeonjai
A múlt pénteki Core M "paper launch" után egy újabb processzorról rántotta le a leplet az Intel: egy hétfő esti webcaston elrajtolt a legújabb Xeon-generáció, a kétfoglalatos gépekbe fejlesztett Haswell-EP, amely Xeon E5-2600/1600 v3 néven lesz elérhető. Ebben az esetben azonban nem csak papíron mutatkoztak be a chipek, azok a nagy szervergyártók gépeiben azonnal el is érhetők.
A Haswell-EP a 22 nanométeres technológiájú, Haswell kategóriás desktop és mobil chipek leszármazottja, néhány fontos különbséggel. Az egyik természetesen a megcélzott felhasználási területhez illő magas magszám (a csúcsmodell 18 magos) és passzoló cache-méret (akár 45 MB L3), a másik az integrált memóriavezérlő, amely DDR3 helyett már DDR4-et támogat. Ennek megfelelően az új processzorok nem passzolnak a korábban legyártott gépekbe, azokhoz egy teljesen új platform is érkezett, Grantley kódnéven.
Keveset változtak a magok
Maguk a processzormagok alig változtak az előző (Ivy Bridge) generációhoz képest, azonos az utasítás-futószalag és az elsőszintű, valamint a másodszintű cache mérete sem változott, továbbra is 64, illetve 256 kilobájttal gazdálkodhatnak a magok. A cache-ek sávszélességét viszont duplázták a mérnökök, feltehetően az AVX2 utasításkészlet-kiterjesztés miatt, amelynek része egy FMA (fused multiply-add) utasítás is, ez a vállalat szerint egyes lebegőpontos kódok esetén akár duplázhatja is a teljesítményt.
Két új portot kapott a "Unified Reservation Station", így a Haswell elméletben már 8 utasítás egyidejű ütemezésére képes. Átdolgozták az elágazásbecslő logikát, megnőtt az L2 TLB (címfordítás tár) mérete és a soron kívüli ütemező több utasításból választhatja ki a következőt, hogy a végrehajtóegységek a lehető legjobban ki legyenek használva. A vállalat szerint azonos órajelen a Haswell teljesítménye egész műveletek alatt nagyjából 10 százalékot javult azonos órajelen, a lebegőpontos teljesítmény viszont az AVX2 miatt szélsőséges esetben kétszeres is lehet.Egy processzormag a korábbiakhoz hasonlóan két utasításszál párhuzamos végrehajtására alkalmas a Hyper-Threading révén, a legolcsóbb, hatmagos verziókban ezt a képességet azonban az Intel letiltotta.
A Haswell egyik nagy dobása a tranzakcionális memóriakezelés. A Transactional Synchronization Extension (TSX) ISA-kiterjesztés a párhuzamos programfuttatást teszi sokkal hatékonyabbá, ezzel sokat gyorsulhatnak a több utasításszálat használó alkalmazások. A TSX-szel kapcsolatban nemrég probléma merült fel, ezeket az utasításokat az Intel átmenetileg (alapértelmezésként) letiltotta a chipjeiben, bekapcsolás egyelőre csak saját felelősségre ajánlott, kizárólag fejlesztési, tesztelési célokra.
Energiatakarékosság
A Haswell-EP ugyanúgy 22 nanométeres technológiával készül mint elődje, így az energiahatékonysággal kapcsolatos fejlesztések a mikroarchitektúra szintjén keresendők. A desktop és mobil verziók jóval takarékosabbak az Ivy Bridge-nél, elsősorban a rendkívül lecsökkentett üresjárati fogyasztás miatt, szerverek esetén az idle állapot kevéssé jellemző, de azért itt sem maradt fejlesztés nélkül az új Xeon, nem véletlen, hogy az Intel mérnökei a korábbinál több magot tudtak besűríteni azonos fogyasztási keretben - igaz, az órajelek jellemzően nem növekedtek.
A Haswell-EP több mint 20 hőszenzorral rendelkezik, így jobban nyomon követhető a lapka hőtermelése, amely révén a hűtés által korlátozott környezetekben (nagy teljesítménysűrűségű telepítések) jobban kézben tartható a fogyasztás és a teljesítmény. A magok és az "uncore" rész frekvenciája már eltérhet a Haswell-EP esetén, így a magokat intenzíven, de az "uncore" részt kevéssé kihasználó alkalmazások miatt utóbbi órajelét nem kell megemelni, így nagyobb keret áll a processzormagok rendelkezésér. A logika persze fordítva is igaz, az uncore-t kihajtó (pl. I/O-intenzív) szoftverek nem okoznak felesleges magfrekvencia-emelkedést.
A processzorok jellemzően a lebegőpontos-intentív kódok futtatása alatt fogyasztanak a legtöbbet, az új Xeonokban ezért az Intel átdolgozta a Turbo módot és bevezette az AVX Turbót, amely az AVX-et használó alkalmazások esetén nem engedi olyan magasra a frekvenciát mint AVX nélkül. Az E5-2699 v3 processzor névleges órajele 2,3 GHz, de a magok akár 2,8 GHz-ig is felpöröghetnek, AVX kód futtatása esetén azonban 1,9 és 2,6 GHz között változik az órajel. A vállalat szerint az AVX2 miatt az ilyen alkalmazások még alacsonyabb órajelen is jóval gyorsabban futnak.
Hyperscaler vagy hazai felhő? Lehet, hogy nem kell választani! Egy jól felépített hibrid vagy multicloud modellben a különböző felhők nem versenytársai, hanem kiegészítői egymásnak.
A magszám növekedésével együtt megváltozott a magok összekapcsolásának módja is. A Xeon E5-2600 v2 generációs processzorokban (Ivy Bridge-EP) a magok és a harmadszintű cache még két, ellentétes irányú körbuszon kommunkáltak, a v3 generáció 14 és 18 magot felvonultató csúcsmodelljei viszont már két független dupla körbuszt kaptak, amelyek switchen keresztül tartják egymással a kapcsolatot.
A DDR4 előnyei
Ahogy már korábban írtuk, a Haswell-EP egyik nagy dobása az átállás DDR3-ról DDR4 memóriára. Az új memóriaszabvány két ponton hoz érdemi előrelépést: egyrészt jóval magasabb sávszélesség elérését teszi lehetővé, másrészt alacsonyabb feszültséget (1,2V) igényel a működéshez, így alacsonyabb a fogyasztása, ami a nagy memóriakapacitású szerverek esetén lehet fontos. A Xeon E5-2600 v3 generáció 2133 MHz-es memóriát támogat jelenleg, a csúcsmodelleknél ez 68 GB/s sávszélességet jelent 4 memóriacsatornán, míg az előző generációnál 59,7 GB/s volt a csúcs. A maximális memóriakapacitás foglalatonként 768 gigabájt, ez azonos az Ivy Bridge-EP értékével, de a jövőben érkező LRDIMM (Load Reduced DIMM) modulokkal azonban 1,5 terabájtra duplázható.
A DDR4 egyik előnye a DDR3-mal szemben, hogy a nagy memóriakapacitású konfigurációkban nem kell annyira korlátozni a memória órajelét. A korábbi, DDR3-at támogató Xeonok esetében 1866 MHz volt a maximális memóriafrekvencia, azonban ha egy foglalathoz 512 gigabájtnyi háttértár kapcsolódott, az órajel 1666 MHz-re csökkent, a maximális 768 gigabájtnál pedig még tovább. A DDR4-et támogató Haswell-EP esetén még 768 gigabájtos foglaltonkénti kapacitás esetén is 1666 MHz a memória órajele, ennél kisebb kiépítések esetén pedig tartható a 2133 MHz.
32+20 új processzor
Az Intel nem kevesebb mint 32 standard SKU-t, azaz kereskedelmi forgalomban elérhető processzorváltozatot dobott piacra a Haswell-EP generációs Xeonokból, ezekhez csatlakozik további 20, amelyet a vállalat legnagyobb ügyfeleinek megrendelésére egyedileg konfigurált, ezek nem is kerülnek forgalomba és a specifikációik sem nyilvánosak egyelőre. A rengeteg különféle processszorváltozatot három különféle "die" szolgálja ki, a legkisebbek 4-8 magot tartalmaznak, a középső verzió 10 vagy 12 magot vonultat fel, a csúcsváltozat pedig legfeljebb 18 aktív processzormaggal és hatalmas, 45 megabájtos L3 cache-sel érkezik.
A különféle Haswell-EP verziókat meg sem kíséreljük felsorolni, a részletekért az Intel weboldalát érdemes böngészni. Azt azért érdemes tudni, hogy még a legkisebb verziók is 4 magot és 10 megabájt L3 cache-t tartalmaznak, a csúcsváltozat, az E5-2699 v3 pedig 18 magot és 45 megabájt L3-at állít csatasorba. A processzorok TDP-je 52 és 145 watt között alakul, magszámtól és órajeltől függően, a listaárak 213 dollártól 4115-ig mennek.
A Xeon E5-2600 v3 processzorgeneráció azonnal elérhető a legnagyobb szervergyártók gépeiben. Az Intel tájékoztatása szerint több mint 60 konfiguráció azonnal rendelhető az olyan cégektől mint a HP, Dell, IBM, Fujitsu, Cray, Huawei, Lenovo, NEC, Oracle és Cisco, év végére pedig bőven 200 fölé nő majd azoknak az adatközponti eszközöknek a száma, amelyekben Haswell-EP generációs chipek dolgoznak. Ezek között szerverek mellett persze megtalálhatók lesznek tárolók, illetve hálózati eszközök is. A Xeon E5-2600 v3-ról az Intel azt állítja, több mint 20 különféle benchmark-rekordot állított fel. A lapkák teljesítményét egy külön cikkben fogjuk tárgyalni.
Új, 40 GbE hálózati vezérlő
Az új processzorok mellett egy új hálózati vezérlőt is bemutatott az Intel tegnap. A Fortville kódnevű XL710 modellszámú kontroller legnagyobb dobása a 40 GbE támogatása, a nagyobb sávszélesség elsősorban virtualizált környezetben lehet érdekes, amikor egy szerveren a VM-ek sűrűségét a hálózati hozzáférés korlátozza. A Fortville három konfigurációban készül, már az alapváltozat is hozza az előd (X710) 2x10 GbE támogatását, a középső verzió 1x40 GbE, a csúcskivitel pedig 2x40 GbE interfésszel rendelkezik. A Fortville nem csak nagyobb sávszélességet biztosít a korábbi Intel vezérlőknél, hanem üresjáratban és terhelés alatt is kevesebbet fogyaszt.