Szerző: Bodnár Ádám

2011. október 12. 11:45:00

Feleslegesen vártak a Bulldozerre a gamerek

Végre hivatalosan is bemutatkoztak az AMD Bulldozer architektúrára épülő processzorai, a vállalat elsőként a csúcskategóriás asztali gépekbe szánt FX sorozat tagjairól rántotta le a leplet. A nyolcmagos Zambezi valószínűleg nem lesz a gamerek kedvence.

Némi késlekedés után végre kereskedelmi rajtot vett az AMD legújabb generációs processzorcsaládja, amelyben a Bulldozer mikroarchitektúra teljesít szolgálatot. A vállalat elsőként a csúcskategóriás asztali gépekbe szánt Zambezi kódnevű lapkáit küldte piacra, ezekből rögtön négy változat is érkezett, amelyek kiviteltől függően négy, hat vagy nyolc aktív maggal rendelkeznek és 3,1-3,6 GHz-es névleges órajelen járnak.

Az elmélet

Amint arról a HWSW már korábban többször is beszámolt, az AMD gyártástechnológiai hátrányának tudatában tervezte a Bulldozert. Chipgyártó partnere, a Globalfoundries ugyanis az Intellel szemben fennálló több, mint másfél éves technológiai hátrányt halmozott fel, ami nagyobb területű, magasabb fogyasztású és drágábban gyártható processzorokat jelent. Ezen hatások minimalizálása érdekében az AMD úgy tervezte meg a Bulldozer mikroarchitektúrát, hogy a lehető legtakarékosabban bánjon a szilíciumterülettel, így adott helyre a legtöbb magot tudja integrálni és így a legmagasabb szintű párhuzamosságot tudja kínálni, miközben az energiával is takarékoskodik elvileg.

A Bulldozer koncepciójának kidolgozása közben elvégzett elemzések azt mutatták, a teljesítménykritikus alkalmazások többsége 80 százalék feletti arányban hajt végre fixpontos műveleteket, vagyis csak kevesebb mint 20 százalékban történik lebegőpontos számítás vagy egyéb adatmanipuláció - logikusnak látszik tehát a nagy helyigényű lebegőpontos egységek megosztása a magok között a helytakarékosság érdekében. Korábban más chipgyártók is próbálkoztak más hasonló fogással, a Sun UltraSPARC T1 processzorban például nyolc mag osztozott egy FPU-n.

Az AMD azonban ennél jóval tovább ment: a vállalat mérnökei a processzormagokat kettes csoportokba szervezte, ezek a csoportok pedig megosztoznak a "frontenden" (utasításbetöltés és dekódolás, elágazáskezelés), valamint egyetlen közös lebegőpontos egységet használnak két 128 bites FMAC egységgel (fused multiply accumulate), illetve a 2 megabájtos L2 cache is közös. Egy két magot tartalmazó modul az operációs rendszerek és az alkalmazások felé azonban két teljes értékű magként látszik, az osztott erőforrások a szoftverek felé teljesen transzparensek és az AMD kommunikációja is két magként hivatkozik rájuk.

A "közösködés" nem csak a szilíciumtakarékosság, hanem az energiatakarékosság oldaláról is előnyös: a processzorok piaci pozicionálását alapvetően meghatározó névleges órajelet leginkább a lebegőpontos számításokat végző kódok által okozott hőfejlődés limitálja, ezért a kevesebb lebegőpontos végrehajtóegység azt is jelenti, hogy kevesebb hő szabadul fel csúcsterhelésen. Az AMD megközelítése elméletben nagyszerű, azonban hogy a gyakorlatban hogy válik be, arról egészen mostanáig a nyilvánosságnak legfeljebb sejtései lehettek, mivel a vállalat óvakodott attól, hogy konkrét teljesítményadatokat vagy rájuk vonatkozó becsléseket hozzon nyilvánosságra.

Az első FX chipek premierjével azonban végre pontos képet kaphatunk arról, mennyire számoltak jól az AMD mérnökei a Bulldozer alapjainak lefektetésekor. A rendelkezésre álló információk szerint nagyjából 5-6 éve kezdhették el a munkát a Bulldozeren, a most bemutatott processzor alaparchitektúrája így azokat az állapotokat és várakozásokat tükrözi, amire a gyártó a projekt indulásakor számított. A Bulldozer a vállalat egyik legnagyobb szabású projektje lett, többszörös csúszással és roadmapek módosításával fűszerezve, a várakozásnak azonban vége, négy Bulldozer-alapú FX processzor mutatkozott be ma.

Az FX-4100, FX-6100, FX-8120 és FX-8150 chipekben kiviteltől függően két, három, illetve négy modul aktív, ami négy, hat, illetve nyolc működő magot, de minden esetben 8 megabájt L3 cache-t jelent. Az FX chipek mindegyike négy darab, kétszer 16 bites HyperTransport linken kommunikál a külvilággal és kétcsatornás 1866 MHz-es modulokat támogató DDR3 memóriavezérlővel rendelkezik. A most bemutatott változatok névleges órajele 3,1 és 3,6 GHz között változik, a médiának a nyolcmagos, 3,6 GHz-es névleges órajelen működő, de akár 4,2 GHz-ig is "turbózható" csúcsváltozatot juttatta el az AMD.

Befutottak az első teszteredmények

Az FX-sorozatú asztali chipekkel együtt az első benchmark-eredmények is publikussá váltak - a mutatott kép finoman szólva is vegyes. Az Anandtech által elvégzett kimerítő tesztek alapján a Bulldozer - elődeihez hasonlóan - leginkább a jól párhuzamosítható kódok alatt teljesít, mint amilyen a videofeldolgozás vagy a tömörítés. Ezekben a tesztekben a listaáron 245 dollárba kerülő nyolcmagos, 3,6 GHz-es névleges órajelen működő FX-8150 teljesítménye látványosan felülmúlja a négymagos, 3,3 GHz-es Core i5-2500K chipét, amely az Intel kínálatában árban a legközelebb esik.

AMD FX-8150 relatív teljesítmény

100% = Intel Core i5-2500K

A vállalat rajongói- és vásárlói bázisának gerincét adó gamerek azonban feltehetően csalódással veszik majd tudomásul, hogy a kevéssé párhuzamosított feladatok alatt a négy modulból, azaz nyolc magból álló FX-8150 teljesítménye gyakran még a 3,3 GHz-es hatmagos Phenom II X6-ét sem éri el, a négymagos Intel Core i5-2500K-t pedig meg sem közelíti, nem beszélve a Core i7-ről. Erőteljesebb magjainak és alacsonyabb cache- és memóriakésleltetésének köszönhetően az Intel chipjei hatalmas előnyre tesznek szert a kevéssé párhuzamosított kódok alatt, amilyenek tipikusan a játékok, amit az FX-8150 magasabb névleges órajelével sem tud ledolgozni.

Miért érdemes belevágnod a Scrum képzésünkbe? (x) Október 21-én Scrum alapozó képzést indít a HWSW, íme néhány jó érv a kurzus mellett.

A teljes képhez hozzátartozik, hogy az AMD szerint a jelenleg elterjedt Windows-verziókat nem optimalizálták a Bulldozer újszerű felépítéséhez, az operációs rendszer erőforrásütemezése nem veszi figyelembe hogy a magok kettes csoportokba vannak szervezve, így a Turbo Mode kevesebbszer kapcsolhat be. A Windows 8 azonban már fel lesz készítve erre, így a jövőre várható OS korai telepítésével az FX-alapú gépek tulajdonosai további extra teljesítményhez juthatnak. Az AMD mérései szerint a Windows 8-on mért eredmények játéktól függően 2-10 százalékos javulást mutatnak a Windows 7-tel összevetve, ez azonban nem változtat nagyot az összképen, játékra az FX-sorozatú chipek kevéssé tűnnek jó választásnak.

AMD FX-8150 relatív teljesítmény

100% = Intel Core i5-2500K

A kétmagos modulokból álló felépítés az energiatakarékosság terén várt eredményeket sem igazán hozza. Alapjáraton az FX-alapú rendszer fogyasztása nagyon közel esik az Intel chipes gépekéhez, ami nem csoda, figyelembe véve az AMD által alkalmazott erőteljes kapuzást - jelentős az előrelépés a Phenom II-höz képest. Terhelés alatt azonban egész másképp fest a helyzet, az FX-8150 fogyasztása jóval meghaladja az elődét és majdnem kétszeres a Core i5-2500K processzoros rendszerrel összevetve, ami nem csoda: a nyolcmagos Zambezi 2 milliárd tranzisztort tartalmaz, mérete 315 mm2, amivel majdnem másfélszer nagyobb a nem egészen 1 milliárd tranzisztorból álló négymagos Intel Sandy Bridge-nél, amely 216 mm2-es alapterülettel bír. Az FX-8150 TDP-értéke 125 watt, szemben a Core i5-2500K 95 wattjával.

A gamerek szerencséjére az FX jól tuningolhatónak tűnik, amit az AMD által elért 8,4 GHz feletti világrekord is bizonyít, igaz ezt az órajelet folyékony nitrogénes hűtéssel érték el. Léghűtés mellett a processzor nominális sebessége mintegy 4,6 GHz-ig húzható, efölött vízhűtést igényel - nem véletlen egybeesés, hogy az AMD saját márkanév alatt elkezdte vízhűtéses rendszer forgalmazását is, amelyhez mintegy 100 dollárért lehet majd hozzájutni.

Szerverfeladatokra jó lehet

A most publikált benchmarkok alapján a Bulldozer várhatóan a sok fixpontos művelettel bíró, masszívan párhuzamos szerverfeladatok alatt érzi majd jól magát mint amilyen a webkiszolgálás vagy a tranzakciófeldolgozás - ez nem is csoda, figyelembe véve az architektúra ide helyezett fókuszát. Ezekben az esetekben a sok párhuzamosan futó szál még a cache-ek és a rendszermemória viszonylag nagy késleltetését is jótékonyan el tudja majd fedni, ugyanakkor a sok mag kiszolgálásához nagy I/O sávszélességre lesz szükség, hogy ne éhezzenek folyamatosan adatok után - a jelenleg hozzáférhető legerősebb Opteronokban négy DDR3-vezérlő található.

Hogy mennyire is lesz jó a szerverfeladatok alatt nyújtott teljesítmény, egyelőre nem tudni, mivel ilyen szoftverekkel egyelőre nem végzett teszteket a külföldi média és az AMD sem publikált egyetlen teszteredményt sem - ezekre feltehetően a Bulldozer-alapú Opteronok későbbi rajtjakor kerül sor. A szerverekben való használhatóságot azonban a korábban már említett magas fogyasztás és hőfejlődés korlátozhatja, mivel ezek a gépek rendszerint napi 24 órában csúcsterhelésen vagy ehhez közel üzemelnek, az energiatakarékossági hátrány jelentős lehet a 32 nanométeres Xeonokhoz képest.

a címlapról