:

Szerző: Bodnár Ádám

2014. január 15. 13:11

AMD Kaveri a desktopon: érdemes megvenni?

Tegnap rajtolt el az AMD vadonatúj processzorgenerációja, a korábban Kaveri néven emlegetett, grafikus vezérlőt is integráló A10-sorozat. Ezzel a lapkacsaláddal veszi kezdetét az "igazi forradalom", a grafikus mag végrehajtóegységei ugyanis végre egyenrangúak a processzormagokkal. Mekkora előrelépést hoz az új processzorcsalád, érdemes ilyenbe ruházni most?

A bejelentéssel együtt nyilvánossá váltak az első teszteredmények is, megpróbálunk az Anandtech által publikált eredményekből néhány következtetést levonni arra nézve, mekkora előrelépést is jelent valójában a Kaveri a közvetlen elődhöz, a Richlandhez képest. Ehhez a most bemutatott csúcsmodell, az A10-7850K által produkált számokat vetjük össze az előd A10-6800K eredményeivel.

Steamroller: alacsonyabb órajel, de magasabb IPC

A két chip teljesítményének összevetése adja magát: mindketten generációjuk csúcsát képviselik és nagyon hasonló a fogyasztásuk is (95, illetve 100 watt). Mind a két lapka négy processzormagot tartalmaz (két Bulldozer-modul), a Kaveri generációs chip órajele azonban némileg alacsonyabb. Ennek legvalószínűbb oka, hogy a lapka egy sokkal komplexebb grafikus vezérlőt tartalmaz mint az elődje, amely több helyet foglal és többet is fogyaszt, így hiába a fejlettebb gyártástechnológia, a CPU órajelét, ezzel pedig fogyasztását is vissza kellett fogni, hogy a Kaveri beférjen a termikus keretbe. Ahogy később látni fogjuk, ez bizonyos feladatokban hátrányt jelent, máshol azonban nem érezhető, ugyanis a Steamroller magok optimalizációja miatt azok órajelenkénti utasításvégrehajtási képessége (Instruction Per Clock, IPC) enyhén megnövekedett.

100% = AMD A10-6800K

Az enyhe itt valóban enyhét jelent, az Anandtech által elvégzett tesztek alapján az új generációs processzor a PovRay tesztben 20 százalékkal múlja felül elődjét, egyébként a teljesítményelőnye - ha van -, inkább csak pár százalékos, sokszor pedig lassabb is a magasabb órajelű Richlandnél. Kiugró a különbség az Agisoft PhotoScan tesztben, amely a beépített grafikus vezérlőt (IGP) is használja, a Kaveri itt elődje sebességének több mint kétszeresét hozza, ezzel is megmutatva, milyen lehetőségek rejlenek az új típusú felépítésben - ennek kihasználásához azonban szoftveres oldalról is szükséges a támogatás persze. Az átlagos teljesítménynövekedés az Anandtech CPU- tesztjeiben 9 százalék egyébként, ami csak az AgiSoft PS tesztnek köszönhető, ezt kivéve a képletből a különbség 2 százalék csupán.

A benchmarkok arra is rámutatnak, a Steamroller magoknak az optimalizáció ellenére sem sikerült leküzdeniük a Bulldozer megközelítésének problémáit. Amint az ismert, az AMD az éveken keresztül fejlesztett processzorgenerációt kimondottan szilíciumtakarékosra tervezte, a processzormagok ezért párosával osztoznak a frontenden és a lebegőpontos egységen. A Steamroller magok a módosítások dacára nem tudnak érdemben hozzáadni a korábbi generáció (Piledriver) teljesítményéhez, ami előrevetíti a későbbre várható Steamroller-alapú Opteronok további sikertelenségét azokon a felhasználási területeken, ahol számít a magonkénti teljesítmény, például a szoftverek licencelése miatt (gyakorlatilag az összes kereskedelmi szerverfeladat, vállalati alkalmazás).

Játszani nem ez való

A Kaveri nagy dobása persze nem a Steamroller-alapú processzormagok beépítése, hanem a vadonatúj, GCN architektúrán alapuló grafikus vezérlő integrálása. A vállalat korábban azt célozta meg, hogy az új generációs processzorokon a korszerű játékok Full HD felbontásban legalább 30 fps sebességgel fussanak. Az Anandtech a játéktesztjeit három különböző felbontásban és részletességi beállítás mellett futtatta, az eredmények alapján pedig elmondható: ugyan a GCN-alapú integrált vezérlő teljesítményben érezhető előrelépést jelent az A10-6800K VLIW4-re épülő grafikus magjához képest, a világot nem váltja meg - a tesztek szerint az átlagos teljesítménynövekedés 15 százalék körüli.


Nyerd meg az 5 darab, 1000 eurós Craft konferenciajegy egyikét!

A kétnapos, nemzetközi fejlesztői konferencia apropójából a HWSW kraftie nyereményjátékot indít.

Nyerd meg az 5 darab, 1000 eurós Craft konferenciajegy egyikét! A kétnapos, nemzetközi fejlesztői konferencia apropójából a HWSW kraftie nyereményjátékot indít.

A publikált eredmények alapján az új processzor integrált vezérlője 1280-as felbontásban, kimondottan sebességre optimalizált beállítások mellett a tesztelt játékok mindegyikében élvezhető teljesítményt ad (kivéve a gépgyilkos Company of Heroes 2-t), de ez az elődjére, az A10-6800K-ra ugyanúgy igaz. Ebben a felbontásban, ilyen részletességi beállítások mellett szinte azonos fps-t ad a Richland és a Kaveri, egyiknek sem elég erős a CPU-ja ahhoz, hogy az integrált vezérlő kifussa magát és a kettő közötti különbség kiütközzön.

A problémák ugyanakkor már 1680x150 pixeles felbontásban és minőségre optimalizált részletességi beállítások mellett elkezdődnek, az EGO engine-re épülő F1 2013 kivételével az összes tesztelt játék átlagos képfrissítési sebessége beesik 25 fps alá a Richlanden és a Kaverin egyaránt, full HD felbontásban, maximális részletesség mellett pedig mindkét GPU-n játszhatatlanok ezek a címek (ismét az F1 2013 a kivétel). Vagyis, 1920 oszlopos felbontás mellett komoly kompromisszumot kell kötni a részletesség terén az élvezetes játékhoz, de még 1680 pixel széles megjelenítő esetén is lejjebb kell tekerni egy-két effektet a folyamatos 30 fps-hez (a fenti táblázatban az átlagos fps érték szerepel).

Az A10-6800K megjelenésekor 142 dolláros listaáron volt hozzáférhető, az A10-7850K a hivatalos árlista szerint 173 dollárt kóstál induláskor. Az AMD ezzel a legdrágább asztali Intel Core i3 (149 dollár) és a legolcsóbb Core i5 (182 dollár) közé lőtte be a chip árát - Magyarországon 50 ezer forint fölé várható a bolti ára az első hírek szerint. Véleményünk szerint játékra asztali gépet nem nagyon érdemes az A10-7850K-ra építeni egyelőre: a Steamroller magok és a GCN-alapú videovezérlő sem hoznak nagy előrelépést, érdemes inkább egy alsó-közepes kategóriájú grafikus kártyába ruházni és egy olcsóbb, akár régebbi generációs processzort megvenni, egy ilyen összeállítás nagyobb eséllyel ad élvezhető sebességet a felbontás és a részletesség növelése esetén. Ráadásul a méregdrága, 2133 MHz-es memóriát is megspóroljuk ekkor.

A Kaveri elsődleges piacát nem is az asztali gépek jelentik, hanem a noteszek. Kérdés persze, hogy ha a legnagyobb teljesítményű és legnagyobb fogyasztású Kaveri így teljesít játékok futtatásakor, akkor mit várhatunk egy visszafogottabb órajelű, gyengébb grafikus chipet tartalmazó, alacsonyabb fogyasztású verziótól - igaz, az AMD által megcélzott, belépő kategóriás notebookokon ma még nem általános a full HD felbontású kijelző, inkább az 1366 vagy 1680 oszlopos megjelenítő az általános. Az Anandtech tesztjei alapján a jelenleg hozzáférhető leggyengébb Kaveri (négymagos, 3,1 GHz-es A8-7600) játékok alatt nyújtott teljesítményére ugyanaz igaz mint a csúcsmodellére. Ezek alapján  érdemesebb lehet talán ezt a 45 wattos modellt megvenni egy asztali gépbe 119 dolláros áron egy diszkrét videokártya mellé.

A probléma: a memória

A Kaveri nagy dobása, hogy a hUMA (heterogeneous Unified Memory Architecture) révén a processzormagok és a GPU egységesen kezelik a közös memóriaterületeket és egységes pointereket használnak. Ez látványosan egyszerűsíti a programozást és gyorsítja a végrehajtást, a közös adatstruktúrákat nem kell folyamatosan mozgatni a területek között. Ez nem csak a fizikai, de a virtuális memóriára is kiterjed, a GPU is képes elérni a virtuális memóriát, az operációs rendszer memóriakezelője pedig rugalmasabban oszthatja ki a tárterületet. A hUMA harmadik fontos hozadéka, hogy a CPU és a GPU folyamatai dinamikusan foglalhatnak le memóriaterületet a teljes kapacitásból, ezzel egyrészt csökken a töredezettség, másrészt optimálisabb kihasználást jelent

A megközelítés ugyan előremutató, de ahhoz, hogy igazán jól működjön, a videovezérlővel integrált processzoroknak jóval nagyobb sávszélességre lenne szüksége: hiába az egységes címzés és a dinamikus memóriafoglalás, ha a memória maga lassú, vagy legalábbis jóval lassabb a grafikus kártyákon elérhető dedikált RAM-hoz képest. A processzorokra integrált vezérlők mindaddig igen korlátozott képességűek lesznek, amíg nem kapnak jóval gyorsabb elérést a memória felé - enélkül esélyük sem lesz megközelíteni a diszkrét vezérlők sebességét, heterogén programozhatóság ide vagy oda. Nem véletlen, hogy a Kaveri kapcsán gyakran emlegetett új generációs konzolok közül a PlayStation 4 GDDR5 memóriát kapott óriási sávszélességgel (176 GBps), az Xbox One-nál pedig egy 102 GBps sebességgel elérhető eSRAM segít rá a 68 GBps-es külső sávszélességre. Összehasonlításképp: az A10-7850K esetében 2133 MHz-es DDR3 modulokkal 34 GBps a csúcs.

Amíg ekkora a különbség a CPU+GPU számára egy PC-ben elérhető és a diszkrét videovezérlők vagy a játékkonzolok chipjei rendelkezésére álló sávszélesség között, a teljesítménykülönbség is megmarad. Kíváncsian várjuk a későbbi inkarnációkat, amelyek remélhetőleg sokkal potensebb memóriavezérlőt tartalmaznak majd. Emellett persze fontos lesz a heterogén programozhatóságból profitáló szoftverek elterjedése is - a Kaveri, s általa az AMD új megközelítése addig csupán egy technológiai ígéret marad.

Milyen technológiai és munkaerőpiaci hatások érhetik a backendes szakmát? Május 8-án végre elindul az idei kraftie! meetup-sorozat is (helyszíni vagy online részvétellel).

a címlapról

Hirdetés

Security témákkal folyatódik az AWS hazai online meetup-sorozata!

2024. április 25. 12:01

A sorozat május 28-i, harmadik állomásán az AWS-ben biztonsági megoldásait vesszük nagyító alá. Átnézzük a teljes AWS security portfóliót a konténerbiztonságtól a gépi tanulásos alkalmazások védelmén át, egészen az incidenskezelésig.