Szerző: Bodnár Ádám

2011. november 17. 12:35

Energiahatékonyság: kis előrelépés a Bulldozer

Folyamatosan szállingóznak a teszteredmények az AMD új szerverprocesszoráról, a Bulldozer-alapú 16 magos Interlagosról. A benchmarkok tanúsága szerint energiahatékonyság terén csak mérsékelt előrelépést képvisel elődjéhez képest.

A Bulldozertől mindenki az energiahatékonyság drámai javulását várta, hiszen az AMD mérnökei ezt szem előtt tartva tervezték az új mikroarchitektúrát és a chip fejlettebb, 32 nanométeres gyártástechnológián is készül a Globalfoundries drezdai üzemében.

Energiahatékonyság mindenek felett

Az AMD mérnökeinek egyik fő célkitűzése volt a Bulldozer megalkotásakor a minél nagyobb energiahatékonyság elérése. Az erre való törekvés az architektúrán és a megvalósításon is érződik: a nagy ötlet, hogy a processzormagok kettesével osztozzanak az adatok betöltését és kiírását, a SRAM cache vezérlését, az x86 utasítások dekódolását, ütemezését, az elágazások spekulatív lekezelését végző vezérlőlogikán és egy közös, erőteljes lebegőpontos blokkot használnak. Egy-egy chip több ilyen kétmagos modulból épül fel, amelyek közösen használják az L3 cache-t és a többi, magokon kívüli erőforrást, mint amilyen a memóriavezérlő és az I/O interfészek (Hypertransport).

Az AMD szerint azzal, hogy a kevéssé kihasznált, ugyanakkor nagy méretű áramkörökön, a frontenden és az FPU-n megosztoznak a processzormagok, a lehető legtöbb mag építhető adott szilíciumterületre, és az energiahatékonyság is javul azáltal, hogy egy kétmagos modulon belül az áramköri redundancia nagy része megszűnik. Ezzel a trükkel az aktív és szivárgási fogyasztás is jelentősen lecsökken a két önálló maghoz képest, hiszen egy modul kevesebb logikai tranzisztorból épül fel mintha mindkét magnak saját frontendje és FPU-ja lenne.

Az osztott FPU más szempontból is kívánatos lehet: a processzorok piaci pozicionálását alapvetően meghatározó névleges órajelet leginkább a lebegőpontos számításokat végző kódok által okozott hőfejlődés limitálja, ezért a kevesebb lebegőpontos végrehajtóegység azt is jelenti, hogy kevesebb hő szabadul fel csúcsterhelésen, így egy chipet magasabb névleges órajelen lehet járatni és eladni. Nem csak a chip logikai felépítése, hanem fizikai implementációja is energiahatékony igyekszik lenni, ennek érdekében az AMD agresszív kapuzást vezetett be, valamint új energiagazdálkodási trükköket (pl. kétféle Turbo mód, C6 állapot).

Baljós előjel volt a Zambezi

Az új Opteronokkal jelentős kockázatot vállalt az AMD, mivel a vadonatúj architektúrát a Globalfoundries szintén vadonatúj, 32 nanométeres gyártástechnológiáján implementálta. Ez már a piaci bevezetésben is fennakadásokat okozott, az eredetileg nyárra tervezett rajtot novemberre kellett halasztani, aminek a kiszivárgott információk szerint a Globalfoundriesnál felmerült problémák az okai. Szintén erre vezethető vissza, hogy az Opteron 6200-as generációból egyelőre csak a 16 magos csúcsváltozatokat szállítja az AMD, a termékskálán lejjebb levő chipek érkezéséről semmi hír.

A Bulldozer asztali változatának, a Zambezinek a rajtjakor is látszott, hogy az új megközelítés energiahatékonyság terén nem képes hozni a várakozásokat, azonban ezt a legtöbben azzal magyarázták, hogy a tesztoldalak olyan FPU-intenzív kódokkal mérték a nyolcmagos FX-8150 processzor teljesítményét és fogyasztását mint a játékok, videószerkesztés, képmanipuláció és 3D renderelés, amelyek a csúcskategóriás desktop gépeken gyakran futtatott feladatok. Az FX-8150 érdemeit elismerők is elfogadták, hogy fogyasztása extrém magas a konkurenciához képest.

Mennyi az annyi?

A Bulldozer-alapú Opteronok hétfői színre lépésével megjelentek az első iparági szabványos tesztek eredményei, amelyek között nem csak teljesítményre, hanem energiahatékonyságra vonatkozó benchmarkok is vannak. A Standard Performance Evaluation Corporation (SPEC) publikálta az első SPECpower teszteredményeket, amelyek egy Java szerverfeladat futtatása alatt mutatott fogyasztást és számítási teljesítményt, valamint e kettő hányadosát tartalmazzák, így képet kaphatunk arról, hogy egy szerver milyen sebességgel és milyen fogyasztás mellett hajtotta végre a feladatot. A Java szerver workload elméletileg "kedvez" is a Bulldozernek, mivel alapvetően fixpontos kódot használ - az energiahatékonysági mutatókban azonban ez sajnos nem érhető tetten.

Hogy mennyit lépett előre az AMD, annak kiderítéséhez érdemes a múltbeli benchmarkokra vetni egy pillantást. A SPECpower_ssj2008 szerint kétfoglalatos konfigurációban a 45 nanométeres négymagos Shanghai szűk 60 százalékkal múlta felül energiahatékonyságban a 65 nanométeres négymagos Barcelonát, a csíkszélességváltás (és minimális architekturális újdonságok) tehát ekkora előnyt jelentettek. Ugyanekkora előrelépést képviselt az azonos, 45 nanométeres gyártástechnológián implementált hatmagos Istanbul is a Shanghaihoz képest, itt a processzor felépítésén és funkcionalitásán változtatott az AMD, a gyártástechnológia változatlan maradt. A két Istanbul egybetokozásából született 12 magos Magny Cours pedig újra 60 százalék feletti növekedést hozott energiahatékonyságban. A várakozás ennek megfelelően az volt, hogy a tervezés első pillanatától az alacsony fogyasztásra és magas hatékonyságra tervezett Bulldozer is képes lesz hasonló előrelépést elérni és az AMD nyilvános vállalásai is ezt támasztották alá.

Egységnyi fogyasztásra eső teljesítmény a processzorgenerációk között.

Az előző generációs, 45 nanométeres technológiával gyártott, 12 magos Opteron 6176SE-hez képest a 32 nanométeres, 16 magos Opteron 6276 azonban nem egészen 26 százalékkal magasabb pontszámot ért el az iparági szabványnak tekinthető SPECpower_ssj2008 tesztben kétfoglalatos konfigurációban, ami nem akkora előrelépés mint amit a korábbiakban a cég egy-egy új generációs Opteronjának megjelenésekor tapasztalhattunk. Igaz, az Opteron 6176SE egy 140 wattos TDP-jű processzor, de az alacsonyabb órajelű, az Opteron 6276-hoz hasonlóan 115 wattos Opteron 6168 energiahatékonysági mutatója nem különbözik tőle érdemben, amint az a fenti táblázatból is kiderül.

Az eredményekből az is látszik, hogy az AMD erőfeszítései a kapuzás terén eredményesek voltak: a SPECpower_ssj2008 benchmark alapján a két Opteron 6176 processzort tartalmazó Gateway GR385 F1 szever üresjárati ("idle") fogyasztása meghaladta a 97 wattot is, a szintén kétfoglalatos Opteron 6276-alapú ProLiant DL165 G7 már csak 68,3 wattot kért - a csúcsterhelésen mért fogyasztás azonban némileg magasabb az új Opteron esetében (308 watt a 297 ellenében). Sajnos alacsonyabb fogyasztású, illetve 16-nál kevesebb magot felvonultató 6200-as Opteronokkal még nem születtek SPECpower teszteredmények, feltehetően azért mert a chipek még nem hozzáférhetők a szervergyártók számára sem.

Miért lehet mindez?

A teljesítmény/fogyasztás mutató korábbinál kisebb emelkedésének okáról legfeljebb találgatni lehet. Kézenfekvő lenne a Globalfoundriest és az új gyártástechnológiát hibáztatni, amely miatt a Bulldozerek nem csak késtek, hanem a várt órajel/fogyasztás karakterisztikát sem hozzák. A 32 nanométeres csíkszélességre való átállás egyetlen hozadéka egyelőre a méretcsökkentés, a gyártástechnológián a Bulldozer órajele egyelőre alig skálázódik, még a nyolcmagos desktop csúcsváltozat, az FX-8150 névleges órajele sem több 3,6 GHz-nél (turbóval 4,2 GHz), majdnem ennyit tudott a Phenom II 45 nanométeres csíkszélességen.

A technológia finomításával ez a jövőben változhat, ahogy a chipgyártó csiszolja az eljárást és új steppingek is érkeznek, így javulhat az Opteronok órajele és ezzel a teljesítménye is, változatlan fogyasztás mellett, ami az energiahatékonysági mutatók növekedésével járna. Ezzel párhuzamosan ahogy az AMD egyre jobban kiismeri a Globalfoundries technológiájának korlátait, a jövőben érkező architektúráját jobban hozzáigazíthatja annak karakterisztikájához, akár egyes áramkörök finomításával, akár teljes áttervezésével.

a címlapról

dualsense

0

Bemutatkozott a PS5 kontrollere

2020. április 8. 12:30

A Sony az elődökhöz képest alaposan átrajzolt vezérlője DualSense néven debütál.