Mellékleteink: HUP | Gamekapocs
Keres
Július 19-én SYSADMINDAY: egy teljes security meetup, számos szórakoztató program, és Felméri Péter standupja várja az érdeklődőket!

AMD Barcelona: fejlett energiatakarékossági technikák és marketing

Bizó Dániel, 2007. szeptember 13. 12:59
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

Mint arról beszámoltunk, az AMD hétfőn mutatta be hivatalosan is következő generációs processzorát, a Barcelonát, mely esménynek Európában stílusosan a Barcelona városát választotta. Dirk Meyer, a vállalat operatív vezérigazgatója elmondta, a Barcelona fejlesztéseinek egyik fókusza az energiahatékonyság volt, aminek érdekében számos technikát bevetettek. Ezen túlmenően a vállalat marketing okokból új jelölési rendszer is bevezetett az egyes energiaosztályok számára, melyek jobban festenek az Intel TDP értékei mellett.

hirdetés
[HWSW] Mint arról beszámoltunk, az AMD hétfőn mutatta be hivatalosan is következő generációs processzorát, a Barcelonát, mely esménynek Európában stílusosan a Barcelona városát választotta. Dirk Meyer, a vállalat operatív vezérigazgatója elmondta, a Barcelona fejlesztéseinek egyik fókusza az energiahatékonyság volt, aminek érdekében számos technikát bevetettek. Ezen túlmenően a vállalat marketing okokból új jelölési rendszer is bevezetett az egyes energiaosztályok számára, melyek jobban festenek az Intel TDP értékei mellett.

By Design

Az AMD 65 nanométeres, szigetelőrétegen feszített szilíciumot alkalmazó eljárásával Drezdában készülő Barcelona 463 millió tranzisztorból épül fel, amivel igen tekintélyes méretet is ölt. Az első négymagos x86-chip mintegy 285 négyzetmilliméter szilíciumot foglal el, amivel lényegesen nagyobb mint elődje, a nagyjából 160 négyzetmilliméteres, kétmagos Opteron (magonként 1 megabájt másodszintű gyorsítótárral), vagy a 143 négyzetmilliméteres, kétmagos Intel Woodcrest (4 megabájtos változat), melyekből a négymagos Clovertown és Tigerton kódnéven Xeonok is készülnek multi-chip tokozási techikával. Az energiaplafon következtében azonban a Barcelona maximális fogyasztása és hőfejlődése nem lépheti át a korábbi generációkét, aminek érdekében számos eszközt bevetettek.

A monolitikus felépítés -- melyet az AMD retorikája natívnak nevez -- bár gyártási szempontból hátrányos, architekturális és elektronikai oldalról közelítve egyértelmű előnyöket mutat fel az Intel moduláris megoldásával szemben. Mivel a négy mag egyetlen szilícium szeleten található, a közöttük lévő kommunikáció nagyságrendekkel gyorsabb ahhoz képest, mintha a jelnek el kellene hagynia a chipet, miközben az ehhez szükséges energia is töredéke az utóbbinak. Az Intel mulit-chip felépítésekor a két Woodcrest közötti kommunikáció az adatbuszon keresztül zajlik, vagyis a jelek igen hosszú utat tesznek meg, ami nagyságrendekkel több energiát emészt fel, ráadásul a processzornál fejletlenebb gyártástechnológiával készült, vagyis kevésbé energiahatékony chipsetnek is aktiválódnia kell.

A Barcelona egyes magjai az AMD oldalán elsőként debütáló 2 megabájtnyi integrált harmadszintű gyorsítótáron (L3 cache) keresztül végzik az adatcserét, mely lényegében ezen célból került a chipre. Finomabb geometriájú eljárások bevezetésével akár 6-8 megabájtos változatok is gazdaságosan termelhetővé válnak majd. Mivel a magok közötti kommunikáció nemcsak kevés energiát emészt fel, hanem villámgyors, és nem terheli a külső adatlinkeket, ezért a processzor és a rendszer erőforrásai hatékonyabban kerülnek kiaknázásra, ugyanis kevesebb az erőforrások várakozással elpazarolt ideje, ami ismét az energiahatékonyabb működést erősíti.

Dinamikus órajel- és feszültségszabályozás

Azon túl, hogy a monolitikus design ezek miatt alapvető előnnyel indul architekturálisan a modulárissal szemben, a Barcelonán dolgozó mérnökök további technikákat is bevetettek a fogyasztás féken tartása érdekében. A Barcelona minden egyes magja önálló órajel-disztribúciós és energiahálózattal rendelkezik, ami lehetővé teszi, hogy a magok egymástól függetlenül kalibrálják órajelüket futásidőben, a terhelés függvényében (PowerNow!). Az Intel termékei jelenleg erre nem képesek, vagyis minden mag a legnagyobb terheltségű órajelén üzemel, még ha üresen is áll, ami energiapazarlást jelent.

Tekintve, hogy a mai nagyteljesítményű processzorok órajelét az energiaplafon határolja be, ez elméletileg lehetővé teszi, hogy egyes magok "túlhajtsák" magukat, miközben a többi éppen üresen áll, és keveset fogyaszt. Az Intel ilyen képességet mutat majd be az októberben tömeggyártásba kerülő 45 nanométeres, Penryn-generációs chipeknél, aminek kifejezetten a rosszul párhuzamsoított PC-szoftvereknél mutatkozhat meg az előnye, szervereknél kisebb relevanciával bír, hiszen a teljesítmény növelésének kevésbé energiahatékony módja.

A magok tápellátása azonos, ami korlátozza ugyan a megtakarítható energia mértékét (az órajellel papíron lineárisan, a feszültséggel négyzetesen skálázódik), ugyanakkor független a magokon kívül eső blokkoktól, mint az L3 cache, vagy az integrált memóriavezérlő, ami lehetővé teszi az alacsonyabb fogyasztás (vagy gyárilag valamivel nagyobb teljesítmény) és a mélyebb energiaszintek elérését (sleep states). Utóbbi kifejezetten notebookokba szánt mobil chipeknél, nem pedig ideális esetben magas terheltségű és nagyteljesítményű tápokkal szerelt szervereknél hoz hasznot. A Barcelona mobil derivatívái ugyanakkor az AMD korlátozott mérnöki erőforrásai miatt még 2008-ban sem érkeznek meg a vállalat terméktervei szerint. A valóságban így ezek a képességek inkább az asztali PC-k terén fejthetik ki jótékony hatásukat.

Agresszív órajelkapuzás

Mélyebbre hatolva a Barcelona energiatakarékossági képességeiben, az egyes magokat a fejlesztők az elődökhöz képest továbbfejlesztett órajelkapuzási technikával vértezték fel. A chip durva és finom órajelkapuzást egyaránt felvonultat: képes teljes blokkok, például teljes végrehajtóegységek teljes lekapcsolására, mikor a futtatott kód szükségtelenné teszi azok aktívan tartását; ezen túlmenően pedig képes kisebb tranzisztorcsoportokat deaktiválni, akár egyetlen órajel alatt. A magokon kívül a memóriavezérlő is lekapcsolja az éppen nem szükséges áramköreit. Ilyen technikákat az Intel a 2003-ban debütált Banias (Pentium M) óta alkalmaz agresszívan, a pontos összevetéshez a két cég azonban nem hoz nyilvánosságra elegendő részletet.

A processzoron kívül

Látható tehát, hogy a Barcelonával az AMD számos területen megelőzte az Intelt a chipszntű energiatakarékossági technikák alkalmazásában, más területeken pedig behozta vagy csökkentette lemaradását. Ezt tovább erősíti rendszerszintű előnye, a mindenkori legfeljettebb félvezetőeljárással készülő memóriavezérlő és az integrált HyperTransport linkek révén ugyanis a kevésbé fejlett technológiával gyártott alaplapi chipset funkciói, így felépítése és fogyasztása redukálható.

Szintén előnyt jelent az AMD oldalán, hogy DDR2 memóriát vezérel, szemben az Intel sztenderd két- és négyutas (Bensley és Caneland) platformjaival, melyek FB-DIMM-et (fully buffered DIMM) használnak. Az FB modulokon megtalálható bufferek jelentette extra fogyasztás egy nagyobb memóriakapacitású gép esetében akár 50-200 watt extra energiát is jelenthetnek -- igaz, egyre alacsonyabb fogyasztású FB-DIMM memóriamodulok kerülnek piacra, így a jobban terlhelhető memóriaalrendszer fogyasztásbeli hátránya idővel csökken.

ACP vs. TDP

Az energiahatékonyság fokozásának érdekében nemcsak mérnökeit vetette be az AMD. A vállalat vélhetően úgy találta, érezhető hátrányba kerül marketingben az Intel által használt, a hűtési rendszer méretezése szempontjából érdekes TDP (thermal design power) metodikájával szemben. Az AMD ugyanis egyfajta elméleti elektronikai keretként (maximálisan megengedett chipfeszültség és áramfelvétel szorzata) határozza meg a tartós hődisszipáció maximális értékét, melyet csak extrém elektronikai körülmények között léphet át rövid időre.

Az Intel ezzel szemben empirikusan, egy saját maga által összeállíott kódmixszel és némi extrapolációs modellezéssel határozza meg a TDP-t, melyek közül a legmagasabb tranzisztoraktivitású kód alatt mért fogyasztás a mérvadó abban, hogy milyen órajelen futhat legfeljebb, illetve melyik energiaosztályba esik. Ez a módszer ugyanakkor természetszerűleg (ugyanolyan chipre is) alacsonyabb TDP-t eredményez, ugyanis nem elméleti, hanem gyakorlati csúcsot (tartós állapot) állapít meg, és kimondja, hogy az ennél magasabb hőfejlődés igen valószínűtlen, ugyanakkor nem kizárt, például energiavírusok esetében. Egyes chipeknél az Intel TDP-je akár 25 százalékkal is alacsonyabb lehet az AMD metodikájával meghatározottnál.


Y-tengely: alkalmazások száma, X-tengely: fogyasztás az elméleti maximum százalékában

Hogy ezt az alapvető hátrányt ledolgozza, az AMD nem megváltoztatta TDP metodikáját, hanem új címkét vezetett be, mégpedig az average CPU power, vagyis ACP néven. Az ACP-vel az AMD célja látványosan az, hogy alálicitáljon az Intel TDP mutatóinak. Az ACP révén az AMD 120 wattos TDP energiaosztályából 105, a 95 wattosból 75, a 68 wattosból pedig 55 watt lett, szemben az Intel 120, 80 és 50 wattos szerver energiaosztályaival. Az ACP szintén empirikus adatok alapján került meghatározásra, többek között TPC-C, SPECCPU, SPECjbb és STREAM tesztek futtatásával, és ezek átlaga alapján kerül meghatározásra a mutató.

Konklúzió

Különféle takarékossági technikák bevetésével az AMD nagyot lépett előre energiahatékonyság terén az előző generációkhoz képest a Barcelonával, ráadásul a számos inkrementális változtatással erőteljesebb felépítésű magok is tovább fokozzák ezt -- adott energiából több munkát végeznek el. Az ACP bevezetésével marketing kommunikációját támogatja meg jelentősen, tovább javítva a platform percepcióját. A fogyasztásnak és energiahatékonyságnak azonban csak az abszolút teljesítmény fényében van értelme, melyben a Barcelona a jelenlegi, 2 gigahertzes órajeleken a korábban felépült várakozások és a cég helyzetének fényében nem remekel az Intel felhozatalával szemben.

Tagadhatatlan ugyanakkor, hogy a Barcelona jelentősen javít az AMD szerverpiaci versenyképességén, és ezáltal remélhetőleg átlagos eladási árán is, és amennyiben az órajeleket az ígért ütemben sikerül felfuttatnia (2,3 gigahertzet ígér legalább a negyedik negyedévre), és az ilyen példányokat megfelelő volumenben szállítani, úgy erre minden esélye megvan a cégnek. A chip előzetes teljesítményével egy következő cikkben foglalkozunk.

A IT-üzemeltetők világnapján egy teljes security meetup, számos szórakoztató program, és Felméri Péter standupja várja az érdeklődőket az Ankertbe.