Szerző: Bizó Dániel

2007. november 12. 14:22

Elrajtolt az Intel következő generációs processzorcsaládja

Az Intel ma útjára bocsátja a Penryn kódnévvel illetett generációt, mely már a vállalat 45 nanométeres csíkszélességű gyártástechnológiáját alkalmazza. A kétmagos Penryn a tavaly nyáron megjelent Merom-generáció inkrementális továbbfejlesztésének tekinthető, és elsősorban az energiahatékonyságban és egyes számításintenzív kódok alatti teljesítményben mutat előrelépést elődjéhez képest. Az új chip további előnye az Intel számára, hogy a tömegtermelhetőség szempontjából ideális méretű, így előállítása hatékony.

[HWSW] Az Intel ma útjára bocsátja a Penryn kódnévvel illetett generációt, mely már a vállalat 45 nanométeres csíkszélességű gyártástechnológiáját alkalmazza. A kétmagos Penryn a tavaly nyáron megjelent Merom-generáció inkrementális továbbfejlesztésének tekinthető, és elsősorban az energiahatékonyságban és egyes számításintenzív kódok alatti teljesítményben mutat előrelépést elődjéhez képest. Az új chip további előnye az Intel számára, hogy a tömegtermelhetőség szempontjából ideális méretű, így előállítása hatékony.

Három és fél év munka eredménye

Az Intel már két üzemében, az oregoni D1D-ben és az arizonai Fab 32-ben folyik a Penryn tömegtermelése, aminek köszönhetően az Intel 10 új négymagos Xeont (Harpertown, 2 chip egy tokban) azonnali hozzáférhetőségét jelentette be 2 és 3,16 gigahertz közötti órajeleken melyekhez hamarosan továbbiak csatlakoznak. Jövő év első felében az izraeli Fab 28, majd a második felében az új-mexikói Fab 11X csatlakoznak majd, ahogyan az Intel áttereli processzorgyártását a 45 nanométeres eljárására, párhuzamosan az új chipek iránti kereslet felfutásával. A felszabaduló 65 nanométeres gyártósorokat az önmagukban sokkal kevésbé profitábilis, de a processzoreladásokat támogató chipsetek és grafikus chipek termelésével köti le az Intel, tovább amortizálva a csillagászati befektetéseket.

A Penrynnel kapcsolatos részletek régóta ismertek, a vállalat számos alkalommal mélyrehatóan tárgyalta azt. A kétmagos chip nagyjából 410 millió tranzisztorból épül fel, 117 millióval többől, mint a Merom, ennek ellenére mérete mindössze 107 négyzetmilliméter, szemben a 65 nanométeres Merom 143 négyzetmilliméterével, vagyis még olcsóbban, alacsonyabb selejthányaddal termelhető, mint elődje. A tranzisztorszám növekedését elsősorban a nagyobb méretű, 6 megabájtos másodszintű gyorsítótár (L2 cache) magyarázza, ugyanakkor a végrehajtó logikában is történtek optimalizálások, és 47 új SSE4 vektorutasítás is belekerült.

A Penryn nyilvánvalóan a Merom egyeneságú leszármazottja, ez azonban nem jelenti azt, hogy megalkotása kevés erőfeszítést igényelt volna az Intel részéről. A Penryn tervezőcsapata 2004 nyarán formálódott, miután a Tejas fejlesztéseit törölte a vállalat, és új irányt szabott ki. Több mint két év munkát követően 2006 karácsonyára kapták vissza az első példányokat, árulta el a HWSW kérdésére Münchenben Stephen Fischer vezető tervező, mellyel a szimulációkat követően megkezdődhetett a design fizikai tesztelése is -- láthatóan nem adódtak komolyabb problémák, és kevesebb mint egy évvel az első szilíciumot követően már tömegtermelésbe került a chip.

A tavaly nyáron debütált Merom, mely a többi Core mikroarchitektúrájú chip anyjának tekinthető, az Intel izraeli csapatát (Haifa) dicséri, fejlesztései pedig nagyjából a legelső Pentium M, a 130 nanométeres Banias 2003 eleji megjelenését követően kezdődhettek, mely szintén az izraeliek műve. A Merom tervezése még javában folyt tehát, mikor a Penryn amerikai csapata megalakult azzal a feladattal, hogy készítsek el annak 45 nanométeres derivatíváját.

Ez azt jelentette, hogy a Penryn csapatának folyamatosan követnie kellett a Merom adatbázisát, és gyakran szinkronizálni, valamint rendszeresen személyesen látogatást tettek a haifai központba, árulta el Fischer. A mikroarchitekturális, logikai szintű tervezést követően az elektronikai implementáció szempontjából a Merom egy kifejezetten stabil projekt volt, így a Penryn "az egyik legsimább projekt volt, melyet valaha csináltam", állította a chiptervező egy beszélgetés során, aki többek között a Katmaion (legelső Pentium III) és a Prescott törlésre került útódain is dolgozott.

Kifinomult energiatakarékosság

A Core mikroarchitektúra 45 nanométeres eljárásra ültetése mellett azonban a Penryn csapata továbbfejlesztésekkel sem maradt adós. A Penryn, hasonlóan a Meromhoz, alapvetően az alacsony fogyasztást és energiahatékonyságot megcélzó design, mely az asztali és szerverváltozatok alapjául szolgál. Ennek megfelelően tervezésekor a notebookokat tartották szem előtt a tervezők, ami a gyártástechnológia képességeit kiaknázó fizikai megvalósítás mellett több intelligens képességet eredményezett. Érdekes, hogy a Penryn egyes más, korábbi chipekkel szemben nem alkalmaz többféle, különböző teljesítménybeli és szivárgási jellemzőkkel bíró tranzisztort a szivárgási áram kordában tartása érdekében.

Az egyik ilyen intelligens képesség az úgynevezett Deep Power Down, vagyis a Penryn a Meromhoz képest egy újabb, mélyebb energiaszinttel (C5) bővült, melybe futásidőben is képes rövid időre belépni annak érdekében, hogy az alacsony processzoraktivitást igénylő szoftverek futtatásakor számottevő energiát spóroljon meg -- mely energiát elsősorban az inaktív áramkörökből szivárgó áram képez. Ezen a mély energiaszinten gyakorlatilag a teljes chip kikapcsolásra kerül, így megszűnik a magokban az órajeldisztribúció, a cache-eket kiürítést követően lekapcsolja a chip -- működéséhez a chipset támogatása szükséges, melyet a Santa Rosa platform már biztosít.

A Penryn ebbe az állapotba technikailag akár másodpercenként több ezerszer is képes be is kilépni. Eléréséhez nem szükséges kifejezett szoftveres támogatás az operációs rendszer részéről (az ACPI BIOS-on keresztül természetesen feltérképezi az elérhető szinteket), ugyanis a chip saját hatáskörben dönt a C4 és C5 állapot között, mégpedig egy tapasztalati úton működő heurisztika alapján. Erre azért van szükség, mert a mély energiaszintbe való be- és kilépésnek energiaköltsége van, melyet az operációs rendszer nem tud figyelembe venni, ahogyan az energiaszintbe való be- és kilépés végrehajtáshoz szükséges idő alatt a rendszer energiát pazarol, hiszen nem tud hasznos munkát végezni. A túl gyakori váltogatás tehát rontana az akkumulátoridőn, ahelyett, hogy javítana.

Fischer elmondása alapján 150 mikroszekundum szükséges ahhoz, hogy a Penryn elhagyja ezt az állapotot, vagyis felhasználói szemmel észrevehetetlen ennek az állapotnak a megjelenése. A notebook chip képes akár két megszakításkérelem között is mély energiaszintet felvenni. A gyakorlati tapasztalat alapján amennyiben ezek a processzoraktivitást igénylő feladatok 3-4 ezredmásodpercnél ritkábban érkeznek, akkor már megéri a C5 állapotba mélyülni -- vagyis szövegszerkesztő futtatásakor, gépelés közben is. Az Intel mérései alapján irodai programok használatakor akár ideje 70 százalékát is C5-ben tölthető a Penryn, átlagfogyasztása pedig 1 watt alá süllyedhet, 27-44 százalékkal alacsonyabbra (szivárgási jellemzőtől függően), mint C4 állapottal, értékes percekkel hosszabítva meg az akkumulátoridőt.

A C5 kizárólag a mobilváltozatokban lesz hozzáférhető, ugyanakkor a Penryn a szerverek számára is tartogat takarékossági képességeket. Az Intel állítása szerint szervereknél akár a magfogyasztás 30 százalékát is kiteheti a különböző processzormagok közötti adatkoherencia megtartását célzó műveletek és kommunikáció, ezért a nyugalmi állapotban lévő magok képesek felvenni olyan "védett" állapotot, melyben nem kelthetőek fel koherencia lekérdezéssekkel (snoop). Ezzel webszervereknél még magas (nem extrém) terhelésen is 10 százalékos energiamegtakarítás érhető el, mérhető teljesítménycsökkenés nélkül, állítja a vállalat.

Specifikus optimalizációk

A Penryn ugyanakkor a teljesítményt is javítja az előző, 65 nanométeres generációhoz képest, mégpedig nagyobb L2 cache, mikroarchitekturális csiszolás és új vektorutasítások révén, melyek elsősorban a számításintenzív kódokat segítik, és kevésbé a szerverfeladatokat. A szoftveres támogatást nem igénylő változtatások része, hogy a Penryn osztó áramkörei immár 4 bittel dolgoznak egyszerre 2 helyett, így kevesebb iterációra van szükség egy eredmény kiszámításához, ami nagyban megdobja például a gyökvonási sebességet -- ez extrém esetben akár 50 százalékos gyorsulást is jelenthet alkalmazásszinten mindenféle újrafordítás vagy optimalizáció nélkül.

>>>A HWSW tesztje az Intel 45 nanométeres processzoráról itt <<<

A 47 új utasítást felvonultató SSE4 ugyanakkor már igényel szoftveres támogatás. Az Intel szerint az SSE4 jelentős továbblépés, mely az általános vektorizált teljesítmény mellett kijelölt területeket céloz meg, mint például videokódolást, képalkotás, 3D renderelést. Az Intel szerint az SSE4 optimalizált DivX 6.6.1 enkóder VirtualDub alatt 63 százalékot gyorsult főként ennek köszönhetően. A gyorsulás mértéke jellemzően ennél sokkal kisebb, 5-15 százalék közötti. A Penryn egy további képessége a dinamikus túlhajtás, mikor az egyik mag órajelét egy szorzófokozattal megemeli teljes terhelés alatt, ha a másik mag kihasználatlan, vagyis rendelkezésre áll szabad energiabüdzsé -- ennek hatása a teljesítményre ugyanakkor önmagában minimális, néhány százalék mindössze.

A további teljesítményfokozó fejlesztések közé tartozik a virtualizált környezetben az egyes virtuális gépek kontextusai közötti váltogatás költségének csökkentése 25-75 százalékkal mindenféle szoftveres támogatás szükségessége nélkül. Az úgynevezett Super Shuffle Engine a vektorizált végrehajtásban segít 128 bites adatmanipuláció támogatásával.

Az Intel összesen 16 különböző 45 nanométeres terméket jelentett be (PDF) ma, melyek közül 15 Xeon, egy pedig egy asztali Core 2 Extreme. A következő hónapok során várhatóak további asztali és mobil változatok megjelenése is, a Santa Rosa mobil platformot a vállalat 2008 első negyedéve során tervezi frissíteni a Penrynnel, mielőtt a második negyedévben, vélhetően az év közepe felé megjelenik a Santa Rosa utódja, a Montevina.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról