Mellékleteink: HUP | Gamekapocs
Keres

Ütőképes lett az AMD Shanghai

Bizó Dániel, 2008. november 13. 14:57
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

Hivatalosan is útjára indult az AMD következő generációs szerverprocesszora, az AMD Shanghai. A négymagos Opteron chip bár nem vonultat fel jelentős architekturális újításokat, a gyártástechnológiai ugrásnak köszönhetően drasztikus előrelépést jelent.

[HWSW] Hivatalosan is útjára indult az AMD következő generációs szerverprocesszora, a Shanghai. A négymagos Opteron bár nem vonultat fel jelentős architekturális újításokat, a gyártástechnológiai ugrásnak köszönhetően drasztikus előrelépést jelent a Barcelona-generációhoz képest, aminek köszönhetően eredményesen veheti fel a küzdelmet a piacon lévő Xeonokkal szemben. Az AMD ismét ütőképessé vált a szerverpiacon.

Új gyártástechnológia

Ha le kívánjuk egyszerűsíteni, akkor a Shanghai lényegében egy Barcelona, csak minden téren számottevően jobb nála -- olyan, amilyennek a Barcelonának mindig is lennie kellett volna. Az új chip az AMD első, 45 nanométeres csíkszélességű eljárással előállított processzorra, és ebben gyökerezik a jelenlegi 65 nanométeres generációval szembeni minden előnye is. A finomabb geometriájú gyártástechnológia magasabb kapcsolási sebességű, vagy adott sebességen alacsonyabb fogyasztású tranzisztorokat eredményez, aminek köszönhetően energiahatékonyabb chipeket képes előállítani az AMD. A Shanghai-on az AMD sunnyvale-i és bostoni tervezőcsapatai dolgoztak tandemben, a projekt kezdetetétől a szállításokig mintegy két és fél év telt el mindössze -- rendkívül rövid idő egy ilyen komplexitású chip esetében, nem véletlen, hogy az AMD igazi sikertörténetként könyvelte el.

A 65 nanométereshez képest nagyjából fele akkora struktúrákat, és harmadával kisebb áramköröket, gyorsabb kapcsolást és energiahatékonyabb működést lehetővé tévő 45 nanométeres immerziós litográfiájú eljárás egyelőre páratlan a félvezetőiparban. Az IBM-mel karöltve az AMD olyan, tömegtermelésben alkalmazható levilágítási technikát dolgozott ki, amelynél a fényforrás és a szilíciumszelet közötti optikai vezetőközeg nem levegő (száraz litográfia), hanem víz. A rendkívül magas tisztaságú víz litográfiai refraktív indexe 1,4, vagyis ennyivel lassul le a fény a vízben -- mivel lerövidül a hullámhossza, így a terjedési sebessége is mérséklődik. A levegő refraktív indexe lényegében elhanyagolható, 1,0003.

A rövidebb hullámhossz pedig nem jelent mást, mint nagyobb felbontási képességet, vagyis a finomabb struktúrák kialakításának képességét. Az iparágban jelenleg tömegesen alkalmazott 193 nanométeres fényforrásokat vizes immerzióval 138 nanométeres effektív hullámhosszra lehet fókuszálni. Bár az immerzió új és költséges litográfiai berendezések beszerzését követeli meg, és egy levilágítás is költségesebb, a 45 nanométeres generációnál még nincsen szükség egyelőre olyan trükközésekre, mint a többszörös levilágítás eltolt maszkokkal, amit az Intel is alkalmaz saját 45 nanométeres eljárásában -- két menet, kétszeres költség. Emiatt az AMD költségbeli előnyt élvez, véli Rolf Stephan, az AMD technológiai részlegénél a tranzisztorok kialakításáért felelős menedzser.

A nagyobb felbontás ellenére az AMD ráadásul alacsonyabb (területre vetített) meghibásodási sűrűséget ért el 45 nanométeren, mint a 65 nanométeres technológia életciklusának hasonló szakaszában, állította Stephan, ami a 45 nanométeres technológia optimalizálására fordított hosszabb időnek köszönhető, magyarázta a HWSW kérdésére a szakember. Ez pedig magasabb kihozatalt, vagyis olcsóbb és nagyobb volumenű termelést tesz lehetővé.

A 45 nanométeres, negyedik generációs feszített szilíciumot használó tranzisztorokkal adott fogyasztásból nagyjából 10 százalékos teljesítménynövekedés valósítható meg, míg ugyanaz a teljesítményszint 25 százalékkal alacsonyabb fogyasztással is elérhető az AMD számításai szerint. Mindez lehetővé tette az cég mérnökei számára, hogy olyan nyitófeszültségű tranzisztorokat alkalmazzanak a Shanghai elektronikai implementációjánál, melyekkel a vezetőrétegek vékonyodása ellenére is szinten tartsák, vagy opcionálisan akár töredékére szorítsák le a szivárgási áramot, ami különösen a hatalmas L3 cache esetében kritikus. A Shanghai 6 megabájtra növelte a harmadszintű tár méretét, több mint 250 millióval 750 millió fölé emelve az integrált tranzisztorok számát, amiből csak az L3 cache 400 milliónál is több tranzisztort emészt fel. Shanghai áramköri blokkjait 11 rétegű fémhuzalozás köti össze egymással és a külvilággal.

Minimális csiszolás

A miniatürizáció mellett természetesen nem maradt az architektúra sem teljesen érintetlen, bár a változások a magok szintjén lényegében elhanyagolhatóak. Megjelent a támogatás a DDR2-800-as memóriamodulokhoz, valamint ahogyan az előbb említettük, 2 megabájtról 6 megabájtra növekedett az L3 cache mérete, ami egyértelműen a legfontosabb architekturális fejlesztés. A Shanghai koherens HyperTransport 3 szabványú kommunikációra is képes ugyan, ehhez azonban csak 2009 második felére érkezik meg a rendszerszintű tűmogatás.

A Shanghai már képes az egyik mag L1 és L2 tárait kiírni az L3-ba, és lekapcsolni azt (Smart Fetch), energiát takarítva meg, valamint a továbbfejlesztett virtuális memóriaindexelésnek köszönhetően gyorsult a virtuális gépek közötti váltás sebessége (Enhanced Rapid Virtualization Indexing). Az új chip továbbá fel tudja térképezni az L3 cache meghibásodott részeit, amit az operációs rendszernek támogatnia kell, így egyelőre inaktív a képesség (Cache Index Disable).

Az 58 százalékkal több tranzisztor ellenére a fejlettebb félvezetőeljárásnak és az elektronikai optimalizációnak köszönhetően az AMD nyitáskor 2,7 gigahertzes órajelet képes felmutatni, 17,4 százalékkal magasabbat a Barcelonánál, ugyanakkora, 95 wattos energiakeret (TDP) mellett. Sőt, az AMD állítása szerint egy Shanghai-alapú rendszer 10 százalékkal kevesebb energiát fogyaszt teljes terhelésnél, és harmadával kevesebbet üresjáratban, miközben Java szerverfeladatok (SPECjbb2005) alatt például 35 százalékkal magasabb teljesítményt ad le a magasabb órajelnek és megnövelt L3 tárnak köszönhetően -- ez éppen 50 százalékkal hatékonyabb energiafelhasználás.

A cikk több oldalból áll:
Facebook
Adatvédelmi okokból az adott hír megosztása előtt mindig aktiválnod kell a gombot! Ezzel a megoldással harmadik fél nem tudja nyomon követni a tevékenységedet a HWSW-n, ez pedig közös érdekünk.