Szerző: Bizó Dániel

2006. július 19. 08:20

Végül, de nem utolsósorban: kétmagos Intel Itanium!

Többszöri és jelentős halasztásokat elszenvedve végre megjelent az Intel Itanium 2 processzorcsalád következő generációja, amelyet a kétmagos Montecito kódnéven ismert lapka képvisel. Ambiciózus célkitűzései ellenére az Itanium messze fő riválisai mögött, a sor legvégén lép be a kétmagos szerverchipek közösségébe, ennek ellenére azonban nem alábecsülendő piacformáló erővel rendelkezhet.

[HWSW] Többszöri és jelentős halasztásokat elszenvedve végre megjelent az Intel Itanium 2 processzorcsalád következő generációja, amelyet a kétmagos Montecito kódnéven ismert lapka képvisel. Ambiciózus célkitűzései ellenére az Itanium messze fő riválisai mögött, a sor legvégén lép be a kétmagos szerverchipek közösségébe, ennek ellenére azonban nem alábecsülendő piacformáló erővel rendelkezhet.

Ideál: nagy, erős, és megbízható

A 90 nanométeres eljárással készülő Montecito nem kevesebb mint 1,72 milliárd tranzisztort integrál egyetlen szilíciumlapkára, amelyből több mint 1,5 milliárdot tesz ki a 24 megabájt harmadszintű gyorsítótár. A chip számtalan újítást mutat fel elődjével, a Madison kódnéven ismert egymagos Itanium 2-vel szemben, de ez nem is csoda, hiszen elődje még 2003 nyarán jelent meg.

Az újdonságok között szerepel a magonként két utasításszál kezelésének képessége, az energiatakarékossági funkció, virtualizációs technológia, valamint még tovább fokozott megbízhatósági és rendelkezésre állási képességek. A Montecitóval az Intel körülbelül kétszer nagyobb teljesítményt és két és félszer nagyobb energiahatékonyságot ígér sok üzleti és tudományos/műszaki feladat futtatása során. Az iparág által széles körben elfogadott, vállalati és műszaki alkalmazásokat lefedő teszteredmények már felbukkantak az Intel oldalán -- természetesen ezek relevanciája saját szoftvereink viselkedésére, szokás szerint, így is erősen korlátozott.

A Montecito fejlesztései leginkább a vállalati szerverfeladatok által támasztott követelményeket veszik célba. A chip által alkalmazott többszálú végrehajtás nem párhuzamos működésű, a magok nagy késleltetésű esemény bekövetkeztekor váltanak a másik szálra (switch-on-event multithreading, SoEMT), hogy a chip ne várakozással töltse idejét. A tranzakcionális jellegű (pl. adatbázis-alapú vállalati szoftverek) feladatok során egy nagyteljesítményű processzor ideje nagyobb részét az adatokra való várakozásra fecsérli, ezen segít a SoEMT a másik utasításszálra való váltással, amelynek futtatásához a szükséges adatok remélhetőleg már a processzor rendelkezésére állnak.


Montecito vs. Madison, egy az egy ellen

Mikroarchitekturálisan ezen túlmenően inkább inkrementálisnak tekinhetőek a fejlesztések, közülük legszembetűnőbb a másodszintű gyorsítótár szétválasztása utasítás- és adattárra, valamint az utasítástár 1 megabájtra való növelése, ami kiegyensúlyozottabbá és kiszámíthatóbbá teszi a különféle kódok futását, javítva az optimalizálhatóságot. Nem szabad elfelejteni ugyanakkor, hogy az Itanium teljesítménye más, elterjedt architektúrákhoz viszonyítva sokkal inkább függ a szoftverek minőségétől. Ez egyúttal azt is jelenti, hogy a platform változatlan hardver mellett is teret enged a teljesítmény látványos emelkedésének, ahogyan a fejlesztők kiismerik a szokatlan architektúrát, valamint a compilerek technológiája is egyre fejlettebbé válik.

A Montecito hatalmas mérete és erőteljes számítási képességei ellenére kisebb energiabüdzsével beéri mint elődje: tartósan legfeljebb 104 wattot fogyaszt, szemben a Madison 122 wattos igényével. Frissítés: a cikk korábbi állításával ellentétben a Montecito nem tartalmaz dinamikus órajel- és feszültségszabályozást (mint amilyen a mobilchipekben is van), mellyel alacsonyabb terhelésen csökkenti a hőtermelést és fogyasztást. Ez a funkció vélhetően a 2007 őszén megjelenő Montvale-magos (90 nanométeres design, Montecito-frissítés) Itanium 2 processzorban lesz fellelhető.

Modellek
ModellÓrajelL3 cacheBuszSoEMTTDPÁr
90501,6 GHz24 MB400/533 MHzvan104 W3692 $
90401,6 GHz18 MB400/533 MHzvan104 W1980 $
90301,6 GHz8 MB400/533 MHznincs104 W1552 $
90201,42 GHz12 MB400/533 MHzvan104 W910 $
90151,4 GHz12 MB400 MHzvan104 W749 $
90101,6 GHz6 MB400/533 MHznincs75 W696 $

A Foxton-hiány

A korábban 2 gigahertzre ígért Montecito konzervatív órajelének legfőbb magyarázata valószínűleg a Foxton néven ismert technológia kényszerű deaktiválásának köszönhető. A Foxton egy kifinomult feszültség- és órajelszabályzó rendszer, amely folyamatosan követi ezeken az értékeken kívül a fogyasztást és a terhelést is. Egy ezzel a technológiával rendelkező chip esetében nem az órajel kerül rögzítésre a gyárban, hanem az energiakeret, a chip pedig mindig az egyedileg meghatározott maximális fogyasztás eléréséig fokozza az órajelet és feszültséget, ha teljes terhelés alatt van.

Míg korábban, néhány évvel ezelőtt az órajel növelése előtt elektronikai, időzítésbeli korlátok adódtak, addig mára a hőfejlődés és fogyasztás képezik a plafont. Különféle kódok futása különböző tranzisztor-aktivitást, végeredményben fogyasztást és hőfejlődést eredményez a processzorokban. Ez pedig azt jelentii, hogy az órajelet a legmagasabb aktivitású kód fogja limitálni, a legtöbb, a tranzisztorokat ennél lényegesen kevésbé igénybe vevő alkalmazás futása viszont nem tölti ki a fogyasztási keretet. Ezzel potenciális teljesítményt pazarlunk el, mivel lehetőség nyílna a frekvencia növelésére.

Végeredményben a Foxton tehát adott fogyasztási keretből lényegesen több teljesítményt csikar ki, mint a hagyományos tervezésű processzorok, hiszen folyamatosan megfelelteti egymásnak a fogyasztás-órajel-feszültség hármast. Ennek érdekében a technológia teljesen szokatlan módon generálja az órajelet, és végzi a disztribúciót a chipen, ami végül többek között a jelenlegi fiaskóhoz is vezetett. A technológia az ígéretek szerint később felbukkan az Itanium, majd akár a Xeon és más termékcsaládokban is.

Keresztmetszet

Az Itanium teljesítményének jelenleg legnagyobb kerékkötője az elavult buszrendszer. Egy tipikus topológiában két Montecito ül egy buszszegmensen, amely 533 MHz-es effektív órajellel 8,5 gigabájt másodpercenkénti sávszélességet biztosít a négy nagyteljesítményű magnak. Ez alig 2,1 gigabájtot jelent magonként, ami sok esetben rendkívül szűkös lehet, lerontva a skálázódást. Leegyszerűsítve a helyzetet kijelenthető, hogy az IBM Power5-rendszerek legnagyobb előnye a rendelkezésre álló brutális sávszélesség, ami révén sok esetben közel lienáris skálázódásra képesek a magok számának növelésével.

Erre gyógyír 2008 második fele, vége előtt nem érkezik. Akkor a négymagos Tukwila fogja a tervek szerint magával hozni az ún. CSI-platformot (Common System Interface), amely az Intel eddig kiszivárogtatott részletek alapján hatalmas előrelépéssel fog szolgálni a chipre integrált memóriavezérlő és a chipeket összekötő alacsony késleltetésű és nagy sávszélességű linkek révén. Addig a magok éhségét a buszrendszer gyorsításával lehet tompítani. A jövő év elején érkező Montecito-frissítés, a Montvale talán magasabb órajelű buszt, 667 vagy akár 800 MHz-est is támogatni fog majd, amely negyeddel illetve felével nagyobb sávszélességet biztosítana. A Montvale a várakozások szerint némileg magasabb órajellel fog rendelkezni, és talán már a Foxton is aktiválásra kerül benne.

Elvonási tünetek

A főként az IBM Power5+ és a Sun UltraSPARC IV+ chipekkel megküzdő Montecito késése már láthatóvá vált az Itanium idei első negyedéves teljesítményén, mivel a HP-n kívül a többi szállító (pl. SGI, Bull, NEC, Fujitsu) gyakorlatilag beállt, és nem tudott piaci növekedést produkálni. Ez részben az elvesztett ügyleteknek köszönhető, részben pedig annak, hogy rengeteg ügyletet kizárólag Montecitóval tudnak teljesíteni.

A HWSW ismeretei szerint az Intel kezdetben képtelen lesz a keresletnek megfelelő mennyiségű processzort előállítani. Ezt részben a volumen felfuttatásához szükséges idő, részben pedig a késés miatt feltorlódott, és most koncentrálódó megrendelések magyarázzák. A Montecito késése által érzékenyen érintett, csődvédelmet kérő SGI egyik vezetőjének nyilatkozata szerint több mint 100 millió dollárnyi megrendelésük van függőben, amelyeket Montecito-alapú Altix 4700 konfigurációkkal nyertek el, de a források a többi szállítónál is hasonló mértékű előrendelésről tudnak, amelyek összességében százezres nagyságrendű Montecitóra való igényt jelenthetnek.


Montecito, 1,72 milliárd tranzisztor

Részben talán ennek is köszönhető a júliusi bejelentés, hogy a várakozások, elvárások ne haladják meg jóval az ellátást. Az InformationWeek lap szerint az Intel megerősítette, hogy a kiemelt ügyfelek számára egy ideje már megkezdődött a Montecito szállítása. A legkorábbi ismert Montecito-alapú rendszer már tavaly decemberben éles üzembe került, a Grouppe Bull ekkor adta át a francia Atomenergiai Biztosság számára a Tera-10 jelölésű szuperszámítógépes konfigurációt, amely 4352 processzorral épült meg.

A Montecitóhoz vérmes reményeket fűz az Intel, az Itanium-platform terjedésének felpezsdítését. Várhatón ezzel a generációval indul meg tömegesen a leváltásra váló RISC-rendszerek (PA-RISC, Alpha, stb) migrációja is. A platformra a kezdeti szoftverhiányt követően mára több mint 8000 minősített alkalmazás érhető el, és a HP-UX, Windows, Linux, BSD és VMS natív futtatásán kívül ma már Solaris, z/OS és OS/390 operációs rendszerek is beüzemelhetőek valós idejű bináris fordítók segítségével.

Az új Itaniummal szerelt gépeket sorra jelentik be a gyártók, egyelőre a kisebbek (a HP-n kívül mindenki annak számít), így az SGI frissíti Altix 4700-as és 450-es vonalait, hasonlóan a Fujitsuhoz, amely bejelentette üzletileg kritikus alkalmazásokhoz szánt Primequest 520, 540, és 580 modelljeit. A HP, amely toronymagasan a legnagyobb Itanium-szállító, néhány hónap múlva jelenti be Montecitóval szerelt szervereinek nyilvános hozzáférhetőségét.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról