Szerző: Bodnár Ádám

2002. május 3. 15:16

3Dlabs P10 vizuális processzor

A Creative Technology által nemrégiben felvásárolt 3Dlabs ma jelentette be legújabb grafikus chipjét. A P10 nevű áramkör számára egy teljesen új kategóriát alkottak: a hangzatos Visual Processing Unit névvel illették.

A Creative Technology által nemrégiben felvásárolt 3Dlabs ma jelentette be legújabb grafikus chipjét. A P10 nevű áramkör funkciói a gyártó szerint jóval túlmutatnak az ATi és az NVIDIA GPU-k (graphics processing unit) képességein, ezért egy teljesen új kategóriát alkottak meg: a P10-et a hangzatos Visual Processing Unit névvel illették.

A 3Dlabs P10 legfontosabb tulajdonságai a következők:

  • 0.15 mikronos csíkszélesség
  • 76 millió (!) tranzisztor
  • gyártó a TSMC
  • 860 lábú HSBGA tokozás
  • 4 pixel pipeline, melyek két textúra feldolgozására képesek
  • 256 bites (!) DDR SDRAM támogatás
  • legfeljebb 256 MByte memória támogatás
  • AGP 4X felület
  • teljes DirectX 8 kompatibilitás

Az adatokból első ránézésre látható, hogy nem mindennapi termékről van szó. Természetesen a korrektség kedvéért hozzá kell tennünk, hogy a chipet elsősorban professzionális 3D grafikai felhasználásra szánják, noha a Creative feltett szándéka, hogy az év vége előtt 3Dlabs chipes grafikus kártyákat dob piacra a játékosok számára is. Hogy ezek a kártyák teljes egészében a P10-en, esetleg annak egy módosított változatán alapulnak-e majd, azt egyelőre természetesen nem tudni.

A felsorolásból kiolvasható a P10 egyik nagy előnye a vetélytársakkal szemben, ez pedig a 256 bites DDR SDRAM támogatás. Mint ismeretes, az NVIDIA és az ATi csúcskategóriás termékei 128 bites DDR SDRAM interfésszel rendelkeznek, amely a jelenleg elterjedt, 300 MHz körüli órajelű memóriachipekkel mintegy 10 GByte/sec sávszélességet biztosít. A 3Dlabs P10 hasonló órajel mellett akár kétszeres sávszélességre is képes lehet. Ez mindenképpen kiemelkedő jellemzőnek tekinthető, noha azt gyanítjuk, hogy az ősszel megjelenő ATi és NVIDIA újdonságok is hasonló felépítésűek lesznek.

A 3Dlabs P10 összesen 16 -- nem tévedés, tizenhat -- vertex feldolgozó egységgel rendelkezik. Azonban ezek egy órajel alatt egy skalár műveletet képesek végrehajtani, az NVIDIA és ATi által használt vertex shader egységek viszont négyet -- az más kérdés, hogy egy skalár művelet végrehajtása ugyanúgy egy órajelet vesz igénybe. Ezt figyelembe véve elmondható, hogy a 3Dlabs chipje a két vertex shader egységgel rendelkező GeForce4 Titaniumnál kétszer több vertex feldolgozó kapacitással bír.

Programozói szempontból a P10 vertex-processzora ugyanúgy "néz ki", mint az ATi vagy az NVIDIA pixel shader egységei, azonban a P10 esetében egy külön logika gondoskodik a 16 vertex feldolgozó egység optimális kihasználásáról.

A 3Dlabs számításai szerint a 16 vertex feldolgozó egységgel teljes körű DirectX 9 kompatibilitás is megvalósítható, azonban mivel a DX9 még nem érte el a végleges állapotot, egyelőre erről elég szűkszavúan nyilatkozik a cég. A kiadott sajtóanyagban mindenesetre az áll, hogy a chipek mintadarabjai és a DX9-meghajtók prototípusai már az alkalmazásfejlesztőknél vannak.

A P10 a raszterizációhoz egy úgynevezett "tile processzort" használ. A megnevezés azért nem szerencsés, mert ennek kapcsán manapság mindenki egy PowerVR KYRO-szerű deferred shader architektúrára asszociál, azonban itt közel sem erről van szó. A 3Dlabs új chipje raszterizációkor a képet 8x8 pixeles négyzetenként dolgozza fel, egyszerűen azért, mert ilyenkor a leghatékonyabb a chipre szerelt cache memóriák kihasználása. A P10-et valamiféle "z-occlusion culling" megoldással is ellátták, erről azonban jelenleg semmiféle információ nem érhető el.

[oldal:Végre: 64 bites színmélység]

A 3Dlabs P10 programozható textúra-processzora minden DirectX 8 effektet támogat, azonban a cég szerint lényegesen többet is tud ennél. Hasonlóan a vertexprocesszorhoz, a textúra-processzor is több párhuzamos, 32 bites feldolgozóegységből áll, egészen pontosan 64 darab lebegőpontos koordinátagenerátorból és 64 egész processzorból, amelyek a pixelek színét számítják ki.

Míg a P10 vertexprocesszora akár kompatibilis is lehet a DirectX 9-cel, a pixel feldolgozó rész bizonyosan nem lesz az, ugyanis a DX9 előírásai szerint a pixel pipeline az elejétől a végéig lebegőpontos processzorokból kell álljon. A 3Dlabs szerint ez annyira megnövelné a tranzisztorok számát, hogy a chip 0,15 mikronos csíkszélességgel túl nagy és drága lenne, a TSMC 0,13 mikronos gyártástechnológiája pedig még mindig gyermekbetegségeivel küzd. Az NVIDIA ősszel megjelenő új chipje mindenesetre már 0,13 mikronos csíkszélességgel készül -- ráadásul éppen a TSMC gyáraiban.

A P10 programozható textúra-processzora egy ciklusban (nem egy órajelciklusban) legfeljebb nyolc textúrát képes egy pixelre feszíteni, míg az ATi Radeon 8500 hatot, a GeForce4 pedig négyet. A 3Dlabs új chipje az összes elképzelhető anti-aliasing megoldást támogatja, természetesen szabadon programozható módokat is. A P10 textúra-processzorának felépítéséből adódóan képes akár 64 bites színmélység kezelésére is.

Szólnunk kell még a P10 egyik igen érdekes újdonságáról is, ez pedig a Virtual Memory System (VMS). Ennek lényege, hogy a chip a textúrákat a rendszermemóriában tárolja, a grafikus memóriát pedig egyfajta cache-ként használja. E technológia révén a korábbinál sokkal nagyobb számú és méretű textúra használható, ugyanis a kártya a textúráknak mindig csak egy 256x256 pixeles szeletét tárolja a grafikus memóriában. Más megoldások esetében még akkor is be kellett tölteni a teljes textúrát, ha annak csak pár pontja látszott -- jelentősen leterhelve ezzel az igencsak korlátozott sávszélességű AGP portot.

John Carmack (id Software) és Tim Sweeney (Epic Games) is dicsérte a P10 memóriaszervezését. Sweeney a nagyobb méretű és számú textúra használatának lehetősége mellett felhívta a figyelmet arra is, hogy ezentúl nem lesz szükség akkora memóriára a videokártyákon, hiszen a textúrák jelentős többségét úgy lehet a rendszermemóriában tárolni, hogy az nem okoz jelentős teljesítményveszteséget. Ennek ellenére a P10 legfeljebb 256 MByte DDR SDRAM memóriát támogat -- biztos ami biztos.

Érdekességnek számít még, hogy a chip egyszerre több 3D grafikus utasításszálat képes kezelni. Ennek az elkövetkezőkben megjelenő Windows-változat, a "Longhorn" megjelenésekor lesz nagy jelentősége, ugyanis a hírek szerint annak kezelőfelülete nagyban támaszkodni majd a három dimenziós megjelenítési képességekre. A többszálúságot egy különálló parancsprocesszor segítségével valósítják meg, amelynek feladata a szálak kezelése, a rendelkezésre álló erőforrások maximális kihasználása. A parancsprocesszor minden szálnak külön utasításpuffert biztosít, így ha valamelyik szál hibás adatokat küld a videokártyának, a többi szál és az operációs rendszer zökkenőmentesen futhat tovább. A parancsprocesszor ezen felül rendkívül gyors váltást tesz lehetővé a 3D ablakok között.

A P10 elsősorban a professzionális grafikus megoldások piacán számíthat sikerre, de a 3Dlabs új tulajdonosa, a Creative még az év vége előtt piacra szeretné dobni otthoni felhasználóknak (játékosoknak) szánt kártyáját, amely valószínűleg a P10-hez nagyon hasonló chipet tartalmaz majd. Az első P10-alapú 3Dlabs kártyák a harmadik negyedévben jelennek meg.

Szólj hozzá a fórumban!

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról