Szerző: Ady Krisztián

2001. szeptember 5. 23:51

Egy KYRO II chipes videokártya: Videologic Vivid!XS

A neten több forrásból is olvashattunk már tesztet KYRO I vagy II grafikus chippel szerelt kártyákról, de sokan még mindig nem tudják, mire is képes az általuk képviselt PowerVR3 technológia és a KYRO II-re épülő Videologic Vivid!XS videokártya.

HIRDETÉS

Alternatív technológia a 3D-s képalkotásban: akár ez is lehetne a KYRO kártyákról készült tesztek alcíme. A neten több forrásból is olvashattunk már tesztet KYRO I vagy II chippel szerelt videokártyákról, de sokan még mindig nem ismerik, mire is képes ez az alternatív technológia.

A videokártyák ma nagy általánosságban véve erőből politizálnak, illetve renderelnek. A renderelésre küldött poligonnal kapcsolatban nem nagyon érdekli őket, hogy az adott poligon látható-e vagy sem, szorgalmasan kirajzolják őket függetlenül attól, hogy végül takarásban lesznek.

A PowerVR már a kezdetektől máshonnan közelítette meg a kérdést, s a fejlesztések gyümölcse most, a PowerVR3 generációnál kezd beérni. Az előd PowerVR2-re épülő Neon250 kártya kompatibilitási okok miatt elvérzett, a játéktermi gépekben kiválóan működő chip nem vált be a PC-s világban, még ma sem létezik hozzá tökéletes meghajtóprogram. A cég szerencsére nem adta fel e kudarc láttán a harcot: fantáziát láttak a dologban.

A PowerVR3 is játéktermi gépekben debütált nagy sikerrel, s a cég úgy gondolta, újra próbát tesz: a KYRO ezen játéktermi chip kicsit módosított változata. A közhiedelemmel ellentétben a PowerVR3 nem áll hadilábon a T&L egységgel, a Naomi2-ben több PowerVR3 chip dolgozik külső T&L egység támogatásával párhuzamosan, fergeteges teljesítményt nyújtva.

A KYRO I kicsit hűvös fogadtatásra talált, spcifikációi meglehetősen szerénynek tűntek. Aki kipróbálta, hatalmasat csalódott, kellemesen: a 115 MHz-es chip a szintén olcsó, szinkronban futó memóriával meglepő teljesítményre volt képes. Ennyi már elég volt ahhoz, hogy továbbfejlesszék a gyártástechnológiát, kicsit optimalizálják a hardvert, s kihozzák a KYRO II-re keresztelt, magasabb órajelű verziót.

A KYRO II 15 millió tranzisztorból épül fel, 3 millióval többet tartalmaz, mint a KYRO I. A gyártás 0,18 mikronos technológiával zajlik, mely nagyobb órajelet eredményez azonos fogyasztás és melegedés mellett. Az órajelet így 115 MHz-ről 175 MHz-re sikerült növelni, ez 50%-os emelkedés!

A KYRO I és II chip egyaránt 2 pixel pipeline-nal rendelkezik, ezeken egy-egy textúrázó egységgel. Elméleti fill rate-je igen alacsony ezért, az órajeltől függően csupán 230 (115MHz) és 350 (175MHz) Mpixel/s. Azonban nem szabad elfelejteni az egyedi technológiát: ez az érték a KYRO II esetében akár 1400 MPixel/s-nak is megfelelhet! Sőt! Mint azt a mellékelt screenshot mutatja, szélsőséges esetben 5700 Mpixel/s-ot is elérhet.

A chip egyéb képességeiről később ejtünk szót.

A tesztelésre kerülő kártya a Videologic KYRO II chipre épülő kártyája, a Videologic Vivid!XS. Ez a kártya 32MB memóriával rendelkezik az előd Vivid!-hez hasonlóan. A Videologictól már megszokott, szép, nagy dobozban a kártya mellett egy kompozit kimenetet biztosító kábelt és egy CD-t találunk. A CD-n meghajtóprogramot, technológiai demókat, néhány látványos képernyővédőt és játékdemót helyezett el a Videologic, valamint mellékelték a WinDVD DVD-lejátszó szoftvert.

A tesztelést a következő konfiguráción végeztem:

  • EPoX 8KTA2 alaplap
  • AMD Duron 700 MHz processzor
  • 384 Mbyte PC100 SDRAM CAS3
  • Windows 2000 Professional SP2

    A memória nem véletlenül futott így, sajnos az egyik modulom egy régebbi, PC100-as modul, mely visszafogja a másik PC133-as CAS2-est; de számomra fontosabb a memória mennyisége, mint a 10%-al nagyobb sebesség. Nem ez lesz az egyetlen korlátozó tényező, mint látni fogjuk, de jól reprezentálja a fenti konfiguráció, mit várhatunk egy jelenleg ma már low-endnek tekinthető géptől.

    A tesztelésben részt vett összhasonlítási alapként a KYRO I-es, 115MHz-es Videologic Vivid! kártya is, valamint az Abit Siluro MX400 64MB-os kártyája. A Silurót az alap 200/166 MHz (core/memória) órajelen teszteltem.

    [oldal:PowerVR3 aka KYRO]

    Tile based - deferred rendering

    Ugyan Tessier igen kitűnő cikkében tökéletesen leírta a PowerVR technológia lényegét, pár szóban azért összefoglalnám, miről is szólnának a fenti kifejezések.

    A KYRO chipek ugynevezett tile-okra, 32x16 pixeles részekre bontják a renderelt képet, s egy-egy ilyen tile feldolgozása külön-külön történik meg. A tile kis méretéből adódik, hogy ezek feldogozása teljes mértékben a chipen belül zajlik le, ezzel is csökkentve a sávszélességigényt. A deferred rendering szintén teljesítményt spórol, a renderelésre kerülő háromszögek, felületek ugyanis renderelés előtt sorbarendezésre kerülnek, eldöntve, mely háromszögek pixelei látszanak, s melyekéi nem. A chip csak a látható felületeket tölti ki, tehát a nem látható, feleslegesen többszörösen renderelésre kerülő pixelek problémája megszűnik. Ez a két technológia határozza meg főként a PowerVR által képviselt technikát, mely mint látni fogjuk, meglehetősen hatékonyan működik.

    A sorbarendezéshez természetesen a hagyományos renderelési technikától eltérően -- mely a háromszögeket egymás után tölti ki -- itt meg kell várni, míg a teljes scene adatai a kártya rendelkezésére állnak, de ez nem jelent igazán problémát, a poligonok feldolgozási sebessége kellően nagy. A KYRO chip 32 db Z-műveletet képes egyetlen órajel alatt elvégezni. A szükséges adatokat a videokártya memóriájában helyezi el, melyekhez így gyorsabban fér hozzá.

    Fentiek bemutatására a PowerVR több technológiai demót is készített, többek között az igen nagy átfedéssel, overdraw-val bíró VillageMark, és a speciális Fortune tesztprogramot.

    A Fortune 52 kártyalapot animál, egyenként 2 átlátszó és egy normál textúrával, jelentősen átfedve egymást. Ez a speciális demó a hagyományos gyorsítóknak meglehetősen nagy falat. De, mint látható, a KYRO lazán megbírkózik vele, nézzük csak meg azt az elméleti Mpixel számlálót!

    Constant Stencil-Buffer, Z-buffer

    A KYRO által képviselt megoldás több előnnyel is jár: mivel egy-egy tile igen kis méretű, könnyen létre lehetett hozni a chipen belül belső buffereket, melyekben a szükséges adatok könnyedén elférnek, kitűnő kompatibilitást nyújtva (az előd Neon 250 lényegében ezek hiánya miatt bukott meg), ugyanakkor nem növelik lényegesen a tranzisztorok számát, sem az előállítási költséget. A játékok által használt, pontosan a láthatóság megállapítására szolgáló Z-buffer a KYRO chipen belül a színmélységtől függetlenül áll 16-24-32 bites módban rendelkezésre, választhatóan -- már amennyiben az adott alkalmazás erre lehetőséget ad. Ugyanez áll a stencil bufferre is, mely az árnyékok, tükrözödések leképezésében nyújt legtöbbször segítséget.

    A 32 bites Z, vagy 24 bites Z és 4 bites stencil buffer 16 bites színmélység mellett is kiválasztható, pontosabb megjelenítést, korrektebb képet biztosítva, eltérően a ma használt legtöbb 3D-gyorsítókártya megoldásától, mely ragaszkodik a használt színmélységnek megfelelő Z-buffer mérethez.

    Internal True Colour

    A KYRO az Internal True Colour technológia segítségével a ma látható legszebb 16 bites képet biztosítja. A belső számítások 32 bites pontossággal zajlanak, s csak a végső, frame-bufferbe történő kiíráskor történik meg a 16 bitre konvertálás, mely így láthatóan szebb képet biztosít a többi kártyához képest. A fentiekből következik, hogy a kártya lényegében ugyanakkora mennyiségű számítást végez el 16 és 32 bites színmélység esetén: nincs is lényeges különbség a teljesítmények között, vagy ha van is, az csak nagyon magas, 1280x1024 vagy 1600x1200-as felbontásnál érzékelhető. Aki azt várja, hogy 16 biten jelentősen gyorsulni fog a kártya, csalódni fog, ugyanakkor a változatlan sebesség kitűnő képminőséggel ajándékoz meg. Ma már alapkövetelmény a 32 bites színmélység véleményem szerint, ugyanakkor a régebbi, csak 16 bites játékaink valóban szebbek lesznek a KYRO-n.

    8-layer multitexturing

    A KYRO chipek ugyan csak 2 pipeline-nal és egy-egy textúrázó egységgel rendelkeznek -- s egyéb paramétereik is igen szerények -- , mégis meglepő dologra képesek: akár 8 textúrát is fel tudnak húzni egyetlen felületre, nagyon minimális teljesítményveszteség árán. S noha a jelenlegi játékok nem nagyon profitálnak még ebből (kivétel talán a Serious Sam), de a jövőben kétségtelenül várható az egy felületre felhúzott textúrák mennyiségének növekedése. A chip ezt igen trükkösen oldja meg: egy úgynevezett loopback technikával az adott pipeline kimenetét képes visszaküldeni úgy a bemenetre, hogy nem szükséges az adatok újbóli feldogozása, sávszélességzabáló mozgatása, csupán egy újabb textúraréteg kiszámítása.

    A technológia előnyeit szintén egy demóval szemléltette a PowerVR. A Temple Demo egyszerre öt réteg textúrát használ, s bizony a 115 MHz-es KYRO I is igen becsületes teljesítményre képes a nem is egy kategóriával drágább társaihoz viszonyítva. Ugyebár egy hagyományos, 2 vagy maximum 3 (pl. Radeon) textúrát egy órajel alatt feldolgozni képes gyorsító jelentősen lelassulhat, ha egy-egy pixellel legalább kétszer annyi ideig kell foglalkozni...

    EMBM, DOT3 bump-mapping, textúratömörítés

    A KYRO támogatja az egyre elterjedtebben használt felületi egyenetlenségeket szemléltető bump mapping technikákat. A Matrox által köztudatba berobbantott EMBM mellett a DirectX által definiált DOT3 és Embossed (1-2-3 rétegű) bump mappinget is támogatja, meglepően kellemes sebességgel (lásd előző pont).

    A KYRO II textúratömörítést is támogat hardveresen, azonban sajnálatosan még mindig csak a DXT1-et, a többi DXT2-5 tömörített textúra kitömörítésre kerül a memóriába. OpenGL alatt is igénybe vehető a textúratömörítés a szabványos extensionök által.

    FSAA

    Az úgynevezett aliasing hatás csökkentésére már régóta kísérleteznek a gyártók az FSAA (Full-Scene Anti Aliasing) technológia hatékony implementálásával. A témával egy cikkünk igen behatóan foglalkozott, melyet melegen ajánlanék a kedves olvasónak, s mely megvilágítja, hogy az FSAA magyar fordításaként használt teljes képernyős élsimítás mint fogalom nem állja meg a helyét. Ugyan a technológia kellemes mellékhatása az alacsonyabb felbontásokon igen "lépcsőzetes" képet mutató felületi élek kisimítása, a lényege ettől eltérően mindenképpen a képminőség javítása lenne.

    A KYRO egyszerű super-sampling FSAA technológiát használ, 2x-es vagy 4x-es módban. Legegyszerűbben ezt úgy lehetne megfogalmazni, hogy 4x FSAA esetén a 800x600-as felbontású képet a kártya úgy számolja, mintha 1600x1200-as felbontású kimenetre (4x-es, 2x2-es FSAA esetén) renderelné le. A frame-bufferbe történő kiírás előtt a képet "visszaátlagoljuk", lekicsinyítjük a cél, 800x600-as felbontásra. Ugye nem kell azt ecsetelni, mekkora az említett technológia sávszélesség és számításigénye egy hagyományos renderelő technológia esetén. De nem így a PowerVR esetén: az említett kicsi, 32x16-os tile-okkal való mahináció irtózatos előnyt nyújt a KYRO-nak. Hiszen sokkal könnyebb egy ilyen kis méretű adatmennyiséggel dolgozni akár 2x2-szeres méretben, mint egy egész 1600x1200-as képpel...

    Szóval a KYRO FSAA implementálása annyira jól sikerült, hogy a 800x600-as, 4X FSAA mellett nyújtott teljesítmény lényegében megegyezik az 1600x1200-as felbontásban nyújtott teljesítménnyel, legalábbis az általam használt processzoron ez tapasztalható, ez pedig pusztán fill rate limitáltsági problémává degradálja a kérdést. Alacsony felbontáson kitűnő teljesítményt nyújt. Elmondható, hogy a 640x480-as felbontáson már kiválóan alkalmazható a KYRO 4x-es FSAA képessége, 800x600 és 1024x768-ban pedig a 2x-es FSAA is megfelelő teljesítményt nyújthat az adott játék típusától, és az elérni kívánt sebességtől függően. Régi játékainkat, melyek esetleg fix, alacsony felbontásban és 16 bites színmélységben hajlandóak csak futni, valóban "digitálisan felújított" formában láthatjuk viszont a KYRO segítségével. De felhozhatnám példának az egyik kedvencemet, az Operation Flashpoint:1985 című játékot is, mely tökéletesen játszható 1024x768x32 2x FSAA mellett, ugyanis processzor-limitált, nem a videokártya a szűk keresztmetszet, ráér FSAA-t számolgatni fölös idejében...

    A fenti képen kívül készítettem még két darab .png kiterjesztésű képet, melyek meglehetősen nagy méretűek, de a veszteségmentes tömörítés segítségével kiválóan bemutatják, mire is jó az FSAA. A példaprogram a PowerVR3 SDK részeként letölthető D3DTree, és egy egyszerűbb fát ábrázol, leveleivel. Az FSAA nélüli kép ide kattintva, míg a 4x-es FSAA-val készített innen érhető el.

    [oldal:Telepítés, 2D, képminőség]

    A telepítés nem okozott gondot, mondjuk ebben közrejátszhat az, hogy az előd Vivid! már a Windows 2000 telepítése óta a gépben lakozott. A viszonyítási alapul szolgáló MX400 eltávolítása után is minden további probléma nélkül tudtam visszaaplikálni a kártyát a gépbe. Korábbi és jelenlegi tapasztalataim alapján elmondható, hogy a Vivid! és Vivid!XS telepítése problémamentes minden Windows rendszer alá, egyetlen feltétel csupán, az előző videokártya uninstall programmal történő korrekt eltávolítása.

    Javasolt mindazonáltal frissen telepített rendszerbe installálni a kártyát, hiszen az ördög sosem alszik...

    A telepítés lezajlása után Win98 SE alatt szépen be kell(ene) állítgatnunk egyesével az adott felbontáshoz és színmélységhez tartozó frissítési frekvenciákat, a telepítő ezt 1024x768-ig alapból 75 Hz-re lövi be. A nem éppen monitorkímélő és igen fárasztó manuális módszer helyett javasolt a Kyro Power Tools segédprogramocska használata, itt ezt pár kattintás segítségével, majd egy újraindítással megoldhatjuk.

    Az említett segédprogram Windows 2000 alatt különösen jól jön, ugyanis a Vivid! és Vivid!XS itt ugyanolyan problémákkal küzd, mint más kártyák: ez a grafikus alkalmazások, D3D és OpenGL alatt "beállított frekvenciától függetlenül stabilan 60 Hz-en frissítő videokártya" esete. Nem igazán tudom, hogy ki a ludas ebben, de ha nem tévedek, több kártya is szenved ettől a problémától, így feltehetően nem csak a driverek írói a hibásak. A 2D-t, a desktop frissítését ez a gond nem érinti.

    Szerencsére az említett segédprogrammal ez a probléma is áthidalható, bár ez nem fog piros pontot jelenteni a végső értékelésnél. Ígéretek szerint a következő driverfrissítés már megoldás hozhat.

    A 2D sebességét, hogy őszínte legyek, nem mértem (megtette más :), mivel véleményem szerint a megcélzott vásárlóközönség nem annyira kényes a 2D sebességére, főleg, ha az csak tesztprogramokkal kimutatható különbségben nyilvánul meg. A való életben nem jelent semmilyen érezhető különbséget. Én legalábbis meg voltam elégedve a kártya ezen paramétereivel.

    Ugyanígy meg voltam elégedve a nyújtott kép minőségével is. A színek teltek, az élesség kitűnő. A Vivid!XS-en lévő 350MHz-es RAMDAC egyeseknek ugyan kevésnek tűnik, de sokan hibásan ezt társítják az életlen képhez, pedig -- mint tudjuk -- ahhoz nagyon kevés köze van. Lényegében csupán a maximális elérhető képfrissítési frekvencia függ ettől a paramétertől, s bizony már a 270 MHz-es Vivid! is bőven megfelelő volt ezen a téren, legálábbis az általános 15-17"-os monitormérethez. A Vivid!XS 1024x768-ig 150, e felett 1280x960-ig 120, 1280x1024-ben 100, 1600x1200-ban 90 Hz-es képfrissítési frekvenciát biztosít maximálisan: csak bírja a monitorunk.

    Visszatérve a képminőségre: az élesség magasabb felbontáson (értsd 1280x1024) sem változik láthatóan, s bár az általam használt Belinea 103040 17"-os monitor nem dokumentáltan 1600x1200-ban is képet ad, a 0,26-os képpontméret itt már nyilván nem elegendő eme, amúgy is igen objektív paraméter megítéléséhez.

    Egy szó mint száz: az általam preferált 1024x768@100Hz-es felbontáson a kártya kitűnő minőségű képet szolgáltat, ugyanúgy, mint 800x600@120Hz alatt. Az összehasonlításként használt Abit Siluro MX400T 64MB-os kártya valamivel életlenebb volt, de a különbség szerintem csak nekem tűnhet fel, aki már 9 hónapja bámulja a Vivid! képét.

    A frissítésen kívül találkoztam még egy igen bosszantó hibával, ez pedig bizonyos alkalmazások esetén jön elő mind a két KYRO kártyán, garantáltan meghajtóprogram-javítást igényelve. Van átmeneti megoldás erre is, de nagyon érdekes, hogy csak és kizárólag 32 bites színmélyégben jelentkezik az egyes alkalmazások ikonjainak hibás megjelenítése. Két alkamazásban tapasztaltam ezt: a StarOffice 5.2-ben, és a Paint Shop Próban, mint az a lenti képeken látható.

    A problémára megoldás az asztal színmélységének 24 bitesre változtatása. Számomra kicsit érthetetlen, mi okozhat ilyen hibát, ami ráadásul az eddigi összes meghajtóprogramban megtalálható. A következőben ígéretek szerint javítva lesz ez is.

    [oldal:3D, D3D, OpenGL]

    A meghajtóprogram feltelepítése után a képernyőtulajdonságok között 3 új fület találhatunk. A harmadik a TV-kimenet használatakor jelenik meg, csak akkor, ha még bekapcsolás előtt csatlakoztattuk TV-nket a kártyára. Állítólag a következő meghajtóprogramban lehetőségünk lesz már menet közben állítani a TV-kimenet állapotát, nem szükséges ehhez ki- és bekapcsolni a gépet.

    A másik, igen fontos fül a 3D Optimisation kattintásra hallgat, itt lehet a KYRO meghajtóprogramját mindenféle csodálatos, és jól használható dolgokra rávenni D3D és OpenGL alatt külön-külön. Az adott alkalmazáshoz akár saját profilt is létrehozhatunk, egyéni beállítást biztosítva neki, függetlenül az általános beállításoktól.

    Minden meghajtóprogram tartalmaz egy-egy gamestng.reg file-t, mely a telepítés során automatikusan lefut. Ebben, a ma már 46 Kbyte-os file-ban már több száz, a PowerVR által előre definiált és kipróbált játékbeállítást találunk, melyek a regisztrációs adatbázisban rögzülnek, s a meghajtóprogram folyamatosan ellenőrzi őket egy-egy program indításakor. Így többnyire az optimális eredményt kapjuk az adott játék futtatásakor. Ezeknek a beállításoknak a nagy része nem is érhető el a felhasználó számára még az említett 3D Optimisation fülön sem.

    Tehát itt D3D alatt a következő beállítási lehetőségeink vannak:

    Control Full-Scene Anti-aliasing
    Ez alatt a szekció alatt az alkalmazás tudta nélkül kapcsolhatjuk ki-be a 2 vagy 4x-es FSAA használatát. Ha itt beállítjuk az FSAA használatát, a KYRO garantáltan FSAA-t fog használni, függetlenül a játék beállításaitól. 2x-es (1x2 vagy 2x1) FSAA esetén választhatunk, hogy horizontális vagy vertikális irányban szeretnénk az FSAA-t elérni.

    Disable Waiting for Vertical Sync
    Ez a jelölőnégyzet a vsync kikapcsolására szolgál, mely hsonlóan az FSAA-hoz, garantált eredményt ad, a játék, alkalmazás beállításától függetlenül ki lesz kapcsolva. Ez a kapcsoló oldalirányú mozgásoknál törést idézhet elő a képben, de a maximális képfrissítés a monitor frekvenciája által nem lesz korlátozva.

    Defer Render Until Flip
    Ez a kapcsoló arra utasítja a meghajtóprogramot, hogy minden esetben várja meg, amíg a teljes scene betöltésre kerül, s csak ezután kezdje el lerenderelni a képet. Növelheti a sebességet, s bizonyos esetekben hibásan megjelenő játékoknál megszüntetheti a problémát, de ugyanakkor okozhat is gondokat: ki kell próbálni. Én egy igen kellemes mellékhatását tapasztaltam: kicsit növelt teljesítmény mellett megszüntette a vsync kikapcsolása által keletkezett töredezettséget. Nem minden alkalmazás tűri meg ezt a kapcsolót, pl. a The Sting! demója csak kikapcsolva nyújt tökéletes képet.

    Force Anisotropic Filtering
    Ez a kapcsoló fixre állítja az anisotropic filter használatát, mely nagyban javítja a kép minőségét, főleg ami a mipmap átmeneteket illeti. Használata viszont igen jelentős teljesítménycsökkenéssel jár.

    Force Texture Compression
    Az előző ponthoz hasonlóan ez is fix beállítást jelent: amennyiben lehetőség van rá, mindenképpen használni fog a kártya textúratömörítést. Néhány esetben növelheti a sebességet, mivel a tömörített textúrák értelemszerűen kisebb sávszélességet fogyasztanak, viszont a textúra minőségétől függően ronthatja a kép minőségét.

    Force Trilinear Texture Filtering
    A kártya ezzel a kapcsolóval mindenképpen trilinear szűrést fog használni, függetlenül a játék beállításától. A bilinear filterhez képest csupán minimális, pár százalék a teljesítménykülönbség, így mindenképpen érdemes ezt a kapcsolót használni.

    Force W Buffering
    A Z-bufferhez hasonlóan az egyre elterjedtebben használt alternatív megoldás, a W bufferelés is a láthatóság megállapítását szolgálja, pontosabb eredményt biztosítva. Ezzel a kapcsolóval utasíthatjuk a kártyát a W bufferelés használatára a KYRO saját RHW (Reciprocal Homogenous W) számítási módszerével, pontosabb megjelenítést biztosítva, viszont néhány esetben különböző renderelési problémákat tapasztalhatunk. Javasolt kikapcsolva hagyni.

    Enable Soft Edges on Cut-out Textures
    Ez a kapcsoló azon textúrák éleit hivatott elsimítani, melyeknek csak egy része lett lerenderelve, s a sebességet sem befolyásolja, de szintén gondokat okozhat a renderelésben bizonyos esetekben.

    Enable External Depth/Stencil Buffer
    Ez az egyik olyan kapcsoló, amivel iszonyatosan lelassíthatjuk a kártyát, viszont 100%-os kompatibilitást kapunk érte. Van néhány játék, mely szeret közvetlenül hozzáférni a Z és stencil-bufferekhez, a frame-bufferhez. A KYRO viszont saját, belső Z buffert használ, mely a külső alkalmazások számára elérhetetlen, így a játék nem fog helyesen futni. A kapcsoló hatására a KYRO a videokártya memóriájában hoz létre Z és stencil-buffert, így viszont elveszik az az előny, mely a belső felépítésből adódik: minden műveletért ki kell nyúlni a videomemóriába. Nem kell mondanom, mekkora lassulást okoz mindez. Jómagam még nem találkoztam olyan esettel, amikor ennek a kapcsolónak a használatára lett volna szükség, de jó tudni, hogy van, a fejlesztők erre is gondoltak...

    Ezek voltak a D3D lehetőségei, most következzenek az OpenGL alatti beállítások:

    Control Full-Scene Anti-aliasing
    A D3D-hez hasonlóan ez is az FSAA bekapcsolására szolgál. Minden körülmények között használni fogja a kártya az FSAA-t.

    Disable Waiting for Vertical Sync
    Szintén zenész: a D3D-nél leírtakhoz hasonlóan ez is garantáltan eliminálja a vsync-et...

    Use Application Specified Buffering
    A KYRO chip az alkalmazások alatt törekszik a triple-buffering használatára, függetlenül az alkalmazás beállításától. Ezzel a kapcsolóval ezt kikapcsolhatjuk az OpenGL alatti alkalmazásoknál, tehát ha például a Q3 single-bufferre van beállítva, a kártya nem fog automatikus triple-bufferinget használni, felszabadítva ezzel memóriája egy részét a textúrák számára. A triple buffering ugyanakkor növelheti a sebességet, folyamatosabbá teszi a renderelt képet, szóval érdemes ezt kikapcsolva hagyni...

    Force Anisotropic Filtering
    Ez a kapcsoló fixre állítja az anisotropic filter használatát, mint a D3D beállításoknál, viszont igen jelentős teljesítménycsökkenéssel jár.

    Force Scissor Support Off
    Ez a kapcsoló igazán számomra sem világos, hogy milyen metódust takar, de a leírás szerint növelheti a sebességet amellett, hogy vizuális problémákat okozhat: jobb kikapcsolva hagyni.

    Force Texture Compression
    Ez a kapcsoló is szerepelt a D3D beállításoknál: amennyiben lehetőség van rá, mindenképpen használni fog a kártya textúratömörítést. Néha növelheti a sebességet -- a Q3 jóval gyorsabb textúratömörítéssel --, mivel a tömörített textúrák értelemszerűen kisebb sávszélességet fogyasztanak, viszont a textúra minőségétől függően ronthatja a kép minőségét.

    Enable Scene Manager
    A nagyon sok poligont használó alkalmazásokban az optimális beállításoknak köszönhetően hiányzó részek lehetnek a képben, ilyet tapasztalhattunk például a 3DMark 2001 poligon-tesztjében. A 7.114-es meghajtóprogram már tartalmazza erre a tesztre a Scene manager automatikus bekapcsolását, így ez a teszt is hibátlanul fut le. Amennyiben ilyen hibát tapasztalnánk, ez a kapcsoló segíthet a problémán, bár ez, ismétlem, csak a nagyon nagy poligonszámmal dolgozó alkalmazásoknál fordulhat elő, jelenleg nincs ilyen játék, melynek szüksége lenne erre a beállítása. A Scene Manager használatához szükségünk lehet a külső Z és stencil-buffer használatára is.

    Enable Fast Colour Calculations
    Mint ahogyan az adott pont neve is sugallja, gyorsabb, de pontatlanabb színszámításokat engedélyezhetünk ezzel a kapcsolóval OpenGL alatt. Bekapcsolása növelheti a teljesítményt, de hibás színeket, sötétebb, esetleg teljesen fekete képet eredményezhet. A teljesítménnyel nincs sok gond, így hagyhatjuk kikapcsolva ezt a kapcsolót.

    Enable Internal Depth/Stencil Buffer
    A D3D-vel ellentétesen működik ez a kapcsoló, szóval ezt bekapcsolva kell hagynunk, kikapcsolt állapotban lesz a külső videokártya-memóriában a Z és stencil-buffer létrehozva. Csökkenti a teljesítményt, de növeli a kompatibilitást.

    A képernyőbeállítások között megmaradt egyetlen fülön, a Display fülön állíthatjuk be a képernyő méretét és helyzetét, az esetleges gamma korrekciót.

    Ennyi előzetes után jöjjenek a száraz tények, a tesztek eredményei, némi magyarázat mellett! Az említett kapcsolók közül csupán a vsync kikapcsolását engedélyeztem, minden más a gyári beállításon maradt.

    A Vivid! kártyáknál a legutolsó 7.114-es meghajtóprogramot, a Siluro esetében a legutolsó hivatalos detonatort, a 12.41-est használtam, szintén alap beállításokkal, a vsync kikapcsolásával.

    [oldal:Q3, MKD2]

    Először nézzük az OpenGL alapokra épülő Quake3: Arena legutolsó javítócsomagjában lévő four.dm_66 demó eredményeit. Ahol csak a felbontás van jelölve, maximális beállítást használtam: trilinear filter, 32 bites textúrák, 32 bites színmélység, maximális textúraminőség, lightmap. A Q3 konfigurációs fájlja a program által generált, kivéve egyetlen kapcsolót, a textúratömörítését, melyet bekapcsoltam.

    Q3A 1.29h normal "four.dm_66"
                       
     
    Fastest
    Fast
    Normal
    HQ
    640
    800
    1024
    1280
    1600
                       
    Vivid!XS
    70,6
    65,2
    65,1
    64,7
    62
    61,8
    61,4
    54,9
    40,1
    Vivid!
    70,5
    64,9
    64,9
    64,6
    62,2
    61,7
    56,1
    37,7
    25,5
    Siluro MX400
    77,7
    72
    72
    70,8
    69,3
    67,6
    57,5
    35,9
    -
     
    Q3A 1.29h 2x FSAA "four.dm_66"
                       
     
    Fastest
    Fast
    Normal
    HQ
    640
    800
    1024
    1280
    1600
                       
    Vivid!XS
    70,8
    65,4
    64,9
    63,9
    62,3
    61,2
    51
    32,2
    -
    Vivid!
    71
    65,4
    64,8
    54,7
    61,5
    52,7
    34
    20,8
    -
    Siluro MX400
    78,3
    71,7
    63,8
    43,5
    58,6
    40,5
    25,2
    14,7
    -
     
    Q3A 1.29h 4x FSAA "four.dm_66"
                       
     
    Fastest
    Fast
    Normal
    HQ
    640
    800
    1024
    1280
    1600
                       
    Vivid!XS
    70,7
    65,2
    63,7
    45,4
    59
    44,3
    27,6
    -
    -
    Vivid!
    71
    63,9
    50,6
    29,9
    44,4
    29,2
    18,1
    -
    -
    Siluro MX400
    78,4
    71,2
    42,8
    27,5
    38,8
    25,7
    15,8
    -
    -

    Nos, a számok gyönyörűen mutatják, hogy a 700-as Duron jelentősen visszafogja a teljesítményt. Amíg a kártya el nem éri a fill rate-limitáltságot, lényegében konstans az fps-számokban kifejezett teljesítmény. A számokból az is kiolvasható, hogy a 115 MHz-es Vivid! valahol a 800x600 és 1024x768-as felbontás között éri el a fill rate határát, míg a Vivid!XS emelt órajelével egy felbontással feljebb, kb. 1024x768 és 1280x1024 közöttig bírja. Ezen felbontások felett már mindegy milyen processzort használunk, a kártya elérte fizikai korlátait. Legalábbis ebben az alkalmazásban.

    Az MX ilyen szempontból 800x600 és 1024x768 közötti felbontásig bírja, lényegében 1024x768-tól semmilyen esetben sem ellenfele a Vivid!XS-nek. A meghajtóprogramja viszont sokkal jobban optimalizált, ez is nagyon szépen látszik alacsony felbontáson, 800x600-ig konstans 6-7 fps-sel többet hoz a Vivid!XS-nél. Jól dolgoznak az NVIDIA mérnökei.

    Az MDK2 is OpenGL-alapú játék T&L-re optimalizálva, ez a tesztereményeken erősen meg is látszik, a 700-as Duron nem kelhet birokra az MX második generációs T&L motorjával. A tesztelést itt is 32 bites színmélységben, a T&L engedélyezésével végeztem el a demóval, a jelzett felbontásokon.

    MKD2 demo
             
     
    640x480
    800x600
    1024x768
    1280x1024
             
    Vivid!XS
    42,31
    42,36
    42,28
    42,53
    Vivid!
    42,48
    42,59
    42,32
    36,9
    Siluro MX400
    69,6
    67,24
    56,1
    34,36
     
    MKD2 demo 2x FSAA
             
     
    640x480
    800x600
    1024x768
    1280x1024
             
    Vivid!XS
    42,41
    42,68
    40,95
    32,62
    Vivid!
    42,73
    41,4
    33,46
    21,07
    Siluro MX400
    58,02
    39,33
    24,34
    14,12
     
    MKD2 demo 4x FSAA
             
     
    640x480
    800x600
    1024x768
    1280x1024
             
    Vivid!XS
    42,44
    39,02
    28,94
    -
    Vivid!
    39,12
    30,24
    18,93
    -
    Siluro MX400
    37,81
    24,68
    15,2
    -

    Az MX gyönyörűen teljesít, de mint azt már jeleztem, nem szabad helytelen következtetést levonni az eredményekből. A Vivid!XS stabilan 42 fps-t hoz 640x480-tól 1280x1024-ig, felbontástól függetlenül. Ez csak egy dolgot jelenthet: a hardveres T&L nélkül a 700-as Duron ennyire képes. Ha erősebb processzort használnánk bizony megfordulna a kocka.

    Hogy melyik kártya rendelkezik nagyobb tartalékokkal? Elég csak megnézni az FSAA eredményeket.

    [oldal:VillageMark, Temple Demo]

    A VillageMark és Temple Demo speciális KYRO-ra optimalizált programokról már esett korábban szó. Az MX kártyán sajnos esélyem sem volt a Temple demó futtatására, a VillageMark alatt elért 23 fps pedig közelében sincs a Vivid!-ek 89 és 78 fps-éhez képest, így inkább ki is hagytam a tesztből. Példásan mutatja viszont a KYRO I és II közötti teljesítménykülönbséget ez a két program, így a rizsa helyett jöjjenek az eredmények, vajon hova sikerült továbblépni az órajel emelésével:

    VillageMark 1.19
               
     
    640
    800
    1024
    1280
    1600
               
    Vivid!XS
    89
    89
    89
    81
    56
    Vivid!
    89
    89
    78
    53
    36

    Sokan szembesülnek a cloudos számlájuk elhízásával. Mint ahogyan a test számára is lehetséges egy jó étrend kialakítása a súlyfelesleg elkerülése érdekében, úgy egy kis tervezéssel a felhő költségei optimalizálhatók. Többek között ilyen témákkal foglalkozik a december 9-i HWSW meetup.

    a címlapról

    Hirdetés

    FinOps: a fájdalommentes diéta titka a felhőben

    2021. december 7. 07:02

    Sokan szembesülnek a cloudos számlájuk elhízásával. Mint ahogyan a test számára is lehetséges egy jó étrend kialakítása a súlyfelesleg elkerülése érdekében, úgy egy kis tervezéssel a felhő költségei optimalizálhatók. Többek között ilyen témákkal foglalkozik a december 9-i HWSW meetup.