Szerző: Gálffy Csaba

2014. szeptember 19. 17:33

Új csúcsmodellt hozott az NVIDIA

Azonos csíkszélességen készül elődjével, ennek ellenére nagyot lép előre teljesítmény/fogyasztás mutatóban a GeForce GTX 980. Abszolút értelemben is hoz gyorsulást a friss hardver, a korona egyértelműen az NVIDIA-t illeti most.

Meglepetésre előbb a középkategóriában tette elérhetővé Maxwell-generációs architektúráját az NVIDIA. A korosodó Keplert azonban immár a csúcskategóriában is leváltja a gyártó, a GTX 780 helyére a várva várt GTX 980-as grafikus kártya került, a Maxwell egy újra átdolgozott, második kiadásával.

Gyorsan fussunk végig a kártyát hajtó GM204 kódnevű GPU specifikációin. A lapka a TSMC 28 nanométeres eljárásán készül, azonban 7,1 milliárd tranzisztor helyett csak 5,2 milliárdnyit tartalmaz. Ezzel együtt a CUDA feldolgozóegységek száma 2880-ról 2048-ra csökkent, a processzor órajele azonban jelentősen, 875 MHz-ről 1126 MHz-re emelkedett, ami az új architektúra magasabb IPC (órajelenként végrehajtott utasítások száma) mutatójával együtt azt jelenti, hogy a kisebb lapka gyorsabb tud lenni az előző generációnál. A hatékonyság a fogyasztásra is igen jó hatást tett, az előző csúcsmodell 250 wattos névleges fogyasztása 165 wattra esett.

28 nanométer

A grafikuschip-gyártók termékstratégiáit az elmúlt évtizedben alapvetően határozta meg a félvezetőgyártás fejlődése, különösen az NVIDIA és az ATI (majd AMD) GPU-it gyártó TSMC gyártástechnológiájának evolúciója. A tajvani bérgyártó ugyanis rendületlenül állította csatasorba az egyre kisebb csíkszélességű eljárásokat, mintegy kétévente komoly előrelépést hozva a piacra fogyasztásban, teljesítményben és tranzisztorsűrűségben. Ez a folyamat lehetővé tette, hogy a GPU-k fejlődése szoros szinkronban haladjon a TSMC által elérhetővé tett tranzisztorszám-növeléssel: 2004-ben a (még IBM félvezetőgyárban készülő) GeForce 6800 Ultra mintegy 222 millió tranzisztorból építkezett, ezzel szemben a most bemutatkozott csúcsmodell már 5,2 milliárd tranzisztort használ - ezt a TSMC fejlesztése tette elérhetővé.

(forrás: Anandtech)

A tajvani bérgyártó azonban immár harmadik éve a 28 nanométeres eljárást kínálja a GPU-gyártóknak, és ez a közeljövőben biztosan nem is fog megváltozni. A cég 20 nanométeres technológiája ugyanis elsősorban alacsony fogyasztásra optimalizált, a nagy teljesítményű GPU-k előállítására nem ideális, a 28 nanométernél kimondottan lassabb. Ennek köszönhetően az AMD és az NVIDIA is stratégiaváltásra kényszerült, a tranzisztorszám növelésével elért teljesítményemelés helyett a meglévő tranzisztorok hatékonyabb kihasználása került a fejlesztés fókuszába.

Maxwell, csapó kettő!

A 28 nanométeres eljárást ma már a TSMC és a partnerei is igen alaposan megismerték, a technológia pedig bemutatkozása óta több körös finomítást is kapott, így rendkívül alacsony selejtaránnyal és nagyon jó órajel-fogyasztás karakterisztikával rendelkezik, ami a frekvencia számottevő emelését tette lehetővé, annak ellenére, hogy a csíkszélesség állandó maradt. Az NVIDIA emellett komoly fejlesztési erőforrásokat csoportosított át az áramköröket generáló szoftverek továbbfejlesztésére is, amely jelentős kézi optimalizációval megtoldva azt eredményezte, hogy a funkcionálisan azonos egységek ma jóval kompaktabbak lehetnek - vagyis ugyanakkora lapkaméretre több és gyorsabb funkcionális elem fér, mint korábban.

Jobbra a Maxwell, balra a Kepler.

Ezt az igen alapos, a tranzisztorok és áramkörök szintjéig lenyúló újratervezést egyébként az is szükségessé tette, hogy a Maxwell architektúra már nem csak az asztali GPU-kat szolgálja ki, hanem ez teljesít szolgálatot az NVIDIA mobilos processzoraiban is, a Tegrákban. Azonban míg az alacsony fogyasztású környezetben csupán néhány apró Maxwell-modul dolgozik, a nagy asztali GPU-kban kétezernél is több futószalag számol egyszerre. Az alapos áttervezés eredménye azonban nem csak a Tegrákban, hanem az asztalon is jelentkezik: a gyártó saját mérései szerint az egységnyi fogyasztásra jutó teljesítmény közel megduplázódott, ami a rengeteg kisebb-nagyobb módosítás összeadódó eredménye. Az architektúra pontos változásairól itt írtunk már részletesen, annyit érdemes kiemelni, hogy az új GPU alapját képező, 128 feldolgozóegységet tömörítő SMM modulok a Kepler-generáció 192 "magos" SMX moduljainak 90 százalékát hozzák teljesítményben, miközben jóval kisebb helyet foglalnak.

Szoftvertesztelés: ütött az óra

A tesztelői szakmát rengeteg friss hatás éri, kifejezetten nehezített pálya ez mostanság.

Szoftvertesztelés: ütött az óra A tesztelői szakmát rengeteg friss hatás éri, kifejezetten nehezített pálya ez mostanság.

A Maxwell második generációja ezen felül további finomhangolásokat hoz, ezek közül kiemelkedik a ROP-egységek számának növelése, egy memóriavezérlőre ugyanis már 16 ilyen jut. A ROP hagyományosan memóriasávszélesség-igényes feladatokat végez, az itt folyó mátrix- és vektoroperációk nagyon leterhelik a memóriavezérlőt. Emiatt a ROP egységek száma nem is skálázható a végtelenségig, a sávszélesség ugyanis igen kemény korlátot jelent a feldolgozás sebességére. Hogyan sikerült az NVIDIA-nak mégis jelentősen növelni a ROP-ok számát? A válasz egy új, Delta Color Compression színtömörítési megoldás, amellyel a pixelek színére vonatkozó adatok látványosan tömöríthetőek, ezzel a memóriafoglalás és a sávszélességigény is jelentősen, a cég adatai szerint 17-29 százalékkal csökkenthető, így azonos műszaki korlátok mellett ennyivel több ROP-egységet tudnak kiszolgálni a memóriavezérlők.

Mit tud és milyen gyors?

A Prohardver elemzése szerint a GPU támogatja az OpenGL 4,5, az OpenCL 1.1 szabványok mellett a Direct3D 11.2 Feature Level 11_1-et, valamint az NVIDIA saját CUDA és C++ AMP programozási környezeteit is. Érdekes azonban a szituáció a DirectX 12-vel kapcsolatban, az NVIDIA ugyanis a folyamatban lévő tárgyalásokra és egyeztetésekre hivatkozva kijelentette, hogy nem vállal hivatalos támogatást egyelőre az új grafikus API-hoz a specifikáció lezárásáig. Ez komoly aggodalmat persze senki számára ne okozzon, csupán a grafikus szabványt körülvevő bizonytalanság egyik melléktermékével állunk szemben.

Az Anandtech tesztje szerint a GTX 980 minden ponton, fogyasztást és teljesítményt tekintve is ráver az AMD legjobbjára, az R9 290X-re, de a különbség nem megalázóan nagy, az új modell magasabb ára pedig az NVIDIA versenyben jelenleg élvezett előnyét pontosan mutatja is: a GTX 980 hazai fogyasztói ára mintegy 180 ezer forint körül alakul majd.

Csatlakozz partnerprogramunkhoz, mi pedig ajánlunk ügyfeleinknek, ezenkívül egyedi kedvezményeket is adunk webhosting csomagjainkra. Próbáld ki ingyenesen az Aruba Cloud-ot, most 40 ezer forint értékű vouchert adunk!

a címlapról