Szerző: Gálffy Csaba

2014. szeptember 19. 17:33

Új csúcsmodellt hozott az NVIDIA

Azonos csíkszélességen készül elődjével, ennek ellenére nagyot lép előre teljesítmény/fogyasztás mutatóban a GeForce GTX 980. Abszolút értelemben is hoz gyorsulást a friss hardver, a korona egyértelműen az NVIDIA-t illeti most.

Meglepetésre előbb a középkategóriában tette elérhetővé Maxwell-generációs architektúráját az NVIDIA. A korosodó Keplert azonban immár a csúcskategóriában is leváltja a gyártó, a GTX 780 helyére a várva várt GTX 980-as grafikus kártya került, a Maxwell egy újra átdolgozott, második kiadásával.

Gyorsan fussunk végig a kártyát hajtó GM204 kódnevű GPU specifikációin. A lapka a TSMC 28 nanométeres eljárásán készül, azonban 7,1 milliárd tranzisztor helyett csak 5,2 milliárdnyit tartalmaz. Ezzel együtt a CUDA feldolgozóegységek száma 2880-ról 2048-ra csökkent, a processzor órajele azonban jelentősen, 875 MHz-ről 1126 MHz-re emelkedett, ami az új architektúra magasabb IPC (órajelenként végrehajtott utasítások száma) mutatójával együtt azt jelenti, hogy a kisebb lapka gyorsabb tud lenni az előző generációnál. A hatékonyság a fogyasztásra is igen jó hatást tett, az előző csúcsmodell 250 wattos névleges fogyasztása 165 wattra esett.

28 nanométer

A grafikuschip-gyártók termékstratégiáit az elmúlt évtizedben alapvetően határozta meg a félvezetőgyártás fejlődése, különösen az NVIDIA és az ATI (majd AMD) GPU-it gyártó TSMC gyártástechnológiájának evolúciója. A tajvani bérgyártó ugyanis rendületlenül állította csatasorba az egyre kisebb csíkszélességű eljárásokat, mintegy kétévente komoly előrelépést hozva a piacra fogyasztásban, teljesítményben és tranzisztorsűrűségben. Ez a folyamat lehetővé tette, hogy a GPU-k fejlődése szoros szinkronban haladjon a TSMC által elérhetővé tett tranzisztorszám-növeléssel: 2004-ben a (még IBM félvezetőgyárban készülő) GeForce 6800 Ultra mintegy 222 millió tranzisztorból építkezett, ezzel szemben a most bemutatkozott csúcsmodell már 5,2 milliárd tranzisztort használ - ezt a TSMC fejlesztése tette elérhetővé.

(forrás: Anandtech)

A tajvani bérgyártó azonban immár harmadik éve a 28 nanométeres eljárást kínálja a GPU-gyártóknak, és ez a közeljövőben biztosan nem is fog megváltozni. A cég 20 nanométeres technológiája ugyanis elsősorban alacsony fogyasztásra optimalizált, a nagy teljesítményű GPU-k előállítására nem ideális, a 28 nanométernél kimondottan lassabb. Ennek köszönhetően az AMD és az NVIDIA is stratégiaváltásra kényszerült, a tranzisztorszám növelésével elért teljesítményemelés helyett a meglévő tranzisztorok hatékonyabb kihasználása került a fejlesztés fókuszába.

Maxwell, csapó kettő!

A 28 nanométeres eljárást ma már a TSMC és a partnerei is igen alaposan megismerték, a technológia pedig bemutatkozása óta több körös finomítást is kapott, így rendkívül alacsony selejtaránnyal és nagyon jó órajel-fogyasztás karakterisztikával rendelkezik, ami a frekvencia számottevő emelését tette lehetővé, annak ellenére, hogy a csíkszélesség állandó maradt. Az NVIDIA emellett komoly fejlesztési erőforrásokat csoportosított át az áramköröket generáló szoftverek továbbfejlesztésére is, amely jelentős kézi optimalizációval megtoldva azt eredményezte, hogy a funkcionálisan azonos egységek ma jóval kompaktabbak lehetnek - vagyis ugyanakkora lapkaméretre több és gyorsabb funkcionális elem fér, mint korábban.

Jobbra a Maxwell, balra a Kepler.

Ezt az igen alapos, a tranzisztorok és áramkörök szintjéig lenyúló újratervezést egyébként az is szükségessé tette, hogy a Maxwell architektúra már nem csak az asztali GPU-kat szolgálja ki, hanem ez teljesít szolgálatot az NVIDIA mobilos processzoraiban is, a Tegrákban. Azonban míg az alacsony fogyasztású környezetben csupán néhány apró Maxwell-modul dolgozik, a nagy asztali GPU-kban kétezernél is több futószalag számol egyszerre. Az alapos áttervezés eredménye azonban nem csak a Tegrákban, hanem az asztalon is jelentkezik: a gyártó saját mérései szerint az egységnyi fogyasztásra jutó teljesítmény közel megduplázódott, ami a rengeteg kisebb-nagyobb módosítás összeadódó eredménye. Az architektúra pontos változásairól itt írtunk már részletesen, annyit érdemes kiemelni, hogy az új GPU alapját képező, 128 feldolgozóegységet tömörítő SMM modulok a Kepler-generáció 192 "magos" SMX moduljainak 90 százalékát hozzák teljesítményben, miközben jóval kisebb helyet foglalnak.

Toxikus vezetők szivárványa

Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

Toxikus vezetők szivárványa Az IT munkakörülményeket, a munkahelyi kultúrát alapjaiban határozzák meg a vezetők, főleg ha még toxikusak is.

A Maxwell második generációja ezen felül további finomhangolásokat hoz, ezek közül kiemelkedik a ROP-egységek számának növelése, egy memóriavezérlőre ugyanis már 16 ilyen jut. A ROP hagyományosan memóriasávszélesség-igényes feladatokat végez, az itt folyó mátrix- és vektoroperációk nagyon leterhelik a memóriavezérlőt. Emiatt a ROP egységek száma nem is skálázható a végtelenségig, a sávszélesség ugyanis igen kemény korlátot jelent a feldolgozás sebességére. Hogyan sikerült az NVIDIA-nak mégis jelentősen növelni a ROP-ok számát? A válasz egy új, Delta Color Compression színtömörítési megoldás, amellyel a pixelek színére vonatkozó adatok látványosan tömöríthetőek, ezzel a memóriafoglalás és a sávszélességigény is jelentősen, a cég adatai szerint 17-29 százalékkal csökkenthető, így azonos műszaki korlátok mellett ennyivel több ROP-egységet tudnak kiszolgálni a memóriavezérlők.

Mit tud és milyen gyors?

A Prohardver elemzése szerint a GPU támogatja az OpenGL 4,5, az OpenCL 1.1 szabványok mellett a Direct3D 11.2 Feature Level 11_1-et, valamint az NVIDIA saját CUDA és C++ AMP programozási környezeteit is. Érdekes azonban a szituáció a DirectX 12-vel kapcsolatban, az NVIDIA ugyanis a folyamatban lévő tárgyalásokra és egyeztetésekre hivatkozva kijelentette, hogy nem vállal hivatalos támogatást egyelőre az új grafikus API-hoz a specifikáció lezárásáig. Ez komoly aggodalmat persze senki számára ne okozzon, csupán a grafikus szabványt körülvevő bizonytalanság egyik melléktermékével állunk szemben.

Az Anandtech tesztje szerint a GTX 980 minden ponton, fogyasztást és teljesítményt tekintve is ráver az AMD legjobbjára, az R9 290X-re, de a különbség nem megalázóan nagy, az új modell magasabb ára pedig az NVIDIA versenyben jelenleg élvezett előnyét pontosan mutatja is: a GTX 980 hazai fogyasztói ára mintegy 180 ezer forint körül alakul majd.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról