Szerző: Bodnár Ádám

2014. november 4. 11:29

Nem váltja meg a világot az NVIDIA Denver

Megjelent a piacon az első olyan termék, amely az NVIDIA által fejlesztett processzormagokra épülő rendszerchipet tartalmazza. A Nexus 9 tablet sebességét az Anandtech gyorsan le is mérte, a tapasztalatok elég vegyesek.

A Project Denverről először a 2011 januárjában tartott Consumer Electronics Show alkalmával beszélt az NVIDIA, a vállalat ekkor jelentette be hivatalosan, hogy az ARM utasításkészlet-architektúrára alapozva saját processzormagokat fejleszt. A nagyszabású terven akkor már vagy három éve dolgozott több száz chiptervező mérnök a cégnél, Jen-Hsun Huang elnök-vezérigazgató pedig nagyjából öt évre taksálta a projekt kifutási idejét, vagyis az első Denver-alapú lapkáknak 2013-ban kellett volna megjelennie.

A koncepció

A chipet fejlesztő mérnökök jelentős része a Stexar nevű cégtől érkezett, amelyet 2006-ban vásárolt fel az NVIDIA. A Stexart Inteltől kiugrott mérnökök alapították, hogy egy x86 utasítások végrehajtására képes chipet építsenek, amely a Transmeta által is használt valós idejű fordítással és dinamikus kódoptimalizációval dolgozik. Az NVIDA berkein belül dolgozó tervezőcsapatot később más chipgyártóknál (pl. AMD, Sun Microsystems, Transmeta) tapasztalatot szerzett mérnökökkel egészítették ki. A Denver nagy dobása ennek megfelelően a futásidejű dinamikus kódoptimalizáció.

A modern processzorokban az áramkörök jelentős része nem az utasítások végrehajtásával foglalkozik, hanem azok olyan átrendezéséről, hogy a végrehajtóegységek a legmagasabb kihasználtsággal működhessenek. Az NVIDIA szoftverrel kerülte meg, hogy bonyolult "out of order" processzort kelljen építenie, a Denver magjai in-order felépítésűek, azonban dinamikus kódoptimalizáció segítségével a gyakran futtatott kódrészleteket már átrendezve, optimalizálva kapják meg - lényegében az out of order logikát szoftver helyettesíti. A leggyakrabban futtatott kódrészleteket a Denver felismeri és egy saját szoftveres algoritmus segítségével futásidőben optimalizálja. Az optimalizált kód a rendszermemória egy elkülönített részében tárolódik és onnan hívja elő a CPU, amikor az adott kódrészletre kerül a sor.

Az NVIDIA még a közelmúltban is arról beszélt, hogy ezzel a megközelítéssel a kurrens ARM processzormagoknál (pl. ARM Cortex-A57, Qualcomm Krait vagy Apple Cyclone) jelentősen nagyobb teljesítményre képes, mivel a szoftveres kódfordítás és optimalizálás révén az utasításablak akár ezres nagyságrendű is lehet, vagyis ennyi utasításból választhatja ki az ütemező a következőt, ellentétben a sok tranzisztort és bonyolult logikát felemésztő hardveres megoldások jellemzően 128-192 utasításos ablakával. Az Anandtech most kipróbálta a Denver-magos NVIDIA Tegra K1 processzorra épülő Nexus 9 tabletet és a teljesítményét is megmérte, ezek alapján a koncepció egyelőre messze nem igazolja az NVIDIA várakozásait és ígéreteit.

A számok

A gyártó által publikált teljesítményadatok szerint a Denvernek állva kellene hagynia a konkurenciát, sőt, egyes esetekben a jóval nagyobb fogyasztásra tervezett Intel Core i3-at is utol kellene érnie, valójában azonban a két Denver-magos, 2,3 GHz-es 64 bites Tegra K1 alig teljesít jobban mint a szintén kétmagos, de 32 bites ARM Cortex-A15 processzormagokat felvonultató korábbi NVIDIA-chip. Az Anandtech által publikált teszteredmények szerint a legtöbb esetben az Apple-féle, 64 bites kétmagos A8X messze megelőzi a Denvert, amely sok esetben még a Cortex-A15 sebességét sem tudja elérni, pedig a memória-sávszélességgel láthatóan nincs gond, nem ez fogja vissza a chipet.

A grafikus teljesítményt is erősen rontják a gyenge processzormagok, ezekben a tesztekben is rendre lemarad a Denver-alapú K1 a Cortex-A15-ös versenytárs mögött, hol kicsit, hol jobban, pedig mindkét lapka azonos grafikus magot tartalmaz. Fogyasztásban ugyanakkor nem teljesít rosszul a chip, a Nexus 9 az Anandtech szerint majdnem 10 órán át futtatja  webböngészős tesztfeladatot. A többi tablettel az összevetés nehéz ebben az esetben, mert az akkuidőt nagyban meghatározzák a rendszerchip mellett más komponensek is, elsősorban a kijelző.

Azt mindenképp érdemes elmondani, hogy az Anandtech által tesztelt rendszer augusztus végi firmware-t tartalmazott, ami még nem a boltokba kerülő, végleges verzió, a megjelenésig ezen változtathattak, ami a teljesítményt is befolyásolhatja - végleges verdiktet majd a boltba kerülő példányokon futtatott tesztek alapján lehet mondani. Mivel a Denver fordító és kódoptimalizációs algoritmusai tisztán szoftveresek, akár a későbbiekben is jöhet olyan frissítés, amely növelheti azok hatékonyságát és ezen keresztül a lapka sebességét is.

A koncepció felett ezek alapján a számok alapján nem érdemes pálcát törni, de az első megvalósítás finoman szólva is harmatosra sikerült, az NVIDIA által beígért gyorsulásnak egyelőre nyoma sincs.

a címlapról