Szerző: Asztalos Olivér

2017. március 10. 14:15

Óriásit dob a hatékonyságon az új PowerVR grafikus architektúra

Óriási előrelépést hozhat az új PowerVR grafikus mikroarchitektúra, a tervezőcég szerint azonos fogyasztás és tranzisztorszám mellett akár közel kétszeresére is nőhet a tempó.

Éves privát rendezvényén mutatta be új grafikus mikroarchitektúráját az Imagination. Bár a Furian nem helyezi teljesen új alapokra az PowerVR vonalat, összességében az elmúlt hét év legnagyobb változását hozza. Az évek óta piacon lévő Rogue-t, és a most bejelentett Furiant egy darabig párhuzamosan futtatja majd a cég, a vadiúj fejlesztés első körben csak a felsőkategóriás okostelefonokban és táblagépekben kap helyet, de a tervezőcég hosszútávon a VR eszközökkel, az autóiparral, illetve a deep learninggel is számol. Várhatóan a most bejelentett a megoldásra építi az akár jövőre, de legkésőbb 2019-ben megjelenő iPhone-ok és iPadek GPU-it az Apple, amely az Imagination legnagyobb partnerének számít.

A Furian fejlesztése a hatékonyság körül forgott, a teljesítmény/terület, illetve a teljesítmény/fogyasztás mutatók optimalizálásra törekedett az Imagination csapata. A filozófia logikus, a mobilos alkalmazásprocesszorok lapkáinak területe és fogyasztási kerete már nagyjából fix, ezért csak a hatékonyság növelésével lehet számottevően feljebb tornászni a számítási teljesítményt, legyen szó belépőszintről vagy csúcskategóriáról.

Ennek megfelelőn a területhatékonyságot hangsúlyozta prezentációja során az Imagination. A Rogue mikroarchitektúrára épülő, csúcskategóriás Series7XT Plus dizájnhoz képest 35 százalékkal nagyobb shader teljesítményt, 80 százalékkal magasabb fill rate-et, ezzel együtt pedig 70-90 százalékkal nagyobb megjelenítési sebességet kínál a Furian azonos területen (hasonló tranzisztorszám mellett) és fogyasztás mellett, ami első hallásra óriási előrelépést sejtet. Ezzel hasonló GPU méret mellett közel duplájára emelhető a tempó, illetve a korábbi sebességet feltételezve majdnem felezhető a fogyasztás, attól függően, hogy az adott processzor esetében melyik a hangsúlyosabb.

A Furian mindezt forradalmi fejlesztések nélküli érte el, az Imagination megtartotta a Rogue alapjait. Ennek megfelelően maradt a TBDR (tile based deferred rendering) rendszer, aminek gyökerei lassan két évtizedesek, a 2000-es években megjelent PC-s Kyro GPU esetében is erre épített az Imagination. Az eljárás lényege alapján a rendszer igyekszik pixelszinten szűrni megjelenített képen nem látható elemeket (pl. háromszögeket), ezzel tehermentesítve a GPU-t a felesleges számításoktól, amely így erőforrásaival a hasznos kalkulációkra fókuszálhat.

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Az egyes blokkok már nem úszták meg az átépítést, a nagyobb számítási teljesítmény, az új funkciók hozzáadása, illetve a (még) jobb skálázhatóság érdekében számos módosítást eszközöltek a tervezők. A Furian (főleg) utóbbi jegyében az erős központi hub, vagyis a centralizált végrehajtás helyett egy hierarchikusabb rendszert vezet be, amivel a komplett GPU kapacitása könnyebb variálható.

A GPU szívét jelentő ALU klaszterben komoly változtatások történtek. Itt a hatékonyság növelésének érdekében 16-ról 32-re duplázódott a futószalagok száma, azaz a klaszter mérete nőtt. Erre szintén a hatékonyság javítása miatt volt szükség, ugyanis egyetlen 32 futószalagos klaszterhez kevesebb vezérlőlogika kell, mint két 16-oshoz. A változtatásból eredően kevesebb klaszterből épülnek majd fel a GPU-k, amihez hozzá kellett igazítani a textúrázóegységek teljesítményét is, ami miatt a korábbi, órajelenkénti négy bilineáris mintát hertzenként nyolcra emeli a Furian.

Ezzel párhuzamosan a futószalagok felépítése is alaposan átalakult. A Rogue kiegyensúlyozott megoldása helyett a Furian egy szélesebb és sűrűbb, kevésbé rugalmas megoldást hoz, a második, szorzásra és összeadásra egyaránt képes MAD ALU-t egy kizárólag szorzásra képes, egyszerűbb MUL ALU-ra cserélte az Imagination. Bár a Rogue két MAD ALU-s felépítése letisztultabbnak és kiegyensúlyozottabbnak tűnhet, az évek során szerzett gyakorlati tapasztalatok alapján a tervezők arra jutottak, hogy a második MAD ALU-t nehéz rendesen etetni, ezért az egy egyszerűbb MUL ALU-val úgy helyettesíthető, hogy közben a rendszer teljesítménye nem szenved különösebb csorbát. Eközben a felszabadult tranzisztorbüdzsét és fogyasztási keretet hasznosabb dolgokra lehet elkölteni, akár nagyon egyszerűen, a többi egység órajelének emelésével.

Ezzel páthuzamosan az Imagination nyitva hagyta az ajtót partnerei számára, akik akár részleteiben, blokk vagy alacsony szinten is hozzányúlhatnak a mikroarchitektúrához, például funkcióspecifikus futószalagok hozzáadásával. Ezt elsősorban az Apple használhatja ki, a cég ugyanis előszeretettel szabja személyre a grafikus mikroarchitektúrát (is), azt hozzáigazítva saját operációs rendszeréhez és API-jához, a Metalhoz. Említésre méltó még a heterogén végrehajtás támogatása, a Furiant már a jövő OpenCL API-jának megfelelően tervezték, külön GPU dizájnokat készülnek majd koherens rendszerekhez.

Az Imagination egyelőre csak a mikroarchitektúrát jelentette be, komplett GPU dizájnok csak később érkeznek, a Series8XT-vel az élen. Az első Furian grafikus egységgel szerelt rendszerchipek jó esetben már jövő év második felében felbukkanhatnak, a széleskörű terjedésre viszont jelen állás szerint 2019 előtt nem lehet számítani.

Kubernetes képzéseinket már közel 300 szakember végezte el. A nagy sikerre való tekintettel a tanfolyamot aktualizált tananyaggal június 18-án újra elindítjuk! A 8 alkalmas, élő képzés képzés órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról