Szerző: Asztalos Olivér

2017. március 10. 14:15

Óriásit dob a hatékonyságon az új PowerVR grafikus architektúra

Óriási előrelépést hozhat az új PowerVR grafikus mikroarchitektúra, a tervezőcég szerint azonos fogyasztás és tranzisztorszám mellett akár közel kétszeresére is nőhet a tempó.

Éves privát rendezvényén mutatta be új grafikus mikroarchitektúráját az Imagination. Bár a Furian nem helyezi teljesen új alapokra az PowerVR vonalat, összességében az elmúlt hét év legnagyobb változását hozza. Az évek óta piacon lévő Rogue-t, és a most bejelentett Furiant egy darabig párhuzamosan futtatja majd a cég, a vadiúj fejlesztés első körben csak a felsőkategóriás okostelefonokban és táblagépekben kap helyet, de a tervezőcég hosszútávon a VR eszközökkel, az autóiparral, illetve a deep learninggel is számol. Várhatóan a most bejelentett a megoldásra építi az akár jövőre, de legkésőbb 2019-ben megjelenő iPhone-ok és iPadek GPU-it az Apple, amely az Imagination legnagyobb partnerének számít.

A Furian fejlesztése a hatékonyság körül forgott, a teljesítmény/terület, illetve a teljesítmény/fogyasztás mutatók optimalizálásra törekedett az Imagination csapata. A filozófia logikus, a mobilos alkalmazásprocesszorok lapkáinak területe és fogyasztási kerete már nagyjából fix, ezért csak a hatékonyság növelésével lehet számottevően feljebb tornászni a számítási teljesítményt, legyen szó belépőszintről vagy csúcskategóriáról.

Ennek megfelelőn a területhatékonyságot hangsúlyozta prezentációja során az Imagination. A Rogue mikroarchitektúrára épülő, csúcskategóriás Series7XT Plus dizájnhoz képest 35 százalékkal nagyobb shader teljesítményt, 80 százalékkal magasabb fill rate-et, ezzel együtt pedig 70-90 százalékkal nagyobb megjelenítési sebességet kínál a Furian azonos területen (hasonló tranzisztorszám mellett) és fogyasztás mellett, ami első hallásra óriási előrelépést sejtet. Ezzel hasonló GPU méret mellett közel duplájára emelhető a tempó, illetve a korábbi sebességet feltételezve majdnem felezhető a fogyasztás, attól függően, hogy az adott processzor esetében melyik a hangsúlyosabb.

A Furian mindezt forradalmi fejlesztések nélküli érte el, az Imagination megtartotta a Rogue alapjait. Ennek megfelelően maradt a TBDR (tile based deferred rendering) rendszer, aminek gyökerei lassan két évtizedesek, a 2000-es években megjelent PC-s Kyro GPU esetében is erre épített az Imagination. Az eljárás lényege alapján a rendszer igyekszik pixelszinten szűrni megjelenített képen nem látható elemeket (pl. háromszögeket), ezzel tehermentesítve a GPU-t a felesleges számításoktól, amely így erőforrásaival a hasznos kalkulációkra fókuszálhat.

Jöhet a malware-cunami az iPhone-okra?

Nyílik az iOS, de tényleg annyira veszélyes ez? Annyira azért nem kell félni, elég sok kontroll van még az Apple-nél.

Jöhet a malware-cunami az iPhone-okra? Nyílik az iOS, de tényleg annyira veszélyes ez? Annyira azért nem kell félni, elég sok kontroll van még az Apple-nél.

Az egyes blokkok már nem úszták meg az átépítést, a nagyobb számítási teljesítmény, az új funkciók hozzáadása, illetve a (még) jobb skálázhatóság érdekében számos módosítást eszközöltek a tervezők. A Furian (főleg) utóbbi jegyében az erős központi hub, vagyis a centralizált végrehajtás helyett egy hierarchikusabb rendszert vezet be, amivel a komplett GPU kapacitása könnyebb variálható.

A GPU szívét jelentő ALU klaszterben komoly változtatások történtek. Itt a hatékonyság növelésének érdekében 16-ról 32-re duplázódott a futószalagok száma, azaz a klaszter mérete nőtt. Erre szintén a hatékonyság javítása miatt volt szükség, ugyanis egyetlen 32 futószalagos klaszterhez kevesebb vezérlőlogika kell, mint két 16-oshoz. A változtatásból eredően kevesebb klaszterből épülnek majd fel a GPU-k, amihez hozzá kellett igazítani a textúrázóegységek teljesítményét is, ami miatt a korábbi, órajelenkénti négy bilineáris mintát hertzenként nyolcra emeli a Furian.

Ezzel párhuzamosan a futószalagok felépítése is alaposan átalakult. A Rogue kiegyensúlyozott megoldása helyett a Furian egy szélesebb és sűrűbb, kevésbé rugalmas megoldást hoz, a második, szorzásra és összeadásra egyaránt képes MAD ALU-t egy kizárólag szorzásra képes, egyszerűbb MUL ALU-ra cserélte az Imagination. Bár a Rogue két MAD ALU-s felépítése letisztultabbnak és kiegyensúlyozottabbnak tűnhet, az évek során szerzett gyakorlati tapasztalatok alapján a tervezők arra jutottak, hogy a második MAD ALU-t nehéz rendesen etetni, ezért az egy egyszerűbb MUL ALU-val úgy helyettesíthető, hogy közben a rendszer teljesítménye nem szenved különösebb csorbát. Eközben a felszabadult tranzisztorbüdzsét és fogyasztási keretet hasznosabb dolgokra lehet elkölteni, akár nagyon egyszerűen, a többi egység órajelének emelésével.

Ezzel páthuzamosan az Imagination nyitva hagyta az ajtót partnerei számára, akik akár részleteiben, blokk vagy alacsony szinten is hozzányúlhatnak a mikroarchitektúrához, például funkcióspecifikus futószalagok hozzáadásával. Ezt elsősorban az Apple használhatja ki, a cég ugyanis előszeretettel szabja személyre a grafikus mikroarchitektúrát (is), azt hozzáigazítva saját operációs rendszeréhez és API-jához, a Metalhoz. Említésre méltó még a heterogén végrehajtás támogatása, a Furiant már a jövő OpenCL API-jának megfelelően tervezték, külön GPU dizájnokat készülnek majd koherens rendszerekhez.

Az Imagination egyelőre csak a mikroarchitektúrát jelentette be, komplett GPU dizájnok csak később érkeznek, a Series8XT-vel az élen. Az első Furian grafikus egységgel szerelt rendszerchipek jó esetben már jövő év második felében felbukkanhatnak, a széleskörű terjedésre viszont jelen állás szerint 2019 előtt nem lehet számítani.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról