Szerző: Gálffy Csaba

2013. április 30. 13:19

Bejelentette a hUMA architektúrát az AMD

Leomlott a CPU-t és GPU-t elválasztó legfontosabb fal, az egységes logikai memóriával és egységes címtérrel fontos előrelépést tett az AMD az integráció felé.

hUMA (heterogeneous uniform memory access) néven érkezik a következő generációs AMD processzorok memóriaarchitektúrája. A hosszú ideje várt megoldással végre elkezdődhet a CPU és GPU magasabb szintű integrációja és a két feldolgozó egység közötti utolsó nagy gát felszámolása.

Jelenleg a CPU és a GPU már egy szilíciumdarabkán kap helyet, közös memóriavezérlővel és gyorsítótárakkal. A rendszermemória logikai kezelése azonban továbbra is különálló, vagyis az egységes fizikai memória egyaránt rendelkezik a CPU-hoz tartozó, és GPU-hozt tartozó résszel, a feldolgozó egységek közvetlenül nem tudják elérni egymás memóriaterületét. Olyan esetekben, amikor ugyanazon az adatstruktúrán felváltva a CPU-nak és a GPU-nak is dolgoznia kellene, az adatot oda-vissza kell másolgatni a memóriaterületek között, ami komoly késleltetést jelent a feladatban és gyakorlatilag megsemmisíti a heterogén (CPU és GPU együttes munkáján alapuló) feldolgozás előnyeit.

A megoldás: hUMA

A problémát az egységes memóriacímzés oldja fel, amelyben a processzormagok és a GPU egységesen "látják" a közös memóriaterületeket és egységes pointereket használnak. Ez látványosan egyszerűsíti a programozást és gyorsítja a végrehajtást, a közös adatstruktúrákat nem kell folyamatosan mozgatni a területek között. Az egyszerűsödés révén feleslegessé válnak egyes címfordító egységek és a szinkronizáció, alacsonyabb lesz a külső buszok terhelése és a melléktevékenységek száma, ez pedig komoly fogyasztáscsökkenést is hozhat a magasabb teljesítmény mellett.

A konkrét technikai megvalósításról az AMD sokat nem árult el, a hUMA főbb jellemzői azonban jól mutatják a megközelítés előnyeit a fejlesztők számára. A kétirányú koherens memória azt jelenti, hogy az adatok módosítása azonnal láthatóvá válik az összes feldolgozóegység számra, legyen az processzormag vagy GPU. Másik nagy előny, hogy nem csak a fizikai, de a virtuális memóriára is kiterjed, vagyis támogatja a lapozást is. Ezzel a GPU is képes lesz transzparensen elérni a virtuális memóriát, az operációs rendszer memóriakezelője pedig rugalmasabban oszthatja ki a tárterületet. A hUMA harmadik fontos hozadéka, hogy a CPU és a GPU folyamatai dinamikusan foglalhatnak le memóriaterületet a teljes kapacitásból, ezzel egyrészt csökken a töredezettség, másrészt optimálisabb kihasználást jelent (nem fordulhat elő, hogy az egyik oldal kifut a rendelkezésre álló memóriából, miközben a másik oldalon még bővel lenne szabad terület).

A fejlesztőkön a sor

A hUMA elkészültével és a Kaveri piacra lépésével megnyílik az út az olyan alkalmazások között, amelyek végre tényleg képesek lesznek heterogén végrehajtásra - ezeket azonban valakinek előbb el is kell készítenie. A játékok és az erős vizuális komponenssel rendelkező üzleti alkalmazások (a Photoshoptól az AutoCAD-ig) profitálhatnak első körben az új archtektúrából, illetve a heterogén számítást igénylő HPC-feladatok kaphatnak jelentős sebességnövekedést.

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A hUMA legfontosabb piacának jelenleg a konzolok ígérkeznek, a PlayStation 4 biztosan, a következő Xbox pedig valószínűleg ilyen egyesített memóriaelérést biztosít az alkalmazások számára. Ez fontos győzelem az AMD-nek és szövetségeseinek, a konzolok farvizén ugyanis létrejönnek majd azok a fejlesztői eszközök, könyvtárak, amelyek minimális módosítással (vagy épp módosítás nélkül) használhatóak lesznek PC-s környezetben is.

Amennyiben ez a forgatókönyv megvalósul, az fontos versenyelőnyt jelenthet az AMD számára az Intellel szemben, az architektúrák sikere ugyanis az azt támogató alkalmazásokon múlik. Az Intel pedig számtalan sikere ellenére néhány nagyon kellemetlen pofonba is beleszaladt a fejlesztői támogatás terén. Kiváló példa erre a Quick Sync, amely fantasztikusan gyors (konzumer szintű) videokódolást biztosít a Core-sorozatú processzorokra integrált fix funkciós áramkörök által. Szoftveres támogatás hiányában azonban a megcélzott amatőr és félprofi videósok számára jobbára elérhetetlen a képesség.

Az Intel is fejleszt

Az AMD jelenleg vezeti a CPU-GPU integrációért folytatott versenyfutást, de az Intel sincs messze lemaradva. A gyártó bejelentette az InstantAccess névre keresztelt új grafikus kiterjesztést, amely az AMD Llanóban bevezetett Zero Copy saját implementációjának felel meg. Az InstantAccess a hUMA-nál alacsonyabb szintű, egyszerűbb megoldás, a CPU-nak biztosít ideiglenes (és erre az időre kizárólagos) hozzáférést a GPU memóriájának egyes részeihez, fordítva azonban ez nem működik.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról