Szerző: Gálffy Csaba

2013. március 07. 13:51:00

GDDR5 és egyesített memóriaarchitektúra a Kaveriben

Újabb, ezúttal nagy lépést tesz a heterogén processzorok felé az AMD, a Kaveri lapkacsalád ugyanis egyesíti a GPU és a CPU memória-alrendszereit és egységes elérést kínál az adatokhoz. A memóriavezérlő támogatja majd a GDDR5 szabványt is, ami óriási sávszélesség-növekedést jelent.

Folyamatosan érkeznek friss információk az AMD következő generációs processzorarchitektúrájáról, a Trinityt váltó Kaveriről. Az új lapka 10-15 százalékos teljesítménynövekedést hoz a korábbi ígéretek szerint, ezt a szűk keresztmetszetek szisztematikus felszámolásával és az új memória-alrendszer bevezetésével éri el a gyártó.

Táguló szűk keresztmetszetek

Az AMD mára meglehetősen jól ismeri a Bulldozer architektúra előnyeit és hátrányait. Az első javításban, a Piledriver magokkal a gyártó még elsősorban az időhiány miatt kimaradt funkciókat pótolta (hard-edge órajelek) és csak a már korábban betervezett javításokat eszközölte. Ezzel szemben a Steamroller tervezésénél már a Bulldozer összes tanulságra a gyártó rendelkezésére állt, így pontosan láthatóvá vált, hogy hol érdemes a designt módosítani.

Az AMD által nyilvánosságra hozott változások két oldalról célozzák a gyorsulást, egyrészt hatékonyabbá válik a magokat adatokkal és utasításokkal ellátó front-end, másrészt maguk a magok is nagyobb teljesítményt kapnak, köszönhetően a szűk keresztmetszetek kibővítésének.A változások sora hosszú, számos puffer mérete nőtt meg (azonos késleltetés mellett), megjelent az XSAVEOPT utasítás támogatása és sokat gyorsult a SYSCALL/SYSRET végrehajtása.

Fontos változás, hogy immár a CPU-modulok mindkét integer magja saját dekódoló logikát kapott, vagyis ezután ebben nem kell osztozniuk. Ez maximális terhelésen érezhető gyorsulást hozhat, ahogy a végrehajtó egységek nem várnak erre a lépcsőre. A lebegőpontos egységet alaposan átdolgozta az AMD, a négyfokozatú futószalag háromfokozatúvá vált, ami az órajelenként végrehajtott utasításokat dobja majd meg.

A fejlesztők a Steamroller új eszköztárának örülhetnek, a gyártó hardveresen integrált néhány teljesítményfigyelő elemet, amellyel az alkalmazás futása a lapka szintjén figyelhető meg. Ezek nem növelik a nyers számítási teljesítményét, de használatukkal gyorsabb és hatékonyabb lehet a programkód optimalizálása, végeredményben tehát az alkalmazás teljesítménye emelkedik.

Koherens memóriakezelés

A Kaveri nagy ígérete, hogy végre felszámolja a CPU és a GPU teljes különválasztását és egyetlen közös memóriarendszerre fűzi fel ezeket, egyenrangú felekként. Ennél is nagyobb lépés, hogy a két részegység egységes címteret használ, egységes pointerekkel, ami látványos sebességnövekedést hozhat sok esetben. Az elválasztott, particionált memória esetében ugyanis az adatokat folyamatosan másolgatni kell a két terület között, ami sok számítási feladatnál el is tüntetni a GPU-n történő feldolgozás előnyeit.

A kiszivárgott információk szerint a Kaveri négycsatornás (4 x 32 bit) memóriavezérlőt alkalmaz, rendszermemóriaként pedig GDDR5 chipeket is képes használni a normál DDR3 mellett, ez utóbbiakat 2 x 64 bites konfigurációban. A GDDR5 nagy előnye, hogy jóval magasabb effektív órajelet képes elérni, ami alacsonyabb késleltetést és jóval magasabb átviteli sebességeket jelent. Ez egyrészt az adatra éhező CPU számára jelentene nagy lökést, de a sokszor szintén memóriakorlátos grafikus teljesítmény is nagyot ugorhat az új szabványú memóriák használatával. A kiszivárgó specifikációk szerint az új lapka támogatja majd a 3200 illetve 3400 MHz (effektív) órajelű GDDR5 és 2400 illetve 2500 MHz (effektív) órajelű DDR3-at, ami a Trinity DDR3-2133-as sebességéhez képest is jelentős növekedést jelent.

Python és Appmenedzsment rendezvényekkel indítjuk a szezont (x) Február 26-27-én indul a HWSW free! ingyenes meetupsorozat, márciusban pedig 30 órás online képzéseket indítunk!

A GDDR5 használata érdekes kérdést vet fel, a jelenleg elérhető megmagasabb kapacitású lapkák 4 gigabitesek (512 megabájt), két lapkával számolva a négy csatornára ez 4 gigabájt rendszer+grafikus memóriát jelent, ami nem számít ma már túl soknak. Az alacsony kapacitású lapkák már korábban is okoztak problémát, iparági források szerint az NVIDIA K20 az eredetileg tervezett 12 gigabájt helyett azért kapott csak 6 gigabájtot, mert fizikailag képtelenség volt elhelyezni a lapkákat.

A Kaveri érdekes új funkciója, hogy képes PCI Express endpoint módra, vagyis elképzelhető, hogy a lapka külön bővítőkártyaként is képes lesz funkcionálni. A másik lehetőség, hogy a funkció a SeaMicro Freedom Fabric nevű interconnect-rendszere miatt vált szükségessé, a processzorokat hálózatba szervező protokoll ugyanis PCI Express-alapú, ebbe így elméletben a Kaveri is beilleszthető lehet.

a címlapról