Szerző: Asztalos Olivér

2020. október 8. 22:25

Az AMD tovább növelheti Intellel szembeni előnyét

Új asztali processzorszériával mutatta be Zen 3-as fejlesztését az AMD. A chiptervező prezentációja szerint az új termékek IPC-ben (egy órajelciklus alatt elvégzett műveletek), illetve turbóban is előrelépnek az előző generációhoz képest, melyekkel egyértelműbbé válik a konkurens Intel Core CPU-khoz mért előny. A számítási teljesítménnyel szemben a disszipáció nem változik, így a hatékonyság is tovább javul. A fejlődésnek megkéri az árát az AMD, a Zen 2-es processzorokhoz mérten ugyanis felfelé mozdultak az árcédulák: modelltől függően 7-20 százalékkal drágább a Zen 3.

A nyúlfarknyi bemutatón csupán a legfontosabb részleteket közölte a tervezőcég, amely elsősorban továbbra is a játékosokat tekinti asztali Ryzenek első számú célközönségének. Mark Papermaster, a vállalat műszaki igazgatója szerint a 2017 elején bemutatott termékvonalban a Zen 3 nyújtja az eddigi legnagyobb előrelépést. A tervezőcsapat több ponton is hozzányúlt a mikroarchitektúrához, így többek között a processzormagokat tartalmazó lapka (CCD) alapfelépítése is megváltozott.

paperm_cache

A Zen első iterációjával bemutatott CCX konfiguráció négy darab magból és ugyanennyi L3-szeletből állt, mely utóbbiak mérete 0,5-től 2 megabájtig skálázódott. A grafikus egységeket nem tartalmazó lapkadizájnokba kivétel nélkül két CCX-et tervezett az AMD, melyek belső adatcseréjét egy koherens adatbusz biztosította. A kapcsolat nem volt közvetlen, az egy-egy CCX a Data Fabrichoz kapcsolódott, amely bizonyos esetekben szűk keresztmetszetnek bizonyult. Az AMD tervezői a Zen 3-nál változtatnak a rendszeren, az összesen 8 magot immár egyetlen összefüggő L3 gyorsítótáron keresztül kapcsolják össze, amivel a lapkán belüli harmadszintű cache gyakorlatilag egybeolvadt. Ezzel egyetlen CCD kétszer 16 helyett 32 megabájt tárat tartalmaz, gyorsítva a lapkán belüli magok adatkommunikációját. A változtatás további előnye, hogy egyetlen mag már akár 32 megabájt harmadszintű tárral is gazdálkodhat, ami növelheti az egyszálas végrehajtás sebességét.

A senior horizonton túl: a staff meg a többiek

Senior tapasztalati szint fölött van még pár egzotikus lépcsőfok, illetve a mögöttük rejtőző elvárások.

A senior horizonton túl: a staff meg a többiek Senior tapasztalati szint fölött van még pár egzotikus lépcsőfok, illetve a mögöttük rejtőző elvárások.

A további, mélyebb változtatásokat egyelőre csak félmondatokban sorolta fel az AMD. Ezek alapján javult az előbetöltés hatékonysága, valamint ugyancsak fejlődött a load/store műveletvégrehajtás, bármi is álljon ennek hátterében. A "Zero Bubble" elágazásbecslés minden bizonnyal az eddigieknél pontosabb mechanizmust, azaz kevesebb tévesztést jelent. A micro-op cache is fejlődött, arról viszont egyelőre csak találgatni lehet, hogy a kapacitás gyarapodott, vagy más fejlesztés történt. A kisebb tárba a lefordított utasítások micro-opjai kerülnek, amelynek pozitív következményei nyilvánvalóak: találat esetén nincs szükség az utasítás cache olvasására, sem pedig dekódolására, így az utasításoknak kevesebb futószalag-lépcsőn kell áthaladniuk, továbbá a téves elágazásbecslés büntetése is kisebb.

paperm_uarch

Végül, de nem utolsó sorban valamelyest a végrehajtás is kiszélesedett, mely egyaránt jelenthet az eddigi 4 helyett 5 utasítás dekódolására képes front endet, illetve extra integer és lebegőpontos végrehajtó portokat. Konkrétumokra még ezzel kapcsolatban is várni kell. A bemutatott, egyszerű ábra alapján a load/store, a front end, illetve a végrehajtók környékén eszközölt fejlesztések hozzák a legtöbbet a konyhára. A tervezőcég saját, 25 különböző munkafolyamatot tartalmazó tesztcsomagja átlagosan 19 százalékos IPC növekedést mutatott, ami majd másfélszerese a Zen+ és a Zen 2 között mért előrelépésnek, de még az éveleji optimistának tűnt pletykákat is felülmúlja. (Összevetés gyanánt: az Intel Skylake-éhez képest a Sunny Cove, vagyis az Ice Lake 18 százalékot lépett előre, nagyjából 4 év alatt.)

Ryzen 5000

Az asztali piacon Ryzen 5000 márkanév alatt jelenik meg a Zen 3, pontosabban az azt elsőként alkalmazó Vermeer. A két lépcsőnyi ugrás oka remélhetőleg az átláthatóságot szolgálja, a GPU-val megtámogatott Ryzenek utóbbi két kiadását ugyanis rendre egy ezressel feljebb pozicionálta a cég, bármiféle műszaki alap nélkül. Így fordulhatott elő, hogy a grafikus egységgel rendelkező 3000-es processzorokban Zen+, a 4000-esekbe pedig Zen 2 magok kerültek. A következő, Zen 3-as magokkal szerelt Cézanne vélhetően az 5000-es szériát gyarapítja majd, amennyiben a cég marketingesei nem kapnak ismét vérszemet.

paperm_rmap

Ezt azonban megelőzi a Vermeer, mely IO architektúra szempontjából a közvetlen előd Matisse felépítését viszi tovább. Mindez elsősorban a többlapkás (multi-chip) felépítésre utal, ahol a központi szerepet egy önálló IO lapka (~északi híd) nyújtja. Ebbe továbbra is a csíkszélesség szempontjából nem kritikus egységek kerültek, így a chip tartalmazza a kétcsatornás memóriavezérlőt, az összesen 24 darab Gen4 PCI Express sávot, illetve a különféle további kontrollereket, például a SATA-t és az USB-t. Arról egyelőre nincs információ, hogy a Matisse-nál megismert dizájn hasznosítja-e újra, vagy egy friss lapkát tervezett az AMD. (A viszonylag magas költségeket tekintve előbbire mutatkozik nagyobb esély.)

A CCD lapkában (modelltől függően lapkákban) a nyolc darab Zen 3-as processzormag, a 32 megabájt L3 gyorsítótár, illetve az akár 100 GB/s-os kétirányú adatkapcsolatot biztosító Infinity Fabric kontroller került. Ennek területét egyelőre homály fedi, mint ahogy arról sincs sziklaszilárd információ, hogy a TSMC mely gyártástechnológiáját veszi igénybe a magok előállításához az AMD. A friss diákon "sima" 7 nanométer szerepel, miközben még tavaly is 7nm+ volt feltüntetve a hivatalos útiterveken. Ez elvileg a CLN7FF+ kódnevű technológiát jelentette volna, amely papíron 20 százalékkal magasabb tranzisztorsűrűséget, illetve 6-12 százalékkal alacsonyabb disszipációt ígért az EUV levilágítási eljárásnak hála. Elsősorban gazdasági szempontból érdekes kérdés, változott-e, ha pedig igen, milyen mértékben a költségesen gyártatható CCD lapka területe, azonban ennek megválaszolásához vélhetően meg kell várni a november 5-i megjelenést.

su_models

A rajtig összesen négy modellt kezd el szállítani disztribútorainak az AMD. A Zen 3 magoktól eltekintve a specifikációkban nincs sok változás, az órajelek mellett leginkább az árcédulákhoz nyúlt a cég. E szerint újfent hat, nyolc, tizenkét, illetve tizenhat darab magot kínáló termékek érkeznek, rendre 5600X, 5800X, 5900X, illetve 5950X típusszámmal. Érdekesség, hogy az újdonságok alapórajele enyhén csökkent, melynek hátterében egyrészt a számottevően megnőtt IPC, másrészt a változatlan gyártástechnológia állhat. Ezzel a 3600X közvetlen utódjaként érkező 5600X 3,8 helyett 3,7, a 3800X-et leváltó 5800X 3,9 helyett 3,8, a 3900X helyét átvevő 5900X pedig 3,8 helyett 3,7 GHz-es. A garantált órajelminimummal szemben a turbó, vagyis a maximális érték nőtt, a négy modellnél egységesen 200 MHz-cel. Frekvenciát tekintve még így sem sikerült beérni az Intelt, összkép szempontjából viszont ez továbbra is csak egyetlen paraméter a sok közül.

Az AMD belső mérései szerint ugyanis a magasabb IPC könnyedén kompenzálja az Intel-féle gigászi turbót: 3D renderben (Cinebench), egyetlen szálon 16 százalék a Ryzen 9 5900X előnye a Core i9-10900K-hoz képest. Játékokban, Full HD felbontás mellett szerény, néhány kivételtől eltekintve 5 százalék körüli az előny, amely csak a kevésbé GPU limites címeknél (pl. League of Legends) nő 20 százalék körüli szintre. A mérésekhez egyébként GeForce RTX 2080 Ti videokártyát használt az AMD, amely nem tudni, hogy a konkurálás vagy inkább a készlethiány áldozatává vált-e, RTX 3090-nel ugyanis nagyobb eltérések születhettek volna az új Ryzenek javára.

hallock_games

A házon belüli összevetés komolyabb javulásról árulkodik. A Ryzen 9 3900XT és 5900XT viszonylatban 5-től egészen 50 százalékig mért gyorsulást az AMD, természetesen továbbra is Full HD felbontásban, kevésbé GPU-limitált címekkel a sor elején. A Ryzen 9 3950X és 5950X között játékoknál 13-29 százalékot, tartalomgyártásban pedig 5-27 százalékot mért a cég. Utóbbi nem csak az otthoni munkaállomással dolgozók számára, de az AMD-nek is rossz hír lehet, hisz ennyiért cserébe kérdéses, hányan fizetik majd ki a fejlesztés (legalább) nettó 800 dolláros díját, vagyis a Ryzen 9 5950X árát. Hiába ugyanis a változatlan AM4 tokozásnak köszönhető fizikai kompatibilitás, egyelőre nem világos, hogy pontosan mely korábbi 400-as (esetleg 300-as) alaplapok kapják meg a támogatáshoz szükséges BIOS-t. Az AMD szerint ráadásul jövő év januárjánál korábban nem lehet számítani a frissítésekre, a tükörsima összeállításhoz tehát 500-as chipkészlettel szerelt alaplap szükséges, amely további kiadást jelenthet.

5950x

Nem csoda, hogy a tizenhatmagos 5950X árcédulájával volt a legóvatosabb az AMD, a már említett 800 dolláros összeg ugyanis szűk 7 százalékkal múlja felül az előd 3950X árát. A további modellek utódjai nagyobb mértékben drágultak, ami az 5900X esetében 10, az 5800X-nél, közel 13, az 5600X-nél pedig 20 százalékos emelést jelent, vagyis a magasabb teljesítményt határozott felárért adja a tervezőcég. Mindez az Intel hátrányának köszönhető. Az új termékeknek hála tovább nő az AMD mozgástere, mely a szerénykedést félretéve egyszerűen csak a leggyorsabb gamer processzoroknak titulálja asztali Ryzen 5000 sorozatának tagjait. Mindeközben az Intel közölte, hogy az ellenfélnek szánt (14 nanométeres) Rocket Lake csak valamikor 2021 első negyedévében érkezik, így AMD-s ármérséklésre még jó darabig biztosan nem érdemes számítani.

Milyen technológiai és munkaerőpiaci hatások érhetik a backendes szakmát? Május 8-án végre elindul az idei kraftie! meetup-sorozat is (helyszíni vagy online részvétellel).

a címlapról