Szerző: Asztalos Olivér

2021. augusztus 23. 13:09

Intel: így előzzük vissza az AMD-t a PC-piacon

Bemutatta az Alder Lake kódnevű, 12. generációs Core processzorokat az Intel. A chipgyártó szerint a termékek jelentős előrelépést hoznak majd, melynek hála sikerülhet visszaelőzni számítási teljesítményben és hatékonyságban az AMD-t. Minderre azonban még néhány hónapot biztosan várni kell, a termékeket ugyanis majd csak valamikor ősszel lehet először megvásárolni.

Az asztali és notebook piacra párhuzamosan érkező Alder Lake számos technikai újítást, illetve friss fejlesztést mutat be. Picit szigorúbban szemlélve a Hybrid Technology, vagyis a hibrid x86-os felépítés már nem számít újdonságnak, habár az ezt prezentáló Lakefield utólag inkább csak amolyan éles technológia bemutatónak tekinthető, a processzora építve ugyanis igencsak kevés termék került piacra.

Internetre kötött közművek: elsőre jó ötletnek tűnt (x)

Gyere el Ipar 4.0-val és annak IT-biztonsági aspektusaival foglalkozó foglalkozó meetupunkra.

Internetre kötött közművek: elsőre jó ötletnek tűnt (x) Gyere el Ipar 4.0-val és annak IT-biztonsági aspektusaival foglalkozó foglalkozó meetupunkra.

Így az Alder Lake lesz az első, valóban tömegesen elérhető hibrid x86-os processzor, mely az ARM big.LITTLE koncepciójának adaptálását takarja. A technológia lényege, hogy az ARM processzorok esetében hosszú évek óta sikerrel alkalmazott módon keverednek a teljesítményre kihegyezett "Golden Cove" Core, illetve a hatékonyságra fókuszáló "Gracemont" Atom magok. Ily módon áthidalható a mikroarchitektúra-skálázás problémája, amibe kivétel nélkül minden más processzorgyártó is belefutott: a sebességre kihegyezett, erős magok sokat is fogyasztanak, ami lefelé csak korlátozottan skálázódik (alacsonyabb órajelen is megmarad a fogyasztás egy része). A megoldás az, hogy az erős magok mellé gyengébb, ezzel együtt pedig alacsonyabb fogyasztású egységek kerülnek be, jelen esetben a vadiúj Atom magok formájában.

alder_summ

Az egyszerűség kedvéért az Intel a nagyobb és erősebb magokat P-Core (P: Performance), a kisebb és hatékonyabb egységeket pedig E-Core (E: Efficiency) jelzéssel kommunikálja. Előbbi, vagyis a P-Core alá sorakozik be a Golden Cove, amely a már hónapok óta piacon lévő Willow Cove (Tiger Lake) utódjának tekinthető. Az Intel szerint (házon belül) a Golden Cove az elmúlt tíz év legnagyobb mikroarchitektúrális ugrásának tekinthető. (Bár a kijelentés komoly előrelépést sejtet, érdemes észben tartani, hogy a chipgyártó hosszú évekig a 2015-ben bemutatott Skylake újrakiadásából élt.)

A Golden Cove mag

A mikroarchitektúra részleteit tekintve valóban nagy és alapvető módosításokat eszközöltek a tervezők. Az Intel nagyteljesíményű magjainak dekóderei az első generációs Core (Conroe és Penryn) processzorok, vagyis nagyjából 2006 óta 4 utasítás (4-wide) szélesek voltak. Mindez csak most, vagyis nagyjából 15 év után változik, a Golden Cove dekódere ugyanis immár 6 utasítás (6-wide) széles. Az Intel ezzel közelebb került az ARM-alapú megoldásokhoz, amelyek között már évek óta léteznek hasonló szélességű dekóderrel szerelt magok. Az ARM és az x86-os architektúrák között azonban egy alapvető különbség, hogy utóbbi utasításainak hossza változó, így lényegesen nehezebb kiaknázni a szélesebb dekódert.

golden_cove_frontend

Az Intel mérnökei ezért többek között a futószalag hosszát is megnövelték, amely ezzel már 17 fokozatú. Az emiatt fennálló esetleges többletfogyasztást nagyrészt a micro-op cache kapacitásának növeléséve próbálták kompenzálni a szakemberek. Ebben a tárban a lefordított utasítások micro-opjai vannak, így az esetek döntő többségében lekapcsolható a viszonylag magas disszipációval bíró dekóder. Nem csoda, hogy az Intel jelentősen, közel 80 százalékkal növelte a szóban forgó tár méretét, amely ezzel már 4K bejegyzést képes tárolni. A kiszélesítés miatti módosítások sora ezzel még nem ért véget. Bár az utasításokat tároló, L1I cache kapacitása maradt 32 kilobájt, az ahhoz tartozó L1 iTLB 128 helyett már 256 bejegyzést képes tárolni. Ugyancsak jelentősen nőtt az L2 BTB (branch target buffer) kapacitása, amely 5K helyett immár 12K bejegyzés tárolására alkalmas.

A dekóderhez igazodva a végrehajtás is szélesebb lett, így a Sunny Cove-val 5-re nőtt érték eggyel magasabbra, 6-ra ugrott a Golden Cove-val. Ugyancsak jelentősen nőtt a ROB (Re-Order Buffer) kapacitása, amely 352 helyett immár 512 bejegyzést képes tárolni. Ugyancsak gyarapodott 20 százalékkal a végrehajtóportok száma (10->12). Az L1 DTLB kapacitása 50 százalékkal, 64-ről 96 bejegyzésesre nőtt, amivel párhuzamosan az L1 előbetöltés hatékonysága is javult. Az L2 gyorsítótár kapacitása a kliensprocesszorokba szánt magok esetében 1,25 megabájt maradt, a szerverekbe szánt variánsnál azonban egészen 2 megabájtig növelhető a másodszintű cache kapacitása.

golden_cove_ipc

Az Intel saját belső mérései szerint a Golden Cove átlagosan 19 százalékos előrelépést jelent IPC-ben. A referenciát azonban a Cypress Cove, vagyis a Rocket Lake asztali processzorokban található mag jelenti, amely valamelyest elmarad a Tiger Lake CPU-k Willow Cove magjától. Ezzel együtt a Golden Cove, illetve az arra építő Alder Lake azonos órajel mellett nagyobb számítási teljesítményre lehet képest, mint a már piacon lévő AMD Zen 3.

A Gracemont mag

Az első piacképes hibrid processzorához a kisebbik, hatékonyságra kihegyezett E-Core formájában ugyancsak egy jelentős fejlesztéssel állt elő az Intel. A Gracemont kódnevű mag nagyjából a 2015-ben bemutatott Skylake számítási teljesítményére képes mintegy 40 százalékkal alacsonyabb disszipáció mellett. A Skylake-hez képest azonban számottevő eltérést, hogy a Gracemont magonként csak egyetlen szálon képes utasításokat végrehajtani. További jelentős eltérés, hogy az Atom márkanév alá besorakoztatott Gracemontot négymagos klaszterbe rendezte az Intel, amelyben egy megosztott 4 megabájtos L2 cache található.

gracemont

A vállalat szerint a négymagos klaszter 80 százalékkal magasabb teljesítményre képes mint négy Skylake végrehajtószál, vagyis két mag, miközben a disszipáció akár 80 százalékkal is alacsonyabb lehet. A hatékonyságot tekintve ez rendkívül komoly előrelépést jelent, habár ebben az összevetésben egy nagyobb gyártástechnológiai előrelépés is történt. Bár a felhasználás területét tekintve valószínűleg nem jelent majd érdemi hátrányt, a Gracemont mag nem támogatja az AVX-512 utasításkészletet. Az Intel ezért a Golden Cove magokban is letiltotta a lehetőséget, habár a fejlesztés rendelkezik az ehhez szükséges végrehajtóegységekkel.

Az Alder Lake

A teljesítményre kihegyezett P-Core, illetve a hatékonyabb üzemet segítő E-Core magokat célpiactól függően keveri az Intel. A (csúcskategóriás) asztali modelleknél 8-8 magot épít be a gyártó, amely összesen 24 végrehajtószálat jelent. A nagyobbik, 12-35 wattos mobil verzióba 6 nagy, illetve 8 kis mag kerül, a legkisebb, 9 wattos variáns pedig 2-8 arányban kínálja majd a Core-Atom konfigurációt. Az asztali Core i9 modelleknél az L3 cache mérete egészen 30 megabájtig skálázódhat.

3_conf

Az integrált GPU-t tekintve az asztali variánsok 32 darab, a mobilok pedig ennek háromszorosát, azaz 96 EU-t (Execution Unit) kínálnak majd. Ezek mellett alapértelmezetten helyet kap az Intel gépi tanulásos dedikált gyorsítója, a Gaussian Neural Accelerator (GNA 3.0). A notebookokba szánt variánsokba képfeldolgozót (IPU), valamint Thunderbolt 4 vezérlőt is integrált az Intel.

A magok, illetve azok újszerűnek számító konfigurációja mellett az úgynevezett uncore részben is több újdonságot rejt az Alder Lake. A processzor ugyanis elsőként támogatja a DDR5-ös memóriaszabványt, amit hivatalosan legfeljebb 4800 MHz-es modulokkal lehet majd kiaknázni kétcsatornás módban. Ennek ellenére a DDR4 támogatás is megmarad, így az alaplapok/konfigurációk gyártói dönthetnek majd arról, hogy milyen memóriával párosítható a processzor. Ezek mellett az LPDDR5(-5200), illetve LPDDR4X(-4266) szabványokat is támogatja az Alder Lake, amit notebookoknál fognak kiaknázni az OEM-ek.

A DDR5 támogatás mellett a PCIe 5.0-t is elsőként hozza el a piacra az Intel. Az asztali piacra szánt Alder Lake összesen tizenhat darab Gen5 sávot kínál majd négy darab Gen4 vonal mellett. Arról egyelőre nincs információ, hogy ezeken milyen módon lehet majd konfigurálni, mint ahogy PCIe 5.0-t támogató hardver sincs még a piacon.

intl_thread_dir

A technikai részleteken túl az Intel egyelőre sem konkrét modellekről, sem pedig a piaci megjelenés várható időpontjáról nem beszélt. A chipgyártó valószínűleg megvárja a Windows 11-et, amely az előzetes hírek szerint hatékonyabban kezeli majd az olyan többmagos heterogén processzorokat, mint amilyen az Alder Lake. Az eltérő magok közötti hatékonyabb váltáshoz a Thread Director Technologyval készül, mely a chipbe épített mikrokontrollerből, valamint egy API támogatásából áll. Ezekkel az operációs rendszer és a processzor képes lesz közösen felmérni, hogy a mindenkori munkafolyamathoz éppen a teljesítményre vagy a hatékonyságra kihegyezett mag-e az optimális végrehajtó.

A nyári leállás után, szeptember 29-30-án az Amazon felhőszolgáltatása és a microservicek témája köré épülő meetupokkal indul újra a HWSW free! meetup-sorozat.

a címlapról

Hirdetés

AWS és microservice meetupokkal kezdjük az őszt!

2021. szeptember 16. 23:28

A nyári leállás után, szeptember 29-30-án az Amazon felhőszolgáltatása és a microservicek témája köré épülő meetupokkal indul újra a HWSW free! meetup-sorozat.