Szerző: Asztalos Olivér

2017. december 20. 13:30

Csendben futott be az Intel "Knights Mill" Xeon Phi gyorsítója

A kizárólag önálló processzor formájában, három modellel piacra kerülő terméket elsősorban gépi tanuláshoz szánja az Intel.

Különösebb hírverés nélkül dobta piacra következő, Knights Mill kódnevű Xeon Phi gyorsítóját az Intel. A processzor alapjai egyeznek a Knights Landingnál megismerttel, a gyártó gyakorlatilag tavaly piacra dobott fejlesztését szabta át néhány ponton. Ennek köszönhetően a Knights Mill képes lényegesen gyorsabban végrehajtani a gépi tanulás gyorsításához (is) alkalmazható műveleteket. Mindezért cserébe nagyjából 16-30 százalékkal ugrott meg a termékek fogyasztása, amely ugyanakkor bőven elfogadható kompromisszumot jelent a végrehajtási tempó növekedésének fényében.

knights-mill_base

Az alapokat tehát a Knights Landingtól kölcsönzi az új Xeon Phi, így maradt a 36 darab csempébe (tile) csoportosított 72 darab, Silvermont mikroarchitektúrára épülő processzormag. A csempék a két magon felül két VPU-t (Vector Processing Unit) is tartalmaznak, melyek az AVX-512 utasításkészlet támogatásáért is felelnek, amelyek mellé még 1 megabájt L2 cache is került, amely a komplett processzorra levetítve 36 gyorsítótárat jelent. Az egyes csempék háló topológiába (mesh) rendezve kommunikálnak egymással. A lapka 14 nanométeres FinFET gyártástechnológiával készül.

Ugyancsak jelen van a Micron által fejlesztett, korábban csak HMC (Hybrid Memory Cube) néven emlegetett, majd az Intel által MCDRAM-ra (Multi-Channel DRAM) keresztelt, integrált memória. A tokozásra, közvetlenül a processzor lapkája mellé telepített, összesen nyolc darab lapka 400 GB/s-nál is nagyobb sávszélességet képes biztosítani a magoknak, amihez kezdésnek 16 GB-os kapacitás társul. Mindezt még két különálló, egyenként 3-3 csatornás memóriavezérlő fejeli meg, amely legfeljebb DDR4-2400 szabványú modulokat támogatására képes, összesen maximum 386 GB kapacitás erejéig.

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Az MCDRAM három működési módba állítható: Lehetőség van harmadszintű, L3 gyorsítótárként használni mind a 16 GB-ot, azonban így minden esetben a processzor dönt arról, hogy mi kerül a tárba. Az úgynevezett Flat Mode esetében az MCDRAM által nyújtott kapacitás a DDR4-es rendszermemóriával együtt, közvetlenül címezhető, amivel egy igen nagy sávszélességű és alacsony késleltetésű, de limitált méretű területhez kaphatnak hozzáférést a fejlesztők. Végül, de nem utolsó sorban a két módot lehet ötvözni is, például két 8 gigabájtos részre osztva a tárat.

knights-mill_eu

Az első változást a VPU (Vector Processing Unit) környékén kell keresnünk, amely három új utasítással gyarapodott. Ebből egyik az AVX512_4FMAPS (vagy Quad FMA), amely a 32 bites, tehát egyszeres pontosságú lebegőpontos végrehajtás gyorsításáért felel, ezzel 12 ciklus alatt, egyetlen utasításban négy FMA műveletet lehet kiszámoltatni. Az AVX512_4VNNIW (VNNI: Vector Neural Network Instructions) a 16 bites, azaz félpontosságú műveleteket képes gyorsabban lezongorázni. Ennek hála a Knights Mill 256 OPS-szal képes FP16-os műveleteket végrehajtani.

avx512forrás: InstLatX64

Ezzel két részre bontva 32 bites, azaz egyszeres pontosságú műveletet is végre lehet hajtani 128 FLOPS-os sebességgel, amihez képest a Knights Landing az egyszeres pontosságú és félpontos műveleteket egyaránt az érték felével, 64 FLOPS-os tempóval számolta ki. A Knights Mill gyenge pontját a 64 bites, azaz a duplapontosság jelenti, amelynek végrehajtási sebessége a Knights Landinghez viszonyítva felére, 16 FLOPS-ra esett vissza.

A rendszer kellően hatékony működéséhez még egy fontos változtatást eszközölt az Intel. A végrehajtás immár double-pumped alapon működik, amivel a terhelés nagyobb része a front-endről a végrehajtóegységekre kerülhet át, ezért cserébe viszont nő a fogyasztás. Mindez a processzorok TDP értékén is jól látszik, a Knights Landing esetében még 215 wattos mutató 250 wattra hízott, a 245 wattos érték pedig 320 wattra ugrott fel. Előbbit a 7235 és 7285 számozású, 64 és 68 magos modellek kapták, a csúcsot jelentő 72 magos 7295-re pedig utóbbit szabta meg az Intel. Az LGA-3647 tokozású processzorokat már szállítja partnereinek a gyártó, amely egyelőre nem hozta nyilvánosságra legújabb gyorsítóinak árazását.

a címlapról