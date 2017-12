Különösebb hírverés nélkül dobta piacra következő, Knights Mill kódnevű Xeon Phi gyorsítóját az Intel. A processzor alapjai egyeznek a Knights Landingnál megismerttel, a gyártó gyakorlatilag tavaly piacra dobott fejlesztését szabta át néhány ponton. Ennek köszönhetően a Knights Mill képes lényegesen gyorsabban végrehajtani a gépi tanulás gyorsításához (is) alkalmazható műveleteket. Mindezért cserébe nagyjából 16-30 százalékkal ugrott meg a termékek fogyasztása, amely ugyanakkor bőven elfogadható kompromisszumot jelent a végrehajtási tempó növekedésének fényében.

Az alapokat tehát a Knights Landingtól kölcsönzi az új Xeon Phi, így maradt a 36 darab csempébe (tile) rendezett 72 darab, Silvermont mikroarchitektúrára épülő processzormag. A csempék a két magon felül két VPU-t (Vector Processing Unit) is tartalmaznak, melyek az AVX-512 utasításkészlet támogatásáért is felelnek, amelyek mellé még 1 megabájt L2 cache is került, amely a komplett processzorra levetítve 36 gyorsítótárat jelent. Az egyes csempék háló topológiát (mesh) alkalmazva kommunikálnak egymással. A lapka 14 nanométeres FinFET gyártástechnológiával készül.

Ugyancsak jelen van a Micron által fejlesztett, korábban csak HMC (Hybrid Memory Cube) néven emlegetett, majd az Intel által MCDRAM-ra (Multi-Channel DRAM) keresztelt, integrált memória. A tokozásra, közvetlenül a processzor lapkája mellé telepített, összesen nyolc darab lapka 400 GB/s-nál is nagyobb sávszélességet képes biztosítani a magoknak, amihez kezdésnek 16 GB-os kapacitás társul. Mindezt még két különálló, egyenként 3-3 csatornás memóriavezérlő fejeli meg, amely legfeljebb DDR4-2400 szabványú modulokat támogatására képes, összesen maximum 386 GB kapacitás erejéig.

Az MCDRAM három működési módba állítható: Lehetőség van harmadszintű, L3 gyorsítótárként használni mind a 16 GB-ot, azonban így minden esetben a processzor dönt arról, hogy mi kerül a tárba. Az úgynevezett Flat Mode esetében az MCDRAM által nyújtott kapacitás a DDR4-es rendszermemóriával együtt, közvetlenül címezhető, amivel egy igen nagy sávszélességű és alacsony késleltetésű, de limitált méretű területhez kaphatnak hozzáférést a fejlesztők. Végül, de nem utolsó sorban a két módot lehet ötvözni is, például két 8 gigabájtos részre osztva a tárat.

Az első változást a VPU (Vector Processing Unit) környékén kell keresnünk, amely három új utasítással gyarapodott. Ebből egyik az AVX512_4FMAPS (vagy Quad FMA), amely a 32 bites, tehát egyszeres pontosságú lebegőpontos végrehajtás gyorsításáért felel, ezzel 12 ciklus alatt, egyetlen utasításban négy FMA műveletet lehet kiszámoltatni. Az AVX512_4VNNIW (VNNI: Vector Neural Network Instructions) a 16 bites, azaz félpontosságú műveleteket képes gyorsabban lezongorázni. Ennek hála a Knights Mill 256 OPS-szal képes FP16-os műveleteket végrehajtani.

forrás: InstLatX64

Ezzel két részre bontva 32 bites, azaz egyszeres pontosságú műveletet is végre lehet hajtani 128 FLOPS-os sebességgel, amihez képest a Knights Landing az egyszeres pontosságú és félpontos műveleteket egyaránt az érték felével, 64 FLOPS-os tempóval számolta ki. A Knights Mill gyenge pontját a 64 bites, azaz a duplapontosság jelenti, amelynek végrehajtási sebessége a Knights Landinghez viszonyítva felére, 16 FLOPS-ra esett vissza.

A rendszer kellően hatékony működéséhez még egy fontos változtatást eszközölt az Intel. A végrehajtás immár double-pumped alapon működik, amivel a terhelés nagyobb része a front-endről a végrehajtóegységekre kerülhet át, ezért cserébe viszont nő a fogyasztás. Mindez a processzorok TDP értékén is jól látszik, a Knights Landing esetében még 215 wattos mutató 250 wattra hízott, a 245 wattos érték pedig 320 wattra ugrott fel. Előbbit a 7235 és 7285 számozású, 64 és 68 magos modellek kapták, a csúcsot jelentő 72 magos 7295-re pedig utóbbit szabta meg az Intel. Az LGA-3647 tokozású processzorokat már szállítja partnereinek a gyártó, amely egyelőre nem hozta nyilvánosságra legújabb gyorsítóinak árazását.