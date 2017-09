Leleplezte legújabb csúcs alkalmazásprocesszorát a Huawei szárnyai alá tartozó chiptervezőcég, a HiSilicon. A Kirin 970 névre keresztel modell a CPU magok helyett a GPU-ra, illetve a mesterséges intelligenciával kapcsolatos műveletek gyorsítására fókuszál. Utóbbihoz az új alkalmazásprocesszor a piacon elsőként egy dedikált egységet mutatott be, amely a CPU-hoz és a GPU-hoz viszonyítva lényegesen nagyobb tempóval és hatékonysággal hajtja végre a számításokat. Utóbbiból elsőként a Mate 10 okostelefonok profitálhatnak, amelyek a Huawei ígérete szerint bő egy hónap múlva piacra kerülnek.

A CPU magokat tekintve szinte semmilyen változást nem láthatunk az előd Kirin 960-hoz képest, marad a két klaszterbe rendezett négy-négy Cortex-A73 és Cortex-A53. Ennek vélhetően az az oka, hogy az újabb dizájnokat jelentő A75 és A55 csak mostanában kerül végleges, implementálható formába, a Kirin 970 terveit pedig vélhetően már az év elején fixálta a HiSilicon. Jobb híján tehát csak minimális finomhangolást végzett a Huawei, az A73-as klaszter magjainak órajelét 40 MHz-zel 2,4 GHz-re emelte, a veterán A53-as magokét pedig ugyanennyivel 1,8 GHz-re mérsékelte.

A GPU háza táján már komolyabb módosítások történtek. A beszállító ARM személye nem változott, viszont a mikroarchitektúrát lecserélte a Huawei, így a Kirin 970-ben már a legújabb, Mali-G72 névre keresztelt fejlesztés dohog. Az ARM korábbi ígérete szerint 25 százalékkal hatékonyabb az előd Kirin 960-ban is helyett kapott Mali-G71-nél, amely előnyt a 970 esetében igyekeztek kikanázni a tervezők. Az új Kirin grafikus egységébe így 50 százalékkal több végrehajtó került, ám az egységek órajelét egyelőre homály fedi, vélhetően az elődbe került Mali-G71MP8 1037 MHz-es csúcsértékét nem éri el a 970-ben dolgozó Mali-G72MP12. Ennek megfelelően az elődnél tapasztalt drasztikus, helyenként akár 180 százalékos ugrásra most nem érdemes számítani, a Huawei 20 százalék körüli előrelépésről beszél, miközben hatékonyságban 50 százalékos a javulásról szól a fáma.

forrás: AnandTech

A Kirin 970 nagy dobása mégsem utóbbi, hanem az NPU (Neural Processing Unit) névre keresztelt egység, amelyet kifejezetten a mesterséges intelligenciával kapcsolatos műveletek gyorsításához tervezett a HiSilicon. Az NPU mikroarchitektúrájáról nem árult el mélyebb részleteket a cég, így csak az alapvető adatok ismertek, mint például a számítási teljesítmény. A tervezőcég szerint FP16-os, azaz félpontosságú lebegőpontos műveleteknél 1,92 TFLOPs tempóra képes, ami körülbelül háromszor nagyobb, mint amit az előd GPU-ja tett le az asztalra.

A Huawei szerint NPU-val körülbelül 2000 kép elemzését végzi el a processzor egy perc leforgása alatt, miközben kizárólag CPU-val ez a szám csak 100 körül mozog, önmagában a GPU pedig csak nagyjából 400 fotót képes feldolgozni. A cég a közvetlen konkurensek fejlesztéseivel is összevetette a Kirin 970 ezen képességét, amely szerint az iPhone 7-ben található processzor csak 487 képpel végzett, a Samsung S8-a pedig 95-tel. Okostelefonos alkalmazásprocesszorról lévén szó a hatékonyság is kiemelt jelentőségű, a tervezőcég szerint a CPU magok teljesítmény/fogyasztás mutatójánál ötvenszer jobb eredményt kínál az NPU. Ezzel kapcsolatban egy konkrét adatot is közölt a Huawei, 1000 kép feldolgozása egy 4000 mAh-s akkumulátor kapacitásának mindössze 0,19 százalékát emésztette fel.

forrás: AnandTech

Fontos kérdés, hogy az NPU-ban szunnyadó számítási kapacitást hogyan lehet kiaknázni, hisz megfelelő szoftveres támogatás nélkül az áramkör jóformán semmit sem ér. A Huawei erre is gondolt, a cég ígérete szerint a Kirin 970 gyorsítóját a nyíltság jegyében alkották meg, így a Google Tensorflow és Tensorflow Lite, valamint Caffe/Caffe2 nyílt forrású könyvtárak is támogatottak. Ezek mellé társul a házon belül készült Kirin AI API és a várhatóan szélesebb támogatást elnyerő Android NN is.

A Huawei szerint az NPU képességét az egyelőre legnépszerűbbnek számító képelemzés mellett számos egyéb területen is lehet majd kamatoztatni, amelyre példa a feladatütemezés, terheléselosztás, memóriakiosztás, gépi látás, nyelvi fordítás. Mindezt persze a felhasználó kezében lapuló készülékbe integrált speciális egység nélkül is meg lehetne valósítani, hisz a műveletek felhőben is végrehajthatóak, azonban ehhez internetkapcsolat szükséges, amely a késleltetés mellett a telefon fogyasztását is növeli. Nem utolsó sorban pedig így a készülék vagy az alkalmazás készítőjét terheli a végrehajtás, pontosabban a infrastrukturális háttér üzemeltetésének költsége. Ebből a megfontolásból várhatóan egyre több okostelefonos processzorba költözik majd be egy NPU-hoz hasonló egység, pletykák szerint a néhány héten belül debütáló új iPhone is ilyen dedikált áramkörrel érkezik.

forrás: AnandTech

Az NPU mellett az immár 10 nanométeres gyártástechnológián készülő processzor természetesen képjel-feldolgozót is tartalmaz, napjaink okostelefonos elvárásainak megfelelően két darabot. Ehhez kapcsolódóan került a processzormagok mellé egy 512 bites SIMD utasításkészletet alkalmazó, képfeldolgozóként funkcionáló DSP, amit egy legfeljebb 32bit/384k minőségű hangfolyam feldolgozására képes HiFi blokk egészít ki. Végül, de nem utolsó sorban a rádiós modem képességein is fejlesztett a Huawei, a 4.5G képesnek kikiáltott egység Cat. 18 LTE kompatibilis, ami a 4x4 MIMO támogatással karöltve legfeljebb 1200 Mbps-os letöltési sebességre lehet képes.