Szerző: Asztalos Olivér

2019. szeptember 24. 09:19

A gépi tanulásos gyorsítókártyák piacával is bepróbálkozik a Huawei

Új piacok után ered a Huawei, amely gépi tanulásra kifejlesztett klaszterét követően a diszkrét gyorsítókártyák és a vállalati alaplapok piacát is célba veszi.

A kínai cég két darab, PCI Express bővítőkártya formátumú terméket mutatott be múlt heti rendezvényén. A gyorsítókártyák egyik érdekessége, hogy azok házon belül fejlesztett chipekre építenek, melyek a Huawei szerint bőven felveszik a versenyt a piacvezető szereplők megoldásaival. E mellett a cég az vállalati alaplapok piacán is szerencsét próbál a Kunpeng termékeivel, melyekkel első körben a szerveres és munkaállomásos rendszereket veszi célba.

Az Atlas 300 (Model: 9000) a korábban már látott Ascend 910 gépi tanulásos chipre épít. A chip az Ascend-Max széria legerősebb tagja, melynek alapját az ugyancsak saját tervezésű DaVinci Max mag jelenti, amelyből összesen 32 darab került az Ascend 910-be. A végrehajtóegységeket háló topológiával (mesh) kapcsolták össze a tervezők, működésüket pedig 32 megabájt megosztott gyorsítótár segíti. A magok mellé fixfunkciós dekódolók is kerülteket, melyek segítségével valós időben dolgozható fel 128 különálló videócsatorna adatfolyama, amely például különféle megfigyelőrendszereknél jöhet kapóra. A lapkában található memóriavezérlőhöz négy darab HBM 2-es memória kapcsolódik összesen 32 gigabájt összkapacitással. Ezt egészíti ki a kártya áramkörére épített 16 gigabájt DDR4-es memória, amivel összesen 48 gigabájtból gazdálkodhatnak a jellemzően memóriaigényes gépi tanulásos algoritmusok.

atlas_accelerator

Az Ascend 910 félpontosságú lebegőpontos műveleteknél (FP16) 256 TFLOPS-os, INT8 (8 bites integer) műveleteknél pedig 512 TOPS csúcsértéket produkál. Ezek nagyon magas értékek, a Tesla V100-as gyorsítója ugyanis FP16 esetében 31,4 TFLOPS-ra, INT8-nál pedig 125 TOPS-ra képes. A specifikációk alapján tehát félpontosságú lebegőpontos műveleteknél az Ascend 910 közel kilencszer gyorsabb az Tesla V100-nál, legalábbis papíron, a független mérésekre ugyanis még várni kell. A Huawei szerint kártyája másodpercenként 1802 darab kép elemzésével végez, szemben "a piac legerősebb gyorsítóival", melyek ugyanennyi idő alatt csak 965 képpel végeznek.

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Szintén fontos szempont a kártya fogyasztása, amiről a Huawei egyelőre nem beszélt, ám vélhetően az Atlas 300 TDP-je is a kategóriában szabványosnak tekinthető 250-300 watt körül mozog. A termék PCI Express 4.0 csatolóval rendelkezik, hátoldalán pedig egy 100 gigabites RoCE (Remote Direct Memory Access over Converged Ethernet) interfész található. Ez az alkalmazás és a kernel közötti adatmásoláskor fellépő, és a TCP/IP protokoll miatti többletterhelést csökkentésére (is) hivatott, amit kiaknázva akár 70 százalékkal is mérsékelhető a szinkronizációs késleltetés.

A Huawei másik, Atlas 300 (Model: 3000) kártyája lényegesen szerényebb teljesítményt céloz, INT8 (8 bites integer) műveleteknél ugyanis csak 64 TOPS-ra képes a gyorsító, ami a 9000-es modell nyolcada. Az Ascend 310 chip a végrehajtóegységek mellett fixfunkciós dekódolókat is tartalmaz, melyek segítségével valós időben dolgozható fel 64 különálló HD felbontású videócsatorna adatfolyama. A félmagas, PCI Express 3.0-s kártyán 32 gigabájt LPDDR4 memória található, TDP-je pedig mindössze 67 watt.

Huawei alaplapok

A gyorsítókártyák mellé más, eddig meglehetősen profilidegennek tűnő termékeket is bejelentett a Kunpeng alaplapok formájában a Huawei. A kétprocesszoros szerver, illetve az egyprocesszoros desktop alaplap is a cég Kunpeng 920-as processzorára épít. A CPU 64 darab Armv8 utasításarchtektúrára alapozó egyedi magokat tartalmaz nyolccsatornás DDR4 memóriavezérlő és PCI Express 4.0 kontroller mellett.

kunpeng_boards

A Huawei elsősorban szerverekbe és munkaállomásokba pakolná a processzoraival integrált alaplapokat, melyeket az IBM OpenPower kezdeményezésének mintájára megnyit az érdeklődők előtt. A cég ettől különböző gyártók és partnerek közötti együttműködéseket remél, melyek kimondott célja létrehozni egy ökoszisztémát a megnyitott technológiák körül. Ehhez a Huawei számos kapcsolódó szellemi termékét teszi licencelhetővé a processzoroktól egészen a firmware-ekig.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról