Mellékleteink: HUP | Gamekapocs
Keres
Ősszel is lesz HWSW free! Alkalmazott AI meetup és agilis fejlesztői meetup a módszertanok dzsungeléből, szeptember 24-25-én.

1 teraflops felett az Intel Knights Corner

Bodnár Ádám, 2011. november 16. 14:00
Ez a cikk több évvel ezelőtt születetett, ezért előfordulhat, hogy a tartalma már elavult.
Frissebb anyagokat találhatsz a keresőnk segítségével:

A héten Seattle-ben zajló Supercomputing Conference 11 esemény kapcsán rendezett sajtótájékoztatóján az Intel működő mintapéldányok formájában mutatta be a jövőre kereskedelmi forgalomba kerülő Knights Corner chipjét, amelyet az NVIDIA és AMD GPU-k ellen küld csatasorba a mérnöki-tudományos számítástechnika világában.

hirdetés

Larrabeeből MIC

A Knights Corner kódnevű chip az Intel MIC (Many Integrated Cores) projektjének gyümölcse, amely az eredetileg grafikus processzornak indult Larrabbee folytatásának tekinthető. A vállalat elgondolása szerint több tucat egyszerű x64 processzormag egy lapkára integrálásával sikeresen veheti fel a versenyt a Teslákkal és FireStreamekkel a HPC szegmensben. A koncepció kísértetiesen hasonlít a GPGPU-k elgondolásához, azonban míg az NVIDIA és az AMD a grafikus chipek felől közelít az általános számítások felé, addig a MIC az általános célú x86 mikroprocesszorok oldaláról érkezik.

Az MIC projekt célja, hogy visszaszorítsa a GPGPU-k és más masszívan párhuzamos architektúrák térnyerését a HPC szegmensben, amelyek masszívan párhuzamosított felépítésük révén a PC-s és szerveres szoftverek futtatására tervezett  processzoroknál jóval magasabb hatékonyságot érnek el szilíciumterületre és energiafogyasztásra vetítve. Ezt a MIC egyszerű x64 magokkal, széles vektorizált (SIMD) kiterjesztéssel, 100 új utasítással és négy utasításszál párhuzamos végrehajtásának lehetőségével (Hyper-Threading) próbálja meg ellensúlyozni.

Az Intel szerint az x64 magok használatának legnagyobb előnye a GPGPU megközelítéssel szemben, hogy a fejlesztőknek nem kell új programozási modellt vagy nyelvet elsajátítani és a vállalat széles körben elterjedt fejlesztői eszközei (fordító, debugger) is használhatók. Az Intel felkészíti fordítóit és optimalizáló eszközeit a MIC támogatására, így a programozók azonos forrásból azonos fejlesztői eszközökkel olyan binárist készíthetnek, amely fut a Core/Xeon processzorokon, de a MIC gyorsítóchipek képességeit is kihasználja, ha vannak a rendszerben. Utóbbihoz mindössze néhány sort kell a kódban elhelyezni.

Rajeeb Hazra (Intel) a Knights Cornerrel

1 teraflops dupla pontosságú lebegőpontos teljesítmény

Az MIC projekt első mérföldköve a 45 nanométeres Knights Ferry kódnevű chip, ami 32 magot tartalmazott, ezeket a lapkákat tartalmazó PCI Express bővítőkártyákat az MIC projektben résztvevő Intel-partnerek, akadémiai intézetek kaphatták meg. Glenn Brook, az Oak Ridge National Laboratoryt és a University of Tennessee mérnöki-tudományos számítástechnikai erőfeszítései felett bábáskodó Joint Institute of Computational Sciences igazgatója az eseményen elmondta, a mérnökök számos alkalmazást, összesen mintegy 5 millió sornyi Fortran, C és C++ kódot ültettek át a 32 magos Knights Ferry tesztchipre, a tudományos szoftverek "portolása" egyenként egy napot vett igénybe.

A Knights Corner már 22 nanométeres csíkszélességgel készül, hogy a projekt mennyire előrehaladott állapotban van azt jól mutatja, hogy az Intel a héten már működő mintapéldányokat demózott az újságírók előtt. A vállalat továbbra sem árul el részleteket a chippel kapcsolatban, nem lehet tudni a pontos magszámot sem, az Intel "több mint 50" magról beszél, de jól értesültek szerint a Knights Corner 64 maggal kerül le a futószalagról, amelyekből néhányat az Intel deaktiválhat. Azt sem tudni egyelőre, milyen órajeleken működnek majd a Knights Corner chipek.

A megcélzott szegmensben a legfontosabb mérőszám a teljesítmény, ebből pedig a Knights Corneren nincs hiány. Az Intel által demózott chipek az iparban széles körben elterjedt, dupla precizitást használó, mátrixszorzást végző DGEMM benchmark alatt 1 teraflops feletti teljesítményt értek el a Register beszámolója szerint, ami a jelenleg hozzáférhető legerősebb Tesla és FireStream lapkák által elért teljesítmény kétszerese és a 32 magos Knights Ferryhez viszonyítva is hasonló a különbség.

A GPGPU sem hal ki

A Knights Corner megjelenése előtt azonban az NVIDIA és az AMD is bemutat legalább egy új GPU-generációt, így a teljesítménykülönbség csökkenhet vagy akár a GPGPU-k javára is fordulhat a mérleg nyelve. A GPGPU-khoz elérhető szoftverfejlesztői eszközök, debuggerek, profilírozók is egyre javulhatnak és a GPGPU-k programozásához szükséges ismeretek is kezdenek széles körben elterjedni, hála az NVIDIA és az AMD erőfeszítéseinek.

Általánosságban igaz a HPC területre, hogy a nyerő architektúra nagyban függ a futtatni kívánt kódtól és ez feltehetően nem lesz másképp az Intel MIC és a GPGPU-k esetében sem. Az Intel sem vonja kétségbe a GPU-gyorsítás létjogosultságát vannak és  lesznek is olyan területek, ahol a GPGPU megközelítés rendkívül hatékony, ha rendelkezésre áll az a szoftverfejlesztői tudás, amivel kihozható a grafikus chipekből a bennük rejlő erő. Az Intelnél ugyanakkor úgy látják, a nagy számítási teljesítményre éhes felhasználók többsége nem akarja majd felvállalni a meglevő szoftverek átírásával vagy módosításával járó anyagi terheket és bonyodalmakat - mindig is olcsóbb volt új hardvert venni mint egy meglevő szoftvert újraírni vagy optimalizálni.

Facebook

Mit gondolsz? Mondd el!

Adatvédelmi okokból az adott hír megosztása előtt mindig aktiválnod kell a gombot! Ezzel a megoldással harmadik fél nem tudja nyomon követni a tevékenységedet a HWSW-n, ez pedig közös érdekünk.
A HWSW októberben induló gyakorlatorientált, 10 alkalmas, 30 órás online képzéseire most early bird kedvezménnyel lehet regisztrálni!