Szerző: Gálffy Csaba

2012. november 13. 16:23

Csúcs-Tesla és FirePro mutatkozott be

Az NVIDIA az elmúlt években szépen kiépítette a nagy teljesítményű GPGPU-piacot. Idén az Intel és az AMD is bejelentkezett a trónért, a három gyártó három megközelítéssel készül megszerezni a trónt.

Mindhárom érintett lapkagyártó nagy erőkkel készült a jelenleg folyó Észak-Amerikai szuperszámítógépes konferenciára. Az SC12-re időzítette az Intel mellett az NVIDIA és az AMD is saját professzionális csúcsmodelljeinek bemutatását, így a hét valódi tűzijátékká vált a szuperszámítógépekbe és szerverekbe szánt gyorsítókártyák piacán.

NVIDIA K20

A zöld gyártó már májusban bemutatta K20 névre keresztelt GPGPU-architektúráját, akkor azonban az új lapkáról csak néhány sarokadatot mondtak el. Az NVIDIA már akkor bejelentette, hogy a K20 15 feldolgozó blokkot (SMX), hatcsatornás memóriavezérlőt és másfél megabájt másodszintű gyorsítótárat kap, a kétszeres pontosságú lebegőpontos műveleteket pedig az egyszeres pontosságúakhoz képest harmadakkora sebességen végzi. Az azóta eltelt időszakban a gyártó véglegesítette a lapka specifikációit, így a megvásárolható termék adatait is nyilvánosságra hozta.

Az első információ, hogy a K20 nem egyetlen lapkát, illetve kártyát jelent, a család ugyanis kéttagú. A K20 névre keresztelt modell mellett megjelent a K20X is, ez utóbbi a csúcsmodell, míg a sima K20 valamivel olcsóbb és lassabb. A K20X az eredeti 15 SMX-ből 14-et tartalmaz aktiválva, a blokkokat hat memóriavezérlő szolgálja ki és épségben megtalálható az 1,5 megabájtos gyorsítótár is. A feldolgozóegységek sebessége 732 MHz, a memória mérete 6 gigabájt, órajele pedig 5,2 GHz (effektív). Az NVIDIA specifikációi szerint az elméleti maximális sebesség 3,95 TFLOPS (FP32) illetve 1,31 TFLOPS (FP64), a memória sávszélessége 250 GBps. Ez a lapka szolgál egyébként a világ jelenlegi leggyorsabb szuperszámítógépében, a Titanban is, több mint 18 ezer példányban.

A K20X némileg "lebutított", visszavágott változata lesz a K20. Ebben a modellben egy feldolgozó blokkot és egy memóriavezérlőt lekapcsolnak a nagy testvérhez képest, a gyorsítótár mérete pedig 1,25 megabájtra csökken. A lapka órajele is néhány százalékkal alacsonyabb, 706 MHz lesz, a memória marad 5,2 GHz, mérete azonban 5 gigabájtra olvad. Az NVIDIA számításai szerint a lapka elméleti maximális teljesítménye így 3,52 TFLOPS-ra (FP32) illetve 1,17 TFLOPS-ra (FP64) csökken, a memória sávszélessége 208 GBps.

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

A két kártya különbségeinek megfelelően a fogyasztás is eltérő, a K20X maximális fogyasztása 235 watt, a K20-é pedig 225 watt. Ez utóbbi adat azért is fontos, mert számos HPC ház és alaplap energiaellátását ehhez a maximális fogyasztáshoz tervezik, így a piacon érdemes volt egy olyan terméket is bemutatni, amely ebbe a keretbe belefér. A két modell mellett szól a lapka hatalmas mérete is, a mintegy 7 milliárd tranzisztort tartalmazó chipet így gazdaságosan lehet termelni, a két hibás blokkot vagy hibás memóriavezérlőt tartalmazó lapkák K20 néven vásárlóra találhatnak.

A K20 és a K20X modelleket az NVIDIA már szállítja a szervergyártó partnerek felé, a végfelhasználó szervezetek pedig még év vége előtt megvásárolhatják a rájuk épülő gépeket. Mivel e termékek közvetlenül az NVIDIA-tól nem érhetőek el, az OEM-től függően a bővítőkártyák ára szélsőségesen alakul majd, a K20 ettől függetlenül mintegy 3000 dollárért, a K20X pedig 5000 dollár körül lesz megvásárolható. Az NVIDIA szerint jelenleg a termékek utáni kereslet messze meghaladja a gyártási kapacitást, azonban ezért nem a gyenge kihozatal, hanem a szükséges kapacitás alulbecslése okozta, ezt a következő negyedévekben javítja a gyártó.

AMD FirePro S-sorozat

Az NVIDIA mellett az AMD is bemutatta saját professzionális felhasználású kártyáinak csúcsát, a FirePro S sorozat legnagyobb, S10000 jelű tagját. Míg az S9000 az AMD legnagyobb egylapkás szerveres modelljének számít, az S10000 az első kétlapkás FirePro modell lesz a gyártó történetében.

Az S10000 két GCN architektúrát használó Tahiti GPU-t integrál, ezekből egy-egy található meg egyébként az S9000 típusszámú kártyán. Egy-egy lapka 1792 stream processzort integrál, 384 bites memóriavezérlővel rendelkezik és összesen 4,3 milliárd tranzisztort tartalmaz. A lapkák órajelét az AMD némileg visszaskálázta, a 900 MHz helyett párban már csak 825 MHz-en üzemelnek, így a fogyasztás is barátságosabb lehet. A lapkákat egyenként 3 gigabájt memória szolgálja ki 5GHz effektív órajelen, vagyis az S9000-hez képest az egy GPU-ra jutó memória megfeleződött.

Az AMD számításai szerint az S10000 elméleti maximális sebessége 5,91 (FP32), illetve 1,48 (FP64) teraflops, a két GPU összesített memória-sávszélessége pedig 480 GBps. Az S10000 ehhez a teljesítményhez 375 wattot fogyaszt maximálisan - a 225 wattos piac számára az S9000-t kínálja a gyártó. Az S10000 így elsősorban az abszolút csúcskategóriát célozza, ahol sem a fogyasztás, sem a kártya bekerülési költségei nem lényegesek, cserébe a maximális teljesítményt kell egy foglalatból kihozni. Mivel a HPC GPGPU piac ma az NVIDIA saját vadászterületének számít, az AMD nem teketóriázott, piacra dobott egy olyan kártyát, amely teljesítményben biztosan meg fogja majd előzni a K20-at. Ettől elvonatkoztatva azonban az S10000 jóval több piacon versenyez, mint az NVIDIA kártyája - míg a zöldek a HPC piacra, szerverekbe, VDI-hoz és munkaállomásokhoz külön-külön optimalizált terméket mutattak be, az AMD S-sorozatának tagjai egyszerre fedik le ezeket a szegmenseket.

Az S10000 az AMD szerint 3600 dolláros áron kerül piacra, ami 1100 dolláros prémium a "feleakkora" S9000-hez képest. A gyártó bejelentése szerint a szállításokat már megkezdték egyes partnerek felé, a termék a Tesla K20 előtt meg fog jelenni a piacon.

Kubernetes képzéseinket már közel 300 szakember végezte el. A nagy sikerre való tekintettel a tanfolyamot aktualizált tananyaggal június 18-án újra elindítjuk! A 8 alkalmas, élő képzés képzés órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról