Szerző: Gálffy Csaba

2012. november 13. 16:23

Csúcs-Tesla és FirePro mutatkozott be

Az NVIDIA az elmúlt években szépen kiépítette a nagy teljesítményű GPGPU-piacot. Idén az Intel és az AMD is bejelentkezett a trónért, a három gyártó három megközelítéssel készül megszerezni a trónt.

Mindhárom érintett lapkagyártó nagy erőkkel készült a jelenleg folyó Észak-Amerikai szuperszámítógépes konferenciára. Az SC12-re időzítette az Intel mellett az NVIDIA és az AMD is saját professzionális csúcsmodelljeinek bemutatását, így a hét valódi tűzijátékká vált a szuperszámítógépekbe és szerverekbe szánt gyorsítókártyák piacán.

NVIDIA K20

A zöld gyártó már májusban bemutatta K20 névre keresztelt GPGPU-architektúráját, akkor azonban az új lapkáról csak néhány sarokadatot mondtak el. Az NVIDIA már akkor bejelentette, hogy a K20 15 feldolgozó blokkot (SMX), hatcsatornás memóriavezérlőt és másfél megabájt másodszintű gyorsítótárat kap, a kétszeres pontosságú lebegőpontos műveleteket pedig az egyszeres pontosságúakhoz képest harmadakkora sebességen végzi. Az azóta eltelt időszakban a gyártó véglegesítette a lapka specifikációit, így a megvásárolható termék adatait is nyilvánosságra hozta.

Az első információ, hogy a K20 nem egyetlen lapkát, illetve kártyát jelent, a család ugyanis kéttagú. A K20 névre keresztelt modell mellett megjelent a K20X is, ez utóbbi a csúcsmodell, míg a sima K20 valamivel olcsóbb és lassabb. A K20X az eredeti 15 SMX-ből 14-et tartalmaz aktiválva, a blokkokat hat memóriavezérlő szolgálja ki és épségben megtalálható az 1,5 megabájtos gyorsítótár is. A feldolgozóegységek sebessége 732 MHz, a memória mérete 6 gigabájt, órajele pedig 5,2 GHz (effektív). Az NVIDIA specifikációi szerint az elméleti maximális sebesség 3,95 TFLOPS (FP32) illetve 1,31 TFLOPS (FP64), a memória sávszélessége 250 GBps. Ez a lapka szolgál egyébként a világ jelenlegi leggyorsabb szuperszámítógépében, a Titanban is, több mint 18 ezer példányban.

A K20X némileg "lebutított", visszavágott változata lesz a K20. Ebben a modellben egy feldolgozó blokkot és egy memóriavezérlőt lekapcsolnak a nagy testvérhez képest, a gyorsítótár mérete pedig 1,25 megabájtra csökken. A lapka órajele is néhány százalékkal alacsonyabb, 706 MHz lesz, a memória marad 5,2 GHz, mérete azonban 5 gigabájtra olvad. Az NVIDIA számításai szerint a lapka elméleti maximális teljesítménye így 3,52 TFLOPS-ra (FP32) illetve 1,17 TFLOPS-ra (FP64) csökken, a memória sávszélessége 208 GBps.

A két kártya különbségeinek megfelelően a fogyasztás is eltérő, a K20X maximális fogyasztása 235 watt, a K20-é pedig 225 watt. Ez utóbbi adat azért is fontos, mert számos HPC ház és alaplap energiaellátását ehhez a maximális fogyasztáshoz tervezik, így a piacon érdemes volt egy olyan terméket is bemutatni, amely ebbe a keretbe belefér. A két modell mellett szól a lapka hatalmas mérete is, a mintegy 7 milliárd tranzisztort tartalmazó chipet így gazdaságosan lehet termelni, a két hibás blokkot vagy hibás memóriavezérlőt tartalmazó lapkák K20 néven vásárlóra találhatnak.

A K20 és a K20X modelleket az NVIDIA már szállítja a szervergyártó partnerek felé, a végfelhasználó szervezetek pedig még év vége előtt megvásárolhatják a rájuk épülő gépeket. Mivel e termékek közvetlenül az NVIDIA-tól nem érhetőek el, az OEM-től függően a bővítőkártyák ára szélsőségesen alakul majd, a K20 ettől függetlenül mintegy 3000 dollárért, a K20X pedig 5000 dollár körül lesz megvásárolható. Az NVIDIA szerint jelenleg a termékek utáni kereslet messze meghaladja a gyártási kapacitást, azonban ezért nem a gyenge kihozatal, hanem a szükséges kapacitás alulbecslése okozta, ezt a következő negyedévekben javítja a gyártó.

AMD FirePro S-sorozat

Az NVIDIA mellett az AMD is bemutatta saját professzionális felhasználású kártyáinak csúcsát, a FirePro S sorozat legnagyobb, S10000 jelű tagját. Míg az S9000 az AMD legnagyobb egylapkás szerveres modelljének számít, az S10000 az első kétlapkás FirePro modell lesz a gyártó történetében.

Az S10000 két GCN architektúrát használó Tahiti GPU-t integrál, ezekből egy-egy található meg egyébként az S9000 típusszámú kártyán. Egy-egy lapka 1792 stream processzort integrál, 384 bites memóriavezérlővel rendelkezik és összesen 4,3 milliárd tranzisztort tartalmaz. A lapkák órajelét az AMD némileg visszaskálázta, a 900 MHz helyett párban már csak 825 MHz-en üzemelnek, így a fogyasztás is barátságosabb lehet. A lapkákat egyenként 3 gigabájt memória szolgálja ki 5GHz effektív órajelen, vagyis az S9000-hez képest az egy GPU-ra jutó memória megfeleződött.

Az AMD számításai szerint az S10000 elméleti maximális sebessége 5,91 (FP32), illetve 1,48 (FP64) teraflops, a két GPU összesített memória-sávszélessége pedig 480 GBps. Az S10000 ehhez a teljesítményhez 375 wattot fogyaszt maximálisan - a 225 wattos piac számára az S9000-t kínálja a gyártó. Az S10000 így elsősorban az abszolút csúcskategóriát célozza, ahol sem a fogyasztás, sem a kártya bekerülési költségei nem lényegesek, cserébe a maximális teljesítményt kell egy foglalatból kihozni. Mivel a HPC GPGPU piac ma az NVIDIA saját vadászterületének számít, az AMD nem teketóriázott, piacra dobott egy olyan kártyát, amely teljesítményben biztosan meg fogja majd előzni a K20-at. Ettől elvonatkoztatva azonban az S10000 jóval több piacon versenyez, mint az NVIDIA kártyája - míg a zöldek a HPC piacra, szerverekbe, VDI-hoz és munkaállomásokhoz külön-külön optimalizált terméket mutattak be, az AMD S-sorozatának tagjai egyszerre fedik le ezeket a szegmenseket.

Az S10000 az AMD szerint 3600 dolláros áron kerül piacra, ami 1100 dolláros prémium a "feleakkora" S9000-hez képest. A gyártó bejelentése szerint a szállításokat már megkezdték egyes partnerek felé, a termék a Tesla K20 előtt meg fog jelenni a piacon.

a címlapról