Szerző: Bizó Dániel

2008. június 10. 11:01

Megszületett a világ első petaflops szuperszámítógépe, az IBM Roadrunner

Az IBM által épített Roadrunner (Gyalogkakukk) szuperszámítógép a világon elsőként érte el hivatalosan az 1 petaflopsos lélektani teljesítmény-határt, ami milliárdszor millió lebegőpontos művelet másodpercenkénti végrehajtását jelenti. Az aranyat érő új rekord több mint kétszerese az eddigi legerősebb konfiguráció teljesítményének. A Roadrunner további érdekessége, hogy hibrid Opteron-Cell architektúrát alkalmaz.

[HWSW] Az IBM által épített Roadrunner ("Gyalogkakukk") szuperszámítógép a világon elsőként érte el hivatalosan az 1 petaflopsos lélektani teljesítmény-határt, ami milliárdszor millió lebegőpontos művelet másodpercenkénti végrehajtását jelenti. Az aranyat érő új rekord több mint kétszerese az eddigi legerősebb konfiguráció teljesítményének. A Roadrunner további érdekessége, hogy hibrid Opteron-Cell architektúrát alkalmaz.

A 120 milliós dolláro gépet az IBM építette a Poughkeepsie-ben (New York) található létesítményében, majd ezt követően szállítják át a mintegy 3 ezer kilométerre fekvő Los Alamosi Nemzeti Laboratóriumba, melyet az Egyesült Államok nukleáris fegyverarzenálját felügyelő Nemzeti Nukleáris Biztonsági Hivatala (NNSA) üzemeltet. A 250 tonnás Roadrunner bődületes teljesítményét nukleáris fegyvertesztek szimulációjára használják majd elsősorban, mivel az ország 15 éve nem folytat kísérleti atomrobbantásokat. A Roadrunner nagyjából egy nap alatt végez egy olyan feladattal, mely 10 éve még 3 évet vett volna igénybe.

Az NNSA által monumentális eredménynek titulált Roadrunner 6120 Opteron processzor köré 12240 PowerXCell 8i chipet szervez, melyek a számítási teljesítmény derekát adjákk. A rendszer három szerverből álló blokkoból épül fel, a blokkok egy kétfoglalatos, kétmagos Opteronoknak helyet adó LS21, és két darab kétutas QS22 Cell blade szerverből épülnek fel. Ezekből a blokkokból 180 darab képez egy összeköttetési csomópontot, 288 InfiniBand DDR portos száloptikás switch-csel, a rendszer pedig összesen 17 ilyen csomópontból épül fel. A 2 petabájtos háttértár 10 gigabites Etherneten csatlakozik.

A több mint 12 ezer PowerXCell 8i mintegy 1332 teraflops elméleti csúcsteljesítménnyel rendelkezik 64 bites lebegőpontos számítások terén, az IBM pedig a Linpack tesztben 1026 teraflopsot, vagyis éppen több mint egy petaflops teljesítményt sajtolt ki. A PowerXCell 8i a PlayStation 3 játékkonzolban bemutatkozott Cell Broadband Engine chip egy szuperszámítógépes felhasználást szem előtt tartó továbbfejlesztése, ami lényegében a 64 bites műveletekkel történő teljesítmény fokozását, és új, DDR2 memóriavezérlő bevezetését takarja. A 65 nanométeres eljárással gyártott chip egy PowerPC mag mellett 8 darab vektorprocesszort integrál, órajele 3,2 gigahertz.

IBM Roadrunner szuperszámítógép

A bődületes teljesítmény mellé energiahatékonyság is társul, ami elsőre talán perverz kijelentésnek tűnik a 3,9 megawattos fogyasztás fényében. Ez 376 megaflopsot jelent wattonként, mellyel az IBM állítása szerint megver bármilyen ismert más konfigurációt, így például a speciális PowerPC chipekre épülő saját Blue Gene/P 350 megaflopsos értékét is felülmúlja. A Kék Óriás szerint a leghatékonyabb Xeonokkal is mindössze 150 megaflops érhető el wattonként. Az IBM szerint a Roadrunnerhez hasonló hibrid/heterogén szuperszámítógépes rendszerek az elkövetkező évtized meghatározó szereplői lesznek, a komplexebb programozás ellenére is.

A Red Hat Linuxot futtató fürt sztenderd MPI programozási modellje szerint egy Opteron maghoz rendel egy PowerXCell 8i chipet, ahol az Opteron a számítás vezérlését látja el, amihez az IBM biztosít fejlesztőeszközöket és könyvtárakat. A vállalat szerint a kód optimalizálása kritikus jelentőségű lesz abban, hogy a Roadrunner és a hozzá hasonló rendszerek potenciálját ki lehessen aknázni. A korlát a teljesítmény előtt nem a számítási algoritmusokban rejlik, vélik az IBM-nél, hanem a memóriakezelésben, vagyis hogy a végrehajtóegységeket folyamatosan adattal lássák el -- a Cell megalkotói éppen a memóriafalat tartották szem előtt a mikroarchitektúra megalkotásakor, és céljuk a memóriaszintű műveletek párhuzamosságának fokozása a késleltetés elfedése érdekében.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról