:

Szerző: Asztalos Olivér

2021. augusztus 24. 12:58

Gépi tanulásra fókuszál az IBM vadiúj chipe

Bemutatta legújabb, mainframe-ekbe szánt processzorát az IBM. A nagy méretű chip fejlesztésében meghatározó szempont volt a gépi tanulásos műveletek gyorsítása.

Az új processzorról Dr. Christian Jacobi, a Nagy Kék vezető tervezője beszélt az idei Hot Chips alkalmából. A chip összesen nyolc darab magot tartalmaz, amelyek mély szuperskalár OoO (Out-of-Order) futószalaggal rendelkeznek. A magok órajele rendkívül magas, 5 GHz feletti, a hozzájuk tartozó L2 gyorsítótár mérete pedig darabonként 32 megabájt, ami a komplett chipet tekintve 256 megabájt gyorsítótárat jelent.

Nyerd meg az 5 darab, 1000 eurós Craft konferenciajegy egyikét!

A kétnapos, nemzetközi fejlesztői konferencia apropójából a HWSW kraftie nyereményjátékot indít.

Nyerd meg az 5 darab, 1000 eurós Craft konferenciajegy egyikét! A kétnapos, nemzetközi fejlesztői konferencia apropójából a HWSW kraftie nyereményjátékot indít.

A Telum egyik érdekes fejlesztése épp utóbbit, vagyis a cache-t célozza. A magokhoz kapcsolódó másodszintű tárak ugyanis igény szerint harmadszintű tárként kombinálhatóak, sőt, a komplett szervert tekintve akár negyedszintű cache-ként is összevonhatóak. A rendszer legfeljebb nyolc darab processzort tartalmazhat, így az L4 cache kapacitása akár 2 gigabájtig is skálázható, amennyiben arra a végrehajtás szempontjából szükség van.

01:59
 

IBM Telum Processor brings deep learning inference to enterprise workloads

Még több videó

A Telum legfőbb újítása a gépi tanulásos műveletek gyorsítása, amit a chipbe épített dedikált egységekre bíztak a mérnökök. Ez processzoronként legfeljebb 6 TFLOPs végrehajtási tempót jelent, amely 32 processzoros rendszer esetében már közel 200 TFLOPs-os számítási kapacitást jelent FP16-os, vagyis negyedpontosságú lebegőpontos műveleteknél. Az IBM ígérete szerint a gyorsító képessége firmware kiadások segítéségével bővíthető lesz. A gyorsító képessége természetesen TensorFlow-n keresztül is ki lehet majd aknázni a Nagy Kék saját Deep Learning Compiler-e mellett.

A tervezési munkálatokat vezető Jacobi szerint a Telum gépi tanulástól eltekintve is jelentős ugrás a z15-ben található elődhöz képest, amelyhez viszonyítva foglaltonként akár 40 százalékos is lehet a gyorsulás. A lapka a felhasználási területnek megfelelően hatalmas, mintegy 530 négyzetmilliméter területű. A 22,5 milliárd tranzisztort felvonultató szilíciumot a Samsung gyártja 7 nanométeres eljárásával.

Milyen technológiai és munkaerőpiaci hatások érhetik a backendes szakmát? Május 8-án végre elindul az idei kraftie! meetup-sorozat is (helyszíni vagy online részvétellel).

a címlapról

Hirdetés

Security témákkal folyatódik az AWS hazai online meetup-sorozata!

2024. április 26. 04:24

A sorozat május 28-i, harmadik állomásán az AWS-ben biztonsági megoldásait vesszük nagyító alá. Átnézzük a teljes AWS security portfóliót a konténerbiztonságtól a gépi tanulásos alkalmazások védelmén át, egészen az incidenskezelésig.