Szerző: Bodnár Ádám

2011. június 15. 13:16

Demózta jövőre várható Fusion chipjét az AMD

A héten zajló AMD Fusion Developer Summiten az AMD nem csak a Llano kódnevű processzort mutatta be, hanem a jövőbeli terveiről is ejtett néhány szót. 2012-ben a cég által szállított processzorok túlnyomó többsége már "APU" lesz, vagyis integrált GPU-t tartalmaz.

Teljesen új magokat kap a Trinity

A Llano legnagyobb problémája, hogy elavult K10.5 magokat kapott. Ezen hivatott segíteni a 2012-ben esedékes Trinity kódnevű chip, amely már a Bulldozer-generációba tartozik, vagyis az AMD legújabb fejlesztésű, helytakarékos x86 processzormagjai dolgoznak benne - a jelenleg elérhető információk szerint akár négy darab. A lapkát a Globalfoundries gyártja majd 32 nanométeres eljárással, vagyis a technológia azonos lesz a most megjelent Llanóéval - a chipnek azonban már a 22 nanométeres Intel Ivy Bridge-dzsel kell versenyeznie a piacon.

A gyártástechnológia lemaradást próbálja ellensúlyozni az AMD a Bulldozerrel, amelynek a magjai párosával osztoznak például a lebegőpontos egységeken, hogy minimalizálják a szükséges szilíciumterületet.  A Trinityben a GPU-t is teljesen átdolgozzák az AMD mérnökei, a Fusion Developer Summitről származó beszámolók szerint a chipbe a tavaly decemberben bemutatott Radeon HD 6900 ("Cayman") leszármazottjának tekinthető, VLIW4 architektúrára épülő grafikus vezérlő kerül.

Ez a lépés is a helytakarékos teljesítménynövelést szolgálja. Amint az ismert, a Cayman legfontosabb architekturális újdonsága, hogy elődjénél kevesebb, de hatékonyabb felépítésű stream processzort tartalmaz, a nagyobb teljesítményt pedig magasabb órajel révén éri el. A korábbi VLIW5 helyett bevezetett VLIW4 architektúrában a stream processzorok egyszerre nem 5, hanem csak 4 utasítást képesek feldolgozni, de az AMD szerint ez nem csökkenti a teljesítményt, mivel a modern játékok és grafikus alkalmazások alatt átlagosan 3,4 párhuzamos utasítást lehet kinyerni a kódból, vagyis egy végrehajtóegység rendszeresen kihasználatlan marad. Az új, "keskenyebb" SPU-kra való áttérés eredménye, hogy az architektúra helytakarékosabb.

Az AMD vezetői szerint a Trinity 50 százalékkal nagyobb teljesítményt nyújt a Llanónál, de  - ez egyaránt köszönhető az erőteljesebb x86 processzormagoknak és a fejlettebb grafikus vezérlőnek. A chipet demózta is a vállalat a Fusion Developer Summiten, de a Windows Media Playerben HD videót lejátszó laptop nem sokat mutatott meg a Trinity várható teljesítményéről - az első chipek mindenesetre kész vannak, és néhány héttel a gyártósor elhagyása után már Windowst futtatnak, ami arra enged következtetni, a fejlesztés jól halad.

Nem a Globalfoundries, hanem a TSMC lesz a gyártója az Ontario és a Zacate utódainak, amelyek egyelőre Krishna és Wichita kódnéven szerepelnek a vállalat terméktervében és szintén 2012-ben várhatók. Ezek a lapkák továbbfejlesztett Bobcat-magokra épülnek, ezekből a gyártástechnológiai fejlesztéseknek köszönhetően akár négy is kerülhet egy chipre a DX11-es GPU mellé. A Krishna és a Wichita továbbra is az ultrahordozható notebookokat, valamint a tableteket célozza.

Fusion System Architecture

"Jövő ilyenkorra a leszállított processzoraink 90 százaléka Fusion APU lesz" - mondta a Fusion Developer Summiten a vállalat alelnöke, Rick Bergman. A szilíciumon történő integráció mellett a grafikus mag alkalmazásának rugalmas programozhatósága (GPGPU), és az ezt támogató programozási modellek kulcsfontosságú is szerepet töltenek be a Fusion koncepcióban. A cél, hogy az x86-os processzorok és a grafikus eredetű magok szorosan együttműködnek a feladatokon, és erőforrásaikat az alkalmazások egyaránt ki tudják használni. Az AMD a szoftveres körítést is gőzerővel fejleszti, hogy a Fusion chipek képességei a programozók számára ne csak különleges API-kon keresztül (pl. OpenCL, DirectCompute) legyenek elérhetők.

A végső cél, hogy a GPU erőforrásait úgy használhassák a fejlesztők, mintha az a CPU szerves része lenne - Phil Rogers, az AMD egyik technikai vezetője szerint hasonló lesz ahhoz, mint amikor a lebegőpontos társprocesszorok beolvadtak a CPU-kba a 90-es évek elején. Ennek érdekében az AMD lehetővé kívánja tenni, hogy a CPU és a GPU egységes névteret és teljesen koherens memóriát osszon meg egymás között - ma még lassú adatmásolásra van szükség ahhoz, hogy a CPU számításainak eredményeivel a GPU dolgozhasson vagy fordítva, mivel csak fizikailag alkotnak egy egységet, logikailag nem.

A fentieket részben már meg is valósította az NVIDIA a CUDA-val: a márciusban megjelent CUDA 4.0 legfontosabb újdonságát a memóriakezelés alapos átrendezése jelenti: a teljes CUDA platform (CPU-k és GPU-k) egységes virtuális memóriacímteret kap, így az alkalmazások transzparens módon használhatják a memóriát, a virtuális címzést a meghajtó fordítja le fizikai címekre. A meghajtóra hárul így a memóriakezelés teljes feladata, az NVIDIA mérnökei szerint sikerült megoldani a sok heterogén feldolgozóegység és sok, szintén heterogén sebességű memória allokációjának és elérésének optimalizációját. Az alkalmazásfejlesztői oldalról ez a memóriakezelés jelentős egyszerűsítését jelenti, a felhasználói programok csak az egységesített memóriát látják, a háttérben pedig a meghajtó elvégzi a szükséges, alacsony szintű műveleteket.

Azonban míg a CUDA gyártóspecifikus, az AMD egy gyártó- és platformfüggetlen "ernyőben" gondolkodik. A Fusion System Architecture Intermediate Layer egy olyan "virtuális utasításkészlet-architektúra" lenne, amely teljesen független a processzor vagy a GPU gyártójától és típusától - az AMD ráadásul nem csak a CPU-k mellé integrált GPU-kat támogatná, hanem a rendszerhez csatlakoztatott diszkrét grafikus vezérlőket is. Az AMD várja további cégek csatlakozását a kezdeményezéshez, de nem csak hardvergyártók, hanem operációsrendszer-fejlesztők, köztesszoftver- és fejlesztőieszköz-gyártók, illetve alkalmazásfejlesztők érdeklődésére is számít.

Rogers szerint a jelenlegi heterogén többmagos architektúrák - mint amilyen a Llano is - teljesítményét a programozási modell és az ebből eredő kommunikációs feladatok fogják vissza. "A jó hír, hogy a Fusion System Architecture ledönti ezeket a korlátokat" - mondta. "A GPU-t egyenrangú processzorrá emeljük."

A K8s annyira meghatározó technológia, hogy kis túlzással szinte az összes IT-szakemberre nézve karrier-releváns.

a címlapról