Szerző: Gálffy Csaba

2011. június 15. 16:49

Bemutatta a legújabb utasításkészletét az Intel

Megjelent a Haswell kódnevű processzorok új utasításainak leírása az Intel holnapján. A kiterjesztés egy része a Sandy Bridge-ben bemutatkozott AVX utasításokat bővíti 256 bitesre, de érkezik néhány valódi újdonság is, valamint sikerült az AMD Bulldozere felé is barátságtalan lépést tenni.

AVX2

Minden jelentős architektúraváltásnál bővül az Intel processzorai által támogatott utasításkészlet, az együttműködés a két legjelentősebb processzorgyártó között azonban teljességgel hiányzik. Nem változik ez a Haswell kódnevű Intel processzor megérkezésével sem, az Intel továbbra is egyoldalúan bővíti az utasításkészletet, ezúttal azonban néhány, eddig AMD-exkluzív utasítást is támogatni fog. A kisebb gyártó számára rossz hír, hogy az Intel a fused multiply-add (lebegőpontos szorzás és összeadás, majd egyetlen kerekítés) más verzióját fogja alkalmazni mint a hamarosan bemutatkozó Bulldozer-család.

A Haswellben a legnagyobb újdonság az AVX2 néven bemutatkozó utasításkiegészítés, amely az AVX-ben már bemutatkozott VEX utasításkódolást használja. Az AVX2 utasítások a legtöbb SSEx SIMD utasítás 256 bites verzióját jelentik. A fixpontos műveletek így a korábbiakhoz képest dupla hosszúságú adattal képesek dolgozni, ami különösen hasznos lesz majd a kép- és videofeldolgozó alkalmazások munkafolyamataiban. A Haswell támogatni fogja az AVX utasításkészletet lebegőpontos adatok esetében is, az AVX2 azonban csak fixpontos adatokkal működik.

A Haswell támogatni fog egy sor új bitmanipulációs utasítást is, amelyek a tömörített adatbázisok, hash-számítások, nagy számokkal végzett műveletek, illetve általános felhasználású kód esetében is hasznos lehet. Az új processzorgeneráció tartalmaz majd egy új memóriaelérési utasítást is, amellyel nem összefüggő memóriarészekről származó adatot is lehet vektorizálni. Az Intel ígérete szerint a "gyűjtő" utasítás biztonságosan maszkolva lesz, ami jól használhatóvá teszi feltételes betöltési utasításokkal is. Kibővül 256 bitesre az SSE4-ben bemutatkozó bitkeverő (bit shuffle) utasítás, amely két vektor egymáshoz kötött permutációját képes előállítani DWORD és QWORD finomságban is.

Az AMD kitalálta, az Intel átvette

A Haswell-generációval az Intel végre átveszi és támogatni fogja az AMD által kidolgozott FMA3 utasításkészlet, a továbbfejlesztett és végül felhasznált FMA4-et azonban nem. Az FMA3 az AMD háromoperátoros utasításcsomagjának része volt, amelyet eredetileg kompatibilisnek szántak az Intel AVX utasításokkal. Az Intel azonban az utolsó pillanatban módosította a bejelentett specifikációkat, a kompatibilitás így nem jött létre és a zöldek lemondtak az utasítások implementációjáról.

A FMA3-t most az Intel egyoldalúan, a támogatás bejelentésével feltámasztotta, és így valószínűleg a következő generációs AMD processzorok is támogatni fogják - a fejlesztési ütemtervet tekintve leghamarabb a Haswellel egy időben. A Bulldozer magokban végül implementált, négy operandussal működő FMA4 utasításkészlet alól az Intel döntése azonban kihúzza a szőnyeget, így ez valószínűleg nem kap majd mérhető iparági támogatást. Az FMA3 és FMA4 ugyanazon műveletek gyorsítására használható, az egyetlen különbség, hogy az FMA3 a kimenetet az egyik bemeneti változó helyére, az FMA4 pedig külön írja ki. Bár a két megoldás gyakorlatilag megegyezik, az eltérés elég az inkompatibilitáshoz.

Jöhet a malware-cunami az iPhone-okra?

Nyílik az iOS, de tényleg annyira veszélyes ez? Annyira azért nem kell félni, elég sok kontroll van még az Apple-nél.

Jöhet a malware-cunami az iPhone-okra? Nyílik az iOS, de tényleg annyira veszélyes ez? Annyira azért nem kell félni, elég sok kontroll van még az Apple-nél.

Az Intel szerint az FMA Haswellben integrált verziója jelentősn növeli majd a lebegőpontos műveletek sebességét és pontosságát, ami különösen a transzcendens matematikai műveletek számára fontos. Az FMA segítségével a mérnöki-tudományos feladatok, a professzionális képalkotási és például arcfelismerési algoritmusok gyorsulhatnak fel. Az inteles FMA-implementáció skaláris műveleteket végez 128 és 256 bites adattípusokon.

A Haswell természetesen megtartja majd az Ivy Bridge-ben bemutatkozó újdonságokat is, így a hardveres véletlenszám-generátort, a féllebegőpontos (float16) gyorsítókat is, és a Sandy Bridge-ben idén bemutatkozott AVX utasításkészletet is. Az új utasítások részletes leírása az Intel oldalán érhető el.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról