2025. augusztus 5. 13:14

Sakktornát rendeznek nagy nyelvi modelleknek

A nagy nyelvi modellek nem kifejezetten jók az olyan stratégia gondolkodást igénylő játékokban, mint a sakk, a számukra rendezett sakkbajnokságon keresztül azonban a kutatók és fejlesztők könnyebben megérthetik, nyomon követhetik a fejlődésüket.

Sakkbajnokságot indít a legnépszerűbb AI-modellek számára a Kaggle Game Arena a Google Deepmind csapatával közösen, ahol az egyébként egészen más célra tervezett mesterséges intelligencia megoldások nem hús-vér emberekkel, hanem egymással vehetik fel a versenyt.

A háromnapos, augusztus 5-től 7-ig tartó, az alábbi streamen élőben követhető versenyen a Google Gemini 2.5 pro és Flash, az OpenAI-féle o3 és o4-mini, az Anthropic Claude 4 Opus, az xAI-től érkező Grok 4, a DeepSeek R1 és a Moonshot AI Kimi k2-je vesz majd részt, egyenes kieséses versenyben, a tesztmeccseket követő párosítás alapján.

sakk

Az AI ára

Fizetnek a befektetők, fizetnek a felhasználók, és nagy árat fizet az IT munkaerőpiac is. Vékony jégen járunk. Itt a 85. kraftie adás.

Az AI ára Fizetnek a befektetők, fizetnek a felhasználók, és nagy árat fizet az IT munkaerőpiac is. Vékony jégen járunk. Itt a 85. kraftie adás.

A Kaggle szerint a viadalt (melynek csak első eleme a sakkbajnokság) egyfajta benchmark-platformként is fel lehet fogni, illetve egy-egy ilyen meccs segíthet majd a kutatóknak megérteni a nagy nyelvi modellek fejlődési, tanulási mintáit a komplexebb, stratégiai gondolkodást igénylő feladatok esetében.

Az ún "általános célú" nagy nyelvi modellek egyelőre meglehetősen sokszor "mellényúlnak" az efféle játékokban, nem ritkák a szabálytalan, illetve olykor kifejezetten abszurd lépések sem, a ChatGPT és a Gemini azonban mostanra már egy átlagos amatőr játékos szintjét képviseli.

Ezzel egyébként a kanyarban sincsenek a sakkvilág legismertebb mesterséges intelligenciájához, a Deepmind által 2017-ben megalkotott AlphaZero-hoz képest, mely klasszikus megerősítéses tanulási módszerrel a nulláról képezve magát - négy óra alatt - több millió partit játszott le saját maga ellen, majd megverte a világ akkori legfejlettebb sakkprogramját, a Stockfish-t.

Via chess.com

a címlapról

Mi történne Európával, ha holnap lekapcsolnák az AWS-t?

Európa digitális szuverenitása egyre égetőbb dilemma, erről beszélgettünk az IVSZ szakértőjével.

bünti

Sakktornát rendeznek nagy nyelvi modelleknek

Az AI ára

Mi történne Európával, ha holnap lekapcsolnák az AWS-t?

Újabb fronton szorongatja az EU az önző Google-t

Szélesebbre nőtt a Galaxy Z Fold8, amiből már Ultra is van

Sakktornát rendeznek nagy nyelvi modelleknek

Az AI ára

Mi történne Európával, ha holnap lekapcsolnák az AWS-t?

Újabb fronton szorongatja az EU az önző Google-t

Szélesebbre nőtt a Galaxy Z Fold8, amiből már Ultra is van

Szelfivideós bejelentkezés jött a Google-fiókokhoz

Másfél évtizedes növekedési csúcson az Intel

A Meta tortájába haraphat bele a Samsung kamerás okosszemüvege

Szelfivideós bejelentkezés jött a Google-fiókokhoz

Másfél évtizedes növekedési csúcson az Intel

A Meta tortájába haraphat bele a Samsung kamerás okosszemüvege