Sakktornát rendeznek nagy nyelvi modelleknek
Sakkbajnokságot indít a legnépszerűbb AI-modellek számára a Kaggle Game Arena a Google Deepmind csapatával közösen, ahol az egyébként egészen más célra tervezett mesterséges intelligencia megoldások nem hús-vér emberekkel, hanem egymással vehetik fel a versenyt.
A háromnapos, augusztus 5-től 7-ig tartó, az alábbi streamen élőben követhető versenyen a Google Gemini 2.5 pro és Flash, az OpenAI-féle o3 és o4-mini, az Anthropic Claude 4 Opus, az xAI-től érkező Grok 4, a DeepSeek R1 és a Moonshot AI Kimi k2-je vesz majd részt, egyenes kieséses versenyben, a tesztmeccseket követő párosítás alapján.
A Kaggle szerint a viadalt (melynek csak első eleme a sakkbajnokság) egyfajta benchmark-platformként is fel lehet fogni, illetve egy-egy ilyen meccs segíthet majd a kutatóknak megérteni a nagy nyelvi modellek fejlődési, tanulási mintáit a komplexebb, stratégiai gondolkodást igénylő feladatok esetében.
Az ún "általános célú" nagy nyelvi modellek egyelőre meglehetősen sokszor "mellényúlnak" az efféle játékokban, nem ritkák a szabálytalan, illetve olykor kifejezetten abszurd lépések sem, a ChatGPT és a Gemini azonban mostanra már egy átlagos amatőr játékos szintjét képviseli.
Ezzel egyébként a kanyarban sincsenek a sakkvilág legismertebb mesterséges intelligenciájához, a Deepmind által 2017-ben megalkotott AlphaZero-hoz képest, mely klasszikus megerősítéses tanulási módszerrel a nulláról képezve magát - négy óra alatt - több millió partit játszott le saját maga ellen, majd megverte a világ akkori legfejlettebb sakkprogramját, a Stockfish-t.
Via chess.com