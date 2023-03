Többek közt kreatívabb együttműködést és nagyobb pontosságot ígér az OpenAI nemrég bejelentett GPT-4 multimodális nagy nyelvi modellje (LLM), ami elődjétől fejlettebb módon szöveg- és képbevitelt egy időben tud elemezni, bár válaszokat továbbra is csak szöveg formájában állít elő. Ez azt jelenti, hogy a fotókon, grafikonokon, mémeken és más vizuális termékeken látható információkkal is képes dolgozni a modell.

A kutatók bejegyzése szerint a GPT-4 és a többek közt a ChatGPT chatbotot hajtó GPT-3.5 közti különbség a hétköznapi beszélgetésekben is láthatóan megmutatkozik: míg az előző modellen alapuló chatbot legfeljebb 3000 szóban tud választ generálni összetett kérdésekre, a GPT-4 már akár 25 000 szavas válaszokat is készít, megértve az ok-okozati összefüggéseket. Míg a korábbi modellek kiadásakor a bejelentéssel együtt a modellarchitektúra technikai részleteit is közzétette az OpenAI, a GPT-4 esetében ezt már mellőzi a verseny- és biztonsági aggályok miatt, így kevésbé részletes publikációt osztott meg honlapján.

Sam Altman vezérigazgató arra is felhívta a figyelmet, hogy a nyelvi modellek eddigi jellegzetes nagy problémája, tehát a hallucináció, vagy a problémás hangvételű szövegek előállítása az új verzióban is jelen van. A GPT-4 tehát szintén korlátozott és nem tökéletes, de lenyűgöző eredményeket ad, az előrelépés mérhetően tetten érhető a különféle benchmarkok és tesztek révén, az OpenAI összehasonlításként közzétette például, hogy az új modell mennyire teljesített jobban elődjénél egyes szimulált iskolai vizsgákon, ami jó ideje a szövegek értelmezésére alkalmas algoritmusok egyik mércéje - középiskolai emelt statisztikában például az emberek 85 százalékánál jobban teljesített, a GPT-3.5 esetében ez az arány még 40 százalék volt.

A startup tájékoztatása szerint a fejlesztést a jövőben számos termékbe integrálják a partnerek, köztük a Duolingo, a Stripe és a Khan Academy szolgáltatások fejlesztőivel sikerült megállapodni. Természetesen elérhető lesz a frissített ChatGPT-ben is, de csak annak előfizetéses, havi 20 dollárba kerülő Plus csomagjában. Az API hamarosan elérhetővé válik a külső fejlesztők számára is, hogy beépíthessék alkalmazásaikba.

Az eredeti GPT-modellt leíró kutatási cikk 2018-ban jelent meg, amit egy évvel rá követett a GPT-2, majd 2020-ban a GPT-3, így viszonylag hossszabb idő kellett a GPT-4 bemutatkozásához. A vállalat eleinte tartózkodott a modell szélesebb körű megnyitásától, de 2022 végén elindította a GPT-3.5-ön alapuló ChatGPT chatbotot, amit már bárki elérhetett, ezzel rávilágítva rengeteg etikai problémára is. A GPT 4 bejelentésében az OpenAI hangsúlyozza, hogy a rendszer hat hónapos biztonsági képzésen ment keresztül, melynek eredményeként a belső tesztek szerint 82 százalékkal csökkent a valószínűsége annak, hogy nem kívánt módon reagál a kérésekre, és 40 százalékkal jobb eséllyel produkál valódi tényeket tartalmazó szövegeket elődjénél.