Szerző: Dömös Zsuzsanna

2023. március 16. 10:00

Forradalmat nem, inkább előrelépést hoz a GPT-4

A szöveg mellett már képet is elfogad inputként az OpenAI legújabb nagy nyelvi modellje, a GPT-4, ami szinte minden téren érezhető fejlődést hoz, de továbbra sem hagyja el a hallucináció problémáját.

Többek közt kreatívabb együttműködést és nagyobb pontosságot ígér az OpenAI nemrég bejelentett GPT-4 multimodális nagy nyelvi modellje (LLM), ami elődjétől fejlettebb módon szöveg- és képbevitelt egy időben tud elemezni, bár válaszokat továbbra is csak szöveg formájában állít elő. Ez azt jelenti, hogy a fotókon, grafikonokon, mémeken és más vizuális termékeken látható információkkal is képes dolgozni a modell. 

A kutatók bejegyzése szerint a GPT-4 és a többek közt a ChatGPT chatbotot hajtó GPT-3.5 közti különbség a hétköznapi beszélgetésekben is láthatóan megmutatkozik: míg az előző modellen alapuló chatbot legfeljebb 3000 szóban tud választ generálni összetett kérdésekre, a GPT-4 már akár 25 000 szavas válaszokat is készít, megértve az ok-okozati összefüggéseket. Míg a korábbi modellek kiadásakor a bejelentéssel együtt a modellarchitektúra technikai részleteit is közzétette az OpenAI, a GPT-4 esetében ezt már mellőzi a verseny- és biztonsági aggályok miatt, így kevésbé részletes publikációt osztott meg honlapján.

Sam Altman vezérigazgató arra is felhívta a figyelmet, hogy a nyelvi modellek eddigi jellegzetes nagy problémája, tehát a hallucináció, vagy a problémás hangvételű szövegek előállítása az új verzióban is jelen van. A GPT-4 tehát szintén korlátozott és nem tökéletes, de lenyűgöző eredményeket ad, az előrelépés mérhetően tetten érhető a különféle benchmarkok és tesztek révén, az OpenAI összehasonlításként közzétette például, hogy az új modell mennyire teljesített jobban elődjénél egyes szimulált iskolai vizsgákon, ami jó ideje a szövegek értelmezésére alkalmas algoritmusok egyik mércéje - középiskolai emelt statisztikában például az emberek 85 százalékánál jobban teljesített, a GPT-3.5 esetében ez az arány még 40 százalék volt.

gpt4

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A startup tájékoztatása szerint a fejlesztést a jövőben számos termékbe integrálják a partnerek, köztük a Duolingo, a Stripe és a Khan Academy szolgáltatások fejlesztőivel sikerült megállapodni. Természetesen elérhető lesz a frissített ChatGPT-ben is, de csak annak előfizetéses, havi 20 dollárba kerülő Plus csomagjában. Az API hamarosan elérhetővé válik a külső fejlesztők számára is, hogy beépíthessék alkalmazásaikba.

Az eredeti GPT-modellt leíró kutatási cikk 2018-ban jelent meg, amit egy évvel rá követett a GPT-2, majd 2020-ban a GPT-3, így viszonylag hossszabb idő kellett a GPT-4 bemutatkozásához. A vállalat eleinte tartózkodott a modell szélesebb körű megnyitásától, de 2022 végén elindította a GPT-3.5-ön alapuló ChatGPT chatbotot, amit már bárki elérhetett, ezzel rávilágítva rengeteg etikai problémára is. A GPT 4 bejelentésében az OpenAI hangsúlyozza, hogy a rendszer hat hónapos biztonsági képzésen ment keresztül, melynek eredményeként a belső tesztek szerint 82 százalékkal csökkent a valószínűsége annak, hogy nem kívánt módon reagál a kérésekre, és 40 százalékkal jobb eséllyel produkál valódi tényeket tartalmazó szövegeket elődjénél.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról