Szerzői jogok megsértésének vádjával perli a The New York Times Company birtokában lévő The New York Times kiadó az OpenAI-t és befektetőjét, a Microsoftot, mivel a médiaóriás szerint a cég mesterségesintelligencia-modelljeinek képzéséhez jogtalanul használta fel a lap tulajdonában álló újságcikkeket.

A manhattani szövetségi körzeti bíróságnak benyújtott perdokumentumok szerint az OpenAI cikkek millióit használhatta fel jogtalanul a ChatGPT és a Microsoft Copilot szolgáltatások alatt dolgozó modellek betanítására a lap hozzájárulása nélkül, így The Times arra szólította fel az OpenAI-t, hogy távolítsa el a jogsértő anyagokból származó képzési adatokat, emellett nem számszerűsített kártérítésre fejezte ki igényét a „több milliárd dolláros” kárért. Ráadásul ha ez nem lenne elég, a generatív AI így most olyan cikkeket képes gyártani, melyek "közvetlen versenyhelyzetet" teremtenek a kiadóvállalat tartalmaival.

A pert szakértők máris történelmi jelentőségűnek nevezték, legalábbis abban az értelemben mindenképpen, hogy a New York Times az első nagy amerikai lapkiadó, mely a generatív nyelvi modelleket használó mesterséges intelligenciákat üzemeltető amerikai vállalatokat perbe fogta.

A generatív nagy nyelvi modellek (LLM) betanításához fejlesztőik többek közt az interneten nyilvánosan elérhető szövegeket, esszéket, kódokat, cikkeket használják fel a képzési adatkészletek kiegészítéséhez. Nehézséget okoz viszont, hogy az adatok közé ne kerüljenek be a licencek hatálya, vagy szerzői jogvédelem alá tartozó tartalmak. Már több hírügynökség is használ kódot azon célból, hogy megakadályozza az OpenAI-t, a Google-t és más fejlesztőket abban, hogy a webhelyeikről képzési adatokat kaparjanak le.

A beadvány szerint különösen aggasztó, hogy az OpenAI és a Microsoft rendszerei képesek a Times cikkeit szemlézni, azokat összefoglalni illetve az újság, illetve azok újságíróinak stílusát utánozni, ami a fenti aggályok mellett rombolja a lap és az olvasók kapcsolatát, illetve veszélyezteti a kiadóvállalat bevételforrásait is. A lap megítélésének is árthat a modellek használata során előforduló hallucináció: a dokumentum konkrét példákat hoz arra, amikor a Copilot helytelenül állította több felhasználói kérdésre adott válaszaiban, hogy bizonyos információk (tévesen) a The Times-tól származnak. Egy másik aggály, hogy az OpenAI és a Microsoft árt a hírpiaci versenynek, mivel olyan információkat adhat ki, amelyekhez előfizetés nélkül általában nem férne hozzá - az OpenAI legalább egy alkalommal véletlenül lehetővé tette a ChatGPT-felhasználók számára, hogy megkerüljék a fizetős hírtartalmakat.

A New York Times ugyan engedi, hogy a keresőmotorok elérjék és indexeljék a tartalmait, de arra nem ad engedélyt, hogy más célokból is felhasználhatóak legyenek, például generatív modellek képzésére, a médiavállalat szerint erre vonatkozóan egy külön megállapodást kellett volna kötni, de a két cég közt zajló egyeztetések ezzel kapcsolatban eddig nem hoztak sikert.

A jogi eljárás megindítását mindkét fél szerint egy hosszú hónapokig tartó egyeztetési folyamat előzte meg, ám a felek végül nem jutottak megállapodásra az alapvető kérdésekben. Az OpenAI a bedvány kézhez vételét követően a sajtónak azt nyilatkozta, hogy a céget konstruktív tárgyalásokat folytatott a kiadóval, éppen ezért meglepő, hogy a New York Times jogászai végül a bíróság elé vitték az ügyet. A most indított per kimenetele a későbbiekben precedens értékű lehet, hiszen meghatározhatja a többi kiadó és a sajtótermék, valamint a nagy nyelvi modellek fejlesztőinek viszonyát.