Szerző: Dömös Zsuzsanna

2024. május 9. 14:00

A Stack Overflow adataival okosodik a ChatGPT

A Google után a másik legmeghatározóbb piaci szereplővel is együttműködést írt alá a világ legnagyobb fejlesztői közösségi platformja.

A legnépszerűbb fejlesztői online közösség, a Stack Overflow márciusban jelentette be, hogy az Overflow API-n keresztül teszi nyitottá a tudásbázisához való hozzáférést a nagy nyelvi modellek (LLM) fejlesztésével foglalkozó cégek számára. A platform első partnereként a Google-t nevezte meg, ami az adatokat a Gemini for Google Cloud szolgáltatás finomításához fogja felhasználni, így a Gemini a Stack Overflowtól származó javaslatokkal, kódokkal és válaszokkal bővül. A felek akkor nem közölték a partnerség pénzügyi részleteit, ami egyébként nem kizárólagos, tehát más LLM-fejlesztők is hozzáférhetnek az API-hoz.

Május elején érkezett a második bejelentés: az OpenAI pár napja közölte, hogy szintén felhasználja a fejlesztői platform értékes adatait a ChatGPT-hez, külön forrásmegjelöléssel ellátva a platformról származó kódolási javaslatokat. Az API-n keresztül ez több mint 58 millió kérdést és választ jelent, több millió felhasználói megjegyzéssel és a bejegyzés metaadataival, ezen felül szavazatokat és szerkesztéseket tartalmaz. Az OpenAI közleményében úgy fogalmaz, hogy a lépés erősítheti a felhasználók elköteleződését a ChatGPT irányába, ami láthatóan igyekszik erősíteni pozícióját a piacon már jelenlévő különféle kódolóasszisztensekkel szemben a specializáltabb adatforrással.

stack_ai

Mindent vivő munkahelyek

Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Mindent vivő munkahelyek Mindig voltak olyan informatikai munkahelyek, melyek nagyon jól fekszenek az önéletrajzban.

Az együttműködés kétirányú, így a Stack Overflow a partner nagy nyelvi modelljeit használhatja fel a tavaly bejelentett generatív AI alkalmazása, az Overflow AI finomításához. Az integráció első eredményeit az év első felében teszi hozzáférhetővé a cég belsős tesztek után, de azt még nem tudni, hogy ez milyen funkciókat jelent majd.

Zavaros idők


A bejelentés után tiltakozási hullám indult a közösségen belül, a felhasználók tömegesen kezdték el törölni kérdéseiket és válaszaikat az ellenérzésük demonstrálásáként, vagy azok helyére az együttműködést kritizáló sablonszöveget illesztettek. A fő kritika, hogy a platform kvázi nyerészkedik a közösség által ingyen előállított tartalmakon. Az akció láthatóan nem hatotta meg a Stack Overflow üzemeltetőit, akik átmenetileg tiltást nyomtak a lázadókra, azzal az indoklással, hogy a posztok átszerkesztésével súlyosan megsértették a közösség érdekeit, a teljes átírásra csak kivételes esetekben kerülhet sor. A Stack Overflow felhasználási szabályzata egyébként kijelenti, hogy a közzétett tartalmakat belátása szerint használhatja fel.

A Stack Overflow tavaly októberben építette le munkaerő-állománya 28 százalékát. A 2022-es év végén széles körben elérhetővé vált az egyszerűbb kódolási feladatokat elvégző ChatGPT, ezután kezdett el minden mutató egyértelmű csökkenést mutatni az oldalon, beleértve az oldalmegtekintéseket, látogatásokat, a feltett kérdések és szavazatok számát. 

Míg a járvány és a vele járó leállások nem veszélyeztették különösebben a Stack Overflow üzleti modelljét, a kódoló asszisztensek, így a Copilot, a Cody, illetve a kódokat generáló ChatGPT, illetve ezen termékek sorra érkező alternatívái egy új helyzetet teremtettek, mivel a kevésbé bonyolult feladatok elvégzéséhez hatékony eszköznek bizonyulnak, így kevesebb fejlesztő fordul rögtön a keresőkhöz, vagy a Stack Overflow közösségéhez egy problémával.

A platform versenyelőnnyé kovácsolható értéke, hogy a világ leggazdagabb, programozók által feltett kérdésekkel és megoldásokkal teli adatbázisát birtokolja. A partnerség fordulatot is jelent a Stack Overflow egy évvel korábbi hozzáállásához képest, miután egy ideig átmenetileg korlátozni kezdték a moderátorok a robotok által generált válaszokat.

Az értékes adathalmazokon ülő online szolgáltatások tehát hamar felismerték a generatív AI adatéhségének lehetőségeit, a Reddit februárban jelentette be, hogy 60 millió dolláros üzletet kötött a Google-lel, melynek keretén belül a közösségi platform felületén megjelenő felhasználói beszélgetések a keresőcég MI-modelljeinek fejlesztéséhez használhatók fel, a megállapodás egy éves időtartamot fed le. De nem a Reddit az egyetlen cég, mely próbál üzletet csinálni a birtokában lévő adatok betanítási célzatú értékesítésével, az irányvonal vonzó a hírügynökségek számára is: az OpenAI nemrég licencszerződéseket kötött az Associated Press-szel és az Axel Springerrel, nemrég a Financial Times-szal, hogy a médiaorgánumok cikkeit képzésre használhassa fel.

Asszisztensek előre!


A platform tavaly júniusban közzétett éves jelentése első alkalommal tartalmazta az idő közben nagy teret nyert nyelvi modellekre építő kódolóasszisztensekre vonatkozó kérdéseket is. A jelentés szerint egyre elfogadottabbá válik az iparban, hogy a fejlesztők MI-eszközöket használnak a munkájuk során, holott a kóderek jelentős része szkeptikus az előállított kódok pontosságát és minőségét illetően. A válaszadók 77 százaléka pozitívan áll a mesterséges intelligencia alkalmazásához a munkafolyamatok során, 70 százalékuk már használt idén, vagy tervez használni a jövőben a kódolást segítő eszközöket. Az MI-alapú kisegítő eszközök előnyei közt főleg a produktivitás javítását (33%) és a gyorsabb tanulást (25%) említette a többség.

Bizalom terén viszont van még mit javulni: mindössze 3 százalék bizalmi szintje magas az ilyen eszközök iránt, 39 százalék „valamelyest bízik”. További 31 százalék bizonytalan volt a kérdésben, a többiek kissé bizalmatlan (22 százalék) vagy erősen bizalmatlanként (5 százalék) jellemezték magukat. A legnépszerűbb fejlesztői eszköz a GitHub Copilot, a válaszadók 55 százaléka használja, ezt követi a Tabnine (13 százalék) és az AWS CodeWhisperer (5 százalék). 

Az IT szakma egyik fele csak legyint az AI betörésére, vagy még az érdemi kipróbálásig sem jutott el, a másik felének már-már egzisztenciális szorongása van. Amíg tavaly a programozást segítő asszisztenseknek volt reneszánszuk, addig idén nagyon úgy fest, az AI programozók vannak soron, hiszen az első AI programozó, Devin bejelentése után már látszanak a követők is. 

Az AI toolokat aktívan használó fejlesztőkkel HWSW Kraftie podcastünk korábbi adásában is beszélgettünk a tapasztalataikról, a Stack Overflow haldoklásáról, illetve  mindezeknek a munkaerőpiacra gyakorolt hatásáról.

Kubernetes képzéseinket már közel 300 szakember végezte el. A nagy sikerre való tekintettel a tanfolyamot aktualizált tananyaggal június 18-án újra elindítjuk! A 8 alkalmas, élő képzés képzés órái utólag is visszanézhetők, és munkaidő végén kezdődnek.

a címlapról