A legnépszerűbb fejlesztői online közösség, a Stack Overflow márciusban jelentette be, hogy az Overflow API-n keresztül teszi nyitottá a tudásbázisához való hozzáférést a nagy nyelvi modellek (LLM) fejlesztésével foglalkozó cégek számára. A platform első partnereként a Google-t nevezte meg, ami az adatokat a Gemini for Google Cloud szolgáltatás finomításához fogja felhasználni, így a Gemini a Stack Overflowtól származó javaslatokkal, kódokkal és válaszokkal bővül. A felek akkor nem közölték a partnerség pénzügyi részleteit, ami egyébként nem kizárólagos, tehát más LLM-fejlesztők is hozzáférhetnek az API-hoz.

Május elején érkezett a második bejelentés: az OpenAI pár napja közölte, hogy szintén felhasználja a fejlesztői platform értékes adatait a ChatGPT-hez, külön forrásmegjelöléssel ellátva a platformról származó kódolási javaslatokat. Az API-n keresztül ez több mint 58 millió kérdést és választ jelent, több millió felhasználói megjegyzéssel és a bejegyzés metaadataival, ezen felül szavazatokat és szerkesztéseket tartalmaz. Az OpenAI közleményében úgy fogalmaz, hogy a lépés erősítheti a felhasználók elköteleződését a ChatGPT irányába, ami láthatóan igyekszik erősíteni pozícióját a piacon már jelenlévő különféle kódolóasszisztensekkel szemben a specializáltabb adatforrással.

Az együttműködés kétirányú, így a Stack Overflow a partner nagy nyelvi modelljeit használhatja fel a tavaly bejelentett generatív AI alkalmazása, az Overflow AI finomításához. Az integráció első eredményeit az év első felében teszi hozzáférhetővé a cég belsős tesztek után, de azt még nem tudni, hogy ez milyen funkciókat jelent majd.

Zavaros idők

A bejelentés után tiltakozási hullám indult a cégen belül, a felhasználók tömegesen kezdték el törölni kérdéseiket és válaszaikat az ellenérzésük demonstrálásáként, vagy azok helyére az együttműködést kritizáló sablonszöveget illesztettek. A fő kritika, hogy a platform kvázi nyerészkedik a közösség által ingyen előállított tartalmakon. Az akció láthatóan nem hatotta meg a Stack Overflow üzemeltetőit, akik átmenetileg tiltást nyomtak a lázadókra, azzal az indoklással, hogy a posztok átszerkesztésével súlyosan megsértették a közösség érdekeit, a teljes átírásra csak kivételes esetekben kerülhet sor. A Stack Overflow felhasználási szabályzata egyébként kijelenti, hogy a közzétett tartalmakat belátása szerint használhatja fel.

A Stack Overflow tavaly októberben építette le munkaerő-állománya 28 százalékát. A 2022-es év végén széles körben elérhetővé vált az egyszerűbb kódolási feladatokat elvégző ChatGPT, ezután kezdett el minden mutató egyértelmű csökkenést mutatni az oldalon, beleértve az oldalmegtekintéseket, látogatásokat, a feltett kérdések és szavazatok számát.

Míg a járvány és a vele járó leállások nem veszélyeztették különösebben a Stack Overflow üzleti modelljét, a kódoló asszisztensek, így a Copilot, a Cody, illetve a kódokat generáló ChatGPT, illetve ezen termékek sorra érkező alternatívái egy új helyzetet teremtettek, mivel a kevésbé bonyolult feladatok elvégzéséhez hatékony eszköznek bizonyulnak, így kevesebb fejlesztő fordul rögtön a keresőkhöz, vagy a Stack Overflow közösségéhez egy problémával.

A platform versenyelőnnyé kovácsolható értéke, hogy a világ leggazdagabb, programozók által feltett kérdésekkel és megoldásokkal teli adatbázisát birtokolja. A partnerség fordulatot is jelent a Stack Overflow egy évvel korábbi hozzáállásához képest, miután egy ideig átmenetileg korlátozni kezdték a moderátorok a robotok által generált válaszokat.

Az értékes adathalmazokon ülő online szolgáltatások tehát hamar felismerték a generatív AI adatéhségének lehetőségeit, a Reddit februárban jelentette be, hogy 60 millió dolláros üzletet kötött a Google-lel, melynek keretén belül a közösségi platform felületén megjelenő felhasználói beszélgetések a keresőcég MI-modelljeinek fejlesztéséhez használhatók fel, a megállapodás egy éves időtartamot fed le. De nem a Reddit az egyetlen cég, mely próbál üzletet csinálni a birtokában lévő adatok betanítási célzatú értékesítésével, az irányvonal vonzó a hírügynökségek számára is: az OpenAI nemrég licencszerződéseket kötött az Associated Press-szel és az Axel Springerrel, nemrég a Financial Times-szal, hogy a médiaorgánumok cikkeit képzésre használhassa fel.

Asszisztensek előre!

A platform tavaly júniusban közzétett éves jelentése első alkalommal tartalmazta az idő közben nagy teret nyert nyelvi modellekre építő kódolóasszisztensekre vonatkozó kérdéseket is. A jelentés szerint egyre elfogadottabbá válik az iparban, hogy a fejlesztők MI-eszközöket használnak a munkájuk során, holott a kóderek jelentős része szkeptikus az előállított kódok pontosságát és minőségét illetően. A válaszadók 77 százaléka pozitívan áll a mesterséges intelligencia alkalmazásához a munkafolyamatok során, 70 százalékuk már használt idén, vagy tervez használni a jövőben a kódolást segítő eszközöket. Az MI-alapú kisegítő eszközök előnyei közt főleg a produktivitás javítását (33%) és a gyorsabb tanulást (25%) említette a többség.

Bizalom terén viszont van még mit javulni: mindössze 3 százalék bizalmi szintje magas az ilyen eszközök iránt, 39 százalék „valamelyest bízik”. További 31 százalék bizonytalan volt a kérdésben, a többiek kissé bizalmatlan (22 százalék) vagy erősen bizalmatlanként (5 százalék) jellemezték magukat. A legnépszerűbb fejlesztői eszköz a GitHub Copilot, a válaszadók 55 százaléka használja, ezt követi a Tabnine (13 százalék) és az AWS CodeWhisperer (5 százalék).

Az IT szakma egyik fele csak legyint az AI betörésére, vagy még az érdemi kipróbálásig sem jutott el, a másik felének már-már egzisztenciális szorongása van. Amíg tavaly a programozást segítő asszisztenseknek volt reneszánszuk, addig idén nagyon úgy fest, az AI programozók vannak soron, hiszen az első AI programozó, Devin bejelentése után már látszanak a követők is.

Az AI toolokat aktívan használó fejlesztőkkel HWSW Kraftie podcastünk korábbi adásában is beszélgettünk a tapasztalataikról, a Stack Overflow haldoklásáról, illetve mindezeknek a munkaerőpiacra gyakorolt hatásáról.