Szerző: Dömös Zsuzsanna

2024. március 1. 12:30

A Stack Overflow adataival okosodik a Google Gemini

A népszerű közösségi fejlesztői tudásbázis új API-ja hozzáférést ad az MI-modellek fejlesztői számára.

A nemrég bejelentett, egyelőre aktívan fejlesztés alatt álló Overflow API-n keresztül teszi nyitottá a tudásbázisához való hozzáférést a legnépszerűbb fejlesztői online közösség, a Stack Overflow a nagy nyelvi modellek (LLM) fejlesztésével foglalkozó cégek számára. A platform első partnere ebben a Google, ami a Stack Overflow adatait a Gemini for Google Cloud szolgáltatás finomításához fogja felhasználni, tehát a Gemini valamikor az év első felében a Stack Overflowtól származó javaslatokkal, kódokkal és válaszokkal bővül. Az együttműködés kétirányú, mivel a Stack Overflow adaptálja a Google Cloud egyes technológiáit és szolgáltatásait is, például a Vertex AI gépi tanulási platformot. A felek nem közölték a partnerség pénzügyi részleteit, ami egyébként nem kizárólagos, tehát később más LLM-fejlesztők is hozzáférhetnek az API-hoz.

A Google a Stack Overflow-t közvetlenül a Google Cloud Console-ba is beépíti, és lehetővé teszi a fejlesztők számára, hogy közvetlenül onnan tehessenek fel kérdéseket és kapjanak válaszokat. Az API-n keresztül ez több mint 58 millió kérdést és választ jelent, több millió felhasználói megjegyzéssel és a bejegyzés metaadataival, ezen felül szavazatokat és szerkesztéseket tartalmaz.

stack

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A Stack Overflow tavaly júliusban osztotta meg, hogy az OverflowAI kezdeményezés keretében próbál minél több MI-képességet beépíteni a Stack Overflow for Teams szolgáltatásba és a nyilvánosan elérhető platformba, az API ennek a törekvésnek a részét képezi.

A Stack Overflow tavaly októberben építette le munkaerő-állománya 28 százalékát. A 2022-es év végén széles körben elérhetővé vált az egyszerűbb kódolási feladatokat elvégző ChatGPT, ezután kezdett el minden mutató egyértelmű csökkenést mutatni az oldalon, beleértve az oldalmegtekintéseket, látogatásokat, a feltett kérdések és szavazatok számát. Míg a járvány és a vele járó leállások nem veszélyeztették különösebben a Stack Overflow üzleti modelljét, a kódoló asszisztensek, így a Copilot, a Cody, illetve a kódokat generáló ChatGPT, illetve ezen termékek sorra érkező alternatívái egy új helyzetet hoztak, mivel a kevésbé bonyolult feladatok elvégzéséhez hatékony eszköznek bizonyulnak, így kevesebb fejlesztő fordul rögtön a keresőkhöz, vagy a Stack Overflow közösségéhez egy problémával. A platform versenyelőnnyé kovácsolható értéke, hogy a világ leggazdagabb, programozók által feltett kérdésekkel és megoldásokkal teli adatbázisát birtokolja.

Az értékes adathalmazokon ülő online szolgáltatások tehát hamar felismerték a generatív AI adatéhségének lehetőségeit, a Reddit februárban jelentette be, hogy 60 millió dolláros üzletet kötött a Google-lel, melynek keretén belül a közösségi platform felületén megjelenő felhasználói beszélgetések a keresőcég MI-modelljeinek fejlesztéséhez használhatók fel, a megállapodás egy éves időtartamot fed le. De nem a Reddit az egyetlen cég, mely próbál üzletet csinálni a birtokában lévő adatok betanítási célzatú értékesítésével, az irányvonal vonzó a hírügynökségek számára is: az OpenAI nemrég licencszerződéseket kötött az Associated Press-szel és az Axel Springerrel, emellett tárgyalásokat folytat a CNN, a Fox és a Time lapokkal, hogy a médiaorgánumok cikkeit képzésre használhassa fel.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról