Véget vet a Cloudflare a zabolázatlan adatkaparásnak
Az adatkaparó robotok tevékenységét korlátozó eszközöket tesz elérhetővé ügyfelei számára a Cloudflare.
A Cloudflare jövőre egy piacteret tervez indítani, melyen keresztül a weboldalak tulajdonosai hozzáférést értékesíthetnek a különféle AI-modellek fejlesztői számára az oldalaik tartalmához. A szolgáltatás ezzel a lépéssel próbálná szelidíteni azt a jelenleg eléggé szabályozatlan helyzetet, hogy az AI-cégek botokkal kaparják össze tömegesen a neten nyíltan hozzáférhető adatokat, hogy azokat a modelljeikbe táplálják. A robotok azonban engedély vagy az alkotók ellenszolgáltatása nélkül vizsgálják át a weboldalakat.
Még a piactér elindulása előtt a Cloudflare hétfőn elérhetővé tette ügyfelei számára az ingyenes AI Audit eszközt, melyen keresztül a weboldal-tulajdonosok elemzéseket láthatnak arról, hogy a többek közt az OpenAI, a Meta és az Amazon kaparói milyen gyakran és mikor keresik fel oldalaikat.
Még fontosabb, hogy az ügyfeleknek lehetőségük lesz egy gombnyomással blokkolni az adatkaparó AI-botokat az AI Audit segítségével, de megadhatnak bizonyos kivételeket, ha saját belátásuk szerint engedélyeznék a tevékenységet, vagy akár üzleti megállapodást köthetnek később az adatok felhasználásáról.
Kollektív sárfürdő egy kiszivárgott fejvadász db-ben Tanmese egy Temuról rendelt fejvadász cégről és a hazai IT morális talapzatról lelépő, elit öngyilkos alakulatáról.
A hálózati szolgáltatási nagyvállalat ezzel a lépéssel jobban beleáll abba a generatív AI berobbanásával felmerült problémába, hogy a kisebb kiadókat hátrányba hozza, ha az internetezők a ChatGPT-n keresztül kapják meg készen az őket érdeklő információkat ahelyett, hogy a releváns weboldalakat látogatnák meg.
Ugyan az elmúlt évben már több kiadónak sikerült partnerséget kötnie az OpenAI-jal tartalomlicencekkel kapcsolatban, a legtöbb weboldal, főleg a kisebb szereplők számára ez nem feltétlen elérhető opció, miközben tartalmaikat napi rendszerességgel pásztázzák át az AI-modellekhez adatokat harácsoló robotok.
Önmagukban nem magukkal a robotokkal van gond – hiszen a keresőmotorokban is így tudnak megjelenni az oldalak a tartalom indexelésével, de az AI-érában nagy kihívást jelent a csak bizonyos tevékenységet végző botok kiszűrése. A nagy nyelvi modellek fejlesztését támogató botok lekaparják a nyilvánosan elérhető adatokat a modellek betanításához anélkül, hogy feltüntenék a forrásokat, és nem fizetnek ellenszolgáltatást sem az alkotóknak. Ez oda vezethet, hogy az alkotók a szellemi termékeiket, vagy ahhoz nagyon hasonló eredményeket láthatnak viszont az AI által generált válaszokban.