:

Szerző: Dömös Zsuzsanna

2024. szeptember 25. 13:45

Véget vet a Cloudflare a zabolázatlan adatkaparásnak

Az adatkaparó robotok tevékenységét korlátozó eszközöket tesz elérhetővé ügyfelei számára a Cloudflare.

A Cloudflare jövőre egy piacteret tervez indítani, melyen keresztül a weboldalak tulajdonosai hozzáférést értékesíthetnek a különféle AI-modellek fejlesztői számára az oldalaik tartalmához. A szolgáltatás ezzel a lépéssel próbálná szelidíteni azt a jelenleg eléggé szabályozatlan helyzetet, hogy az AI-cégek botokkal kaparják össze tömegesen a neten nyíltan hozzáférhető adatokat, hogy azokat a modelljeikbe táplálják. A robotok azonban engedély vagy az alkotók ellenszolgáltatása nélkül vizsgálják át a weboldalakat.

Még a piactér elindulása előtt a Cloudflare hétfőn elérhetővé tette ügyfelei számára az ingyenes AI Audit eszközt, melyen keresztül a weboldal-tulajdonosok elemzéseket láthatnak arról, hogy a többek közt az OpenAI, a Meta és az Amazon kaparói milyen gyakran és mikor keresik fel oldalaikat.

Még fontosabb, hogy az ügyfeleknek lehetőségük lesz egy gombnyomással blokkolni az adatkaparó AI-botokat az AI Audit segítségével, de megadhatnak bizonyos kivételeket, ha saját belátásuk szerint engedélyeznék a tevékenységet, vagy akár üzleti megállapodást köthetnek később az adatok felhasználásáról.

clodflare

Kafka és CI/CD alapozó online képzéseket indít a HWSW!

Ősszel 6 alkalmas, 18 órás Kafka és CI/CD alapozó képzéseket indít a HWSW. Most early bird kedvezménnyel jelentkezhetsz!

Kafka és CI/CD alapozó online képzéseket indít a HWSW! Ősszel 6 alkalmas, 18 órás Kafka és CI/CD alapozó képzéseket indít a HWSW. Most early bird kedvezménnyel jelentkezhetsz!

A hálózati szolgáltatási nagyvállalat ezzel a lépéssel jobban beleáll abba a generatív AI berobbanásával felmerült problémába, hogy a kisebb kiadókat hátrányba hozza, ha az internetezők a ChatGPT-n keresztül kapják meg készen az őket érdeklő információkat ahelyett, hogy a releváns weboldalakat látogatnák meg. 

Ugyan az elmúlt évben már több kiadónak sikerült partnerséget kötnie az OpenAI-jal tartalomlicencekkel kapcsolatban, a legtöbb weboldal, főleg a kisebb szereplők számára ez nem feltétlen elérhető opció, miközben tartalmaikat napi rendszerességgel pásztázzák át az AI-modellekhez adatokat harácsoló robotok.

Önmagukban nem magukkal a robotokkal van gond – hiszen a keresőmotorokban is így tudnak megjelenni az oldalak a tartalom indexelésével, de az AI-érában nagy kihívást jelent a csak bizonyos tevékenységet végző botok kiszűrése. A nagy nyelvi modellek fejlesztését támogató botok lekaparják a nyilvánosan elérhető adatokat a modellek betanításához anélkül, hogy feltüntenék a forrásokat, és nem fizetnek ellenszolgáltatást sem az alkotóknak. Ez oda vezethet, hogy az alkotók a szellemi termékeiket, vagy ahhoz nagyon hasonló eredményeket láthatnak viszont az AI által generált válaszokban.

Áprilisi, minden munkavállaló számára kötelező, laza jogi hallgatmányunk után itt a második, befejező rész. Nem kell megijedni, informatív és hasznos lesz ez is! Ennyi a minimum, amit munkavállalóként illik tudnod.

a címlapról