Szerző: Hlács Ferenc

2019. július 24. 13:45

Az adathalmazokkal való kollaborációnak adna hátszelet a Microsoft

A nyilvános és a két fél közötti, bizalmas adatmegosztást is lehetővé teszik a vállalat által felvázolt egyezmények.

Előre elkészített adatmegosztási megállapodásokkal igyekszik a Microsoft egyszerűbbé tenni az adathalmazok megosztását különböző szervezetek, vállalatok vagy magánszemélyek között. Mint azt Erich Andersen, a redmondi óriás vezető IP-jogásza LinkedIn posztjában leírja, rengeteg szervezet szeretne együtt dolgozni megosztott adathalmazokon, ugyanakkor a hasonló kezdeményezéseket sokszor feltartják, vagy akár meg is hiúsítják a felmerülő logisztikai, illetve jogi nehézségek. Andersen szerint a vállalat célja, hogy szervezetek, de akár magánszemélyek is egyszerűbben tudják megosztani összegyűjtött adathalmazaikat. Jelenleg még azon cégek esetében is, akik nagyon is nyitottak hasonló együttműködésekre, az adatmegosztási folyamat fölöslegesen hosszú és összetett.

A vállalat ezért mindjárt három megállapodástípust is létrehozott a hatékonyabb adatmegosztás elősegítésére. Az első ilyen az "Open Use of Data Agreement", röviden O-UDA címet viseli, célja pedig a különböző adathalmazok nyilvános hozzáférhetőségének elősegítése. Az O-UDA-t a Microsoft olyan személyeknek vagy szervezeteknek szánja, akik maguk birtokolják az adott adathalmazt, vagy az annak korlátlan megosztására vonatkozó jogokat. Az egyezmény a szabad felhasználást lehetővé tevő megosztásra vonatkozik, amelynél nincs szó érzékeny vállalati vagy személyes adatokról.

msdatashr

A "Computational Use of Data Agreement" vagy C-UDA olyan adathalmazok megosztására vonatkozik, amelyekben a megosztó személy vagy szervezet saját tartalmain kívül nyilvánosan elérhető forrásokból származó, törvényesen, szabadon megosztható adatok is lehetnek. Az egyezmény az adathalmazok használatát "számítási célokra" teszi lehetővé, például adatelemzési vagy gépi tanulási folyamatokhoz. Fontos feltétel, hogy a C-UDA esetében az O-UDA-hoz hasonlóan a megosztott adathalmazokban nem lehetnek személyes vagy egyéb bizalmas adatok.

Égbe révedő informatikusok: az Időkép-sztori

Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

Égbe révedő informatikusok: az Időkép-sztori Mi fán terem az előrejelzés, hogy milyen infrastruktúra dolgozik az Időkép alatt, mi várható a deep learning modellek térnyerésével?

A harmadik egyezmény a "Data Use Agreement for Open AI Model Development" vagy DUA-OAI, címéből sejthető módon a különböző gépi tanulási modellek betanítását célzó adatok megosztására irányul. Lényeges különbség a fenti két megállapodással szemben, hogy míg azok egy féltől lényegében korlátlan számú partner felé irányulhatnak, addig a DUA-OAI szigorúan az adatok két fél közötti megosztását célozza. Az egyezmény értelmében tehát egyik szervezet a saját birtokában lévő adathalmazokat osztja meg egy másik szervezettel, hogy az az információk felhasználásával saját gépi tanulási modelljeit betaníthassa - amely modellt aztán nyílt forrású projektként elérhetővé teszi. Miután nem nyilvános adatmegosztásról van szó, a DUA-OAI már érzékenyebb adatok használatának is utat engedhet.

A vállalat reményei szerint a jelenlegi megállapodási formáknál lényegesen egyszerűbb tervezetei lökést adnak majd az adathalmazok megosztásának a hasonló területen dolgozó vállalatok között. A Microsoft folyamatosan várja a visszajelzéseket a három egyezmény kapcsán, amelyek alapján aztán tovább csiszolhatja a tervezeteket.

Nagyon széles az a skála, amin az állásinterjú visszajelzések tartalmi minősége mozog: túl rövid, túl hosszú, semmitmondó, értelmetlen vagy semmi. A friss heti kraftie hírlevélben ezt jártuk körül. Ha tetszett a cikk, iratkozz fel, és minden héten elküldjük emailben a legfrissebbet!

a címlapról