Mellékleteink: HUP | Gamekapocs
Keres
Reagáltunk az igényekre: 40 órás Java képzést indítunk haladóknak szeptember 13-án!

Nyílt bétában a Google Cloud Vision API-ja

Hlács Ferenc, 2016. február 19. 11:30

Bárki használatba veheti a Google Photos mögött is dolgozó fejlett képfelismerő megoldást. A Google lezárta a Cloud Vision API zárt bétatesztjét, a fejlesztői interfész továbbra is béta státuszban már szabadon igénybe vehető

Megnyitja fejlett képfelismerő API-ját a Google az érdeklődő fejlesztők előtt. A vállalat blogbejegyzésben jelentette be, hogy az egyelőre béta címke alatt elérhető Google Cloud Vision API-val mostantól bárki kiaknázhatja a Photos online képtárhely impresszív keresője alatt is dolgozó technológiát. A vállalat először tavaly december elején tette elérhetővé a megoldást néhány kiválasztott partner számára, akik a cég szerint már sok millió képnél bevetették azt. A szoftver az elmúlt hónapokban ezen fejlesztők visszajelzései alapján csiszolódott publikus bétáig.

A Cloud Vision API a vele "megetetett" képeken számos objektum felismerésére képes, mindennapi tárgyak széles skálájától a földrajzi helyeken át, egészen az emberi arcokig. Utóbbiakon a különböző érzelmeket is meg tudja különböztetni, mint az öröm, harag vagy szomorúság. Az API emellett OCR (Optical Character Recognition) képességeket is kapott, így segítségével a szöveges tartalmak is kibányászhatók az egyes fotókból, leolvashatók vele például az utcatáblák vagy egyéb feliratok. A szoftver számos nyelvvel megbirkózik.

A szöveges tartalmakon túl a megoldás a különböző vállalati logókat is kiszúrja a képeken, sőt, segítségével biztonságos képkeresési megoldások is létrehozhatók, amelyek a találatok közül adott kritériumok alapján kiszűrik a nem megfelelőnek ítélt - például korhatáros - képeket. Az API-ra mindezek mellett a kép számos általánosabb tulajdonságának elemzése is rábízható, például a fotón domináns színek meghatározása.

Az API egyes funkcióit a Google használatalapú modellben teszi elérhetővé, így ha egy projekthez csak az OCR-re van szükség, a többi képesség értelemszerűen kimarad a csomagból. A fejlesztők havi legfeljebb ezer kép erejéig a teljes Cloud Visiont ingyenesen használhatják, fölötte a Google három árkategóriába rendezte a különböző funkciókat.

Az említett OCR esetében például ezer darab elemzett képenként 2,5 dollárt kér, ha az egy hónap alatt vizsgált képek száma nem haladja meg az egymilliót. Ugyanakkor ha ez a szám ötmillióig hízik, az egységár 2 dollárra csökken, ha pedig az ötmilliót is meghaladja, 60 centre. A béta időszak alatt a Google legfeljebb havi húszmillió kép elemzését teszi lehetővé. A fenti korlát, illetve a béta státusz miatt a cég érthető módon egyelőre nem javasolja, hogy a Cloud Vision API-t bárki kritikus fontosságú feladatokhoz vesse be.

Mit gondolsz? Mondd el!

Adatvédelmi okokból az adott hír megosztása előtt mindig aktiválnod kell a gombot! Ezzel a megoldással harmadik fél nem tudja nyomon követni a tevékenységedet a HWSW-n, ez pedig közös érdekünk.
Tudod mennyit keres egy jó Java-fejlesztő? Tudod mennyi nyitott pozíció van csak itthon? A kereslet nagy, a kínálat kicsi. Reagáltunk az igényekre.