Szerző: Hlács Ferenc

2016. február 19. 11:30:00

Nyílt bétában a Google Cloud Vision API-ja

Bárki használatba veheti a Google Photos mögött is dolgozó fejlett képfelismerő megoldást. A Google lezárta a Cloud Vision API zárt bétatesztjét, a fejlesztői interfész továbbra is béta státuszban már szabadon igénybe vehető

Megnyitja fejlett képfelismerő API-ját a Google az érdeklődő fejlesztők előtt. A vállalat blogbejegyzésben jelentette be, hogy az egyelőre béta címke alatt elérhető Google Cloud Vision API-val mostantól bárki kiaknázhatja a Photos online képtárhely impresszív keresője alatt is dolgozó technológiát. A vállalat először tavaly december elején tette elérhetővé a megoldást néhány kiválasztott partner számára, akik a cég szerint már sok millió képnél bevetették azt. A szoftver az elmúlt hónapokban ezen fejlesztők visszajelzései alapján csiszolódott publikus bétáig.

A Cloud Vision API a vele "megetetett" képeken számos objektum felismerésére képes, mindennapi tárgyak széles skálájától a földrajzi helyeken át, egészen az emberi arcokig. Utóbbiakon a különböző érzelmeket is meg tudja különböztetni, mint az öröm, harag vagy szomorúság. Az API emellett OCR (Optical Character Recognition) képességeket is kapott, így segítségével a szöveges tartalmak is kibányászhatók az egyes fotókból, leolvashatók vele például az utcatáblák vagy egyéb feliratok. A szoftver számos nyelvvel megbirkózik.

2:09
 

What is Cloud Vision API?

Még több videó

Python everywhere! Gyere Pythonozni a HWSW rendezvényeire! Megmutatjuk, hogy a Python nem csak a fejlesztők nyelve, hiszen egyszerűsége miatt bárhol és bárki használhatja.

A szöveges tartalmakon túl a megoldás a különböző vállalati logókat is kiszúrja a képeken, sőt, segítségével biztonságos képkeresési megoldások is létrehozhatók, amelyek a találatok közül adott kritériumok alapján kiszűrik a nem megfelelőnek ítélt - például korhatáros - képeket. Az API-ra mindezek mellett a kép számos általánosabb tulajdonságának elemzése is rábízható, például a fotón domináns színek meghatározása.

Az API egyes funkcióit a Google használatalapú modellben teszi elérhetővé, így ha egy projekthez csak az OCR-re van szükség, a többi képesség értelemszerűen kimarad a csomagból. A fejlesztők havi legfeljebb ezer kép erejéig a teljes Cloud Visiont ingyenesen használhatják, fölötte a Google három árkategóriába rendezte a különböző funkciókat.

Az említett OCR esetében például ezer darab elemzett képenként 2,5 dollárt kér, ha az egy hónap alatt vizsgált képek száma nem haladja meg az egymilliót. Ugyanakkor ha ez a szám ötmillióig hízik, az egységár 2 dollárra csökken, ha pedig az ötmilliót is meghaladja, 60 centre. A béta időszak alatt a Google legfeljebb havi húszmillió kép elemzését teszi lehetővé. A fenti korlát, illetve a béta státusz miatt a cég érthető módon egyelőre nem javasolja, hogy a Cloud Vision API-t bárki kritikus fontosságú feladatokhoz vesse be.

a címlapról

Hirdetés

Python everywhere!

2020. február 21. 02:15

Gyere Pythonozni a HWSW rendezvényeire! Megmutatjuk, hogy a Python nem csak a fejlesztők nyelve, hiszen egyszerűsége miatt előszeretettel használják az üzemeltetők és DevOps szakemberek, tesztelők, illetve az adattudósok is, és elfut szinte bárhol, a mikrovezérlőktől egészen a böngészőkig.