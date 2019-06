Kaggle integrációt kap a BigQuery, a Google Cloud nagyvállalati felhős adattára. A 2010-ben elindult, a Google által pedig 2017-ben bekebelezett Kaggle köré épül fel a legnagyobb online adattudós-közösség, az a Google szerint mintegy 3 millió felhasználót számlál. A keresőóriás blogposztban számolt be az összeborulásról, amellyel a BigQuery felhasználói számára tenné lehetővé többek között gyors SQL lekérdezések futtatását, gépi tanulási modellek SQL-ben történő betanítását, illetve elemzését.

Mindez a Kaggle Kernels néven ismert, ingyenes, hosted Jupyter notebook környezetével lehetséges, amellyel már nem kell külön mozgatni, vagy letölteni a BigQueryben tárolt, jellemzően tetemes adatmennyiségeket a gépi tanulási feladatokhoz. Amennyiben a felhasználó Google Cloud fiókját összekapcsolja egy adott Kernels notebookkal vagy scripttel, a kívánt lekérdezések már magában a notebookban létrehozhatók a BigQuery API Client libraryval, és futtathatók a BigQueryvel, szinte bármilyen elemzést lehetővé téve.

Persze az integrációból nem csak a Kaggle, de a Bigquery felhasználói is profitálhatnak, hiszen ők a Kaggle Kernelsszel egy népszerű IDE-t kapnak, amellyel a lekérdezési és elemzési feladatok egy helyen végezhetők el, egységesítve a munkamenetet, és egy sor exportálási-importálási feladatot megspórolva a felhasználóknak.

Ezeken túl az összefonódás ugyancsak fontos előnye, hogy a BigQuery felhasználók hozzáférést kapnak a Kaggle méretes nyílt forrású közösségéhez, amely felé egyszerűen közzétehetik Kernels notebookjaikat, illetve mások munkáját is tanulmányozhatják. A Google Cloud felhasználóknak BigQuery és Kaggle fiókra is szükségük lesz az összekapcsolt szolgáltatások használatához. A vállalat Kaggle gyorstalpalóját is frissítette egy SQL kurzussal, amely az SQL haszánlatát mutatja be a BigQueryben.