Itthon Üzleti A Google egyszerűsíti a gépi tanulást az sql használatával

A Google egyszerűsíti a gépi tanulást az sql használatával

Tartalomjegyzék:

Videó: Build SQL Database Projects Easily in Azure Data Studio | Data Exposed (November 2024)

Videó: Build SQL Database Projects Easily in Azure Data Studio | Data Exposed (November 2024)
Anonim

A Google most hozzáadta a gépi tanulási (ML) képességeket a Google BigQuery-hez, a cég petabájt (PB) méretű felhőalapú adatbázis-kínálatához. Az új verzió, amelyet BigQuery ML-nek neveznek, lehetővé teszi az egyszerű SQL (Strukturált lekérdezési nyelv) utasítások használatát az ML-modellek prediktív elemzéshez történő létrehozásához és telepítéséhez.

Ez nem csak jó hír az adattudósok számára, akik a Google-t használják. Az üzleti elemzők számára is jó az adatelemzési képességek fejlesztése iránt érdeklődő vállalkozók számára, mivel egy hatékonyabb versenytársat ad hozzá a meglehetősen kis forgalmazók listájához, amely képes a felhőn keresztül ilyen szintű kifinomultságot biztosítani. A másik két legismertebb név az Amazon Relational Database Service és a Microsoft Azure SQL, és további információkat talál a legújabb felhőalapú adatbázis-szolgáltatásunkban.

Az összes adattermék-gyártó és -vásárló akadálya mindig is a készségek hiánya volt. Különösen igaz ez az ML és a prediktív elemzés iránt érdeklődőkre, mivel ezek a tudományágak gyakran megkövetelik az új technológiák ismeretét és a nyelvek lekérdezését.

"Minden adattudós számára több száz elemző dolgozik az adatokkal és legtöbbjük SQL-t használ" - mondta Sudhir Hasbe, a Google Cloud termékmenedzsment igazgatója a PCMag-nak. Valamit meg kellett adni, ha az adatelemzők egy serege hatalmát ki kellene szüntetni a szűk keresztmetszetről, amelyet a túl kevés és túl túl dolgozó tudósok hoztak létre.

A Google válasza erre a dilemmára nem hihetetlen. Noha az ML forró tendencia, és mindenféle termékben megjelenik, ez továbbra is szilárdan adattudós terület. Számos eladó tett lépést a technológia egyszerűsítésével, de a csúnya igazság az, hogy sokat egyszerűsítheti, és az emberi lakosság több mint 99 százaléka számára még mindig túl nehéz ezt használni. Ennek ellenére képesnek kell lennünk arra, hogy az ML többet tudjon csinálni, és gyorsabban megcsinálja, mint egy szuper okos embercsoport.

A Google az ML-t a Google BigQuery-ben ülteti, hogy közelebb álljon az adatokhoz. Az alkalmazás az ML képességeit gyorsabban hozza létre, mint a hagyományos ML modellek, mivel az adatok elemzése a forráson elvégezhető. Most a bétaverzióban a BigQuery ML lehetővé teszi az elemzőknek (és adattudósoknak), hogy prediktív elemzéseket végezzenek, például előrejelzzék az eladásokat és ügyfélszegmenseket hozzanak létre közvetlenül az adatok tetején, ahol azt tárolják. Ez önmagában tiszteletreméltó és figyelemre méltó frissítés.

A Google azonban tovább haladt egy olyan képesség hozzáadásával, amely lehetővé teszi az adatelemzők számára, hogy egyszerű SQL utasításokat használhassanak az ML modellek felépítéséhez és telepítéséhez. Jelenleg a prediktív elemzéshez a lineáris regresszió és a logisztikus regressziós modellek állnak rendelkezésre, mivel ezek a két leggyakrabban használt modell.

Íme egy példa, amelyet a Google nyújtott be annak bemutatására, hogy az elemzők hogyan használnák ezt a képességet:

Hasbe szerint a Google azt tervezi, hogy idővel további ML-lehetőségeket fog hozzáadni ehhez a képességhez. "Meg kell hallgatnunk ügyfeleinket, hogy mely modelleket szeretnénk, hogy hozzáadunk, hogy előbb a leghasznosabb modelleket biztosítsuk" - mondta.

További Google BigQuery frissítések

Az ML után a frissítések jelentős listáján a fürtkészítési képesség, a BigQuery Geographic Information Systems (BigQuery GIS), egy új Google Sheets adatcsatlakozó és egy új Google Sheets adatcsatlakozó található.

A klaszterezés szintén bétaverziós, és lehetővé teszi fürtözött táblázatok létrehozását egy olyan adat-optimalizáló mozgalomban, amely összefűzi a sorokat hasonló fürtkulcsokkal. Ez csökkenti a költségeket, mivel javítja a teljesítményt és lehetővé teszi a Google BigQuery számára, hogy a felhasználót csak a beszkennelt adatokért számolja fel, nem pedig a teljes táblát vagy partíciót.

A BigQuery GIS jelenleg alfa formában van, és a térinformatikai adatok elemzésére használják. Miközben a Google Cloud csapata együttműködött a Google Earth Engine-lel a BigQuery GIS felépítése érdekében, a földrajzi térbeli adatait az asztalra kell hoznia. Ez nem jelent problémát számos iparágban és az egész ágazatban, beleértve a csatlakoztatott autórendszereket, a tárgyak internetét (IoT), a gyártást, a kiskereskedelmet, az intelligens városokat és a telematikát. Nem is beszélve a kormányzati ügynökségektől, a Környezetvédelmi Ügynökségtől (EPA) és a Nemzeti Földrajzi-Intelligencia Ügynökségtől a Nemzeti Óceáni és Légköri Intézetig (NOAA), és természetesen az összes katonai ágig.

A BigQuery GIS az S2 könyvtárat használja, amelynek több mint milliárd felhasználója van számos termék, például a Google Earth Engine és a Google Maps segítségével. Ha további földrajzi adatokra van szüksége, akkor a szövetségi kormány hatalmas mennyiségű adatot oszt meg a GeoPlatformon.

Egy új Google Sheets adatcsatlakozó valószínűleg sok adatanalitikusot örömmel fog megtenni, csak azért, mert ez mindennapi használatra praktikus. A Google BigQuery alkalmazáshoz hozzáférhet a Google Sheets (táblázatkezelő program) segítségével, és használhatja a Google Sheets eszközöket, például a Explore, amely kombinált együttműködés, adatmegjelenítés és természetes nyelvű lekérdező eszköz.

A Google BigQuery új felhasználói felülettel (UI) bétaverzióban is rendelkezik. Az egyik érdekesebb elem az egy kattintással történő megjelenítési funkció, amelyet a Google Data Studio támogat. Mindent összevetve, ez egy nagyszerű frissítési forduló egy már elegáns szolgáltatáshoz. Ezeket a frissítéseket a PCMag Adatbázis-szolgáltatásként (DBaaS) megoldásainak következő fordulójában tesztelik, miután a hibákat kidolgozták, és a termékek meghaladták a megfelelő alfa- és bétaállapotot.

A PCMag EIC Dan Costa az adatok jövőjét tárgyalja:
A Google egyszerűsíti a gépi tanulást az sql használatával