Itthon Vélemények Hogyan értelmezhetik a vállalkozások a nagy adatpiacot?

Hogyan értelmezhetik a vállalkozások a nagy adatpiacot?

Videó: Игорь Ашманов - аналитика Big Data. Все секреты больших данных с конференции eTarget (полное видео) (November 2024)

Videó: Игорь Ашманов - аналитика Big Data. Все секреты больших данных с конференции eTarget (полное видео) (November 2024)
Anonim

A vállalkozások nem kapnak pontot azért, hogy mennyire hatékonyan működnek infrastruktúrájuk, vagy mennyire képesek összegyűjteni az összes összegyűjtött nagy adatot. Számít az elemzés és az intelligencia minősége, amelyet az adatok termelnek.

Az elmúlt néhány évben a Hadoop az a szó, amely a leginkább megegyezik az adatok lenyelésével, feldolgozásával és átalakításával. Ez az elosztott adattárolás és -feldolgozás nyílt forráskódú kerete létrehozta saját vállalati területét és integrálta magát minden nagyobb felhőplatformhoz. A Hadoop messze nem az egyetlen Big Data technológiáról, amelyről érdemes beszélni, de ez lett az, amelyre sok más épít.

A vállalkozások számára a probléma az, hogy a Hadoop hely tele van disztribúciókkal és szerszámkészítési lehetőségekkel, és amint azt a Gartner kutatási igazgatója, Nick Heudecker kifejtette, sokuk hasonlóan néz ki. Heudecker, akinek a kutatása az információkezelésre kiterjed, beleértve a Big Data és a NoSQL tereket, elmondta, hogy ha az általános adatfeldolgozási lehetőségeket veszi figyelembe, akkor sok eladó nagyon hasonló funkciókat kínál.

A piac lebontása

Három fő, tiszta játékú Hadoop induló vállalkozás van - a Cloudera, a Hortonworks és a MapR -, és mindegyik folyamatosan növekedett 2015-ben. A Gartner szerint mindegyiknek mintegy 700 ügyfele van, 10% -ot ad vagy vesz, a globális piac 2 100–2 400 Hadoop ügyfél világszerte. Mindhárom ingyenes és vállalati szintű Hadoop disztribúciót kínál, és mindegyik jelentős nyílt forrású hozzájárulást nyújt az Apache Software Foundation (ASF) szalaghirdetése alá tartozó projektekhez.

"Adataink azt mutatják, hogy a Hadoop használatának 44% -a jelenleg nem fizetett" - mondta Heudecker. "Van egyértelmű vezető? Nem hiszem. Úgy gondolják, hogy mindannyian megragadják a piaci részesedést, mert ez egy nagyon új hely."

Az elmúlt néhány hónapban a három verseny közötti verseny nagy része az adatelemző képességek és az Apache Spark, egy nyílt forrású Big Data feldolgozó motor integrálásának kreatív módjai miatt valós idejű adatfolyamoktól a gépi tanulásig terjedő nyílt forráskódú adatfeldolgozó hajtóművei.. A MapR a közelmúltban bejelentette a MapR Streams egy "összevont adatplatform" részeként, amely integrálja a Hadoop, a Spark-alapú adatfeldolgozást és az elemzést. A Hortonworks bevezette a Hortonworks Data Platform (HDP) frissítését a memórián belüli Spark elemzéssel, és a Cloudera egy nyílt forráskódú Spark-integrációt kínál az One Platform Initiative révén, valamint a Spark tanfolyamok kínálatával.

"Nagyon sok történik az információkezelési és információs infrastruktúra terekben, és ez nem minden a Hadoop-ban" - magyarázta Heudecker. "A Spark sebesség- és memóriaközpontú adatfeldolgozási modellje óriási lendületet mutat, bár a Spark fejlesztése még mindig a korai szakaszában van. A Spark egy újabb lingua franca lesz az adatfeldolgozásban, hasonlóan a mai SQL-hez, és határozottan jeleit mutatja, hogy van néhány lába. mivel egyre több vállalat fektet be ebbe."

Heudecker kiemelte a felhő-játékosok fontosságát a Big Data-ban is; azok a technológiai óriások, amelyek integrálták a Hadoop és más Big Data technológiákat a meglévő infrastruktúra-szolgáltatásként (IaaS) kínálatukba.

Az Amazon Web Services (AWS) az Amazon Elastic MapReduce (EMR) szolgáltatását használja felhőalapú Hadoop-zenekar létrehozásához. A Microsoft nagyszámú Big Data szolgáltatást kínál az Azure felhőplatformon belül, együttműködve a Hortonworks HDInsight szolgáltatásával az Apache Hadoop, Spark, HBase és Storm kezelésére, valamint az SQL-alapú Azure Data Lake és az Azure Data Analytics szolgáltatásaival. Az IBM mind a helyszíni IBM Open Platform ajánlatot kínálja a Hadoop számára, mind az IBM BigInsights, egy elemzőcsomagot, amely a tetején fut, valamint a kezelt Hadoop és az Apache Spark-as-a-szolgáltatás a Bluemix felhőben. A lista folytatódik, és a vállalkozások megtalálják a felhőben az alkalmazhatóbb használati eseteket.

"Becsléseink szerint önmagában az AWS-nek körülbelül 5000 ügyfele van, tehát a tiszta játék együttesének több mint kétszerese az ügyfélkörnek" - mondta Heudecker. "A felhőbe való bejutás egyik előnye, hogy megkapja az ökoszisztémát. A tiszta játékból származó Hadoop disztribúciókat bármelyik IaaS kínálatból meg lehet kapni. A MapR az összes felhőben elérhető, amelyre gondolhat, kivéve az IBM-t; ugyanolyan. Cloudera és Hortonworks számára. Nem láttuk, hogy a felhő elérhetősége túl sok tényezővé válik, amikor az egyik szállítót választjuk."

Vállalati adatstratégia kiválasztása

Heudecker szerint az adatfeldolgozásba és az analitikai megoldásokba való befektetés során mind a kis-, mind a közepes méretű vállalkozások (SMB-k) és a növekvő vállalkozási vállalkozások számára az a döntés, hogy melyik platform képes nyújtani a legmagasabb szintű szolgáltatást. Gartner szerint a vállalkozások számára a legnagyobb kihívás a készségek hiánya - kitalálni, ki fogja kezdeni a platformot, miután telepítette és telepítette.

"Ha a vállalatok adatplatform-partnert keresnek, ki fog segíteni számukra az adatok begyűjtésében? Ki fog segíteni számukra az analitikai alkalmazás felépítésében? Ami a három tiszta játékú Hadoop-ert illeti, az értékelési kritériumok általában a a kezelési eszközök és konzolok, az adatkezelési eszközök és a teljesítmény érettsége."

A Hadoop platform választásának másik érdekes aspektusa a lojalitás hiánya. A vállalatok 6–12 havonta újraértékelik Hadoop platformukat, hogy megvizsgálják, vajon az adatfeldolgozó komponensek továbbra is megfelelőek-e, mivel a tér gyorsan változik, és hogy a nagy szereplők milyen kevésen differenciáltak egymással. Heudecker szerint a beszélt vállalatok 20% -ának több Hadoop disztribúciója fut az adatközpontjában vagy a felhőben, vagy hagyva, hogy a különböző csapatok válasszák meg a választott platformukat, vagy szándékosan diverzifikálják, hogy elkerüljék az egyetlen Hadoop disztribúció beragadását.

Ez a fajta diverzifikált platformportfólió hozzájárul ahhoz, amit Frank Buytendijk, a Gartner kutatási alelnöke és a digitális stratégiára összpontosító megkülönböztetett elemző „információnak mint eszköznek nevezik”. Mivel nem működtethet vállalkozást tőke, munkaerő, anyagok és fizikai vagy virtuális eszközök nélkül, Buytendijk azt mondta, hogy információ nélkül nem tud vállalkozást működtetni.

"A vállalkozásokat a három áramlás szempontjából néztük: az elsődleges áruk áruk voltak, a másodlagos áramlások pénzek voltak, a harmadlagos áramlások pedig információk voltak, amelyek biztosítják az áruk és a pénz összehangolását. Most a legtöbb vállalkozásban fordítva van. Az elsődleges információ az információ, az azonosítástól és a konfigurálástól a tartalommarketingig stb. Az, hogy ezt a Big Data-t hívja-e, nem számít."

A "Big Data" elavult

Buytendjik azt mondta, hogy nem látja a Big Data-t különálló technológiának a vállalkozások számára, hanem egyetlen témának vagy gondolkodásmódnak az általános digitális stratégiájában.

"Nem hiszem, hogy Big Data stratégiával rendelkeznék" - mondta Buytendjik. "Alig létezik olyan üzleti stratégia, amely nem tartalmaz digitális alkatrészeket, ezért hiszek abban, hogy olyan digitális stratégiával rendelkezem, amelyben mindenféle technológia kritikus képességeket biztosít. Ide tartozik a mobil, a szociális, a felhő, a tárgyak internete, az intelligens gépek és a nagy adat."

Heudecker úgy véli, hogy egyre kevésbé kezdjük el beszélni a "Big Data" -ról, mert most csak adatok vannak. Így történik az üzlet. A hatalmas adatmennyiség és a nagy sebességű adat már nem ilyen ijesztő.

"Az információ és az elemzés ismét a Big Data-t veszi igénybe" - mondta Heudecker. "A Big Data kategória őszintén szólva nem tesz különbséget. Mindig megkérdezzük a Big Data piac méretét, de mit is jelent ez? A Big Data valójában nem piac, hanem egy koncepció. Egy vállalkozás számára, amikor a Big Data-ra gondol valami egyedi és különleges, ami radikálisan különbözik a korábban elvégzettől, egy hiba. Ezen a ponton az adatok csak normálisak."

Hogyan értelmezhetik a vállalkozások a nagy adatpiacot?