Tartalomjegyzék:
- 1. Ne felejtsd el a logisztikát
- 2. Vegye figyelembe adatait
- 3. Az algoritmusok nem mágikus golyók
- 4. Használjon változatos eszközkészletet
- 5. Kísérlet a hibrid tanulással
- 6. Olcsó nem azt jelenti, hogy rossz
- 7. Ne hívja meg AI-nek
Videó: Calling All Cars: Missing Messenger / Body, Body, Who's Got the Body / All That Glitters (November 2024)
A gépi tanulásról szóló üzleti útmutató (ML) első része lebontotta, hogy az ML esernyő-koncepciója sokkal árnyaltabb legyen az üzleti környezetben. A leghatékonyabb stratégiák az ML-t a gyakorlati értelemben veszik figyelembe, mind bonyolult mélyreható tanulást, mind kevésbé intenzív "olcsó tanulási" technikákat alkalmazva a vállalati folyamatok optimalizálása és a kézzelfogható üzleti intelligencia (BI) betekintése érdekében.
Az ML telepítésének célja az üzleti alkalmazásokban az alsó sor javítása vagy a vállalat versenyelőnyének megnyomása. De a szervezet nagyobb rendszerében az ebben a folyamatban fektetett idő és erőforrások maximális kihasználása messze túlmutat az algoritmusokon. Az üzleti döntéshozóknak gondoskodniuk kell arról, hogy minden, ami figyelembe veszi az ML implantációját - az adatoktól és a logisztikától kezdve a felhasználói kapcsolattartásig - összehangoltan működjön együtt a hatékonyság maximalizálása érdekében.
Ted Dunning, Ph.D., a MapR fő alkalmazásszervezője, egy vállalati szoftvercég, amely különféle Big Data disztribúciókat és adatkezelő eszközöket kínál. Dunning két könyv társszerzője volt arról is, hogy „gyakorlati gépi tanulásra” hivatkozik, és az évek során számos vállalat számára fejlesztette ki az ML technológiákat, ideértve az ID Analytics csalások észlelési rendszerét (a LifeLock vásárolta) és a Musicmatch Jukebox szoftvert, amely később a Yahoo Music lett. Jelenleg az Apache Software Foundation inkubációs alelnöke.
A Dunning figyelte, hogy az ML tér évtizedek óta fejlődik, és sokat tanult arról, hogy mi működik, és mi nem egy praktikus üzleti környezetben. Az alábbiakban a Dunning hét bevált gyakorlatot mutat be, amelyeket követni kell az ML-ben gyökerező üzleti megoldások kidolgozása során.
1. Ne felejtsd el a logisztikát
A sikeres ML nem csupán a megfelelő eszköz vagy algoritmus megválasztása. Dunning szerint el kell döntenie, hogy melyik megközelítés megfelelő, és meg kell terveznie azt az adott helyzetben. Például Dunning az ML-ről beszélt egy online marketing kampányban, szemben a sokkal bonyolultabb forgatókönyvekkel, például az autonóm autót irányító algoritmusokkal. Az algoritmus fokozatos fejlesztésére fordított erőforrások megéri az autó gondját, ám a marketing forgatókönyvben sokkal jobb megtérülést jelentene az egész logisztika optimalizálásával.
"A vállalkozások számára gyakran a logisztika, nem pedig a tanulás adja meg az értéket. Ez az a rész, amelyre időt és erőforrásokat kell költenie" - mondta Dunning. "Az algoritmus módosítása kismértékű javulást eredményezne. De az adatok, a felhasználói felület, valamint a felhasználói hallgatás és a felhasználókkal való kapcsolat módosítása egyszerűen 100 százalékos javulást eredményezhet. Az algoritmus megváltoztatására fordított idő töredéke érdemes, mivel sok a vállalkozások számára, mint a felhasználók meghallgatása."
Ennek szemléltetése érdekében Dunning elmagyarázta, hogyan épített egy modellt alkalmazáscsalások azonosítására (ellopott személyazonosságú hamis számlák megnyitására) a vállalat ügyféladatbázisában. Az általa épített modell nagyszerű eredményeket ért el, de Dunning észrevette, hogy ez nagyon súlyosan befolyásolja a kérelmező nemét.
Kiderült, hogy a logisztika ki van kapcsolva. A jelentkezési folyamat működésével a kérelmező csak akkor töltötte ki a nemeit, miután már vásárlóvá vált, és számos átvilágítási lépést tett a csalók kiszűrésére. Tehát a nemek közötti egyenlőség területének felhasználásával az ML-modell megcsalták a teljes csalási folyamat logisztikáját. Ennek semmi köze sincs az algoritmushoz, és mindaz, ami annak függvénye, hogy a vállalat miként kezdett megszerezni az adatait.
2. Vegye figyelembe adatait
A vacsora tele van fülbemászó apróságokkal. Miután "a logisztika, nem pedig a tanulás" -val kezdte, azt mondta, hogy az ötlet másik fele "az adatok, nem pedig az algoritmusok". Annak biztosítása, hogy az ML algoritmusok értékes betekintést nyújtsanak, az biztos, hogy a megfelelő adatokat adja meg nekik. Dunning azt mondta: ha nem kapja meg azt az eredményt, amelyre keres, akkor leginkább azért van, mert nem a megfelelő adatokat használja.
"Az emberek mindenféle algoritmust megsemmisítenek és egóhoz kötöttek, de manapság a rendelkezésre álló eszközök miatt mindenki és édesanyjuk mindenféle új algoritmust képes kidolgozni és készít" - mondta Dunning. "Az adatok sokkal fontosabbak, és sokkal több növekedést eredményeznek, mint az algoritmusok végtelen finomítása. Ha egy olyan nehéz problémán dolgozik, mint például a beszédfelismerés vagy a számítógépes látás, ez egy dolog. De ez egy adatközpontú terület. A forgatókönyvek többségében sokkal több hasznot fog elérni a megszerzett adatok módosítása és a kérdés megváltoztatása."
Ezt tette a Dunning a 2000-es évek közepén, amikor video-ajánlási motort épített a Veoh Networks nevű cégnél. A csapat azon felhasználói pár által létrehozott videók azonosítására törekedett, amelyekre az emberek a vártnál több kattintással kattintottak, de az algoritmus nem működött. A zene szempontjából gondolkodtak, ahol a felhasználók név szerint ismerik kedvenc művészeiket és dalaikat. Tehát megváltoztatta a kérdést azáltal, hogy a felhasználói felületet hozzáigazították anélkül, hogy magát az algoritmust megérintették.
"A felhasználó által létrehozott videókban senki sem ismeri a művészeket, és sok videónak valóban spam címe volt, hogy több nézetet szerezzen. Az algoritmus tweakein történő kerékpározás soha nem adott volna jó eredményeket" - mondta Dunning. "Amit tettünk, megváltoztattuk a felhasználói felületet, hogy 10 másodpercenként jeladó jelet bocsásson ki. Úgy találtuk, hogy ha a jelzőt a kattintások helyett a javasló nyers adatainak kattintásánál használjuk, akkor fantasztikus eredményeket kaptunk. Ennek a változásnak a felemelkedése több száz százalékkal javult az elkötelezettség az ajánlások miatt, algoritmikus változtatások nélkül."
3. Az algoritmusok nem mágikus golyók
Az ML-megvalósítások folyamatos próbálkozáson és hibán alapulnak. Nem számít, mennyire jó az algoritmusa, ha a rendszer kölcsönhatásba lép az emberekkel, akkor azt idővel módosítani kell. Dunning hangsúlyozta, hogy a vállalkozásoknak folyamatosan mérniük kell végrehajtásuk általános hatékonyságát, és azonosítaniuk kell azokat a változásokat és változókat, amelyek javítják és rosszabbá teszik. Ez valószínűleg látszólag hangzik, de Dunning szerint annak ellenére, hogy nyilvánvalóan hangzik, nagyon kevés ember csinálja ezt, vagy jól csinálja.
"Sokan szeretnének egy rendszert telepíteni, vagy valamilyen lépést tenni, és azt akarják, hogy az algoritmusuk örökre tökéletesen működjön" - mondta Dunning. "Egyik algoritmus sem lesz varázslatos golyó. A felhasználói felület nem marad örökre. Egy adatgyűjtési módszer soha nem váltható fel. Mindez megtörténhet és megtörténhet, és a vállalkozásoknak ébernek kell mérniük, értékelniük és újraértékelniük a rendszer működik."
4. Használjon változatos eszközkészletet
Több tucat ML eszköz érhető el, amelyek közül sok ingyenesen használható. Számos Apache Software Foundation (ASF) projektben - köztük a Mahout, Singa és a Spark - népszerű nyílt forráskódú könyvtárak, például Caffe, H20, Shogun, TensorFlow és Torch, valamint ML könyvtárak vannak. Ezután előfizetési alapú lehetőségek vannak, például az Amazon Machine Learning, a BigML és a Microsoft Azure Machine Learning Studio. A Microsoftnak is van egy ingyenes kognitív eszközkészlete.
Számtalan forrás áll rendelkezésre. Dunning számos vállalkozással, adattudósokkal és az ML szakemberekkel beszélt, és mindig megkérdezi tőlük, hogy hány különböző keretet és eszközt használnak. Dunning szerint a legtöbb ember szerint legkevesebb 5-7 szerszámot használnak, gyakran sokkal többet.
"Nem lehet ragasztva egy szerszámhoz. Többet kell használnia, és mint ilyen, jobb, ha a rendszert úgy állítja össze, hogy az agnosztikus legyen" - mondta Dunning. "Bárki, aki megpróbálja meggyőzni arról, hogy ez az eszköz az egyetlen, amire szükséged lesz, elad egy számlát.
"Jövő héten történhet valami, ami megzavarja az almakocsiot, és az innováció üteménél, amelyet látunk, legalább öt-tíz évig folytatódni fog" - folytatta Dunning. "Nézzen meg egy olcsó tanulási példát, ahol talán újból felhasznál egy meglévő képosztályt a katalógusban szereplő képek elemzésére. Ez mély tanulás a számítógépes látás bedobásával. De vannak olyan eszközök odakinn, amelyek mindent összecsomagoltak. mérni, értékelni és válogatni a különféle eszközök között, és az Ön infrastruktúrájának ezt üdvözölnie kell."
5. Kísérlet a hibrid tanulással
Dunning azt mondta, hogy olcsó és mély tanulást is keverhet valamilyen hibridré. Például, ha egy létező számítógépes látásmodellet vesz fel, és újraépíti a néhány felső réteget, ahol döntés születik, akkor egy meglévő keretet választhat egy teljesen új felhasználási esethez. Dunning egy Kaggle versenyre mutatott, amelyben a versenyzők éppen ezt tették; adatcsomagot készítettek és új algoritmust írtak a tetejére, hogy segítsék a számítógépet a macskák és a kutyák megkülönböztetésében.
"A macskák és kutyák megkülönböztetése nagyon finom dolog az ML algoritmus szempontjából. Gondolj a logikára: a macskáknak hegyes füle van, de a német juhászoknak is. A kutyáknak nincsenek foltok, kivéve a dalmátokat, stb. Ez elég nehéz felismerni. önmagában "- mondta Dunning. "A győztes srác kifejlesztett egy rendszert, amely ezt 99 százalékos pontossággal tette meg. De inkább az a benyomásom volt, aki a harmadikba jött. Ahelyett, hogy a semmiből épített volna, egy másik feladatból vett egy meglévő képfelismerő programot, és elvitte a A felső réteget beillesztette egy egyszerű osztályozóba. Néhány példát adott, és hamarosan 98 százalékkal pontosabb volt a macskák megkülönböztetése a kutyáktól. Az egész folyamat a srácnak három órát vett igénybe."
6. Olcsó nem azt jelenti, hogy rossz
A nyilvánvaló konnotáció ellenére Dunning szerint az olcsó tanulás nem jelenti a rossz tanulást. Az ML-megvalósításra fordított idő nem közvetlenül kapcsolódik annak üzleti értékéhez. A fontosabb minõség, mondta - az, hogy megbizonyosodjunk arról, hogy a folyamat megismételhetõ és megbízható. Ha az üzleti vállalkozás indokolatlan források befektetése nélkül képes ezt elérni, akkor annál jobb.
"Az olcsó nem azt jelenti, hogy rossz. Ha működik, akkor működik. Ha olcsó, és működik, ez nagyszerű. De az építkezésre tett erőfeszítés nem határozza meg az értéket. Ez egy összköltség-tévedés" - mondta Dunning.. "Az, amely meghatározza az értéket, az az, hogy hogyan javítja az üzletet. Ha az eredmény növeli a profitot, csökkenti a költségeket vagy javítja a versenyhelyzetét. Ez a hatás, nem az erőfeszítés."
7. Ne hívja meg AI-nek
Dunning hangsúlyozta, hogy amikor ezekről a technikákról beszélnek, a vállalkozásoknak pontos terminológiát kell használniuk: ML, számítógépes látás vagy mélyreható tanulás. Mindez általában a "mesterséges intelligencia" esernyő alá tartozik, de Dunning szerint az AI meghatározása egyszerűen "olyan cucc, amely még nem működik".
"A legjobb definíció, amelyet valaha hallottam az AI számára, az, hogy azokat a dolgokat még nem tudjuk megmagyarázni. Azok a dolgok, amelyeket nem tudtunk kitalálni" - mondta Dunning. "Minden alkalommal, amikor valami működőképes, az emberek azt mondják:" Ó, ez nem AI, ez csak egy szoftver. Ez csak egy szabálymotor. Ez tényleg csak a logisztikai regresszió. " Mielõtt kitalálnánk valamit, azt AI-nek nevezzük, utána mindig valami másnak nevezzük. Sok szempontból az AI-t jobban használják a következõ határ szóként, és az AI-ben mindig lesz egy következõ határ. hova megyünk, nem pedig oda, ahova már elértünk."