Tartalomjegyzék:
Videó: Week 0, continued (November 2024)
A beszélgető mesterséges intelligencia (AI) alapvetően átalakítja a technológiával való interakciót. A Siri-vel kezdve 2011-ben, és az elmúlt fél évtized során fejlődött - először okostelefon-operációs rendszerekben (OSS), és mostanában különféle formai tényezőkön belül beszerezhetők - a digitális vagy virtuális asszisztensek beépültebb elemévé váltak mindennapi felhasználói élményünkben (UX). Amikor megszokjuk, hogy a virtuális asszisztensek több dolgot csinálnak nekünk, és léteznek bárhol is, a következő kérdés: Hová mennek innen?
Az Amazon Alexa, az Apple Siri, a Microsoft Cortana és a Google Assistant a hanggal aktivált segítőinkké váltak, amikor információt keresünk, ütemezzük az ütemezésünket, és mindennapi mindennapi feladatokat intuitív módon hajtunk végre. Ez bármit jelenthet, kezdve egy kihangosító szöveg elküldésével vagy zene lejátszásával az Amazon Echo-n keresztül, az Uber-utazás vagy pizza megrendelésével a Google Kezdőlapon. Ezek az egyszerű művelettípusok csak a kezdet. Megkezdjük az ilyen típusú AI értékének megfigyelését is bonyolultabb forgatókönyvekben és üzleti beállításokban.
A Cortana és a Google Assistant egyre intelligensebbé válnak, kontextusbeli emlékeztetőkkel és ajánlásokkal, amelyek a termelékenység optimalizálására irányulnak, valamint olyan izgalmas innovációkkal, amelyek számítógépes látást és más gépi tanulási (ML) algoritmusokat tartalmaznak. Az Alexa fejleszt egy harmadik fél készségeinek változatos ökoszisztémáját, és a Google és a Microsoft követte a példát.
Az Alexa Skills Kit, Cortana Skills és a Google által végzett tevékenységek eszközöket adnak a cégeknek és a fejlesztőknek a hangtechnika alkalmazására az e-mailes marketingtől és az e-kereskedelemtől kezdve a kiadások nyomon követéséig és a flottakezelésig. Ezek az üzleti alkalmazások és használati esetek csak az, amit eddig láttak. A PCMag beszélt az Amazon, a Google és a Microsoft munkatársaival, hogy megértsék virtuális asszisztens látásukat, a technológia fejlődését, és mit gondolnak ezek a cégek a vállalkozásoknak a hang-képes AI segítőkkel.
Mik a virtuális asszisztensek?
Legyen szó akár digitális asszisztensnek, virtuális asszisztensnek vagy hangsegédnek, lényegében egy ügynökről vagy alkalmazásról beszél, amely lehetővé teszi a felhasználók számára, hogy kérdéseket tegyenek fel, vagy parancsokat adjanak az NL segítségével. A virtuális asszisztens sokféle formában létezhet, legyen az okostelefonján vagy asztalán, csatlakoztatott hangszórón belül, vagy szükség esetén felhívható bizonyos alkalmazásokba és szolgáltatásokba. Például a Google Assistant már elérhető olyan Android készülékeken, mint a Google Pixel és a Google Allo csevegőalkalmazás, és úton van mind iPhone, mind TV-hez.
"Olyan természetes módszert keresettünk, amellyel az emberek kölcsönhatásba léphetnek a technológiával, így jöttünk létre egy beszélgető felülettel, hogy megbeszéljünk egy gépet" - mondta Gummi Hafsteinsson, a Google Assistant termékmenedzsment igazgatója. "A beszélgetés a legtermészetesebb felület, amelyre gondolhat, és mindannyian tudjuk, hogyan kell csinálni nagyon természetesen."
A PCMag az év elején beszélt Hafsteinsson-kel a barcelonai Mobile World Congress-en. Hafsteinsson karrierjét a Google-ban kezdte, segítve a Google Maps és a Google Voice Search elindítását. Ezután néhány évet az Apple-nél töltött, majd a Siri-n dolgozott, mielőtt megalapította az intelligens üzenetküldő startupot, az Emu-t, amelyet a Google 2014-ben vásárolt meg. Hafsteinsson azóta visszatért a Google-nak a Google Asszisztensnél.
"A Google Assistant már Alloban található, az autóban, az Android TV-ben, az Android Wear új verziójában… kibővítjük azon eszközök fajtáját, amelyekre asszisztenst kaphat" - mondta Hafsteinsson. "Egy Allo csoportos csevegésben megkérheti az asszisztens utazási információit, és megoszthatja azokat a beszélgetés során. Az asszisztens más harmadik fél szolgáltatásaival is együttműködik, mint például az Uber."
Hafsteinsson szerint az egyik kihívás, amelyet a virtuális asszisztensek meg akarnak oldani, az, hogyan hoz létre egy felületet, amely működik anélkül, hogy megértené az egyes szolgáltatásokat, amelyekkel beszélnie kell. A Google a teljes termékcsomagba építi az intelligenciát, és a Google Assistant segítségével a cég megkísérli az UX egyszerűségét megőrizni, miközben egyre összetettebb adatkészleteket, integrációkat és automatizált logikát vezet be.
"Az egyetlen működő felület, amelyet nem kell megtanulnia" - mondta Hafsteinsson. "Az asszisztens természetes interfészként jelenik meg bárhol a vadonban, legyen az akár szolgáltatás, akár eszköz. És mindazokat a dolgokat együtt szervezzük, amelyek az Ön számára működnek."
Az egyik fontos különbség a virtuális asszisztens elválasztása a chatbottól. A chatbotok nagyon hasonló típusú élményt nyújtanak: egy beszélgetési felületet, amelyen keresztül a felhasználó interakcióba lép egy virtuális ügynökkel. Ezek hatóköre azonban szűkebb, mint a virtuális asszisztenseknél, amelyek mindenütt rendelkezésre állnak a digitális élmények között, és szélesebb körű felhasználást kínálnak.
Ha kihagyja az NL kommunikáció eszközeit (a chatbotok általában szöveges alapú csevegést használnak, szemben a hang által aktivált beszélgetéssel), akkor a chatbots-re egy célzott alkalmazásként gondolhat, amit egy virtuális asszisztens képes megtenni. A Microsoft vezérigazgatója, Satya Nadella és David Marcus, a Facebook üzenetküldő termékeinek vezetője hasonló véleményeket fejeztek ki a chatbotok elhelyezése egy alkalmazás új verziójaként. Ha megnézi a Facebook Messenger és a Microsoft botkönyvtárait, akkor ez a logika igaz.
A chatbotok sokkal okosabbak lesznek, de a vállalkozások számára elsődleges funkciójuk egy adott alkalmazás, márka vagy szolgáltatás virtuális ügynöke. A chatbotok segítik az ügyfeleket olyan dolgok elvégzésében, mint például a könyvutazás, az üzletvásárlás és az e-kereskedelem teljesítése, vagy ügyfél-támogatási információk megszerzése, valamint az ügyfélszolgálati jegyek beküldése egy beszélgető felületen keresztül. Ha a chatbot egy virtuális ügynök, amely egy adott alkalmazáson belül van beállítva a feladatra, akkor a virtuális asszisztens akkor történik, amikor az AI-hez ingyenes uralkodást ad az operációs rendszer egész területén.
Context-as-a-Service
A virtuális asszisztens értéke abban rejlik, hogy bárhol is van, megadva a személyre szabott információkat, amelyekre néha szüksége van, még mielőtt még tudná is, hogy szüksége van rá. A Cortana esetében az AI eredete a test és vér személyi asszisztenseire és az üzleti életben betöltött szerepükre nyúlik vissza.
"Amikor elkezdtük a Cortana fejlesztését, amely a Windows Phone-on indult, mielőtt a Windows 10-be hoztuk volna, az kezdeményezők valójában leültek az asszisztensekkel" - mondta Laura Jones, a Cortana marketing igazgatója, a társaság Redmond campusában tartott találkozón. hónap. "Mindezeket a személyes asszisztensekkel készített interjúkat elvégezték arról, amit csinálnak. Ez volt a kiindulópont egy valódi digitális asszisztens létrehozásához, szemben a hangfelülettel."
A Microsoft, több mint a többi technológiai óriás, amely ezt a technológiát építi ki, mélyebben gyökerezik az üzleti szoftverekben és a termelékenységben. A Cortana a Microsoft számos alkalmazásában és szolgáltatásában engedélyezve van - a Microsoft Power BI-től a Skype for Business-hez, hogy azonnali kontextus szerinti választ tudjon adni az üzleti kérdésekre anélkül, hogy elhagyná a tartózkodó alkalmazást. A Cortana (Alexa és a Google Assistant mellett) szintén keresztirányú felület. A Cortana alkalmazásként elérhető Android és iOS rendszereken, valamint a Cortana eszköz SDK-n keresztül. Jones szerint a virtuális asszisztens csak annyira jó, ha veled van.
"Az egyik korai tanulás az, hogy minden személyes asszisztens megtartja azt, amit tud valakiről, hogy jobban segítsenek nekik" - mondta Jones. "Tehát az egyik dolog, amit tenni akartunk, az, hogy személyre szabjuk a tapasztalatokat valaki számára, tehát a Cortanától kapott segítség egyedülálló volt számodra, és proaktívan nyomon követheti az Ön számára fontos dolgokat."
A Cortana ezt legegyszerűbben az emlékeztetőkön keresztül teszi. Az ütemezés, az emlékeztetők és a listák a legfontosabb üzleti célú esetek a virtuális asszisztensek számára. Jones beszélt arról, hogy a Cortana-t olyan érintőképernyős eszközön használja, mint például a Microsoft Surface Pro. A Windows 10 évforduló frissítésében található intelligens cédulák lehetővé teszik, hogy írjon valamit, például: „Hívja fel a főnököm 15:00kor”, akár gépeléssel, akár egy írásos megjegyzés írásával a ceruzával a Windows tinta részeként. A Cortana ezután hozzáadja az emlékeztetőt, hogy nyomon kövesse a feladatot.
A Microsoft együttműködik a Wunderlist-kel (hamarosan Microsoft To-Do), hogy integrálja a Cortana és a szinkronizálási listákat az eszközök között. Ez mind a proaktívabb stratégia része, mind a kontextuális adatokat, mind a helyalapú emlékeztetőket felhasználva segíti a felhasználókat az e-mailek, az ütemezés és a napi kötelezettségvállalások kezelésében.
"Emlékeztetőket küldtünk egy egész másik szintre, ahol proaktívan emlékeztetjük az embereket az e-mailben tett kötelezettségvállalásaikra" - mondta Jones. "Tehát, ha e-mailt küldenek azzal, hogy frissítem egy jelentés e szakaszát, a Cortana ezt kiválasztja és emlékeztet rá. Úgy gondoljuk, hogy ez egy igazán vonzó vállalkozási forgatókönyv. Gondoljon arra, hogy hány kötelezettséget vállalsz valakivel szemben a munkahelyen, szemben a A Cortana naponta többször emlékezteti nekem, hogy felállítottam ezt a találkozót, vagy ha igen, és így kell követnem, majd mélyen összekapcsolom az e-maillel, hogy azonnal nyomon követhessem. vagy állítson be emlékeztetőt."
A Microsoft ezt tovább kívánja bővíteni, hogy dinamikusan elkészítse a Cortana teendőket és felszíni információkat az Office 365 teljes adatain alapulóan. A Cortana már teljesen integrálva van a Microsoft Edge böngészőbe (jobb egérgombbal kattinthat az Edge to Ask gombra bármelyik kiemelt szóra) Cortana), és dokumentumokat vagy embereket kereshet olyan alkalmazásokban, mint például a OneDrive for Business és a SharePoint.A Windows 10 készítői frissítése integrálta a Cortana-t a Microsoft Azure Active Directoryval (AAD) is, hogy az AI-képességeket azoknak a vállalati felhasználóknak hozza létre, akik korábban még nem fértek hozzá ehhez. Az ilyen típusú integrációk kiterjednek a Power BI-re is, amely lehetővé teszi a Cortana adatainak bevonását az üzleti intelligencia (BI) lekérdezésekbe és jelentésekbe. Nem szabad összetéveszteni a Cortana Intelligence Suite-lal, amely egy különálló vállalkozás, amely gépi tanulást (ML) és prediktív elemzést épít az üzleti alkalmazásokba.
Ezen túlmenően, Jones elmondta, hogy a Cortana csapata a Microsoft Research-szel együttműködik olyan projektekkel, mint például a Calendar.help (amely még mindig az Előnézetben van), hogy automatizálja a folyamatokat, például a szervezeten kívüli kapcsolatokkal való találkozók ütemezését. A csapat együttműködik a Microsoft IT Division (MSIT) fejlesztő csoportjával is, hogy a Cortana számára sajátos tapasztalatokat hozzon létre, amelyek számos alkalmazást és kontextuális adatot vonnak be.
"Amint elkezdjük növeli a Cortana munkahelyi jelenlétét, gondolkodj azon, hogy reggel felébredsz, hogy megkérdezd a Cortana-t az ütemezésedre a hangszórón" - mondta Jones. "Azt akarjuk, hogy ez átáramoljon, és ha arra kérem a Cortana-t, hogy emlékeztessen nekem valamit, amikor elmegyek dolgozni, kinyitom a számítógépemet, és megszerezem."
Jones az előző hónapban bemutatott egy bemutatót a Microsoft Build-en, és az új Harman Kardon Invoke felszólalón keresztül kérdezte Cortana-t a közelgő találkozókról és a tennivalókról.
Hogyan okosabbak a virtuális asszisztensek?
Minél több feladatot tanít és programoz egy AI-t, annál többet képes lesz elvégezni. E tekintetben a virtuális asszisztenseknek van valami közös a mélyreható tanulási folyamattal, amellyel az ML algoritmusokat és az ideghálózatokat masszív adatkészletekre képzik. A virtuális asszisztensek kiképzése bizonyos üzleti feladatok elvégzéséhez könnyebb; annyit kell tennie, hogy megnyitja az ökoszisztémát a harmadik felek készségeinek fejlesztésére.
Az Amazon a hordozó ebben a tekintetben. Az Alexa Skills Kit 2015 óta érhető el, és lehetővé teszi a vállalatok és fejlesztők számára, hogy az Alexát alkalmazzák bármilyen üzleti környezetben vagy folyamatban. Ennek eredményeként már elérhető a rendelkezésre álló üzleti készségek széles választéka, amelyeket a vállalatok egyszerűen engedélyezhetnek és felhasználhatnak - és ez az ökoszisztéma növekszik.
"Láttuk, hogy az emberek készségeket fejlesztenek ki az Alexa készségek felhasználásával a konferenciatermek automatizálására, és láttuk, hogy az emberek kapcsolatba lépnek az e-maileikkel és naptárukkal. A vállalatok sokféle vállalati forgatókönyvre állítják át az Alexát" - mondta David Limp, az eszközök alelnöke. az Amazonnál, aki felügyeli az Alexa fejlesztését az Amazon összes eszközén.
A Google és a Microsoft követte az Amazon vezetését ezen a téren, a Google fellépései és a Cortana Skills segítségével. Ezek az eszközkészletek lehetővé teszik, hogy speciális készségeket építsen ki, de fejlesztésükbe beépítik a természetes nyelvfeldolgozást (NLP) és olyan funkciókat is, mint például a proaktív javaslatok, amelyek a felhasználóknak a megfelelő kontextusban történő ajánlását javasolják (például emlékeztető, hogy rendeljenek ételeket rendszeres ebédre találkozó).
A PCMag nemrég érte el a Limpot a vezetékes üzleti konferencián New Yorkban. Limp szerint az Amazon nem fejleszti aktívan olyan Alexa képességeit, amelyek kifejezetten a vállalati üzletre irányulnak, mert erre nem kell. A legerősebb ökoszisztéma előnye, hogy a vállalkozások felveszik a platformot és építik, amit akarnak, és egyes esetekben párosítják az Amazon hardverével kapcsolatos tapasztalataikat.
"A vállalati területeken már láthattunk egy csomó lenyűgöző felhasználást" - tette hozzá Limp. "A Wynn Hotels minden szállodai szobában visszhangt ad, ezért képzelje el az összes felhasználási esetet a szoba automatizálására. Egy másik szórakoztató lehetőség a seattle-i stadionok egyikén található, ahol a stadion égboltba helyezi őket, hogy pontszámokat és ételt rendeljen., vagy megírhatják ehhez egyéni képességeiket."
Limp szerint a következő lépés az összes készség (jelenleg több mint 13 000) könnyű felfedezése és kezelhetősége. Az alkalmazásüzletek még soha nem oldották meg a longtail alkalmazások felfedezettségét. Ezt követően azt mondta, hogy a virtuális asszisztens platformok integrációjáról és szabványosításáról szól, hogy összekapcsolják ezt a "milliós készségből álló világot".
"Véleményünk szerint ez nem homogén. Remélésünk és első erőfeszítéseink az volt, hogy a környezetet megnyitjuk az Alexa bővítésére szolgáló készségek előtt, de idővel elképzelhetjük, hogy Cortanát vagy más asszisztenst hívunk fel" - mondta Limp. "Önnek képesnek kell lennie arra, hogy azt mondja: 'Alexa, kérdezd Siri X-et.' Ez egy nagyon valódi felhasználási eset. Az Alexa, Siri, Cortana és a Google Assistant közötti különbség horizontálisabb, mint bármi másnál. Fontos a szabványok megnyitása ezen AI-k kölcsönös működésének szempontjából. Függetlenül attól, hogy a szabványok megfogalmazása vagy annak biztosítása, hogy az API-k nyitva vannak és közzétettük. Látjuk, hogy a világ így néz ki."
Az interoperabilitástól eltekintve, az a tény, hogy ez a tér még csak néhány évvel ezelőtt van. Az Amazon tavaly indította el az Alexa Alapot, hogy ösztönözze az innovációt az űrben, és elkötelezte magát akár 100 millió dolláros kockázati tőke (VC) finanszírozásba történő befektetés mellett mind az induló vállalkozások, mind a már bevezetett márkák számára, és meghúzza a hang és a virtuális asszisztens tech lehetőségeinek határait. A Google és a Microsoft is komoly beruházásokat hajt végre a folyamatos kutatásba.
Mind a Microsoft Jones, mind a Google Hafsteinsson arról beszélt, hogy javítani kell az NL feldolgozását és a társalgási megértést, még mielőtt látnánk, hogy a virtuális asszisztenseket nemcsak a fogyasztók széles körben alkalmazzák, hanem a mindennapi üzleti műveletekbe valóban belevetették.
"Összességében az ipar még mindig nagyon korai" - mondta a Microsoft Jones. "Az elfogadás korai. Egyre növekvő érdeklődést mutatunk a ház iránt, és nagy lehetőségeket kínálunk a termelékenység és a munka iránt, de nem csak a megértésről szól, amit mondok. Ez a szándék megértéséről szól, különösen mivel ezt a technológiát még több beszélgető platform."
A Google Hafsteinsson aggodalmát fejezi ki amiatt, hogy csak a különböző környezetek felületét karcolja meg, és ennek a technológiának az új felhasználási eseteit. Az örökbefogadási számoknál fontosabbnak tartja, hogy a virtuális asszisztensek jelenléte és kontextuális kényelme fokozatosan megváltoztassa viselkedésünket.
"Az elmúlt két évben láttuk ezt a robbanást a technológiában. De meg kell értened, hogy jövője nem a számokon alapszik" - mondta Hafsteinsson. "Azon előnyeken alapszik, amelyeket az emberek számára nyújt. Figyeljen oda, saját felelősségére."