Itthon Előre gondolkodás Intelligens asszisztensek: mi következik a siri után?

Intelligens asszisztensek: mi következik a siri után?

Videó: Bina48 Robot Talks to Siri (November 2024)

Videó: Bina48 Robot Talks to Siri (November 2024)
Anonim

Az intelligens asszisztensek - a Siri, a Google Now, a Cortana és hasonlók - néhány évvel ezelőtt a kíváncsiságokból és a szalon trükkökből indultak el olyan alapvető eszközökhöz, amelyeket sok ember használ a mindennapi életében. A múlt héten elhagytam a New York-i intelligens asszisztensek konferenciáját, amelyet az Opus Research mutatott be, és lenyűgözött a szoftver előrehaladása számos iparágban, ideértve a pénzügyi, biztosítási és orvosi társaságok előrehaladását az egyes ügynökök építésében..

Az Opus Research alapítója, Dan Miller elmondta, hogy számos alapvető technológia, például a beszédfelismerés, több mint 20 éve létezik. Noha nemrégiben nagy változtatásokat tapasztalott, nem pedig forradalmat, azt mondta: "evolúciós úton haladunk", sok termékkel együtt, különféle képességekkel rendelkező kontinuumban. Megjegyezte, hogy több száz olyan intelligens vállalati asszisztens alkalmazható, akik rögzített adatkészlet segítségével egyszerű szöveges beszélgetést folytatnak sima angol nyelven, és például egy weboldalon való navigáláshoz vagy egy GYIK-hoz. A spektrum másik végén valószínűleg csak néhány tucat „dinamikus, emberi érzésű alkalmazás” található, amelyek beszélgetőbbek és környezettudatosabbak.

Miller rámutatott a pályázatokra, amelyek díjat nyertek a konferencián. Az Amtrak Julie interaktív hang-válasz telefonos szolgáltatóként kezdte évekkel ezelőtt, de most olyan ügynökré vált, amely a weboldalon működik, hogy útmutatást nyújtson az Amtrak.com webhelyen, a Next IT ügynöke alapján. A Telefonica Mexikónak Nico nevű ügynöke van, aki rendelkezik avatárral, valamint Twitter és Facebook segítségével támogatást nyújt, az AgentBot platformján alapul. Az ING Hollandiában található az Inge, egy olyan alkalmazás, amely lehetővé teszi a bankszámla egyenlegének ellenőrzését vagy a hangon keresztül történő pénzátutalást a Nuance hangbiometrikus technológiájának használatával a személyazonosság hitelesítéséhez.

A tiszteletreméltó említések közé tartoznak az egészségügyi alkalmazások, például egy olyan alkalmazás, amely segít az egészségügyi terv kiválasztásában. Egyéb alkalmazások, amiről hallottam a show-n, többek között a Domino's Pizza, amelynek van egy Dom nevű alkalmazás, amely lehetővé teszi, hogy hanggal pizzát rendeljen; és a BMW, amelynek virtuális ügynöke van az Up2drive automatikus finanszírozási részének részeként.

A Nuance Brett Beraneck arról beszélt, hogy a mély tanulás ideghálózatainak fejlődése hogyan javította a természetes nyelv megértését és a hangfelismerést, és hogy ez miként jön össze, hogy sokkal nagyobb érdeklődést lehessen elérni a terület iránt. A Nuance Nina asszisztense korai példa volt, és azóta sok egyedi alkalmazásra nőtt, kezdve a biztosítótársaságok interaktív hangos válaszrendszereitől a bevásárló alkalmazásokig. Ezen alkalmazások mindegyike más-más személyiséggel rendelkezik, attól függően, hogy mit akar tenni.

Az egyik nagy új funkció, amelyről beszélt, a hangbiometria volt, amelyben a hangod helyettesíti a jelszót. Beszélt arról, hogy az olyan vállalatok, mint például az ING Európában olyan ügynököket fejlesztenek ki, amelyek nemcsak a hangfelismerést és a természetes nyelvfeldolgozást használják, hanem a hangot is használják a hívó személy felismerésére. Azt mondta, hogy ez biztonságosabb és természetesebb is, mint a hagyományos jelszó.

Míg a legfrissebb tanulmányok attól tartottak, hogy a hangfelvételek becsaphatják az ilyen rendszereket, Nuance megjegyezte, hogy a mai technológia olyan funkciókat tartalmaz, amelyek célja a rögzített hangon megjelenő rendellenességek felvetése, és rámutatott más, más nézőpontú vizsgálatokra. Emellett, elmondta, a tervezők a hang biometria különböző szintjeit is használhatják a különböző funkciókhoz, például egyszerű felismeréssel használhatják a számlaegyenleg ellenőrzését, vagy arra kérhetnek, hogy ismételje meg egy véletlenszerű szavak sorozatát a jelentős pénzátutalásokhoz.

A hangbiometria minden bizonnyal egyre vonzóbbá válik. A múlt heti Gartner szimpóziumon a pénzügyi szolgáltatások „hűvös ügyfél-ügyeiről” szóló ülésen egy Citibank alkalmazás is szerepelt, amely ezt a funkciót használja.

A MyWave-nek van egy Frank nevű asszisztense, amelyet több vállalkozásnak engedélyeznie kellene, hogy lehetővé tegye számukra beszélgetőbb módon való interakciót, ahelyett, hogy minden vállalkozás saját fejlesztésű lenne. Az első felhasználások között szerepel egy új-zélandi bank és a Saveawatt nevű alkalmazás, amelynek célja, hogy segítsen kiválasztani a villamosenergia-szolgáltatót.

Geraldine McBride vezérigazgató elmondta, hogy a cég olyan asszisztenseket próbál létrehozni, amelyek áthidalják az ügyfelek és a szolgáltatási alkalmazások közötti szakadékot, az úgynevezett "ügyfél által kezelt kapcsolatok" vagy a CMR, a tradicionális CRM alkalmazások ösztönzése érdekében. Egy nagy különbség, mondta, az, hogy az ügyfél az összes adatáért felel, nem pedig az üzletért.

Egy másik, viszonylag új vállalat, az Expect Labs rendelkezik egy MindMeld nevű termékkel, amely háttérként működik számos olyan vállalat számára, amelyek hang interfészt kívánnak kínálni a hagyományos interfészek helyettesítésére, valamint a kérdések és válaszok kezelésére. Ez különféle alkalmazásokhoz használható, például tévéműsorok nézéséhez, ha csak a nevet kéri, és a rendszer több rendszert kérdezik le. (Az Amazon Fire TV rendelkezik ezekkel a funkciókkal, de nincs integrálva a kábel set-top boxjához, míg az Expect Labs egyik befektetője a Liberty Global kábeltársaság.)

Tim Tuttle vezérigazgató elmondta, hogy a MindMeld hajlamos a legtöbb eszközben már elérhető beszédfelismerésre használni, ehelyett a természetes nyelv megértésére és a rendelkezésre álló információk ismerettervének felépítésére koncentrál. Azt mondta, a cég megpróbálja méretezni a rendszert, hogy több információt tartalmazzon több forrásból, és lebontja a különféle információkategóriák hierarchiáit, amelyek a legtöbb ilyen rendszer részét képezik. A kérdések tényleges megértése azt jelenti, hogy képesek megérteni a szándékot a különböző kategóriákban - mondta.

Az egyik, amit több résztvevőtől hallottam, a statisztika arra utal, hogy az összes internetes keresés kb. 10% -át hírszerző ügynökökön keresztül végezzük. (Andrew Ng, az AI úttörője szerint ez igaz volt a tavalyi Baidu hangkeresésre is, és több ember azt mondta, hogy ez most igaz a Google-ra is, de nem hallottam első kézből történő megerősítést.)

A jövőre nézve az Opus Research Miller szerint még sok tennivaló van. A rendszerek alapvető pontossága rengeteg fejlesztési lehetőséggel rendelkezik, különösen abban, hogy az ön által mondattól az, amit gondol, és mit végezzen ennek eredményeként. Megemlítette a Xerox PARC vezérigazgatója, Stephen Hoover beszélgetését a konferencián, aki azt mondta, hogy a rendszerek manapság akár 90 százalékkal is pontosabbak megérteni, hogy mit értünk, de ez a 10 százalék továbbra is probléma, mert a legtöbb ember emlékszik, amikor foglalkozik rendszer. És Miller azt mondta, hogy van még jobb személyre szabás, mert ha a rendszer tudja, kivel beszél, jobb eredményeket hozhat. Például megjegyezte, hogy a Facebook tudja, ki használja a rendszert, mert be van jelentkezve; és azt mondta, hogy ez a több ügynökkel történő zökkenőmentes végrehajtása fontosabbá válik.

Ez minden bizonnyal izgalmas kategória, és azt várom, hogy mindannyian sokkal több időt töltsünk telefonjainkkal és számítógépeinkkel való beszélgetésre, és olyan ügynökökkel való kapcsolattartásra, akik nem egészen emberek. Ezt a számítástechnika egyik legérdekesebb tendenciáját találom manapság.

Intelligens asszisztensek: mi következik a siri után?