Tartalomjegyzék:
Videó: Tanuld meg 15 perc alatt kiolvasni a Hangult (November 2024)
Az Amazon Echo készülék nemrég rögzítette a felhasználó magánbeszélgetését, és tudásuk és beleegyezése nélkül elküldte egyik partnerüknek. Ez (ismét) aggályokat vet fel az intelligens hangszórók biztonságával és magánéletével kapcsolatban. A későbbiekben nyilvánvalóvá vált, hogy Alexa furcsa viselkedése nem része a baljóslatú kémkedésnek - inkább az egymással összefüggő hibák sorozata okozta, amelyek az okos hangszóró működésének tulajdoníthatók.
A forgatókönyv szélsőséges eset, az a fajta esemény, amely nagyon ritkán fordul elő. Érdekes tanulmány ugyanakkor a mesterséges intelligencia technológiájának korlátait is, amelyek az Echo-t és más úgynevezett "intelligens" eszközöket hajtják végre.
Túl sok felhő-függőség
A hangparancsok megértése érdekében az intelligens hangszórók, mint például az Echo és a Google Home, mélyreható algoritmusokra támaszkodnak, amelyek kiterjedt számítási teljesítményt igényelnek. Mivel nem rendelkeznek számítási erőforrásokkal a feladat helyszíni elvégzéséhez, el kell küldeni az adatokat a gyártó felhőkiszolgálóinak, ahol az AI algoritmusok a beszéd adatait szöveggé alakítják és feldolgozzák a parancsokat.
Az intelligens hangszórók azonban nem küldhetnek mindent, amit hallanak, felhő-kiszolgálóiknak, mert ehhez a gyártónak túlzott mennyiségű adatot kellene tárolnia szerverén - amelynek a legtöbb felesleges lenne. A felhasználói otthonokban zajló magánbeszélgetések véletlen rögzítése és tárolása szintén adatvédelmi kihívást jelentene, és bajba kerülhetnek a gyártókkal, különös tekintettel az új adatvédelmi szabályokra, amelyek szigorú korlátozásokat vezetnek be a technológiai társaságok által az adatok tárolására és felhasználására vonatkozóan.
Ez az oka annak, hogy az intelligens hangszórókat úgy aktiválják, hogy a felhasználó olyan ébresztő szót mond, mint például az "Alexa" vagy a "Hé Google". Csak a figyelmeztető szó hallása után kezdik el küldeni mikrofonjaik audio bemenetét a felhőbe elemzés és feldolgozás céljából.
Noha ez a szolgáltatás javítja a magánélet védelmét, saját kihívásait mutatja be, amint azt a közelmúltbeli Alexa-esemény kiemelte.
"Ha egy szót - vagy valami nagyon hangosnak tűnik - egy beszélgetés félidején küldik el, akkor Alexának nem lesz a korábbi összefüggései" - mondja Joshua March, a Conversocial vezérigazgatója. "Ezen a ponton rendkívül keményen hallgat minden olyan parancsot, amely az Ön által beállított készségekhez kapcsolódik (például az üzenetküldő alkalmazásukhoz). A magánélet nagyrészt nagymértékben javul azáltal, hogy korlátozzák azt a környezetet, amelyre Alexa figyel (például nem rögzíti vagy hallgatja a szokásos beszélgetéseit), bár ebben az esetben visszaverődött."
A szélsőséges számítások fejlődése segíthet enyhíteni ezt a problémát. Mivel az AI és a mélyreható tanulás egyre több eszközbe és alkalmazásba kerül, néhány hardvergyártó processzorokat hozott létre, amelyek specializálódtak az AI-feladatok elvégzésére anélkül, hogy túlzottan támaszkodnának a felhőforrásokra. Az Edge AI processzorok segítenek az olyan eszközök, mint például az Echo, jobb megértésében és feldolgozásában a beszélgetések számára anélkül, hogy sérthetik a felhasználók magánéletét, azáltal, hogy az összes adatot felhőbe továbbítják.
Háttér és szándék
Az elkülönített és töredezett hangdarabok fogadása mellett az Amazon AI küzd az emberi beszélgetés árnyalatainak megértésével is.
"Noha az elmúlt években óriási előrelépés történt a mély tanulásban, lehetővé téve a szoftverek számára, hogy jobban megértsék a beszédet és a képeket, mint korábban, még mindig sok a korlát" - mondja March. "Míg a hangsegédök felismerik az Ön által mondott szavakat, nem feltétlenül rendelkeznek valós megértéssel a mögöttes jelentés vagy szándék szempontjából. A világ összetett hely, de ma már egyetlen AI-rendszer csak nagyon speciális, szűk felhasználási esetek ".
Például nálunk, emberekben, sok módszer van annak meghatározására, hogy egy mondat felé fordul-e, például a hanghang vagy a vizuális utalások követése - mondjuk azt az irányt, amelyet a beszélõ néz.
Ezzel szemben Alexa azt feltételezi, hogy az "A" szót tartalmazó mondatok minden címzettje. Ez az oka annak, hogy a felhasználók gyakran véletlenül indítják el.
A probléma része az, hogy túlzásba helyezzük a jelenlegi AI-alkalmazások képességeit, gyakran összehasonlítva azokat az emberi elmével vagy felett, és túl sok bizalmat adva nekik. Ezért vagyunk lepve, amikor látványosan kudarcot vallnak.
"A kérdés része az, hogy az" AI "kifejezést annyira agresszíven forgalmazták, hogy a fogyasztók érdektelen mértékben hittek azoknak a termékeknek, amelyekhez ez a kifejezés kapcsolódik." - mondja Pascal Kaufmann, idegtudós orvos és a Starmind alapítója. "Ez a történet szemlélteti, hogy Alexa számos képességgel rendelkezik és viszonylag korlátozottan érti, hogyan és mikor kell ezeket megfelelően alkalmazni."
A mélyreható algoritmusok hajlamosak kudarcra, amikor olyan beállításokkal szembesülnek, amelyek eltérnek az általuk kiképzett adatoktól és forgatókönyvektől. "Az emberi szintű AI egyik meghatározó tulajdonsága az önellátó kompetencia és a tartalom valódi megértése lesz" - mondja Kaufmann. "Ez kulcsfontosságú része annak, hogy egy AI-t valóban" intelligensnek "lehessen tekinteni, és alapvető fontosságú a fejlődéséhez. Az öntudatos digitális asszisztensek létrehozása, amelyek magukkal foglalják az emberi természet teljes megértését, jelöli átalakulását egy szórakoztató újdonságtól valóban valódivá válásáig. hasznos eszköz."
De az emberi szintű AI létrehozása, amelyet általános AI-nek is neveznek, könnyebb mondani, mint megtenni. Évtizedek óta azt gondoljuk, hogy csak a sarkon van, csak hogy megrémüljünk, mivel a technológiai fejlődés megmutatta, milyen bonyolult az emberi elme. Sok szakértő szerint hiábavaló az általános AI üldözése.
Eközben a szűk AI (ahogyan a jelenlegi mesterséges intelligencia technológiákat ismertetik) továbbra is számos lehetőséget kínál, és rögzíthető a hibák megismétlésének elkerülése érdekében. A világosság kedvéért a mélyreható tanulás és a gépi tanulás még mindig születik, és az Amazon-hoz hasonló cégek folyamatosan frissítik AI algoritmusaikat, hogy minden alkalommal kezeljék a szélsőséges eseteket.
Mit kell tennünk
"Ez egy fiatal, feltörekvő terület. A természetes nyelv megértése különösen gyerekcipőben jár, tehát itt még sok mindent megtehetünk" - mondja Eric Moller, az Atomic X műszaki vezetője.
Moller szerint hang-elemző AI algoritmusok úgy hangolhatók, hogy jobban megértsék az intonációt és az inflexiót. "Az" Alexa "szó használata egy szélesebb mondatban másként hangzik, mint egy meghívás vagy parancs. Alexanak nem szabad felébrednie, mert azt mondtad, hogy ezt a nevet múlik." - mondja Moller. Elegendő képzéssel az AI-nek képesnek kell lennie megkülönböztetni, hogy mely hangok irányulnak az intelligens hangszóróra.
A műszaki cégek szintén kiképzik az AI-jét, hogy képesek legyenek megkülönböztetni a háttérzajt, miközben közvetlenül beszélnek. "A háttérbeszélgetésnek van egy egyedi hallható 'aláírása', amelyet az emberek nagyon jól képesek felvenni és szelektíven hangolni. Nincs ok, hogy miért nem lehet az AI modelleket kiképezni, hogy ugyanezt tegyék." - mondja Moller.
Elővigyázatosságból az AI asszisztenseknek értékelniük kell az általuk hozott döntések hatását, és be kell vonniuk az emberi döntéseket olyan esetekben, amikor potenciálisan érzékeny intézkedéseket akarnak tenni. A gyártóknak további biztosítékokat kell beilleszteniük technológiáikba, hogy megakadályozzák az érzékeny információk továbbítását a felhasználó kifejezett és egyértelmű hozzájárulása nélkül.
"Bár az Amazon arról számolt be, hogy Alexa megkísérelte megerősíteni az általa értelmezett tevékenységet, néhány tevékenységet gondosabban kell kezelni, és magasabb szintű megerősítésre kell helyezni a felhasználó szándékát" - mondta Sagi Eliyahi, a Tonkean vezérigazgatója. "Az embereknek ugyanazok a beszédfelismerési problémák vannak, esetenként félreértő kérésekkel. Alexa-val ellentétben azonban az ember nagyobb valószínűséggel igazolja abszolút, hogy érti a homályos kérést, és ami még fontosabb, felméri a kérés valószínűségét a korábbi kérésekhez képest."
Eközben…
Miközben a technológiai vállalatok finomhangolják az AI-alkalmazásokat a hibák csökkentése érdekében, a felhasználóknak végső döntést kell hozniuk arról, hogy mennyit akarnak kitéve az AI-alapú eszközök által okozott lehetséges hibáknak.
"Ezek a történetek ellentmondásban vannak azzal az adatmennyiséggel, amelyet az emberek hajlandóak megosztani az új AI technológiák ígéretével szemben" - mondta Doug Rose, az adattudomány szakértője és számos, az AI-ról és a szoftverről szóló könyv írója. "Lehet, hogy megkísérelje Siri-t, hogy lassú. De a legjobb módja annak, hogy nagyobb intelligenciát érjen el, ha megtámadja a magánbeszélgetéseinket. Tehát legfontosabb kérdés az elkövetkező évtizedben az, hogy megengedjük-e ezeknek az AI-ügynököknek a viselkedésünket ?”
"Melyik család helyezi el az emberi asszisztens a nappali szobába, és hagyja, hogy az ember állandóan bármilyen beszélgetést hallgasson?" - mondja Kaufmann, a Starmind idegtudós. "Legalább ugyanazokat a szabványokat kell alkalmaznunk az úgynevezett" AI "eszközökre (ha nem magasabbak), amelyeket az emberi intelligens lényekre is alkalmazunk, amikor a magánélet, a titoktartás vagy a megbízhatóság vonatkozik."