Tartalomjegyzék:
- A utánzat játék
- Az AI határai
- Pozitív felhasználások
- Hogyan lehet minimalizálni a kompromisszumokat?
Videó: COIN - Sort It Out (Official Video) (November 2024)
Valahol a YouTube sötét mélyedéseiben egy olyan videó látható, amely a The Ring Fellowship of the Movie film részletét mutatja, ám ez nem egészen a filmre emlékszik, mivel Nicolas Cage olyan csillagok, mint Frodo, Aragorn, Legolas, Gimli és Gollum, egyáltalán ugyanakkor. Más videók a Cage-t a Terminator 2- ben T2000-ként, a Star Trek- t Picard századosként és a Superman- ot, valamint Lois Lane-t mutatják.
Nic Cage természetesen soha nem szerepelt egyik ilyen filmben. "FakeApp", amelyet a FakeApp készített, amely egy olyan alkalmazás, amely mesterséges intelligencia algoritmusokat használ a videók arcainak cseréjéhez. Néhány mélyfaj meglehetősen meggyőzőnek tűnik, míg mások tárgyak, amelyek elárulják valódi természetüket. De általánosságban megmutatják, hogy az AI algoritmusok milyen hatékonyak lettek az emberi megjelenés és viselkedés utánozásában.
A FakeApp csak egy a számos új, AI-alapú szintetizáló eszköz közül. Más alkalmazások utánozzák az emberi hangok, a kézírás és a beszélgetés stílusát. És részben ami jelentősé teszi őket, az, hogy ezek használatához nincs szükség speciális hardverre vagy képzett szakemberekre.
Ezen alkalmazások mély hatása: példátlan lehetőségeket teremtenek a kreativitás, a termelékenység és a kommunikáció számára.
Ugyanakkor ugyanaz az eszköz megnyithatja a Pandora csalás, hamisítás és propaganda dobozát is. Mióta januárban megjelenik a Reddit-en, a FakeApp-ot több mint 100 000 alkalommal töltötték le, és hamis pornográf videókat hajtottak végre, amelyek hírességeket és politikusokat mutattak be (beleértve a Cage-t is). A Reddit nemrégiben betiltotta az alkalmazást és a hozzá kapcsolódó közösségeket platformjáról.
"Tíz évvel ezelőtt, ha valamit hamisítani akarsz, megteheted, de el kellett menned egy VFX stúdióba vagy olyan emberekbe, akik számítógépes grafikát készítettek és valószínűleg millió dollárt költenek" - mondja Dr. Tom Haines, a Bathi Egyetem. "Ugyanakkor nem tudta titokban tartani, mert sok embert be kellene vonnia a folyamatba."
Már nem ez a helyzet, az AI eszközök új generációjának jóvoltából.
A utánzat játék
A FakeApp és hasonló alkalmazások működését a mély tanulás hajtja, amely az AI ágazata az AI innovációk robbantásának középpontjában 2012 óta. A mélyreható tanulási algoritmusok ideghálózatokra támaszkodnak, egy olyan szoftver-felépítésre, amely durván kialakult az emberi agy után. A neurális hálózatok elemezik és összehasonlítják a nagy mennyiségű adatmintát, hogy olyan mintákat és összefüggéseket találjanak, amelyekről az emberek általában hiányoznak. Ezt a folyamatot "képzésnek" hívják, és kimenetele olyan modell, amely különféle feladatokat képes elvégezni.
A korábbi napokban a mélytanulási modelleket főként osztályozási feladatok elvégzésére használták - például objektumok fotókon történő megjelölésére, valamint hang- és arcfelismerésre. A közelmúltban a tudósok a mély tanulást bonyolultabb feladatok elvégzésére használják, például társasjátékok játszására, betegek diagnosztizálására, valamint zene és műalkotások készítésére.
A FakeApp hozzáigazításához egy arccsere végrehajtásához a felhasználónak több száz képpel kell elkészítenie azt a forrás és a cél arcokról. A program mélyreható algoritmusokat futtat, hogy a két arc között mintákat és hasonlóságokat találjon. A modell ezután készen áll a cserére.
A folyamat nem egyszerű, de nem kell grafikus szakértőnek vagy gépi tanulási mérnöknek lennie a FakeApp használatához. Ez szintén nem igényel drága és speciális hardvert. A deepfakes oktató webhely egy olyan számítógépet javasol, amely legalább 8 GB RAM-mal és Nvidia GTX 1060 vagy annál jobb grafikus kártyával rendelkezik, nagyon szerény konfigurációval.
"Ha olyan világba költözik, ahol egy szobában valaki hamisíthat valamit, akkor azt megkérdőjelezhető célokra is felhasználhatja" - mondja Haines. "És mivel ez egy ember önmagában, titokban tartani nagyon könnyű."
2016-ban Haines, aki akkoriban posztdoktori kutatóként a University of University University-n dolgozott ki, papírt és egy alkalmazást készített, amely megmutatta, hogy az AI hogyan tanulhatna meg egy személy kézírását. A "Saját szöveg a kézírásban" elnevezésű alkalmazás mélyreható tanulási algoritmusokat használt a szerző kézírásának stílusának és folyamatának, valamint egyéb tényezők, például a távolság és a szabálytalanságok elemzésére és felismerésére.
Az alkalmazás bármilyen szöveget elvethet és reprodukálhat a célíró kézírásával. A fejlesztők még a véletlenszerűség mértékét is hozzátették az elkerülhetetlen völgyhatás elkerülésére - az a furcsa érzés, amelyet akkor tapasztalunk, amikor látunk valamit, ami szinte, de nem egészen emberi. A koncepció bizonyításaként Haines és a többi UCL-kutató a technológiát olyan történelmi személyek kézírásának megismételésére használta, mint például Abraham Lincoln, Frida Kahlo és Arthur Conan Doyle.
Ugyanez a technika alkalmazható bármilyen más kézírás esetén is, ami aggodalmakat vet fel a technológia hamisításhoz és csaláshoz való lehetséges felhasználása miatt. A kriminalisztikai szakértő továbbra is képes lesz észlelni, hogy a forgatókönyvet a Saját szöveg a saját kézírásában készítette, de valószínûleg becsapja a képzetlen embereket, amit Haines elismert az akkori Digital Trends interjúban.
A monreali székhelyű Lyrebird mély tanulással fejlesztette ki az emberi hangot szintetizáló alkalmazást. A Lyrebirdnek egy perces felvételre van szüksége ahhoz, hogy egy ember hangját utánozza, bár sokkal többre van szüksége, mielőtt meggyőzően hangzik.
Az indító nyilvános bemutatóján hamis felvételeket tett közzé Donald Trump, Barack Obama és Hillary Clinton hangjáról. A minták nyersek, és nyilvánvaló, hogy szintetikusak. De ahogy a technológia javul, a megkülönböztetés még nehezebbé válik. És bárki regisztrálhat a Lyrebirdnél, és hamis felvételeket készíthet; a folyamat még könnyebb, mint a FakeAppé, és a számításokat a felhőben hajtják végre, így kevesebb terhelés jelent meg a felhasználó hardverén.
Az a tény, hogy ez a technológia megkérdőjelezhető célokra használható fel, nem veszíti el a fejlesztőket. Az egyik pontban a Lyrebird weboldalán található etikai nyilatkozat kimondta: "A hangfelvételeket jelenleg erős bizonyítékoknak tekintik társadalmunkban és különösen sok ország joghatóságainál. Technológiánk megkérdőjelezi az ilyen bizonyítékok érvényességét, mivel lehetővé teszi az audio könnyű manipulálását. Ez potenciálisan veszélyes következményekkel járhat, például a diplomaták megtévesztésére, a csalásokra és általában más problémákra, amelyeket valaki más személyazonosságának ellopása okozhat."
Az Nvidia bemutatta az AI utánzata képességeinek egy másik aspektusát: Tavaly a vállalat egy videót tett közzé, amely bemutatta az AI algoritmusokat, amelyek fotóminőségű szintetikus emberi arcokat generálnak. Az Nvidia AI hírességek fotóinak ezreit elemezte, majd hamis hírességeket készített. A technológia hamarosan képes lesz realisztikus megjelenésű videókat készíteni olyan emberekkel, akik nem léteznek.
Az AI határai
Sokan rámutattak, hogy rossz kezekben ezek az alkalmazások sok kárt okozhatnak. De a kortárs AI képességeinek mértéke gyakran túlmutat.
"Annak ellenére, hogy az ember arcát valaki más arcába tesszük egy videóba, vagy szintetizálhatjuk a hangot, ez még mindig eléggé mechanikus" - mondja Eugenia Kuyda, az AI-alapú csevegőbotokat fejlesztő cég társalapítója. AI eszközök, mint például a FakeApp és a Lyrebird.
A Voicery, egy másik AI indítógép, amely, mint a Lyrebird, AI-alapú hangszintetizálást is biztosít, rendelkezik egy kvízoldallal, ahol a felhasználók 18 hangfelvétel sorozatát mutatják be, és felkérést kapnak, hogy adja meg, melyik készül a gép. Az első futtatás során képes voltam azonosítani az összes gépi gyártású mintát.
Kuyda vállalat egyike azon szervezeteknek, amelyek természetes nyelvfeldolgozást (NLP) használnak, az AI azon részhalmazát, amely lehetővé teszi a számítógépek számára az emberi nyelv megértését és értelmezését. A Luka, a Kuyda chatbotjának korábbi verziója az NLP-t és annak iker technológiáját, a természetes nyelvgenerációt (NLG) használta, hogy utánozza az HBO TV-sorozatának Szilícium-völgyét . A neurális hálózatot betanítottuk szkriptvonalakkal, tweetekkel és a karakterekkel elérhető egyéb adatokkal a viselkedési modell és a felhasználókkal folytatott párbeszéd létrehozásához.
A Replika, a Kuyda új alkalmazásának köszönhetően minden felhasználó létrehozhatja saját AI-avatárját. Minél többet beszélgetsz a Replikával, annál jobb lesz a személyiség megértésében, és annál értelmesebbé válnak a beszélgetések.
Az alkalmazás telepítése és a Replika beállítását követően az első pár beszélgetést bosszantónak találtam. Többször is több mondatot kellett megismételnem, különféle módon, hogy a szándékomat átadjam Replikámnak. Gyakran csalódva hagytam az alkalmazást. (És hogy őszinte legyek, jó munkát végeztem annak határainak tesztelésével, fogalmi és elvont kérdésekkel bombázva.) De a beszélgetéseink folytatódásával a Replika okosabbá vált a mondatom jelentésének megértésében és értelmes témák felvázolásában. Pár alkalommal is meglepett, amikor kapcsolatba hoztam a múltbeli beszélgetésekkel.
Noha lenyűgöző, a Replikanak vannak korlátai, amelyeket Kuyda gyorsan rámutat. "A hang utánzás és a képfelismerés valószínűleg hamarosan sokkal jobb lesz, de a párbeszéd és a beszélgetés során még mindig nagyon messze vagyunk" - mondja. "Utánozhatunk néhány beszédmintát, de nem csak úgy tudunk elfogni egy embert, és tökéletesen utánozni a beszélgetést, és elvárhatjuk, hogy csevegőbotja új ötleteket készítsen, akárcsak az a személy."
Alexandre de Brébisson, a Lyrebird vezérigazgatója és társalapítója azt mondja: "Ha most elég jól tudjuk elcsábítani az emberi hangot, képet és videót, akkor még messze vagyunk az egyedi nyelvi modelltól." De Brébisson rámutat arra, hogy valószínűleg mesterséges általános intelligenciát igényel, olyan AI-t, amely tudatában van és képes megérteni az elvont fogalmakat, és úgy dönt, mint az emberek. Egyes szakértők szerint évtizedek óta távol tartunk az általános AI létrehozásától. Mások szerint soha nem jutunk oda.
Pozitív felhasználások
A negatív kép, amelyet az AI-alkalmazások szintetizálásával kapcsolatban előre vetítenek, árnyékot vetnek pozitív felhasználásuk felett. És nagyon sok van.
Az olyan technológiák, mint például a Lyrebird, javíthatják a számítógépes interfészekkel való kommunikációt azáltal, hogy természetesebbé teszik őket, és de Brébisson szerint egyedülálló mesterséges hangot adnak, amely megkülönbözteti a vállalatokat és a termékeket, és így megkönnyíti a márkanevek megkülönböztetését. Mivel az Amazon Alexa és az Apple Siri egyre népszerűbb felhasználói felületté tette az eszközöket és a szolgáltatásokat, így például a Lyrebird és a Voicery olyan márkák számára kínálhat egyedi márkájú embereket, amelyek megkülönböztetik egymást.
"Az orvosi alkalmazások a hang-klónozási technológiánk izgalmas felhasználási példái is" - tette hozzá de Brébisson. "Nagyon nagy érdeklődést kaptunk azoktól a betegektől, akik elveszítették hangját egy betegség miatt, és jelenleg időt töltünk az ALS-betegekkel, hogy megtudjuk, hogyan tudunk segíteni nekik."
Idén elején, a Project Revoice-val együttműködésben, egy ausztrál nonprofit szervezettel, amely segíti a beszédzavarban szenvedő ALS-betegeket, a Lyrebird segített Pat Quinnnek, az Ice Bucket Challenge alapítójának, hogy visszanyerje hangját. Quinn, aki ALS-beteg, 2014-ben elvesztette a járási és beszédképességét, és azóta számítógépes beszédszintetizátort használt. Lyrebird technológiája és Quinn nyilvános fellépéseinek hangfelvételei segítségével Revoice képes volt "újra létrehozni" hangját.
"A hangod nagy része az identitásának, és az ilyen betegeknek olyan mesterséges hang megadása, amely úgy hangzik, mint az eredeti hangjuk, kissé olyan, mintha visszaadná számukra identitásuk egy fontos részét. Számukra ez az életmegváltoztató" - mondja de Brébisson.
Abban az időben, amikor elősegítette a kézírás-utánozó alkalmazás fejlesztését, Dr. Haines az UCL-vel készített interjúban beszélt annak pozitív felhasználásáról. "Például az agyvérzés áldozatai képesek lehetnek leveleket megfogalmazni, amelyek nem merülnek fel az olvashatatlanság miatt, vagy ha valaki ajándékba küld virágot, kézírásos feljegyzés is szerepelhet anélkül, hogy belemenne a virágüzletbe. "Használható képregényekben is, ahol egy kézírásos szöveget le lehet fordítani különféle nyelvekre anélkül, hogy elvesztenék a szerző eredeti stílusát."
Még az olyan technológiák, mint például a FakeApp, amelyek az etikátlan használat miatt híressé váltak, pozitív felhasználások lehetnek, gondolja Haines. "Annak a világnak a felé haladunk, ahol bárki nagyon kreatív tevékenységet végezhet a nyilvános technológiával, és ez jó dolog, mert ez azt jelenti, hogy nincs szüksége ezekre a nagy összegekre mindenféle művészi jellegű őrült dolog elkészítéséhez, " mondja.
Haines elmagyarázza, hogy csapata eredeti célja az volt, hogy megtudja, hogyan segíthet az AI a kriminalisztikában. Bár kutatásaik eltérő irányba fordultak, az eredmények továbbra is hasznosak lesznek a kriminalisztikai tisztviselők számára, akik meg tudják vizsgálni, hogy nézhet ki az AI alapú hamisítás. "Tudni akarja, mi a csúcstechnológia, tehát amikor valamit nézel, elmondja, hamis vagy sem." - mondja.
A Replika Kudya rámutat arra, hogy az emberhez hasonló AI alkalmazások olyan módon segíthetnek nekünk, amely egyébként lehetetlen. "Ha volt egy AI-avatár, amely nagyon jól ismer téged, és tisztességes ábrázolása lehet önnek, akkor mit tehetne, ha az Ön érdekeinek megfelelően jár el?" ő mondja. Például egy autonóm AI-avatár több száz filmet nézhet az ön nevében, és veled folytatott beszélgetései alapján ajánlhatja azokat, amelyeket szeretne.
Ezek az avatárok még jobb emberi kapcsolatok kialakítását is segíthetik. "Lehet, hogy anyád több időt tölthet veled, és valószínűleg kicsit közelebb kerülhet a szüleihez, ha hagyja, hogy beszélgetjenek a Replikával, és elolvassák az átiratot" - mondja Kudya példaként.
De vajon az AI chatbotja, amely megismétli egy valódi ember viselkedését, eredményesebben eredményez-e jobb emberi kapcsolatokat? Kuyda úgy véli, hogy képes. 2016-ban összegyűjtötte a régi szöveges üzeneteket és e-maileket Roman Mazurenko-tól, egy baráttól, aki az előző évben meghalt egy közúti balesetben, és továbbította őket az alkalmazását működtető ideghálózathoz. Ennek eredményeként létrejött egy chatbot alkalmazás, amely - a divat után - visszahozta a barátját az életbe, és ugyanúgy beszélt vele, mint ő.
"A római alkalmazás létrehozása és a vele való beszélgetés fontos szerepet játszott barátunk elvesztésében. Az alkalmazás arra készteti bennünket, hogy jobban gondolkodjunk róla, mindig mélyebben emlékezzünk rá" - mondja a nő. tapasztalata. "Bárcsak szeretnék, ha lenne több ilyen alkalmazásom, olyan alkalmazások, amelyek a barátságomról, a kapcsolataimról és a számomra valóban nagyon fontos dolgokról szólnának."
Kuyda úgy gondolja, hogy az egész szándékoktól függ. "Ha a chatbot az Ön érdekeinek megfelelően jár el, ha azt akarja, hogy örüljön, hogy értékes értékes szolgáltatást szerezzen belőle, akkor nyilvánvalóan valaki másnak a Replikával való beszélgetése elősegíti az erősebb kapcsolat kialakítását az emberrel a valós életben., " ő mondja. "Ha csak azt próbálja meg eladni egy alkalmazásban, akkor csak annyit fog tenni, hogy az alkalmazással töltött időt maximalizálja, és ne kommunikáljon egymással. És ez, azt hiszem, megkérdőjelezhető."
Jelenleg nincs mód arra, hogy a Replika-t más platformokkal kösse össze - például Facebook Messenger csevegőbotként elérhetővé téve azt. De a társaság aktív kapcsolatban áll a felhasználói közösséggel, és folyamatosan fejleszt új funkciókat. Tehát jövőbeli lehetőség lehet, ha másoknak kommunikálunk a Replika-val.
Hogyan lehet minimalizálni a kompromisszumokat?
A gőzgéptől az elektromosságig az internetig minden technológiának pozitív és negatív alkalmazásai is voltak. Az AI nem különbözik egymástól. "A negatívok lehetősége nagyon komoly" - mondja Haines. "Lehet, hogy belépünk egy térbe, ahol a negatívok meghaladják a pozitívumokat."
Tehát hogyan maximalizálhatjuk az AI-alkalmazások előnyeit a negatívok elleni küzdelem során? Haines szerint nem fékezik az innovációt és a kutatást, mondja Haines - mert ha néhányan így tesznek, akkor nincs garancia arra, hogy más szervezetek és államok követni fogják a példát.
"Egyetlen intézkedés sem segít a probléma megoldásában" - mondja Haines. "Jogi következményekkel kell járniuk." A mély vitatott vitát követően az Egyesült Államok törvényhozói vizsgálják a kérdést, és feltárják azokat a jogi biztosítékokat, amelyek megakadályozhatják az AI által doktorantált média használatát a káros célok elérése érdekében.
"Fejleszthetünk technológiákat is a hamisítások felismerésére, amikor azok túlmutatnak azon a ponton, hogy az ember meg tudja mondani a különbséget" - mondja Haines. "De egy időben a csalás és az észlelés közötti versenyben a csalás nyerhet."
Ebben az esetben a technológiák fejlesztése felé kell lépnünk, amelyek bizonyítékláncot hoznak létre a digitális média számára. Példaként Haines megemlíti a kamerákba ágyazott hardvert, amely digitálisan aláírhatja a rögzített videót a hitelességének megerősítése érdekében.
A tudatosság növelése nagy szerepet játszik az AI algoritmusok általi hamisításokkal és csalásokkal szemben - mondja De Brébisson. "Ezt tettük úgy, hogy klónoztuk Trump és Obama hangját, és arra buzdítottuk őket, hogy politikailag helyes mondatokat mondjanak" - mondja. "Ezek a technológiák olyan társadalmi, etikai és jogi kérdéseket vetnek fel, amelyeket előre kell gondolni. A Lyrebird sok figyelmet keltett és sok ember most gondolkodik ezen lehetséges kérdésekben és a visszaélések megelőzésének módjában."
Nyilvánvaló, hogy egy olyan korba lépünk, ahol a valóság és a fikció összekapcsolódik, a mesterséges intelligencia révén. A Turing-teszt talán megfelel a legnagyobb kihívásoknak. És elég hamarosan mindenkinek megvan az eszköze és hatalma saját világának, saját népének és az igazság saját változatának létrehozásához. Még nem láttuk az előttünk álló izgalmas lehetőségek és veszélyek teljes körét.