Itthon vélemények Hogyan ai, ml átalakítja a beszédet szöveggé, nyelvfordításokat tim bajarin

Hogyan ai, ml átalakítja a beszédet szöveggé, nyelvfordításokat tim bajarin

Videó: Post Graduate Diploma in ML and AI by AAIC and UOH (November 2024)

Videó: Post Graduate Diploma in ML and AI by AAIC and UOH (November 2024)
Anonim

A Google I / O egyik leglenyűgözőbb demója a Duplex volt, egy olyan mesterséges intelligencia, amely felhívta az üzleti helyeket - ebben az esetben a fodrászatot és egy éttermet -, hogy találkozókat foglaljon le. A vonal másik végén látszólag egyik sem volt okosabb ember, és a Duplex könnyedén kezelte a kihívásokat, például amikor az étterem azt mondta, hogy nem fogadja el a kisebb partikra szóló foglalásokat.

Ez a konkrét AI-bejelentés sok lefedettséget kapott a Google I / O-ban, de az AI és a gépi tanulás elterjedt az összes termékben és szolgáltatásban, amelyeket a fejlesztői konferencián mutattak be. Csak nézze meg ezt a diagramot, amelyet a Google az I / O megnyitása előtti napon egy AI-központú elemző eseményen mutatott be.

Két másik dolog mutatott arra az eseményre, amelyet potenciális játékváltóknak tartok.

Az első az, hogyan alkalmazzák az AI-t a hang-szöveges fordításhoz. A cél az, hogy ezt az AI és ML segítségével 99% -os pontossággal elérjék a következő években. De a demók, amelyekben különféle G-Suite alkalmazásokhoz kommentárokat diktáltak, már elég pontosak voltak. Láttuk a Smart Compose mélyebb bemutatóját is, ahol egy személy mondatot ír a Gmailben, és a Smart Compose az első mondat kontextusa alapján írja a következő mondatot az Ön számára.

Különböző hangfelismerő termékek, mint például a Dragon Dictate, évek óta vannak a piacon. De ezek a programok támaszkodtak a lokalizált szoftverre, és kihasználták az egyes kiadások időpontjában rendelkezésre álló jelenlegi feldolgozási teljesítményt. Ezek a programok az évek során jobbak lettek, de ha AI és ML hirdetéseket adnak, akkor a pontossági ráta minden bizonnyal jobb lesz.

A Google megérti a szöveg-beszéd fontosságát, mivel ez kapcsolódik mindennapi életünkhöz. A pontos hang-szöveg interfész kritikus fontosságú, ha vezetésre üzenetet válaszol. Jelentős módja van e-mailekre vagy szöveges üzenetekre való válaszadáshoz hordható vagy okostelefonokon. Végül értékes bemeneti tényezővé válik kevert valóság szemüveg használatakor, amikor a hang használata a navigációs folyamat részeként, és a hangról a szövegre szükség van különféle AR alkalmazásokra.

A második az AI és az ML felhasználása a Google Fordítóban, amely valóban átalakul, ha a fordítás valós időben történik. Nemzetközi utazóként, aki csak angolul beszél, ez a fordítás isten áldása lenne. Vannak olyan kézi eszközök, amelyek megpróbálják lefordítani az ön által mondott nyelvet helyi nyelvre, ám ezeknek sok korlátozása van.

A Google figyelemmel kíséri az ilyen típusú fordítást, tehát biztonságos azt mondani, hogy hamarosan valódi áttöréseket tapasztalhatunk a pontosabb nyelvi fordításban az Android telefonokon. Az Apple AI és ML kutatásokkal is foglalkozik a hang- és szövegfordítás különféle aspektusain, így az a potenciális partnerekkel együtt egy napon mobiltelefonos fordítási megoldást is szállíthat az iOS-en.

Az AI és az ML drámai hatást gyakorol a hang-szöveges fordításra, és legszembetűnőbb hatása az AR és VR UI részeként vagy kevert valóság szemüveg lehet. Személy szerint a nyelvi fordítások leginkább izgatnak, mivel ez megkönnyítené a világutaimat.

Hogyan ai, ml átalakítja a beszédet szöveggé, nyelvfordításokat tim bajarin