Kreatív Online - Hogyan rappel Mona Lisa, és ezzel hogy jutunk el a virtuális társig?

A Microsoft új mesterséges intelligencia technológiájának köszönhetően a Mona Lisa most már nem csak mosolyogni tud, hanem például rappelni is – számolt be a CNN Business. A múlt héten a Microsoft kutatói bemutattak egy általuk kifejlesztett új mesterségesintelligencia-modellt, ami képes egy arcot ábrázoló állóképet és egy hangfelvételét kombinálni, így automatikusan létre tud hozni egy valósághűnek tűnő videót, ami beszédet imitál. Az egyik demóvideóban a kutatók bemutatták, hogy a Leonardo da Vinci-festményéről ismert Mona Lisa Anne Hathaway színésznő hangján komikus rapszöveget adjon elő.

A VASA-1 modell alkotásai egyszerre szórakoztatóak és megrázóan valóságosak. A Microsoft szerint a technológia felhasználható lenne az oktatásban vagy a kommunikációs kihívásokkal küzdő emberek akadálymentesítésében, illetve virtuális társak létrehozására is alkalmas lehet az emberek számára. A Microsoft szerint az is könnyen elképzelhető, hogy az eszköz valódi emberek megszemélyesítésére is lehet majd használni.

@jwestontok We got mona lisa rapping now?💀💀💀#ai #monalisa ♬ original sound - jwestontok

A Microsoft új modelljét számos videóval képezték ki, amiken emberek arca látható beszéd közben, és úgy tervezték, hogy felismerje a természetes arc- és fejmozgásokat, beleértve többek között az ajakmozgást, az arckifejezéseket, a tekintetet és a pislogást. Ha jobban megnézzük, még mindig vannak arra utaló jelek, hogy a videók gépi előállításúak, például a pislogás ritka és a szemöldök is természetellenes mozog. A Microsoft azonban úgy véli, hogy modellje jelentősen felülmúlja más, hasonló eszközök teljesítményét, és megnyitja az utat az emberi viselkedést utánzó, élethű avatárokkal való valós idejű kapcsolat előtt.

A Microsoft egyelőre azt mondta, hogy nem tervezi a VASA-1 modell azonnali kiadását a nyilvánosság számára. A lépés hasonló ahhoz, ahogyan a Microsoft partnere, az OpenAI kezeli a Sora nevű, mesterséges intelligencia által generált videóeszközével kapcsolatos aggályokat: az OpenAI februárban mutatta be a Sorát, de eddig csak néhány professzionális felhasználó és kiberbiztonsági professzor számára tette elérhetővé tesztelési céllal.

(Kiemelt kép forrása: Youtube / Daily Mail)

Rovatok

Új világ íródik – most!