Umelá inteligencia je dnes taká dobrá, že dokáže vytvoriť falošný zvuk a video, ktoré je ťažké odlíšiť od reality. Nástup Photoshopu nás naučil neveriť všetkému, čo vidíme, ale čo sa stane, keď sa nebudeme môcť spoliehať ani na naše ostatné zmysly?
Najnovší príklad audiovizuálnej mágie spoločnosti AI pochádza z univerzity vo Washingtone, kde vedci vytvorili nový nástroj, ktorý preberá zvukové súbory, premení ich na realistické pohyby úst a potom ich prenesie na existujúce video. Konečným výsledkom je video niekoho, kto hovorí niečo, čo nevravel.
Na nasledujúcom zázname môžete vidieť dva klipy Baracka Obamu. Výsledné video nie je dokonalé, ale celkovo je to dosť presvedčivé.
Výskumníci uviedli, že používajú Obamu ako testovací predmet tejto práce, pretože existuje veľké množstvo veľmi kvalitných videozáznamov bývalého prezidenta, čo uľahčuje učenie neurónových sietí. Sedemnásť hodín záznamov bolo potrebných na sledovanie a replikáciu pohybu úst. Výskumník Ira Kemelmacher povedal, že v budúcnosti tento proces by mal byť zrýchlený iba na jednu hodinu.
Tím stojaci za prácou povedal, že dúfajú, že by sa táto technológia dala využiť na zlepšenie nástrojov pre videochat, ako je Skype. Používatelia by mohli zhromažďovať videozáznamy seba. Video na ich strane by bolo generované automaticky iba pomocou ich hlasu. To by pomohlo v situáciách, keď je pripojenie na internet nestabilné, alebo ak sa snažia ušetriť mobilné dáta.
Samozrejme, existuje tu aj možnosť hrozby, že nástroje, ako je tento, môžu a budú použité na vytvorenie zavádzajúceho videozáznamu. Kombinovať takýto nástroj s technológiou, ktorá dokáže vytvoriť akýkoľvek hlas len z niekoľko minútovej vzorky zvuku by bolo dosť desivé. Podobné výskumy dokázali v reálnom čase zmeniť napríklad aj niečí výraz tváre.
Tím z Washingtonskej univerzity je pochopiteľne odhodlaný zabrániť potencionálnemu zneužitiu, no teoreticky by táto technológia mohla byť použitá na mapovanie hlasu na kohoľvek tvár.
Zdroj: theverge
Pridať nový komentár