AI video zaplaví web brakem. K ničemu jinému ho nepotřebujeme
Nové schopnosti AI generátorů textu a obrazu opakovaně vyvolávají nadšení i obavy. Ani sebezajímavější AI video ovšem stále nedokáže přesvědčivě odpovědět na otázku, k čemu tyto technologie vlastně potřebujeme a kde jsou hranice jejich možností.
Firma OpenAI před měsícem představila svůj nový AI nástroj pro tvorbu videa Sora a sociální sítě zaplavily obdivné reakce. Na první pohled se není čemu divit – schopnost vygenerovat alespoň částečně smysluplné a realistické minutové video na základě krátkého textového pokynu je skutečně pádným důkazem rychlého rozvoje AI nástrojů a nepopiratelný technologický úspěch.
Stejně jako dříve u ChatGPT, Midjourney a dalších systémů pro tvorbu textu či statického obrazu, i okolo Sory se roztočila debata o tom, jak moc novinka změní filmový průmysl, připraví o práci střihače či kameramany a zároveň otevře úžasné nové možnosti. Nechyběly ani spekulace o tom, že si už brzy budeme generovat filmy či seriály sami sobě na míru. A stále dokola je tato diskuze tvořena především snůškou naivních iluzí, chytrého marketingu, obelhávání investorů a zakrýváním skutečného principu technologií, kterým bychom rozhodně neměli říkat „inteligence“.
Určité pochybnosti vyvolaly už jen nedokonalosti v prvních publikovaných výstupech. Podobně jako u jiných AI systémů, i u Sory dochází k častým halucinacím a generuje pětinohé psy a šestiprsté ruce. AI systémy jsou jen pravděpodobnostní generátory, které nemají žádné ponětí o realitě ani možnost jejího poznání, a tak zrovna v případě videa ještě o poznání více tápou při zobrazování pohybu v 3D prostoru.
Vývojářům v OpenAI se sice podařilo dosáhnout dříve nevídané časoprostorové kontinuity ve video záběrech. Sami ale ve svém vlastním propagačním textu přiznávají, že jde jen o plynule propojenou animaci navazujících „filmových políček“, která nemá nic společného se skutečnou simulací reality. A hodně toho prozradili i tajuplným konstatováním, že relativně věrohodný dojem pohybu věcí a lidí v 3D prostoru se objevil sám jen díky velikosti zdrojových dat a výpočtů.
Komentáře v rubrice Prolomit vlny vyjadřují názory autora/autorky.
Technologický reportér Brian Merchant toto „kouzlo“ trochu rozbil poznatkem, že vygenerovaná umělá videa se podezřele věrně podobají „lidskému“ materiálu, na kterém byla Sora vycvičena – jednoduše řečeno jde jen o dovedně pozměněné kopie a de facto plagiáty, což je ostatně stejný problém, kterému v rozsáhlé míře čelí i textové generátory typu ChatGPT.
Čtěte také
Absence ponětí o skutečné 3D realitě se projevuje i tím, že jde jen o plynulé záběry bez střihu. S ním by automatická animace „ztratila nit“ a ocitla se uprostřed ještě bizarnějších halucinací. Ve výčtu dalších nedostatků by šlo ještě dlouho pokračovat, ale hlavním úskalím je společenský a ekonomický kontext celé věci.
Bloger Ed Zitron nedávno trefně podotkl, že OpenAI a další AI firmy se snaží všemi silami zakrýt skutečnost, že jejich úžasné nové nástroje mohou narazit na nepřekonatelné technologické limity, a především po nich i přes masivní marketingovou ofenzivu není skutečná lidská poptávka – jinými slovy stále není jasné, jakou zásadní potřebu AI nástroje řeší či alespoň vytváří.
Pořád jde o ztrátový byznys, který má obrovské finanční a energetické nároky, a není jisté, zda vůbec někdy dosáhne zisku. Vznikající ztrátu musí sanovat gigantickými vklady investoři, které je tak potřeba stále lákat na nová lesklá udělátka. Možná právě proto OpenAI a další společnosti pravidelně vypouštějí nové, byť nedokonalé a problematické produkty.
Čtěte také
Ukazuje se, že AI nástroje nedokázaly a pravděpodobně ani nikdy nedokážou plnohodnotně nahradit lidské tvůrce textu a obrazu, což mělo být jejich hlavním byznysovým lákadlem. Jejich impakt skončil u toho, že naprosto rozvrátily pracovní trh v oblasti tvorby „spotřebního“ obsahu typu levných reklamních textů či ilustračních fotografií, a následně zaplavily sociální sítě, média, vyhledávače a obecně celý internet automaticky vytvářeným brakem a různými formami spamu a podvodů. To bychom jen těžko mohli označit za životaschopnou a produktivní formu ekonomiky.
Líbivá reklama ovšem nedokáže zakrývat realitu věčně. Nadhodnocené akcie velkých technologických společností začínají vyvolávat vzpomínky na situaci před prasknutím první internetové bubliny v roce 2000. Je tedy otázkou, jak dlouho ještě dokážou AI firmy rozvášňovat investory a tlačit nasazení svých nástrojů do všemožných sektorů, kde je ve skutečnosti nikdo nepotřebuje a je to jen ke škodě věci.
Poslechněte si nejnovější komentář rubriky Prolomit vlny.
Související
-
Pokud zjistíme, jak fungují těla a realita, můžeme je začít hackovat, říká filozofka Amy Ireland
Experimentální spisovatelka a filozofka propojuje kyberkulturu s emancipační politikou. V rozhovoru vysvětluje třeba to, jaký osvobozující potenciál má blockchain.
Více z pořadu
Mohlo by vás zajímat
E-shop Českého rozhlasu
Kdo jste vy? Klára, nebo učitel?
Tereza Kostková, moderátorka ČRo Dvojka
Jak Klára obrátila všechno vzhůru nohama
Knížka režiséra a herce Jakuba Nvoty v překladu Terezy Kostkové předkládá malým i velkým čtenářům dialogy malé Kláry a učitele o světě, který se dá vnímat docela jinak, než jak se píše v učebnicích.