AI video zaplaví web brakem. K ničemu jinému ho nepotřebujeme

7. březen 2024

Nové schopnosti AI generátorů textu a obrazu opakovaně vyvolávají nadšení i obavy. Ani sebezajímavější AI video ovšem stále nedokáže přesvědčivě odpovědět na otázku, k čemu tyto technologie vlastně potřebujeme a kde jsou hranice jejich možností.

Firma OpenAI před měsícem představila svůj nový AI nástroj pro tvorbu videa Sora a sociální sítě zaplavily obdivné reakce. Na první pohled se není čemu divit – schopnost vygenerovat alespoň částečně smysluplné a realistické minutové video na základě krátkého textového pokynu je skutečně pádným důkazem rychlého rozvoje AI nástrojů a nepopiratelný technologický úspěch.

Matouš Hrdina

Stejně jako dříve u ChatGPT, Midjourney a dalších systémů pro tvorbu textu či statického obrazu, i okolo Sory se roztočila debata o tom, jak moc novinka změní filmový průmysl, připraví o práci střihače či kameramany a zároveň otevře úžasné nové možnosti. Nechyběly ani spekulace o tom, že si už brzy budeme generovat filmy či seriály sami sobě na míru. A stále dokola je tato diskuze tvořena především snůškou naivních iluzí, chytrého marketingu, obelhávání investorů a zakrýváním skutečného principu technologií, kterým bychom rozhodně neměli říkat „inteligence“.

Určité pochybnosti vyvolaly už jen nedokonalosti v prvních publikovaných výstupech. Podobně jako u jiných AI systémů, i u Sory dochází k častým halucinacím a generuje pětinohé psy a šestiprsté ruce. AI systémy jsou jen pravděpodobnostní generátory, které nemají žádné ponětí o realitě ani možnost jejího poznání, a tak zrovna v případě videa ještě o poznání více tápou při zobrazování pohybu v 3D prostoru.

Vývojářům v OpenAI se sice podařilo dosáhnout dříve nevídané časoprostorové kontinuity ve video záběrech. Sami ale ve svém vlastním propagačním textu přiznávají, že jde jen o plynule propojenou animaci navazujících „filmových políček“, která nemá nic společného se skutečnou simulací reality. A hodně toho prozradili i tajuplným konstatováním, že relativně věrohodný dojem pohybu věcí a lidí v 3D prostoru se objevil sám jen díky velikosti zdrojových dat a výpočtů.

Komentáře v rubrice Prolomit vlny vyjadřují názory autora/autorky.

Technologický reportér Brian Merchant toto „kouzlo“ trochu rozbil poznatkem, že vygenerovaná umělá videa se podezřele věrně podobají „lidskému“ materiálu, na kterém byla Sora vycvičena – jednoduše řečeno jde jen o dovedně pozměněné kopie a de facto plagiáty, což je ostatně stejný problém, kterému v rozsáhlé míře čelí i textové generátory typu ChatGPT.

Čtěte také

Absence ponětí o skutečné 3D realitě se projevuje i tím, že jde jen o plynulé záběry bez střihu. S ním by automatická animace „ztratila nit“ a ocitla se uprostřed ještě bizarnějších halucinací. Ve výčtu dalších nedostatků by šlo ještě dlouho pokračovat, ale hlavním úskalím je společenský a ekonomický kontext celé věci.

Bloger Ed Zitron nedávno trefně podotkl, že OpenAI a další AI firmy se snaží všemi silami zakrýt skutečnost, že jejich úžasné nové nástroje mohou narazit na nepřekonatelné technologické limity, a především po nich i přes masivní marketingovou ofenzivu není skutečná lidská poptávka – jinými slovy stále není jasné, jakou zásadní potřebu AI nástroje řeší či alespoň vytváří.

Pořád jde o ztrátový byznys, který má obrovské finanční a energetické nároky, a není jisté, zda vůbec někdy dosáhne zisku. Vznikající ztrátu musí sanovat gigantickými vklady investoři, které je tak potřeba stále lákat na nová lesklá udělátka. Možná právě proto OpenAI a další společnosti pravidelně vypouštějí nové, byť nedokonalé a problematické produkty.

Čtěte také

Ukazuje se, že AI nástroje nedokázaly a pravděpodobně ani nikdy nedokážou plnohodnotně nahradit lidské tvůrce textu a obrazu, což mělo být jejich hlavním byznysovým lákadlem. Jejich impakt skončil u toho, že naprosto rozvrátily pracovní trh v oblasti tvorby „spotřebního“ obsahu typu levných reklamních textů či ilustračních fotografií, a následně zaplavily sociální sítě, média, vyhledávače a obecně celý internet automaticky vytvářeným brakem a různými formami spamu a podvodů. To bychom jen těžko mohli označit za životaschopnou a produktivní formu ekonomiky.

Líbivá reklama ovšem nedokáže zakrývat realitu věčně. Nadhodnocené akcie velkých technologických společností začínají vyvolávat vzpomínky na situaci před prasknutím první internetové bubliny v roce 2000. Je tedy otázkou, jak dlouho ještě dokážou AI firmy rozvášňovat investory a tlačit nasazení svých nástrojů do všemožných sektorů, kde je ve skutečnosti nikdo nepotřebuje a je to jen ke škodě věci.

Poslechněte si nejnovější komentář rubriky Prolomit vlny.

Spustit audio

Související

Více z pořadu

Mohlo by vás zajímat

E-shop Českého rozhlasu

Kdo jste vy? Klára, nebo učitel?

Tereza Kostková, moderátorka ČRo Dvojka

jak_klara_obratila_na web.jpg

Jak Klára obrátila všechno vzhůru nohama

Koupit

Knížka režiséra a herce Jakuba Nvoty v překladu Terezy Kostkové předkládá malým i velkým čtenářům dialogy malé Kláry a učitele o světě, který se dá vnímat docela jinak, než jak se píše v učebnicích.