AI video zaplaví web brakem. K ničemu jinému ho nepotřebujeme

7. březen 2024

Nové schopnosti AI generátorů textu a obrazu opakovaně vyvolávají nadšení i obavy. Ani sebezajímavější AI video ovšem stále nedokáže přesvědčivě odpovědět na otázku, k čemu tyto technologie vlastně potřebujeme a kde jsou hranice jejich možností.

Firma OpenAI před měsícem představila svůj nový AI nástroj pro tvorbu videa Sora a sociální sítě zaplavily obdivné reakce. Na první pohled se není čemu divit – schopnost vygenerovat alespoň částečně smysluplné a realistické minutové video na základě krátkého textového pokynu je skutečně pádným důkazem rychlého rozvoje AI nástrojů a nepopiratelný technologický úspěch.

Matouš Hrdina

Stejně jako dříve u ChatGPT, Midjourney a dalších systémů pro tvorbu textu či statického obrazu, i okolo Sory se roztočila debata o tom, jak moc novinka změní filmový průmysl, připraví o práci střihače či kameramany a zároveň otevře úžasné nové možnosti. Nechyběly ani spekulace o tom, že si už brzy budeme generovat filmy či seriály sami sobě na míru. A stále dokola je tato diskuze tvořena především snůškou naivních iluzí, chytrého marketingu, obelhávání investorů a zakrýváním skutečného principu technologií, kterým bychom rozhodně neměli říkat „inteligence“.

Určité pochybnosti vyvolaly už jen nedokonalosti v prvních publikovaných výstupech. Podobně jako u jiných AI systémů, i u Sory dochází k častým halucinacím a generuje pětinohé psy a šestiprsté ruce. AI systémy jsou jen pravděpodobnostní generátory, které nemají žádné ponětí o realitě ani možnost jejího poznání, a tak zrovna v případě videa ještě o poznání více tápou při zobrazování pohybu v 3D prostoru.

Vývojářům v OpenAI se sice podařilo dosáhnout dříve nevídané časoprostorové kontinuity ve video záběrech. Sami ale ve svém vlastním propagačním textu přiznávají, že jde jen o plynule propojenou animaci navazujících „filmových políček“, která nemá nic společného se skutečnou simulací reality. A hodně toho prozradili i tajuplným konstatováním, že relativně věrohodný dojem pohybu věcí a lidí v 3D prostoru se objevil sám jen díky velikosti zdrojových dat a výpočtů.

Komentáře v rubrice Prolomit vlny vyjadřují názory autora/autorky.

Technologický reportér Brian Merchant toto „kouzlo“ trochu rozbil poznatkem, že vygenerovaná umělá videa se podezřele věrně podobají „lidskému“ materiálu, na kterém byla Sora vycvičena – jednoduše řečeno jde jen o dovedně pozměněné kopie a de facto plagiáty, což je ostatně stejný problém, kterému v rozsáhlé míře čelí i textové generátory typu ChatGPT.

Čtěte také

Absence ponětí o skutečné 3D realitě se projevuje i tím, že jde jen o plynulé záběry bez střihu. S ním by automatická animace „ztratila nit“ a ocitla se uprostřed ještě bizarnějších halucinací. Ve výčtu dalších nedostatků by šlo ještě dlouho pokračovat, ale hlavním úskalím je společenský a ekonomický kontext celé věci.

Bloger Ed Zitron nedávno trefně podotkl, že OpenAI a další AI firmy se snaží všemi silami zakrýt skutečnost, že jejich úžasné nové nástroje mohou narazit na nepřekonatelné technologické limity, a především po nich i přes masivní marketingovou ofenzivu není skutečná lidská poptávka – jinými slovy stále není jasné, jakou zásadní potřebu AI nástroje řeší či alespoň vytváří.

Pořád jde o ztrátový byznys, který má obrovské finanční a energetické nároky, a není jisté, zda vůbec někdy dosáhne zisku. Vznikající ztrátu musí sanovat gigantickými vklady investoři, které je tak potřeba stále lákat na nová lesklá udělátka. Možná právě proto OpenAI a další společnosti pravidelně vypouštějí nové, byť nedokonalé a problematické produkty.

Čtěte také

Ukazuje se, že AI nástroje nedokázaly a pravděpodobně ani nikdy nedokážou plnohodnotně nahradit lidské tvůrce textu a obrazu, což mělo být jejich hlavním byznysovým lákadlem. Jejich impakt skončil u toho, že naprosto rozvrátily pracovní trh v oblasti tvorby „spotřebního“ obsahu typu levných reklamních textů či ilustračních fotografií, a následně zaplavily sociální sítě, média, vyhledávače a obecně celý internet automaticky vytvářeným brakem a různými formami spamu a podvodů. To bychom jen těžko mohli označit za životaschopnou a produktivní formu ekonomiky.

Líbivá reklama ovšem nedokáže zakrývat realitu věčně. Nadhodnocené akcie velkých technologických společností začínají vyvolávat vzpomínky na situaci před prasknutím první internetové bubliny v roce 2000. Je tedy otázkou, jak dlouho ještě dokážou AI firmy rozvášňovat investory a tlačit nasazení svých nástrojů do všemožných sektorů, kde je ve skutečnosti nikdo nepotřebuje a je to jen ke škodě věci.

Poslechněte si nejnovější komentář rubriky Prolomit vlny.

Spustit audio

Související

Více z pořadu

Mohlo by vás zajímat

E-shop Českého rozhlasu

Víte, kde spočívá náš společný ukrytý poklad? Blíž, než si myslíte!

Jan Rosák, moderátor

slovo_nad_zlato.jpg

Slovo nad zlato

Koupit

Víte, jaký vztah mají politici a policisté? Kde se vzalo slovo Vánoce? Za jaké slovo vděčí Turci husitům? Že se mladým paním původně zapalovalo něco úplně jiného než lýtka? Že segedínský guláš nemá se Segedínem nic společného a že známe na den přesně vznik slova dálnice? Takových objevů je plná knížka Slovo nad zlato. Tvoří ji výběr z rozhovorů moderátora Jana Rosáka s dřívějším ředitelem Ústavu pro jazyk český docentem Karlem Olivou, které vysílal Český rozhlas Dvojka.