Umelá inteligencia opäť posúva hranice. Videá, ktoré vytvorila, nerozoznáte od reality

Nenechajte si ujsť

Erik Košťany
Erik Košťany
Moje meno je Erik (alebo Erino), mám 28, momentálne bývam v Bratislave. Kino navštevujem niekoľkokrát do mesiaca a čo nestihnem tam, doháňam na obrazovkách doma. Vlastním niekoľko konzol, rád si prečítam dobrú knihu či komiks, ale nevyhýbam sa ani pohybu po vonku (či už na nohách alebo bicykli)

Najčítanejšie za 7 dní

Umelá inteligencia sa posúva na ďalší level

OpenAI neprestáva posúvať hranice toho, čo dokáže umelá inteligencia. Chat GPT pomáha už v nejednej oblasti ľudských životov, tvorba obrázkov DALL-E od začiatku roka ešte strojnásobila počet používateľov. Ako informovala spoločnosť na svojej oficiálnej webovej stránke, teraz prichádza na rad nástroj Sora, ktorý pripravuje tak realistické videá, že sa vám nebude chcieť veriť, že sú vytvorené pomocou AI.

Od obrázkov už bol k vytvoreniu videa iba z jednoduchého textu len malý krok. Najprv bol predstavený nástroj Runway a už ten prichádzal s fotorealistikými stvárneniami. Google sa nenechal zahanbiť a priniesol svoj nástroj Lumiere. Nový model od OpenAI ich však bez problémov schová do vrecka.

Minútové video iba zo zopár slov

Nástroj dokáže preniesť napísaný text na video do dĺžky až jednej minúty. Iba z niekoľkých znakov dokáže vytvoriť komplexné scény, ktoré dokážu naplno zachytiť pohyb, zobrazené subjekty (osoby) do najmenších detailov a úplne presvedčivo priniesť aj pozadie. Nezostávali len pri slovách, ale na predvedenie priniesli hneď krátke video – historické zobrazenie Kalifornie počas zlatej horúčky. Ukážka naozaj pôsobí ako zo zreštaurovaného dokumentu.

Služba pritom funguje pomerne jednoducho. Stačí zadať takzvaný Prompt, teda príkaz. Ten môže byť iba zopár slov dlhý alebo môžete do detailov popisovať, čo sa má vo videu diať. Tvorcovia pridali aj 10 sekúnd dlhú ukážku, pri ktorej bol vygenerovaný príkaz „niekoľko veľkých srstnatých mamutov sa blíži dupajúc cez zasnaženú lúku; ich dlhá srsť jemne vlaje vo vetre; v diaľke sú zasnežené stromy a dramaticky pôsobiace hory; je poludňajšie svetlo a slnko je ďaleko na oblohe, ale vytvára hrejivé odlesky; kamera je posadená nižšia a tak poskytuje s veľkým srstnatým citavcov pocit hĺbky“. Vidíme, že sa ho podarilo splniť do bodky a neuveriteľne presne.

Upozorňujú, že nástroj nie je dokonalý

Nástroj Sora zatiaľ nie je dostupný pre širokú verejnosť, ale len pre vybranú skupinu výskumníkov. Vytvorené však už boli desiatky videí, ktoré ukazujú potenciál umelej inteligencie. Do absolútnych detailov zachytia postavy, okolitú krajinu, dokonca aj jazda vlakom pri nej pôsobí realisticky plynule. Vie tak zachytiť krásu fauny aj podstatu emócií.

Spätnú väzbu od ostatných ľudí chcú začať zbierať až keď si budú vedomí toho, že vedia vychytať chyby. Ako totiž na webe upozorňujú, súčasný model má svoje nedostatky. Nerozumie ešte špecifikám príčiny a následku. Hovoria, že ak si napríklad človek odhryzne zo sušienky, stále sa môže nachádzať v ďalšom zábere nedotknutá. Nevie ešte úplne rozlíšiť pravú a ľavú stranu, nerozumie istým trajektóriám kamery, ktorá má sledovať objekt. Príkladom je video hrajúcich sa vĺčať, pri ktorom Sora nevie správne zachytiť ich počet.

Celé video spracuje naraz, vrstvy zvládne za pár sekúnd

Tvorcovia dodávajú, že nástroj rozumie mnohým podobám textu a stále sa pracujú na jeho zlepšovaní. Objasnili trochu aj systém práce AI. Hovoria, že začína s niečím, čo vyzerá ako „statický šum“ a postupne video v jednotlivých krokoch zjemňuje. Celé video však dokáže spraviť v priebehu niekoľkých sekúnd.

AI dokáže pracovať aj s existujúcimi videami, do ktorých pridá nové prvky alebo ich urobí dlhšími. Potvrdené bolo, že do svojej databázy dostala celú radu videosekvencií aj obrázkov (vrátane tých z DALL-E 3), počet však bližšie nešpecifikovali. Dokonca bolo otestované aj vytvorenie celého videa z jedného obrázku. Výsledok v tomto prípade síce nie je dokonalý, ale určite sa nedá hovoriť o zlyhaní.

Čo hovoríte na nástroj Sora a ním vytvorené videá vy? Dokázali by ste ich bez prečítania rozoznať od reality? Myslíte si, že toto je úplná budúcnosť tvorby? Dajte nám vedieť v komentároch. 

Zdroj: openai.com/sora

Mohlo by sa ti páčiť

1 COMMENT

LEAVE A REPLY

Please enter your comment!
Please enter your name here

- REKLAMA -

Najnovší obsah

- REKLAMA -