
Képzeljük el, hogy egy filmet nézve nem csupán passzív szemlélők vagyunk, hanem aktívan befolyásolhatjuk a cselekményt, felfedezhetjük a környezetet, mintha egy videojátékban lennénk. Ez az interaktív videózás jövőképe, amelynek megvalósításán egy Odyssey nevű, önvezető autóipari gyökerekkel rendelkező csapat dolgozik. A 2023-ban indult kaliforniai vállalkozás egy olyan vizuális MI-platform fejlesztésén fáradozik, amely forradalmasíthatja a tartalomfogyasztási szokásainkat. Céljuk, hogy filmes minőségű tartalmakból valós időben szerkeszthető 3D-s jeleneteket hozzanak létre, amelyekkel a felhasználók közvetlen interakcióba léphetnek.
A technológia lényege, hogy a rendszer a nézői beavatkozásokra reagálva, dinamikusan alakítja a videófolyamot. A legfrissebb bemutatóik alapján a rendszer lenyűgöző, 40 milliszekundumos válaszidővel képes új képkockákat generálni. Ez gyakorlatilag azt jelenti, hogy a nézők szinte azonnali visszajelzést kapnak mozdulataikra, ahogy egy renderelt 3D-s világban navigálnak a megszokott vezérlők segítségével. Az Odyssey által fejlesztett világmodelleket úgy tervezték, hogy a bejövő műveletek és azok előzményei alapján próbálják megjósolni a jövőbeni állapotokat, miközben fenntartják a térbeli konzisztenciát. A cég ígérete szerint a rendszer képes legalább öt percen át koherens és logikus videófolyamokat biztosítani.
Az Odyssey egyik megkülönböztető jegye, hogy nem kizárólagosan támaszkodik nyilvánosan elérhető adathalmazokra modelljei tanításakor. Terveztek egy speciális, hátizsákra szerelhető 360 fokos kamerarendszert, amellyel valós helyszíneket rögzítenek. Ezek az egyedi felvételek szolgálnak majd alapul a folyamatosan fejlődő, egyre jobb minőségű modellek létrehozásához. Jelenleg a technológia 30 képkocka/másodperc sebességgel képes videókat streamelni, Nvidia H100 GPU-kból álló klasztereken futtatva. Az Odyssey becslése szerint ez felhasználói óránként körülbelül 1-2 dolláros költséget jelenthet.
A vállalkozás víziója szerint ez a technológia teljesen új szórakoztatási formákat nyithat meg, amelyek a mai videós tartalmak evolúciójának következő lépcsőfokát képviselhetik. Az igény szerint generálható és szabadon felfedezhető történetek megszabadulhatnának a hagyományos filmkészítés korlátaitól és jelentős költségeitől. Természetesen a fejlesztés korai szakaszban jár, a bemutatott demók még nem tökéletesek és néha instabilak, de a cég gyors fejlődést ígér. A projekt komolyságát jelzi, hogy eddig 27 millió dollár befektetést vonzottak, és olyan neves szakemberek ülnek az igazgatótanácsban, mint a Pixar egyik alapítója és a Walt Disney Animation Studios korábbi elnöke.
Ugyanakkor a kreatív iparágban sokan óvatosan, sőt, némi aggodalommal figyelik az MI ilyen irányú fejlődését, elsősorban a munkahelyek esetleges tömeges megszűnésétől tartva. Az Odyssey állítása szerint igyekszik ezeket a fenntartásokat is kezelni, bár ennek konkrét módjai még nem teljesen világosak. Maga a cég is elismeri, hogy nem egy már megoldott kutatási problémáról van szó, és a minőség folyamatos javulásának mikéntje csak a jövőben fog kiderülni. Vannak szakértők, akik szerint ez a megközelítés bár látványos videók generálására alkalmas lehet, a valódi „világszimuláció” – amely képes a végtelen számú, kiszámíthatatlan eshetőség intelligens kezelésére és az irreleváns részletek absztrakciójára – még jóval komplexebb képességeket igényelne. Ennek ellenére az irány rendkívül érdekes: ahelyett, hogy előre rögzített képkockákból álló, passzívan fogyasztott videókat kapnánk, a jövőben a tartalom képkockáról képkockára, a mi interakcióinkra reagálva alakulhat, egy teljesen újfajta, személyre szabott élményt kínálva.