
A videógenerálás területén egyre kiélezettebb a helyzet, a piaci szereplők innovatív megoldásokkal versengenek a felhasználók figyelméért. Úgy tűnik, az OpenAI hamarosan bemutatja a Sora 2 nevű, szövegből videót generáló modelljét. Erre a következtetésre a vállalat szerverein fellelhető információk alapján jutottak a szakértők.
Noha a hivatalos bejelentés még várat magára, egyre több jel utal arra, hogy a Sora 2 komoly előrelépést jelenthet a területen, és a Google Veo 3 modelljének kíván komoly kihívója lenni. A verseny már régen nem csak a látványos képkockákért folyik, hanem azért is, hogy a felhasználók elképzelései minél valósághűbben keljenek életre, lehetőleg hanggal együtt.
A korábbi Sora modell kétségkívül lenyűgöző látványvilágot produkált, azonban a videók hang nélkül készültek. Ezzel szemben a Google által idén bemutatott Veo 3 modell nem csupán vizuálisan nyújt többet, hanem képes szinkronizált hangot – beszédet, környezeti zajokat és akár háttérzenét – is hozzáadni a létrehozott jelenetekhez. Ez új távlatokat nyitott a szövegalapú videógenerálásban, mivel a hang jelentősen fokozza a valósághű élményt.
A Sora 2 versenyképességéhez elengedhetetlen lesz, hogy ne csak a képminőség legyen kiemelkedő, hanem a hangélmény is hiteles és meggyőző legyen. A legnagyobb kihívást a természetes hanghatások, a megfelelő hangulatú háttérzene és a valósághű szájmozgás-szinkron megvalósítása jelenti. Habár a Veo 3 sem tekinthető tökéletesnek, már most képes olyan rövid videók létrehozására, amelyeknél a hang és a kép harmóniája meggyőző.
A fejlesztések azonban etikai és piaci kérdéseket is felvetnek. A hang hozzáadása még nehezebbé teszi a valóság és a generált tartalmak közötti különbségtételt.
Fontos kiemelni, hogy a szolgáltatások jelenleg nem teszik lehetővé valós személyek, erőszakos cselekmények vagy szerzői jog által védett tartalmak generálását. Azonban a hang előállításának képessége mindenképpen tovább bonyolítja a helyzetet ezen a téren. A felhasználók számára a választás során az ár is meghatározó tényező lehet: a Google Veo 3 modelljéhez havi 250 dolláros előfizetés szükséges, míg az OpenAI számára előnyt jelenthet, ha a Sora 2 elérhetőbb áron kínálja a szolgáltatást a ChatGPT Plus vagy Pro előfizetők számára. Az biztos, hogy a mesterséges intelligencia által vezérelt videós korszak következő fejezete hamarosan kezdetét veszi.
Nyitóképünk: pcwplus.hu