A Google újabb lépést tett offenzívájában mesterséges intelligencia alkalmazása videojátékokban és virtuális világok A Project Genie, egy prototípus, amely lehetővé teszi a felhasználók számára interaktív környezetek létrehozását és navigálását néhány szöveges prompt vagy egy kép alapján, elindításával a vállalat az eszközt még tesztelés alatt álló kísérletként mutatja be. A kezdeti bemutatók azonban izgalmat és kétségeket is kiváltottak az iparágon belül.
Egyelőre a hozzáférés korlátozott a Google AI Ultra csomag előfizetői az Egyesült Államokbanrövid munkamenetekkel és a rendszer kísérleti jellegére egyértelműen jellemző előadásokkal. Ennek ellenére a projekt egy olyan jövő felé mutat, amelyben bármely felhasználó hozz létre egy kis „játszható világot” másodpercek alatt, anélkül, hogy ismernie kellene a grafikus motorok programozását vagy kezelését.
Mi a Project Genie, és milyen technológiákat ötvöz?

A Genie Projekt egy A Google DeepMind és a Google AI által fejlesztett kutatási prototípus amely interaktív világgenerátorként működik. Technikai alapjai három pilléren nyugszanak: a Genie 3 modellen, amely a dinamikus környezetek szimulálására specializálódott; a Nano Banana Pro-n, amely a vizuális aspektusokért és a vázlatokért felelős; és a Gemini-n, a multimodális modellen, amely értelmezi a felhasználói utasításokat és asszisztensként működik az alkotás során.
A rendszer lelke az Genie 3, egy "világ"modell, amely képes képkockáról képkockára megjósolni, mi történik a képernyőnA korábbi, csak statikus 3D-s jeleneteket generáló technológiákkal ellentétben ez a megközelítés lehetővé teszi, hogy a környezet valós időben reagáljon a játékos mozgására, hozzávetőlegesen 720p felbontással és több perces vizuális koherenciával a DeepMind belső kísérletei szerint.
Ennek alapján integrált Nano Banana Pro, amely a színpad kezdeti képének generálásáért felelős Egy leíró szöveggel vagy egy referenciaképpel kezdve ez az első nézet vázlatként szolgál a grafikai stílus, a világ kompozíciója és a felfedezőút során irányítandó karakter megjelenésének eldöntéséhez.
Végül, a A Gemini orkestrációs rétegként és asszisztensként működik.Természetes nyelven értelmezi az utasításokat, menet közben segít a világ beállításában, és megkönnyíti az olyan feladatokat, mint a perspektíva megváltoztatása (első vagy harmadik személyű), egy már létrehozott környezet újrakeverése, vagy több ötlet egyetlen játszható forgatókönyvvé való kombinálása.
Hogyan jönnek létre és fedezhetők fel a virtuális világok

A Project Genie működése a következő köré épül: progresszív folyamat három fázisban A Google úgy foglalja össze, mint világok felvázolása, felfedezése és összeolvasztása. A cél az, hogy bárki el tudjon jutni egy ötlettől egy interaktív élményig további eszközök nélkül.
Az első szakaszban a felhasználó leírást ír a létrehozni kívánt világról, vagy feltölt egy referenciaképet. Ebből a bemenetből A Nano Banana Pro statikus előnézetet generál A helyszín lehet egy alacsony poligonális stílusú erdő, egy futurisztikus városi környezet, egy történelmi táj, vagy bármi, amit a szöveg leír. A karakter típusát, a kameramódot és néhány alapvető mozgási paramétert is ebben a fázisban határozzák meg.
Miután a vázlatot elfogadták, játékba lép a Genie 3, amely lehetővé teszi a játékos számára, hogy Fedezd fel szabadon a környezetet a tipikus PC-s vezérlőkkel, mint például a W, A, S és D billentyűkA modell menet közben generálja, hogy mi jelenik meg a karakter előtt, az egyes képkockákat az előzőek alapján megjósolva, és bizonyos állandóságot fenntartva, amikor a kamera elfordul, vagy visszatér egy már meglátogatott területre.
A harmadik kulcsfontosságú képesség az világok kombinációja és újrakeveréseA rendszer lehetővé teszi a felhasználók számára, hogy korábban generált forgatókönyveket újra megnézzenek, új paraméterekkel módosítsák őket, egyesítsék őket, vagy akár a Google-ból előre generált világokat használjanak variációk építéséhez. Ezenkívül a munkamenetek videói megoszthatók más felhasználókkal, akik megtekinthetik vagy inspirációként felhasználhatják azokat.
Mindez egy webes alkalmazásból fut, hasonlóan a Google más mesterséges intelligencia szolgáltatásaihoz, így Nincs szükség további programok telepítésére, és nincs szükség speciális műszaki ismeretekre sem.Egyszerűen nyisd meg az eszközt, írd be az utasítást, és kezdj el kombinációkat tesztelni, amíg érdekes eredményt nem találsz.
Technikai korlátok: idő, teljesítmény és realizmus

A Google ragaszkodik ahhoz, hogy a Project Genie-t a következőképpen definiálja: hangsúlyozott kísérleti jellegű kutatási prototípusEz a címke nem puszta formalitás: a jelenlegi tapasztalatok számos egyértelmű korlátot mutatnak, amelyek a kezdeti kíváncsiságon túl is meghatározzák az eszköz gyakorlati használatát.
A legnyilvánvalóbb az 60 másodperces korlát generálásonként és felfedezési munkamenetenkéntEzután a világ leáll, és egy új élménynek kell kezdődnie. A cég magyarázata szerint ez a korlátozás lehetővé teszi a számítási erőforrások jobb elosztását, mivel minden munkamenet egy dedikált chipet tart fenn a játékos számára.
A teljesítmény tekintetében a nyilvános tesztek leírják közel 720p felbontás és 20 és 24 képkocka/másodperc közötti frekvenciaEzekhez a funkciókhoz észrevehető bemeneti késleltetés társul a karakter mozgatásakor vagy a kamera váltásakor. Néhány korai tesztelő szerint az élmény inkább egy interaktív videóra hasonlít, mint egy teljesen folyékony, hagyományos videojátékra.
Azt is meg kell jegyezni, hogy a Genie 3 Ez nem egy klasszikus grafikus motor, hanem egy modell, ami megjósolja a következő képkockát. A fentiek alapján. Ez furcsa viselkedést eredményez: utak, amelyek látható ok nélkül megváltoztatják a textúrát, eltűnő elemek, valószínűtlen fizika, vagy véletlenszerűen deformálódó animációk.
A Google maga is figyelmeztet, hogy a generált világok „Lehet, hogy nem tűnnek teljesen valóságosnak, vagy nem mindig felelnek meg a fizika törvényeinek vagy utasításainak.”A karaktervezérlés pedig pontatlan lehet. Más szóval, a technológia ígéretesnek tűnik, de még messze van attól, hogy kifinomult játékélményt nyújtson a játékmenet és a vizuális stabilitás tekintetében.
Korlátozott hozzáférés és nemzetközi ütemterv

Ebben az első fázisban a Project Genie csak a következők számára érhető el: Google AI Ultra ügyfelek az Egyesült ÁllamokbanA vállalat legfejlettebb előfizetési csomagja olyan vállalkozásoknak és alkotóknak szól, akiknek nagy teljesítményű mesterséges intelligencia-képességekre van szükségük. Ez egy prémium szolgáltatás, amely korlátozza a kísérlethez hozzáférő felhasználók számát.
A tesztelés korlátozásáról szóló döntést egyrészt az magyarázza, hogy minden munkamenet számítási költsége Ez annak köszönhető, hogy a Google részletes visszajelzéseket szeretne gyűjteni a szélesebb körű bevezetés előtt. A DeepMind kutatási igazgatója, Shlomi Frutcher hangsúlyozta, hogy „izgalmas”, hogy ezeket az eszközöket több ember számára is elérhetővé tehetjük, hogy valós használati véleményeket gyűjtsünk, de egyelőre nincs konkrét dátum az európai vagy más piacokon való megjelenésükre.
Spanyol és európai felhasználók, valamint tanulmányok szempontjából ez azt jelenti, hogy legalábbis rövid távon, A legreálisabb szerep a megfigyelőé lesz.: szorosan kövesse nyomon a teszteket, elemezze a közösségi médiában már keringő videókat, és értékelje, hogy ez a technológia milyen mértékben integrálható a pályatervezés, a gyors prototípus-készítés vagy az ötletvizualizáció munkafolyamataiba.
A Google jelezte szándékát, hogy fokozatosan bővítsd a hozzáférést Feltéve, hogy a teljesítmény, a költségek és a jogi kérdések ezt lehetővé teszik. A terjeszkedés üteme azonban a közösség reakciójától és a szerzői jogokkal, valamint a harmadik féltől származó tartalmak felelősségteljes felhasználásával kapcsolatos viták alakulásától is függ.
Képesség ismert játékok és szerzői jogi viták utánzására
A Project Genie egyik legkényesebb pontja az volt, hogy képesség változó sikerrel olyan világok újraalkotására, amelyek egyértelműen a meglévő videojátékok ihlette világokNéhány szakújságírónak sikerült olyan forgatókönyveket alkotnia, amelyek egyértelműen hasonlítottak olyan címekre, mint a Super Mario 64, a Metroid Prime vagy a The Legend of Zelda: Breath of the Wild.
A Zelda esetében még látták is őket karakterek, akik ugráskor siklóernyőt használnakEz a gesztus szorosan kapcsolódik a Nintendo játékhoz. Ezek a véletlenek arra utalnak, hogy a modellt nagyszámú nyilvánosan elérhető játékmenet-videóval képezték ki, ami kérdéseket vet fel a szellemi tulajdon kezelésével kapcsolatban a mesterséges intelligencia betanítása során.
Több teszt után, amelyek során újraalkották a jól ismert franchise-ok ihlette világokat, a Google elkezdte... bizonyos forgatókönyvek és karakterek generálásának blokkolásakülönösen akkor, ha konkrét neveket vagy védjegyeket említenek. Bizonyos esetekben az eszköz közvetlenül megakadályozza bizonyos sagák alapján létrehozott világok létrehozását, „harmadik féltől származó tartalomszolgáltatók érdekeire” hivatkozva.
A cég elmagyarázza, hogy a Project Genie... „elsősorban nyilvánosan elérhető webes adatokkal képezve”De ne feledjük, hogy ez a tartalom továbbra is szerzői jogi törvények hatálya alá tartozik. Ennek eredményeként egy még fejlesztés alatt álló moderálási rendszer jött létre, amelyben a szerzői joggal védett művek reprodukálására irányuló egyes kísérleteket kifejezetten blokkolnak, míg mások átcsúsznak, amennyiben elkerülik a túlzottan közvetlen hivatkozásokat.
Ez a szabálytalan viselkedés vitát vált ki a Milyen mértékben lehet vagy kellene a mesterséges intelligenciát a meglévő játékokból inspirálni? És hol húzódik a határ a tiszteletadás, az utánzás és a másolás között? Ez a vita valószínűleg különösen releváns lesz olyan régiókban, mint az Európai Unió, ahol a mesterséges intelligenciával kapcsolatos adatok betanítására és a szerzői jogokra vonatkozó szabályozási keretrendszerek még mindig meghatározás alatt állnak.
Lehetséges hatás a videojáték-iparra
A médiafigyelés vonzerején túl másodpercek alatt generált „Mario-szerű” vagy „Zelda-szerű” világokA Project Genie egy szélesebb körű verseny része, amely a nagy technológiai vállalatok között zajlik, hogy a generatív mesterséges intelligenciát alkalmazzák a játékfejlesztésben. A Microsoft például olyan projekteket mutatott be, mint a Muse, amelyek automatizálják a tervezési és gyártási folyamat egyes részeit, és más vállalatok is hasonló megoldásokat keresnek a költségek csökkentése és a fejlesztés felgyorsítása érdekében.
Ebben az összefüggésben a Google javaslata arra törekszik, hogy gyors prototípus-készítő és kísérletező eszköz Ez mind a független stúdiók, mind a nagy kiadók számára érdekes lehet. Az a képesség, hogy egy vázlatból vagy egy szövegrészből játszható forgatókönyvet építhetünk, megkönnyítheti az ötletek korai validálását, belső demók létrehozását vagy a mechanikák tesztelését hónapok munkájának befektetése nélkül.
Az ilyen típusú megoldások térnyerése azonban aggodalomra ad okot az ágazat egyes szereplői körében. Egyrészt, Aggodalomra ad okot a bizonyos szakmai profilokra gyakorolt lehetséges hatás. Ha a tartalom egy része automatikusan generálódik. Másrészt sok fejlesztő ódzkodik az olyan üzleti modellektől, amelyekben a mesterséges intelligenciát már publikált műveken képezik ki anélkül, hogy a szerzők egyértelmű kompenzációban részesülnének.
Az európai és spanyol piacokon, ahol a kulturális alkotások védelméről szóló vita különösen intenzív, kulcsfontosságú lesz megvizsgálni, hogy az olyan eszközök, mint a Project Genie, hogyan illeszkednek a jövőbeli szabályozásokba. Az olyan szempontok, mint a betanítási adatok átláthatósága, a jogtulajdonosok leiratkozási rendszerei és a létrehozott tartalom hozzárendelése, döntő fontosságúak lehetnek a körültekintő alkalmazás és a fejlesztőkkel és kiadókkal való folyamatos konfliktusok között.
A Project Genie egyelőre korai szakaszban van, Inkább nyilvános laboratóriumként működik, mint késztermékként.Az evolúciója, és az, hogy a Google hogyan kezeli a kapcsolódó jogi és etikai kérdéseket, fogja meghatározni, hogy végül integrálódik-e a stúdiók munkafolyamataiba, vagy egy feltűnő, de korlátozott kísérlet marad.
A prototípus megjelenése azonban egyértelművé teszi, hogy a nagy technológiai vállalatok a következőket látják: Interaktív világok automatikus generálása elsőrendű stratégiai terep. Bár a tényleges használata ma korlátozott és technikai tökéletlenségek sújtják, a haladási irány egyértelmű: olyan modellek, amelyek egyre inkább képesek szöveget és képeket játszható élményekké alakítani, és egy olyan iparág, amelynek el kell döntenie, hogyan kíván együtt élni ezekkel az új eszközökkel.