Sam Altman snižuje očekávání od AGI
Sam Altman, CEO OpenAI, snižuje očekávání od AGI. Tvrdí, že její dopad bude menší, než se předpokládá, i když dorazí dříve. Co za tím vězí?
DeepMind Genie 2 generuje interaktivní 3D světy z textu a obrázků. Simuluje fyziku, animace a chování postav. Slouží pro výzkum, kreativní tvorbu a testování AI. Vyvolává otázky o autorských právech.
DeepMind, výzkumná organizace Google zaměřená na umělou inteligenci, odhalila model s názvem Genie 2, který dokáže generovat "nekonečné" množství hratelných 3D světů. Tento model, nástupce dříve vydaného Genie, vytváří interaktivní scény v reálném čase na základě obrázku a textového popisu (např. "Roztomilý humanoidní robot v lese"). Podobné modely vyvíjí také společnost World Labs a izraelský startup Decart.
Genie 2 dokáže generovat rozmanité 3D světy, ve kterých se uživatelé mohou pohybovat pomocí myši a klávesnice, skákat, plavat atd. Model je trénován na videích a simuluje interakce objektů, animace, osvětlení, fyziku, odrazy a chování "NPC" postav. Mnoho simulací vypadá jako AAA videohry, pravděpodobně proto, že trénovací data obsahují záznamy z populárních her. DeepMind však, stejně jako mnoho jiných AI laboratoří, nezveřejňuje detaily o zdrojích svých dat.
Vzhledem k tomu, že DeepMind je součástí Google, má přístup k YouTube. Google již dříve naznačil, že jeho podmínky použití umožňují využití videí z YouTube pro trénování modelů. Vyvolává to otázku, zda Genie 2 vytváří neoprávněné kopie videoher, které "sledoval". Toto bude muset v budoucnu pravděpodobně řešit soud.
Genie 2 dokáže generovat konzistentní světy z různých perspektiv (např. z pohledu první osoby nebo izometrického pohledu) po dobu až jedné minuty, většinou však 10-20 sekund. Model reaguje na stisk kláves a dokáže správně identifikovat a pohybovat postavou. "Náš model například dokáže pochopit, že šipky na klávesnici by měly pohybovat robotem, a ne stromy nebo mraky," uvádí DeepMind v blogu.
Většina podobných modelů, tzv. "světových modelů", simuluje hry a 3D prostředí s artefakty, problémy s konzistencí a halucinacemi. Například Decartův simulátor Minecraftu, Oasis, má nízké rozlišení a rychle "zapomíná" rozložení úrovní. Genie 2 si však pamatuje části scény, které nejsou v dohledu, a dokáže je přesně vykreslit, když se znovu stanou viditelnými. Totéž zvládají i modely World Labs.
Hry vytvořené s Genie 2 by nebyly příliš zábavné, protože by se pokrok mazal každou minutu. DeepMind proto model prezentuje spíše jako výzkumný a kreativní nástroj pro prototypování interaktivních zážitků a testování AI agentů. "Díky schopnostem Genie 2 zobecňovat mimo distribuci lze koncepční umění a kresby proměnit v plně interaktivní prostředí," píše DeepMind. "A použitím Genie 2 k rychlé tvorbě rozmanitých prostředí pro AI agenty mohou naši výzkumníci generovat testovací úlohy, které agenti během tréninku neviděli.”
Tvůrci, zejména v herním průmyslu, mohou mít smíšené pocity. Nedávné vyšetřování Wired ukázalo, že velcí hráči jako Activision Blizzard používají AI ke snižování nákladů, zvyšování produktivity a kompenzaci úbytku zaměstnanců.
V současné době není Genie 2 veřejně dostupný.
DeepMind's Genie 2 představuje významný krok vpřed ve vývoji AI pro generování interaktivních 3D světů. I když vyvolává otázky ohledně autorských práv a v současnosti není dostupný veřejnosti, má potenciál ovlivnit herní průmysl, výzkum AI a kreativní tvorbu.
Genie 2 je jako digitální loutkové divadlo, kde scénář píšete textem a obrázkem. Představte si propojení s technologiemi haptické zpětné vazby – virtuální světy by se staly hmatatelnými. Nebo integraci s biometrickými senzory, které by herní prostředí přizpůsobovaly vašemu emočnímu stavu. A co teprve propojení s generativní hudbou AI? Každý krok by byl doprovázen unikátní melodií. To by mohlo vést k novým formám terapie, vzdělávání a zábavy. Ať už bude budoucnost jakákoliv, Genie 2 a podobné modely otevírají cestu k dosud nevídaným možnostem.