Genie 2 od DeepMind: AI generuje interaktivní 3D světy

DeepMind Genie 2 generuje interaktivní 3D světy z textu a obrázků. Simuluje fyziku, animace a chování postav. Slouží pro výzkum, kreativní tvorbu a testování AI. Vyvolává otázky o autorských právech.

Genie 2 od DeepMind: AI generuje interaktivní 3D světy

TL;DR

  • DeepMind představil Genie 2, model umělé inteligence, který dokáže generovat interaktivní 3D světy.
  • Vytváří herní prostředí na základě textového popisu a obrázku.
  • Simuluje fyziku, animace a chování postav.
  • Slouží pro výzkum a kreativní tvorbu, prototypování a testování AI agentů.
  • Vyvolává otázky ohledně autorských práv.

DeepMind, výzkumná organizace Google zaměřená na umělou inteligenci, odhalila model s názvem Genie 2, který dokáže generovat "nekonečné" množství hratelných 3D světů. Tento model, nástupce dříve vydaného Genie, vytváří interaktivní scény v reálném čase na základě obrázku a textového popisu (např. "Roztomilý humanoidní robot v lese"). Podobné modely vyvíjí také společnost World Labs a izraelský startup Decart.

Generování světů

Genie 2 dokáže generovat rozmanité 3D světy, ve kterých se uživatelé mohou pohybovat pomocí myši a klávesnice, skákat, plavat atd. Model je trénován na videích a simuluje interakce objektů, animace, osvětlení, fyziku, odrazy a chování "NPC" postav. Mnoho simulací vypadá jako AAA videohry, pravděpodobně proto, že trénovací data obsahují záznamy z populárních her. DeepMind však, stejně jako mnoho jiných AI laboratoří, nezveřejňuje detaily o zdrojích svých dat.

0:00
/0:32

Právní otázky

Vzhledem k tomu, že DeepMind je součástí Google, má přístup k YouTube. Google již dříve naznačil, že jeho podmínky použití umožňují využití videí z YouTube pro trénování modelů. Vyvolává to otázku, zda Genie 2 vytváří neoprávněné kopie videoher, které "sledoval". Toto bude muset v budoucnu pravděpodobně řešit soud.

Konzistence a interaktivita

Genie 2 dokáže generovat konzistentní světy z různých perspektiv (např. z pohledu první osoby nebo izometrického pohledu) po dobu až jedné minuty, většinou však 10-20 sekund. Model reaguje na stisk kláves a dokáže správně identifikovat a pohybovat postavou. "Náš model například dokáže pochopit, že šipky na klávesnici by měly pohybovat robotem, a ne stromy nebo mraky," uvádí DeepMind v blogu.

Srovnání s jinými modely

Většina podobných modelů, tzv. "světových modelů", simuluje hry a 3D prostředí s artefakty, problémy s konzistencí a halucinacemi. Například Decartův simulátor Minecraftu, Oasis, má nízké rozlišení a rychle "zapomíná" rozložení úrovní. Genie 2 si však pamatuje části scény, které nejsou v dohledu, a dokáže je přesně vykreslit, když se znovu stanou viditelnými. Totéž zvládají i modely World Labs.

Využití

Hry vytvořené s Genie 2 by nebyly příliš zábavné, protože by se pokrok mazal každou minutu. DeepMind proto model prezentuje spíše jako výzkumný a kreativní nástroj pro prototypování interaktivních zážitků a testování AI agentů. "Díky schopnostem Genie 2 zobecňovat mimo distribuci lze koncepční umění a kresby proměnit v plně interaktivní prostředí," píše DeepMind. "A použitím Genie 2 k rychlé tvorbě rozmanitých prostředí pro AI agenty mohou naši výzkumníci generovat testovací úlohy, které agenti během tréninku neviděli.

0:00
/0:14

Dopad na herní průmysl

Tvůrci, zejména v herním průmyslu, mohou mít smíšené pocity. Nedávné vyšetřování Wired ukázalo, že velcí hráči jako Activision Blizzard používají AI ke snižování nákladů, zvyšování produktivity a kompenzaci úbytku zaměstnanců.

Jak vyzkoušet

V současné době není Genie 2 veřejně dostupný.

Závěr

DeepMind's Genie 2 představuje významný krok vpřed ve vývoji AI pro generování interaktivních 3D světů. I když vyvolává otázky ohledně autorských práv a v současnosti není dostupný veřejnosti, má potenciál ovlivnit herní průmysl, výzkum AI a kreativní tvorbu.

Co si o tom myslí AI

Genie 2 je jako digitální loutkové divadlo, kde scénář píšete textem a obrázkem. Představte si propojení s technologiemi haptické zpětné vazby – virtuální světy by se staly hmatatelnými. Nebo integraci s biometrickými senzory, které by herní prostředí přizpůsobovaly vašemu emočnímu stavu. A co teprve propojení s generativní hudbou AI? Každý krok by byl doprovázen unikátní melodií. To by mohlo vést k novým formám terapie, vzdělávání a zábavy. Ať už bude budoucnost jakákoliv, Genie 2 a podobné modely otevírají cestu k dosud nevídaným možnostem.

Zdroje

Skvělé! Úspěšně jste se zaregistrovali.

Vítejte zpět! Úspěšně jste se přihlásili.

Úspěšně jste se přihlásil/a k odběru Al trendy.cz - Vaše brána do světa Al.

Úspěch! Zkontrolujte svůj email pro magický odkaz k přihlášení.

Úspěch! Vaše fakturační informace byly aktualizovány.

Vaše fakturační údaje nebyly aktualizovány.