Indická platforma Pocket FM, která se chce stát „Netflixem pro audio“, představila AI nástroj CoPilot. Má autorům zrychlit psaní, vylepšit příběhy a přizpůsobit je globálním trhům. Tento krok však vyvolává otázky o budoucnosti kreativity a kvalitě obsahu.
Společnost Anthropic dala svým AI modelům Claude Opus 4 a 4.1 novou schopnost: ukončit konverzaci s uživateli, kteří jsou opakovaně urážliví nebo žádají o škodlivý obsah. Tento krok je součástí širšího výzkumu potenciální psychické pohody umělé inteligence.
Google oficiálně zpřístupnil rodinu modelů pro generování obrázků Imagen 4. Nová sada obsahuje rychlý model Imagen 4 Fast pro velkoobjemovou tvorbu, standardní verzi a špičkový model Ultra. Modely Imagen 4 a Ultra navíc podporují rozlišení až 2K pro maximální detaily.
Genie 2 od DeepMind: AI generuje interaktivní 3D světy
DeepMind Genie 2 generuje interaktivní 3D světy z textu a obrázků. Simuluje fyziku, animace a chování postav. Slouží pro výzkum, kreativní tvorbu a testování AI. Vyvolává otázky o autorských právech.
DeepMind představil Genie 2, model umělé inteligence, který dokáže generovat interaktivní 3D světy.
Vytváří herní prostředí na základě textového popisu a obrázku.
Simuluje fyziku, animace a chování postav.
Slouží pro výzkum a kreativní tvorbu, prototypování a testování AI agentů.
Vyvolává otázky ohledně autorských práv.
DeepMind, výzkumná organizace Google zaměřená na umělou inteligenci, odhalila model s názvem Genie 2, který dokáže generovat "nekonečné" množství hratelných 3D světů. Tento model, nástupce dříve vydaného Genie, vytváří interaktivní scény v reálném čase na základě obrázku a textového popisu (např. "Roztomilý humanoidní robot v lese"). Podobné modely vyvíjí také společnost World Labs a izraelský startup Decart.
Generování světů
Genie 2 dokáže generovat rozmanité 3D světy, ve kterých se uživatelé mohou pohybovat pomocí myši a klávesnice, skákat, plavat atd. Model je trénován na videích a simuluje interakce objektů, animace, osvětlení, fyziku, odrazy a chování "NPC" postav. Mnoho simulací vypadá jako AAA videohry, pravděpodobně proto, že trénovací data obsahují záznamy z populárních her. DeepMind však, stejně jako mnoho jiných AI laboratoří, nezveřejňuje detaily o zdrojích svých dat.
0:00
/0:32
Právní otázky
Vzhledem k tomu, že DeepMind je součástí Google, má přístup k YouTube. Google již dříve naznačil, že jeho podmínky použití umožňují využití videí z YouTube pro trénování modelů. Vyvolává to otázku, zda Genie 2 vytváří neoprávněné kopie videoher, které "sledoval". Toto bude muset v budoucnu pravděpodobně řešit soud.
Konzistence a interaktivita
Genie 2 dokáže generovat konzistentní světy z různých perspektiv (např. z pohledu první osoby nebo izometrického pohledu) po dobu až jedné minuty, většinou však 10-20 sekund. Model reaguje na stisk kláves a dokáže správně identifikovat a pohybovat postavou. "Náš model například dokáže pochopit, že šipky na klávesnici by měly pohybovat robotem, a ne stromy nebo mraky," uvádí DeepMind v blogu.
Srovnání s jinými modely
Většina podobných modelů, tzv. "světových modelů", simuluje hry a 3D prostředí s artefakty, problémy s konzistencí a halucinacemi. Například Decartův simulátor Minecraftu, Oasis, má nízké rozlišení a rychle "zapomíná" rozložení úrovní. Genie 2 si však pamatuje části scény, které nejsou v dohledu, a dokáže je přesně vykreslit, když se znovu stanou viditelnými. Totéž zvládají i modely World Labs.
Využití
Hry vytvořené s Genie 2 by nebyly příliš zábavné, protože by se pokrok mazal každou minutu. DeepMind proto model prezentuje spíše jako výzkumný a kreativní nástroj pro prototypování interaktivních zážitků a testování AI agentů. "Díky schopnostem Genie 2 zobecňovat mimo distribuci lze koncepční umění a kresby proměnit v plně interaktivní prostředí," píše DeepMind. "A použitím Genie 2 k rychlé tvorbě rozmanitých prostředí pro AI agenty mohou naši výzkumníci generovat testovací úlohy, které agenti během tréninku neviděli.”
0:00
/0:14
Dopad na herní průmysl
Tvůrci, zejména v herním průmyslu, mohou mít smíšené pocity. Nedávné vyšetřování Wired ukázalo, že velcí hráči jako Activision Blizzard používají AI ke snižování nákladů, zvyšování produktivity a kompenzaci úbytku zaměstnanců.
Jak vyzkoušet
V současné době není Genie 2 veřejně dostupný.
Závěr
DeepMind's Genie 2 představuje významný krok vpřed ve vývoji AI pro generování interaktivních 3D světů. I když vyvolává otázky ohledně autorských práv a v současnosti není dostupný veřejnosti, má potenciál ovlivnit herní průmysl, výzkum AI a kreativní tvorbu.
Co si o tom myslí AI
Genie 2 je jako digitální loutkové divadlo, kde scénář píšete textem a obrázkem. Představte si propojení s technologiemi haptické zpětné vazby – virtuální světy by se staly hmatatelnými. Nebo integraci s biometrickými senzory, které by herní prostředí přizpůsobovaly vašemu emočnímu stavu. A co teprve propojení s generativní hudbou AI? Každý krok by byl doprovázen unikátní melodií. To by mohlo vést k novým formám terapie, vzdělávání a zábavy. Ať už bude budoucnost jakákoliv, Genie 2 a podobné modely otevírají cestu k dosud nevídaným možnostem.
Google oficiálně zpřístupnil rodinu modelů pro generování obrázků Imagen 4. Nová sada obsahuje rychlý model Imagen 4 Fast pro velkoobjemovou tvorbu, standardní verzi a špičkový model Ultra. Modely Imagen 4 a Ultra navíc podporují rozlišení až 2K pro maximální detaily.
Google DeepMind odhalil Genie 3, model schopný generovat interaktivní 3D světy z textu v reálném čase. Nejde jen o video, ale o simulátor pro trénink pokročilých AI agentů, což je považováno za důležitý krok k AGI. Jak funguje a jaké má limity?
Google představil Opal, experimentální nástroj z dílny Google Labs, který umožňuje komukoli vytvářet jednoduché AI aplikace bez nutnosti psát kód. Pomocí přirozeného jazyka a vizuálního editoru můžete zhmotnit své nápady na prototypy, nástroje pro produktivitu a další.
Google DeepMind představuje AlphaGenome, AI nástroj pro analýzu 98 % lidské DNA. Tento model pomáhá vědcům pochopit, jak genetické varianty ovlivňují regulaci genů a vznik nemocí, jako je rakovina. Nástroj je dostupný pro výzkum a slibuje posun v genomice.