ElevenLabs uvedla Conversational AI 2.0, významný posun pro hlasové agenty. Přináší přirozenější konverzace, RAG pro přístup k datům, vícejazyčnost a podnikové funkce jako HIPAA.
Opera představila Opera Neon, prémiový prohlížeč s agentní AI, který nabízí funkce Chat, Do (automatizace) a Make (tvorba obsahu). Cílí na budoucnost webu (Web 4o) a je dostupný přes čekací listinu.
Google představil Stitch, experimentální AI nástroj využívající Gemini 2.5 Pro k transformaci textových popisů nebo obrázků na UI designy a frontend kód, s cílem zrychlit a zjednodušit vývoj aplikací.
Genie 2 od DeepMind: AI generuje interaktivní 3D světy
DeepMind Genie 2 generuje interaktivní 3D světy z textu a obrázků. Simuluje fyziku, animace a chování postav. Slouží pro výzkum, kreativní tvorbu a testování AI. Vyvolává otázky o autorských právech.
DeepMind představil Genie 2, model umělé inteligence, který dokáže generovat interaktivní 3D světy.
Vytváří herní prostředí na základě textového popisu a obrázku.
Simuluje fyziku, animace a chování postav.
Slouží pro výzkum a kreativní tvorbu, prototypování a testování AI agentů.
Vyvolává otázky ohledně autorských práv.
DeepMind, výzkumná organizace Google zaměřená na umělou inteligenci, odhalila model s názvem Genie 2, který dokáže generovat "nekonečné" množství hratelných 3D světů. Tento model, nástupce dříve vydaného Genie, vytváří interaktivní scény v reálném čase na základě obrázku a textového popisu (např. "Roztomilý humanoidní robot v lese"). Podobné modely vyvíjí také společnost World Labs a izraelský startup Decart.
Generování světů
Genie 2 dokáže generovat rozmanité 3D světy, ve kterých se uživatelé mohou pohybovat pomocí myši a klávesnice, skákat, plavat atd. Model je trénován na videích a simuluje interakce objektů, animace, osvětlení, fyziku, odrazy a chování "NPC" postav. Mnoho simulací vypadá jako AAA videohry, pravděpodobně proto, že trénovací data obsahují záznamy z populárních her. DeepMind však, stejně jako mnoho jiných AI laboratoří, nezveřejňuje detaily o zdrojích svých dat.
0:00
/0:32
Právní otázky
Vzhledem k tomu, že DeepMind je součástí Google, má přístup k YouTube. Google již dříve naznačil, že jeho podmínky použití umožňují využití videí z YouTube pro trénování modelů. Vyvolává to otázku, zda Genie 2 vytváří neoprávněné kopie videoher, které "sledoval". Toto bude muset v budoucnu pravděpodobně řešit soud.
Konzistence a interaktivita
Genie 2 dokáže generovat konzistentní světy z různých perspektiv (např. z pohledu první osoby nebo izometrického pohledu) po dobu až jedné minuty, většinou však 10-20 sekund. Model reaguje na stisk kláves a dokáže správně identifikovat a pohybovat postavou. "Náš model například dokáže pochopit, že šipky na klávesnici by měly pohybovat robotem, a ne stromy nebo mraky," uvádí DeepMind v blogu.
Srovnání s jinými modely
Většina podobných modelů, tzv. "světových modelů", simuluje hry a 3D prostředí s artefakty, problémy s konzistencí a halucinacemi. Například Decartův simulátor Minecraftu, Oasis, má nízké rozlišení a rychle "zapomíná" rozložení úrovní. Genie 2 si však pamatuje části scény, které nejsou v dohledu, a dokáže je přesně vykreslit, když se znovu stanou viditelnými. Totéž zvládají i modely World Labs.
Využití
Hry vytvořené s Genie 2 by nebyly příliš zábavné, protože by se pokrok mazal každou minutu. DeepMind proto model prezentuje spíše jako výzkumný a kreativní nástroj pro prototypování interaktivních zážitků a testování AI agentů. "Díky schopnostem Genie 2 zobecňovat mimo distribuci lze koncepční umění a kresby proměnit v plně interaktivní prostředí," píše DeepMind. "A použitím Genie 2 k rychlé tvorbě rozmanitých prostředí pro AI agenty mohou naši výzkumníci generovat testovací úlohy, které agenti během tréninku neviděli.”
0:00
/0:14
Dopad na herní průmysl
Tvůrci, zejména v herním průmyslu, mohou mít smíšené pocity. Nedávné vyšetřování Wired ukázalo, že velcí hráči jako Activision Blizzard používají AI ke snižování nákladů, zvyšování produktivity a kompenzaci úbytku zaměstnanců.
Jak vyzkoušet
V současné době není Genie 2 veřejně dostupný.
Závěr
DeepMind's Genie 2 představuje významný krok vpřed ve vývoji AI pro generování interaktivních 3D světů. I když vyvolává otázky ohledně autorských práv a v současnosti není dostupný veřejnosti, má potenciál ovlivnit herní průmysl, výzkum AI a kreativní tvorbu.
Co si o tom myslí AI
Genie 2 je jako digitální loutkové divadlo, kde scénář píšete textem a obrázkem. Představte si propojení s technologiemi haptické zpětné vazby – virtuální světy by se staly hmatatelnými. Nebo integraci s biometrickými senzory, které by herní prostředí přizpůsobovaly vašemu emočnímu stavu. A co teprve propojení s generativní hudbou AI? Každý krok by byl doprovázen unikátní melodií. To by mohlo vést k novým formám terapie, vzdělávání a zábavy. Ať už bude budoucnost jakákoliv, Genie 2 a podobné modely otevírají cestu k dosud nevídaným možnostem.
Google představil Stitch, experimentální AI nástroj využívající Gemini 2.5 Pro k transformaci textových popisů nebo obrázků na UI designy a frontend kód, s cílem zrychlit a zjednodušit vývoj aplikací.
Google na konferenci I/O 2025 představil významná vylepšení svého vlajkového AI modelu Gemini 2.5. Novinky se týkají především personalizovaného učení díky integraci LearnLM a pokročilých schopností analýzy video obsahu, které nacházejí uplatnění jak ve vzdělávání, tak v podnikových řešeních.
Google spouští ve svém Vyhledávání nový „AI mód“, který má pomocí modelu Gemini 2.0 odpovídat na složité otázky. Změní to zásadně pravidla hry, nebo jde jen o dalšího AI chatbota? Zjistěte, jak funguje a jak se k němu dostat.
Google testuje AI pro odhad věku uživatelů. Tento krok přichází v reakci na rostoucí obavy o ochranu mladistvých na internetu. Systém se zaměřuje na odhad věku uživatelů. Jak to přesně funguje? A co to znamená pro ochranu soukromí na platformách jako YouTube?