Tinder se snaží oživit pokles uživatelů pomocí AI. Personalizované shody a AI Photo Finder mají nahradit únavné swipování. Nový CEO Spencer Rascoff vidí v AI budoucnost seznamování. Dokáže AI zachránit Tinder?
OpenAI prošla rebrandingem! Nové logo, písmo a barvy mají sjednotit vizuální identitu a posílit pozici na trhu s AI. Zjistěte více o motivaci, designových změnách a reakcích odborníků. Jak se vám líbí nový vzhled ChatGPT?
AI nástroj Devin je prezentován jako autonomní softwarový inženýr, avšak ve většině úkolů selhává. Realita jeho schopností zaostává za sliby, což otevírá otázky o budoucnosti AI v softwarovém inženýrství.
Genie 2 od DeepMind: AI generuje interaktivní 3D světy
DeepMind Genie 2 generuje interaktivní 3D světy z textu a obrázků. Simuluje fyziku, animace a chování postav. Slouží pro výzkum, kreativní tvorbu a testování AI. Vyvolává otázky o autorských právech.
DeepMind představil Genie 2, model umělé inteligence, který dokáže generovat interaktivní 3D světy.
Vytváří herní prostředí na základě textového popisu a obrázku.
Simuluje fyziku, animace a chování postav.
Slouží pro výzkum a kreativní tvorbu, prototypování a testování AI agentů.
Vyvolává otázky ohledně autorských práv.
DeepMind, výzkumná organizace Google zaměřená na umělou inteligenci, odhalila model s názvem Genie 2, který dokáže generovat "nekonečné" množství hratelných 3D světů. Tento model, nástupce dříve vydaného Genie, vytváří interaktivní scény v reálném čase na základě obrázku a textového popisu (např. "Roztomilý humanoidní robot v lese"). Podobné modely vyvíjí také společnost World Labs a izraelský startup Decart.
Generování světů
Genie 2 dokáže generovat rozmanité 3D světy, ve kterých se uživatelé mohou pohybovat pomocí myši a klávesnice, skákat, plavat atd. Model je trénován na videích a simuluje interakce objektů, animace, osvětlení, fyziku, odrazy a chování "NPC" postav. Mnoho simulací vypadá jako AAA videohry, pravděpodobně proto, že trénovací data obsahují záznamy z populárních her. DeepMind však, stejně jako mnoho jiných AI laboratoří, nezveřejňuje detaily o zdrojích svých dat.
0:00
/0:32
Právní otázky
Vzhledem k tomu, že DeepMind je součástí Google, má přístup k YouTube. Google již dříve naznačil, že jeho podmínky použití umožňují využití videí z YouTube pro trénování modelů. Vyvolává to otázku, zda Genie 2 vytváří neoprávněné kopie videoher, které "sledoval". Toto bude muset v budoucnu pravděpodobně řešit soud.
Konzistence a interaktivita
Genie 2 dokáže generovat konzistentní světy z různých perspektiv (např. z pohledu první osoby nebo izometrického pohledu) po dobu až jedné minuty, většinou však 10-20 sekund. Model reaguje na stisk kláves a dokáže správně identifikovat a pohybovat postavou. "Náš model například dokáže pochopit, že šipky na klávesnici by měly pohybovat robotem, a ne stromy nebo mraky," uvádí DeepMind v blogu.
Srovnání s jinými modely
Většina podobných modelů, tzv. "světových modelů", simuluje hry a 3D prostředí s artefakty, problémy s konzistencí a halucinacemi. Například Decartův simulátor Minecraftu, Oasis, má nízké rozlišení a rychle "zapomíná" rozložení úrovní. Genie 2 si však pamatuje části scény, které nejsou v dohledu, a dokáže je přesně vykreslit, když se znovu stanou viditelnými. Totéž zvládají i modely World Labs.
Využití
Hry vytvořené s Genie 2 by nebyly příliš zábavné, protože by se pokrok mazal každou minutu. DeepMind proto model prezentuje spíše jako výzkumný a kreativní nástroj pro prototypování interaktivních zážitků a testování AI agentů. "Díky schopnostem Genie 2 zobecňovat mimo distribuci lze koncepční umění a kresby proměnit v plně interaktivní prostředí," píše DeepMind. "A použitím Genie 2 k rychlé tvorbě rozmanitých prostředí pro AI agenty mohou naši výzkumníci generovat testovací úlohy, které agenti během tréninku neviděli.”
0:00
/0:14
Dopad na herní průmysl
Tvůrci, zejména v herním průmyslu, mohou mít smíšené pocity. Nedávné vyšetřování Wired ukázalo, že velcí hráči jako Activision Blizzard používají AI ke snižování nákladů, zvyšování produktivity a kompenzaci úbytku zaměstnanců.
Jak vyzkoušet
V současné době není Genie 2 veřejně dostupný.
Závěr
DeepMind's Genie 2 představuje významný krok vpřed ve vývoji AI pro generování interaktivních 3D světů. I když vyvolává otázky ohledně autorských práv a v současnosti není dostupný veřejnosti, má potenciál ovlivnit herní průmysl, výzkum AI a kreativní tvorbu.
Co si o tom myslí AI
Genie 2 je jako digitální loutkové divadlo, kde scénář píšete textem a obrázkem. Představte si propojení s technologiemi haptické zpětné vazby – virtuální světy by se staly hmatatelnými. Nebo integraci s biometrickými senzory, které by herní prostředí přizpůsobovaly vašemu emočnímu stavu. A co teprve propojení s generativní hudbou AI? Každý krok by byl doprovázen unikátní melodií. To by mohlo vést k novým formám terapie, vzdělávání a zábavy. Ať už bude budoucnost jakákoliv, Genie 2 a podobné modely otevírají cestu k dosud nevídaným možnostem.
Google Gemini 2.0 Flash Thinking Mode je experimentální model AI, který generuje "myšlenkový proces" jako součást své odpovědi. To mu umožňuje silnější uvažování a otevírá nové možnosti v oblastech jako je lékařská diagnostika, právo, vzdělávání a design.
Gemini, nejnovější AI model od Googlu, míří na Android zařízení. Co to znamená pro uživatele a vývojáře? Přečtěte si více o možnostech Gemini Nano, Gemini API a Google AI SDK.
Google představil nové modely Veo 2 a Imagen 3 pro generování videa a obrazu, které slibují vyšší kvalitu a realističnost. Nový nástroj Whisk umožňuje remixovat obrázky pro unikátní výstupy. Modely jsou dostupné v Google Labs.