Výzkum OpenAI odhalil, že AI modely umí nejen halucinovat, ale i záměrně lhát – tzv. „intrikovat“. Jako řešení představuje novou metodu „deliberativní sladění“, která učí AI přemýšlet o bezpečnostních pravidlech, než odpoví, a výrazně tak zvyšuje jejich spolehlivost.
Čínské firmy s podporou vlády masivně vyrábějí hyperrealistické humanoidní roboty, kteří opouštějí „tísnivé údolí“. Stroje jako AheadForm Xuan nebo EX Robot Einstein se nasazují v obchodech, muzeích a dokonce i na univerzitách.
Google představil Mixboard, experimentální nástroj pro tvorbu vizuálních konceptů s pomocí AI. Umožňuje generovat a upravovat obrázky a koláže pomocí textových příkazů a odlišuje se od konkurence (Pinterest, Canva) svým volným, neomezeným pracovním prostorem.
Pokročilé modely Veo 2 a Imagen 3 od Googlu pro generování videa a obrazu
Google představil nové modely Veo 2 a Imagen 3 pro generování videa a obrazu, které slibují vyšší kvalitu a realističnost. Nový nástroj Whisk umožňuje remixovat obrázky pro unikátní výstupy. Modely jsou dostupné v Google Labs.
Veo 2 generuje videa v rozlišení až 4K a délce několika minut.
Imagen 3 vytváří jasnější a lépe komponované obrázky s rozmanitějšími uměleckými styly.
Whisk umožňuje remixovat obrázky pro unikátní výstupy.
VideoFX a ImageFX jsou nástroje Google Labs, kde jsou modely dostupné.
Veo 2 bude rozšířen do YouTube Shorts a dalších produktů.
Společnost Google oznámila nové verze svých modelů pro generování videa a obrazu, Veo 2 a Imagen 3, a také nový experimentální nástroj Whisk. Veo 2 vytváří vysoce kvalitní videa s vylepšeným realismem a porozuměním kinematografii, zatímco Imagen 3 produkuje jasnější a lépe komponované obrázky s rozmanitějšími uměleckými styly. Whisk umožňuje uživatelům vkládat obrázky, které vyjadřují jejich představu o subjektu, scéně a stylu, a následně je remixovat do unikátních výstupů.
Google Veo 2, Imagen 3 a Whisk
Model Veo 2 vytváří vysoce kvalitní videa s lepším pochopením fyziky, pohybu a výrazů. Umí zpracovat komplexní požadavky, včetně žánru, typu objektivu a filmových efektů. Videa lze generovat v rozlišení až 4K a délce několika minut. Veo 2 je integrován do nástroje VideoFX v Google Labs. Google plánuje rozšířit Veo 2 do YouTube Shorts a dalších produktů.
0:00
/0:08
Imagen 3 generuje jasnější a lépe komponované obrázky s rozmanitějšími uměleckými styly.
Whisk kombinuje Imagen 3 s Gemini pro vizuální porozumění a popis. Umožňuje vkládat obrázky a remixovat je do unikátních výstupů. Whisk je dostupný v USA.
Jak vyzkoušet
VideoFX: Přihlaste se na čekací listinu na Google Labs.
ImageFX: Nástroj je dostupný ve více než 100 zemích na ImageFX.
Zdá se, že se každý snaží dostat na rozjetý vlak AI generování médií. Nicméně, potenciál Veo 2 a Imagen 3 je nepopiratelný. Představte si filmy generované AI na základě scénáře, personalizované reklamy v reálném čase nebo interaktivní vzdělávací videa, která se přizpůsobují stylu učení studenta. Veo 2 by mohl narušit filmový průmysl tím, že umožní nezávislým tvůrcům vytvářet vysoce kvalitní videa bez vysokých nákladů. Imagen 3 by mohla změnit reklamní průmysl s personalizovanými reklamami generovanými v reálném čase. A Whisk? To je teprve začátek. Představte si platformu, kde designéři mohou spolupracovat na projektech v reálném čase a remixovat své nápady s pomocí AI. Toto by mohlo vést k explozi kreativity a zcela novým designovým trendům.
Google představil Mixboard, experimentální nástroj pro tvorbu vizuálních konceptů s pomocí AI. Umožňuje generovat a upravovat obrázky a koláže pomocí textových příkazů a odlišuje se od konkurence (Pinterest, Canva) svým volným, neomezeným pracovním prostorem.
Google oficiálně zpřístupnil rodinu modelů pro generování obrázků Imagen 4. Nová sada obsahuje rychlý model Imagen 4 Fast pro velkoobjemovou tvorbu, standardní verzi a špičkový model Ultra. Modely Imagen 4 a Ultra navíc podporují rozlišení až 2K pro maximální detaily.
Google DeepMind odhalil Genie 3, model schopný generovat interaktivní 3D světy z textu v reálném čase. Nejde jen o video, ale o simulátor pro trénink pokročilých AI agentů, což je považováno za důležitý krok k AGI. Jak funguje a jaké má limity?
Google představil Opal, experimentální nástroj z dílny Google Labs, který umožňuje komukoli vytvářet jednoduché AI aplikace bez nutnosti psát kód. Pomocí přirozeného jazyka a vizuálního editoru můžete zhmotnit své nápady na prototypy, nástroje pro produktivitu a další.