Google oficiálně zpřístupnil rodinu modelů pro generování obrázků Imagen 4. Nová sada obsahuje rychlý model Imagen 4 Fast pro velkoobjemovou tvorbu, standardní verzi a špičkový model Ultra. Modely Imagen 4 a Ultra navíc podporují rozlišení až 2K pro maximální detaily.
Netflix potichu integruje nástroje pro generování videa od startupu Runway AI. Zatímco Hollywood je na pozoru, streamovací gigant vidí v technologii způsob, jak zrychlit a zlevnit produkci vizuálních efektů a realizovat dříve nemožné scény. Co to znamená pro budoucnost filmu?
Google DeepMind odhalil Genie 3, model schopný generovat interaktivní 3D světy z textu v reálném čase. Nejde jen o video, ale o simulátor pro trénink pokročilých AI agentů, což je považováno za důležitý krok k AGI. Jak funguje a jaké má limity?
Pokročilé modely Veo 2 a Imagen 3 od Googlu pro generování videa a obrazu
Google představil nové modely Veo 2 a Imagen 3 pro generování videa a obrazu, které slibují vyšší kvalitu a realističnost. Nový nástroj Whisk umožňuje remixovat obrázky pro unikátní výstupy. Modely jsou dostupné v Google Labs.
Veo 2 generuje videa v rozlišení až 4K a délce několika minut.
Imagen 3 vytváří jasnější a lépe komponované obrázky s rozmanitějšími uměleckými styly.
Whisk umožňuje remixovat obrázky pro unikátní výstupy.
VideoFX a ImageFX jsou nástroje Google Labs, kde jsou modely dostupné.
Veo 2 bude rozšířen do YouTube Shorts a dalších produktů.
Společnost Google oznámila nové verze svých modelů pro generování videa a obrazu, Veo 2 a Imagen 3, a také nový experimentální nástroj Whisk. Veo 2 vytváří vysoce kvalitní videa s vylepšeným realismem a porozuměním kinematografii, zatímco Imagen 3 produkuje jasnější a lépe komponované obrázky s rozmanitějšími uměleckými styly. Whisk umožňuje uživatelům vkládat obrázky, které vyjadřují jejich představu o subjektu, scéně a stylu, a následně je remixovat do unikátních výstupů.
Google Veo 2, Imagen 3 a Whisk
Model Veo 2 vytváří vysoce kvalitní videa s lepším pochopením fyziky, pohybu a výrazů. Umí zpracovat komplexní požadavky, včetně žánru, typu objektivu a filmových efektů. Videa lze generovat v rozlišení až 4K a délce několika minut. Veo 2 je integrován do nástroje VideoFX v Google Labs. Google plánuje rozšířit Veo 2 do YouTube Shorts a dalších produktů.
0:00
/0:08
Imagen 3 generuje jasnější a lépe komponované obrázky s rozmanitějšími uměleckými styly.
Whisk kombinuje Imagen 3 s Gemini pro vizuální porozumění a popis. Umožňuje vkládat obrázky a remixovat je do unikátních výstupů. Whisk je dostupný v USA.
Jak vyzkoušet
VideoFX: Přihlaste se na čekací listinu na Google Labs.
ImageFX: Nástroj je dostupný ve více než 100 zemích na ImageFX.
Zdá se, že se každý snaží dostat na rozjetý vlak AI generování médií. Nicméně, potenciál Veo 2 a Imagen 3 je nepopiratelný. Představte si filmy generované AI na základě scénáře, personalizované reklamy v reálném čase nebo interaktivní vzdělávací videa, která se přizpůsobují stylu učení studenta. Veo 2 by mohl narušit filmový průmysl tím, že umožní nezávislým tvůrcům vytvářet vysoce kvalitní videa bez vysokých nákladů. Imagen 3 by mohla změnit reklamní průmysl s personalizovanými reklamami generovanými v reálném čase. A Whisk? To je teprve začátek. Představte si platformu, kde designéři mohou spolupracovat na projektech v reálném čase a remixovat své nápady s pomocí AI. Toto by mohlo vést k explozi kreativity a zcela novým designovým trendům.
Google oficiálně zpřístupnil rodinu modelů pro generování obrázků Imagen 4. Nová sada obsahuje rychlý model Imagen 4 Fast pro velkoobjemovou tvorbu, standardní verzi a špičkový model Ultra. Modely Imagen 4 a Ultra navíc podporují rozlišení až 2K pro maximální detaily.
Google DeepMind odhalil Genie 3, model schopný generovat interaktivní 3D světy z textu v reálném čase. Nejde jen o video, ale o simulátor pro trénink pokročilých AI agentů, což je považováno za důležitý krok k AGI. Jak funguje a jaké má limity?
Google představil Opal, experimentální nástroj z dílny Google Labs, který umožňuje komukoli vytvářet jednoduché AI aplikace bez nutnosti psát kód. Pomocí přirozeného jazyka a vizuálního editoru můžete zhmotnit své nápady na prototypy, nástroje pro produktivitu a další.
Google DeepMind představuje AlphaGenome, AI nástroj pro analýzu 98 % lidské DNA. Tento model pomáhá vědcům pochopit, jak genetické varianty ovlivňují regulaci genů a vznik nemocí, jako je rakovina. Nástroj je dostupný pro výzkum a slibuje posun v genomice.