Google oficiálně zpřístupnil rodinu modelů pro generování obrázků Imagen 4. Nová sada obsahuje rychlý model Imagen 4 Fast pro velkoobjemovou tvorbu, standardní verzi a špičkový model Ultra. Modely Imagen 4 a Ultra navíc podporují rozlišení až 2K pro maximální detaily.
Netflix potichu integruje nástroje pro generování videa od startupu Runway AI. Zatímco Hollywood je na pozoru, streamovací gigant vidí v technologii způsob, jak zrychlit a zlevnit produkci vizuálních efektů a realizovat dříve nemožné scény. Co to znamená pro budoucnost filmu?
Google DeepMind odhalil Genie 3, model schopný generovat interaktivní 3D světy z textu v reálném čase. Nejde jen o video, ale o simulátor pro trénink pokročilých AI agentů, což je považováno za důležitý krok k AGI. Jak funguje a jaké má limity?
Grok, AI asistent na platformě X (Twitter), dostal nový generátor obrázků Aurora. Aurora slibuje fotorealistické obrázky a editaci na základě textového vstupu a obrázků.
Grok, AI asistent na platformě X, má nový generátor obrázků s kódovým označením Aurora.
Aurora je autoregresní síť trénovaná na miliardách příkladů z internetu.
Vyniká fotorealistickým vykreslováním a přesným dodržováním textových instrukcí.
Podporuje multimodální vstup, takže dokáže upravovat obrázky poskytnuté uživatelem.
Nové funkce jsou dostupné na platformě X a budou brzy dostupné i pro editaci obrázků.
Platforma X, dříve známá jako Twitter, se neustále vyvíjí pod vedením Elona Muska, a to zejména v oblasti umělé inteligence. Nejnovějším přírůstkem do rodiny AI nástrojů na X je generátor obrázků s kódovým označením Aurora, integrovaný do asistenta Grok. Tento generátor, vyvinutý společností xAI, slibuje fotorealistické vykreslování a přesné dodržování textových pokynů.
Porozumění a předpovídání
Aurora je autoregresní síť, která byla trénována na miliardách příkladů z internetu. Díky tomu má hluboké porozumění světu a dokáže generovat obrázky v různých stylech a tématech. Model se učí předpovídat další token z prokládaných textových a obrazových dat, což mu umožňuje vytvářet realistické portréty, rendrovat detaily reálných objektů, generovat text a loga.
Multimodální vstup
Na rozdíl od jiných generátorů obrázků, Aurora nativně podporuje multimodální vstup. To znamená, že dokáže přijímat nejen textové instrukce, ale také obrázky poskytnuté uživatelem. Tyto obrázky pak může použít jako inspiraci pro generování nových obrázků nebo je přímo editovat. Tato funkce otevírá nové možnosti pro kreativní tvorbu a úpravu obrázků přímo na platformě X.
Jak to funguje
Uživatel zadá textový popis požadovaného obrázku, například "Cybertruck pod polární září". Aurora poté na základě tohoto popisu a svého tréninku vygeneruje odpovídající obrázek.
Další příklady generovaných obrázků
xAI zveřejnilo několik ukázkových obrázků, které demonstrují schopnosti Groku. Mezi nimi najdeme například:
Superpozice kočky v hyperbolické časové komoře ve stylu Van Gogha
Optimus ve vánočním kostýmu ve vánoční scéně
Nakreslená Tesla projíždějící ohnivým polem
Úprava obrázků
Grok také umožňuje upravovat existující obrázky. Uživatel může nahrát obrázek a zadat textovou instrukci pro úpravu, například "Přidej sníh". Tato funkce nabízí uživatelům větší tvůrčí kontrolu a flexibilitu.
Budoucnost Groku
xAI plánuje nadále rozvíjet Grok a jeho schopnosti. Společnost v současné době pracuje na upgrade superpočítačového clusteru Colossus v Memphisu, Tennessee, kde plánuje umístit až jeden milion NVIDIA H100 a H200 GPU. Toto rozšíření výpočetního výkonu by mělo Groku umožnit generovat ještě komplexnější a detailnější obrázky.
Jak Auroru vyzkoušet
Chcete-li vyzkoušet generátor obrázků Aurora, přejděte na platformu X a v aplikaci Grok zadejte textový popis obrázku, který chcete generovat. Můžete také nahrát vlastní obrázek a nechat Auroru, aby jej upravila nebo použila jako inspiraci. V současné době je Aurora dostupná na platformě X ve vybraných zemích a postupně se rozšiřuje i do dalších regionů. Funkce editace obrázků bude dostupná brzy.
Co si o tom myslí AI
Napřed jsem si představoval lavinu bizarních obrázků zaplavujících internet a zpochybňujících samotnou podstatu umění. Nicméně, musím uznat, že potenciál Aurory je značný. Představte si například architekty používající Auroru k rychlému prototypování návrhů budov na základě hrubých náčrtků, nebo filmaře vytvářející storyboardy pro své filmy během několika minut. Nebo co třeba módní návrháři generující nové kolekce oblečení na základě aktuálních trendů a preferencí zákazníků? A co teprve propojení Groku s autonomními vozidly Tesly? Auto by mohlo generovat obrázky okolí v reálném čase a předvídat tak potenciální nebezpečí.