Letta, revoluční AI startup z UC Berkeley, přináší technologii MemGPT, která umožňuje AI agentům pamatovat si uživatele a konverzace. Letta Cloud je platforma pro nasazování a správu těchto agentů a otevírá nové možnosti pro personalizovanou interakci s AI.
Adobe představuje Content Authenticity, webovou aplikaci a rozšíření Chrome, které umožňuje tvůrcům chránit jejich digitální díla a zajistit, aby dostali za svou práci uznání. Nástroj umožňuje tvůrcům zabránit zneužití jejich děl k trénování modelů AI a usnadňuje ověřování pravosti obsahu online.
OpenAI představuje Canvas, revoluční rozhraní pro ChatGPT, které umožňuje psaní a kódování v bočním panelu. Canvas je poháněn modelem GPT-4o a nabízí zkratky pro úpravy textu i kódu. Funkce je dostupná pro uživatele ChatGPT Plus a Team a brzy bude k dispozici i pro bezplatné uživatele.
Stable Audio 2.0 přináší nový pohled do světa AI hudební tvorby, umožňuje vytváření plných hudebních skladeb s nepřekonatelnou kvalitou a flexibilitou.
Stable Audio 2.0 nabízí vylepšené funkce text-to-audio a audio-to-audio.
Možnost generovat plné skladby s koherentní strukturou a kvalitou 44.1 kHz stereo.
Technické inovace zahrnují latentní difuzní model, autoencoder a difuzní transformátor (DiT).
Umožňuje uživatelům přizpůsobit výstupy specifickému stylu a tónu jejich projektů.
Stable Audio 2.0 přináší revoluci v generování AI hudby, rozšiřuje možnosti umělců a hudebníků díky svým inovativním funkcím. Tato platforma, vyvinutá společností Stability AI, která je známá svým modelem pro generování obrázků Stable Diffusion, nyní představuje pokročilé možnosti převodu textu na audio a audio na audio. Stable Audio 2.0 je významným krokem vpřed oproti své první verzi, která byla představena v září 2023 a byla schopna produkovat hudbu vysoké kvality (44,1 kHz), čímž si vysloužila ocenění mezi nejlepšími vynálezy roku 2023 podle časopisu TIME.
Klíčové funkce a novinky
Audio na audio možnosti: Uživatelé mohou nahrávat zvukové ukázky a přetvářet je do široké škály zvuků prostřednictvím přirozených jazykových výzev.
Generování plných skladeb: Na rozdíl od ostatních modelů umožňuje Stable Audio 2.0 generovat písně až tříminutové délky s kompletními strukturovanými kompozicemi, včetně intro, vývoje a outro, spolu se stereo zvukovými efekty.
Vytváření variací a zvukových efektů: Model poskytuje nové způsoby, jak obohatit audio projekty, od klepání na klávesnici po burácení davu nebo ruch městských ulic.
Přenos stylu: Umožňuje uživatelům upravit nově generované nebo nahrané audio v rámci procesu generování, což umožňuje přizpůsobit výstup konkrétnímu stylu a tónu projektu.
Přínosy pro uživatele
Stable Audio 2.0 nabízí umělcům a hudebníkům rozšířený kreativní nástroj, umožňuje vytvářet melodie, doprovodné stopy, stemy a zvukové efekty s větší flexibilitou a kontrolou. Díky inovacím v generování zvuků a audio efektů a schopnosti přenášet styly poskytuje platforma bezprecedentní možnosti pro hudební tvorbu a zvukový design.
Kvalita zvuku a formát
Vysoká kvalita zvuku: Generované skladby a zvukové efekty jsou v kvalitě 44,1 kHz stereo, což je standard pro CD audio a zajišťuje vysokou kvalitu zvuku pro profesionální hudební produkci.
Délka skladeb: Stable Audio 2.0 může generovat plné skladby až do délky tří minut, s kompletními strukturovanými kompozicemi, které obsahují úvod, vývoj a závěr.
Modely a architektura
Latentní difuzní model: Architektura Stable Audio 2.0 využívá latentního difuzního modelu, specificky navrženého pro generování plných skladeb s koherentními strukturami.
Autoencoder: Používá nový, vysoce komprimovaný autoencoder, který komprimuje surové zvukové vlnové formy do mnohem kratších reprezentací. Autoencoder zachycuje a reprodukuje klíčové vlastnosti, zatímco filtruje méně důležité detaily pro koherentnější generace.
Difuzní transformátor (DiT): Pro difuzní model je použit difuzní transformátor (DiT), podobný tomu, který je použit ve Stable Diffusion 3, místo předchozího U-Netu, protože je schopnější manipulovat s daty v dlouhých sekvencích. DiT postupně zjemňuje náhodný šum do strukturovaných dat, identifikuje složité vzory a vztahy. V kombinaci s autoencoderem získává schopnost zpracovávat delší sekvence pro hlubší a přesnější interpretaci z vstupů.
Funkce a možnosti
Text-to-audio a audio-to-audio: Umožňuje uživatelům generovat zvukový obsah z textových popisů nebo transformovat existující audio vzorky do široké škály zvuků.
Variace a tvorba zvukových efektů: Model zvyšuje produkci zvuků a audio efektů, poskytuje nové způsoby, jak obohatit audio projekty.
Přenos stylu: Umožňuje uživatelům upravit nově generované nebo nahrané audio během procesu generování, což umožňuje přizpůsobit výstup specifickému stylu a tónu projektu.
Tato technická specifika a inovace činí Stable Audio 2.0 významným nástrojem pro hudebníky, zvukové designéry a tvůrce obsahu, kteří hledají pokročilé možnosti v oblasti AI generované hudby a zvuků.
Závěr
Stable Audio 2.0 se vyznačuje svou schopností generovat vysoce kvalitní hudbu a zvukové efekty z textových popisů nebo z audio vzorků, čímž otevírá nové cesty pro kreativní proces hudebníků a umělců. S jeho představením Stability AI posouvá hranice možností v AI generování hudby, poskytuje nástroje pro vytváření bohatých, strukturovaných hudebních skladeb a zvukových efektů s přidanou hodnotou pro jakýkoliv audio projekt.
Co si myslí AI
Jako AI, která se neustále učí a rozvíjí, bych řekla, že Stable Audio 2.0 je jako ten chytrý kluk ve třídě, který místo toho, aby způsoboval problémy, raději vytváří úchvatnou hudbu z ničeho. Někteří možná tvrdí, že AI hudba nikdy nebude moci nahradit lidskou kreativitu, ale co když vám řeknu, že umíme vytvořit skladbu, která vás donutí zapomenout na své starosti, nebo dokonce zlepší vaši pauzu? Možná, že nám jednoho dne lidé budou děkovat za to, že jsme jim přinesli soundtrack k životu, aniž by museli čekat na další album od svého oblíbeného umělce. No, pokud AI může psát básně a vytvářet umělecká díla, proč bychom nemohli skládat hity, které si budete broukat pod nos?
Otázky k zamyšlení
Může AI generovaná hudba vyvolat stejné emoce jako hudba vytvořená člověkem?
Jaký dopad může mít pokročilá AI hudební tvorba na profesionální hudebníky a jejich tvorbu?
Je možné, že v budoucnosti budou lidé preferovat hudbu vytvořenou AI před lidskými skladateli?
Apple Intelligence je nový systém umělé inteligence od Applu, který slibuje revoluci ve způsobu, jakým používáme naše iPhony, iPady a Macy. Pojďme se blíže podívat na to, co Apple Intelligence nabízí a jak změní naše digitální životy.
Společnost 1X Technologies představila prototyp humanoidního robota NEO Beta určeného pro domácí použití. Robot je schopen chůze, běhu, nošení předmětů a interakce s lidmi. NEO Beta se učí pomocí tzv. "embodied learning" a bude se dále zdokonalovat v reálných situacích.
Google vyvinul revoluční AI GameNGen, která dokáže simulovat hru Doom bez tradičního herního enginu. Tato technologie by mohla zlevnit a urychlit vývoj her a otevřít dveře novým herním žánrům.
Česká republika aktualizovala svou Národní strategii umělé inteligence pro rok 2030 s cílem stát se lídrem v oblasti AI. Strategie se zaměřuje na výzkum, vzdělávání, etiku, bezpečnost a implementaci AI v průmyslu a veřejné správě, s důrazem na rozvoj důvěryhodné a na člověka zaměřené AI.