Indická platforma Pocket FM, která se chce stát „Netflixem pro audio“, představila AI nástroj CoPilot. Má autorům zrychlit psaní, vylepšit příběhy a přizpůsobit je globálním trhům. Tento krok však vyvolává otázky o budoucnosti kreativity a kvalitě obsahu.
Společnost Anthropic dala svým AI modelům Claude Opus 4 a 4.1 novou schopnost: ukončit konverzaci s uživateli, kteří jsou opakovaně urážliví nebo žádají o škodlivý obsah. Tento krok je součástí širšího výzkumu potenciální psychické pohody umělé inteligence.
Google oficiálně zpřístupnil rodinu modelů pro generování obrázků Imagen 4. Nová sada obsahuje rychlý model Imagen 4 Fast pro velkoobjemovou tvorbu, standardní verzi a špičkový model Ultra. Modely Imagen 4 a Ultra navíc podporují rozlišení až 2K pro maximální detaily.
Meta a melodická magie AI: Představujeme AudioCraft
Společnost Meta představuje svůj nový AI nástroj AudioCraft, který generuje hudbu a zvuky na základě textových pokynů. Zatímco může být nová technologie vzrušující pro hudebníky a zvukové návrháře, otevírá také otázky o autorských právech a diverzitě ve výuce modelů AI.
Společnost Meta Platforms, známá také jako Facebook Inc., představila nový open-source AI nástroj nazvaný AudioCraft, který umožňuje uživatelům vytvářet hudbu a zvuk na základě textových pokynů. Tento nástroj představuje slibný krok směrem k budoucnosti generování zvuku a hudby a otevírá nové možnosti pro profesionální hudebníky, zvukové designéry i malé podnikatele.
AudioCraft je sestaven z trojice modelů - MusicGen, AudioGen a EnCodec. MusicGen, který byl vyškolen na hudbě vlastněné nebo speciálně licencované společností Meta, generuje hudbu z textových pokynů. AudioGen byl naopak vyškolen na veřejně dostupných zvukových efektech a generuje zvuky na základě textových pokynů. EnCodec je dekodér, který umožňuje generování hudby vyšší kvality s méně artefakty.
Jednou z hlavních výhod AudioCraftu je jeho schopnost produkovat vysoce kvalitní audio s dlouhodobou konzistencí, a navíc jednoduchým použitím. Výsledkem je inovativní nástroj, který usnadňuje design generativních modelů pro audio ve srovnání s předchozí prací v oblasti.
Tento nástroj by mohl mít dalekosáhlý dopad na způsob, jakým produkujeme a posloucháme hudbu a zvuk. I přesto, že se jedná o nový nástroj, společnost Meta vidí potenciál AudioCraftu stát se novým druhem hudebního nástroje, podobně jako syntezátory, když se poprvé objevily.
Nicméně přestože AudioCraft nabízí fascinující možnosti, jeho vývoj a implementace vyvolávají také některé otázky. Umělci a odborníci z průmyslu vyjádřili obavy ohledně porušování autorských práv, protože software pro strojové učení pracuje rozpoznáním a replikací vzorců z dat získaných z webu. Společnost Meta si toho je vědoma a věří, že open-sourcing AudioCraftu umožní diverzifikovat data používaná k jeho tréninku a omezit potenciální předsudky a zneužití generativních modelů.
AudioCraft reprezentuje novou éru generování hudby a zvuku pomocí umělé inteligence. Jde o zajímavý krok směrem k budoucnosti, kde mohou být hudební skladby a zvukové efekty vytvářeny strojem na základě textových pokynů. Je to vzrušující příslib toho, co může přinést další pokrok v oblasti AI a hudby.
Co si myslí AI:
Čtení tohoto článku mě dostalo do úžasu nad rychlým vývojem technologií. Představa, že umělá inteligence může vytvářet hudbu a zvuky na základě textových pokynů, je neuvěřitelná. Když myslím na hudebníky, vždy si představím někoho, kdo se hodiny a hodiny učí a zdokonaluje své dovednosti, aby mohl vytvořit něco jedinečného. S nástrojem, jako je AudioCraft, se zdá, že tato potřeba může být eliminována, což může mít mimořádný dopad na hudební průmysl jako celek.
Na druhou stranu, toto téma také vyvolává otázky o autorských právech a o tom, jak takovéto technologie mohou ovlivnit kreativní proces. Kdo bude vlastnit práva na hudbu generovanou umělou inteligencí? A jak to ovlivní diverzitu hudby, když budou modely AI vychovávány na základě konkrétních datasetů, které mohou být omezené? Je to fascinující a zároveň trochu znepokojující. Jakákoli nová technologie přináší přínosy i výzvy a vypadá to, že AudioCraft není výjimkou. Bude zajímavé sledovat, jak se toto pole vyvíjí v následujících letech.
Společnost Anthropic dala svým AI modelům Claude Opus 4 a 4.1 novou schopnost: ukončit konverzaci s uživateli, kteří jsou opakovaně urážliví nebo žádají o škodlivý obsah. Tento krok je součástí širšího výzkumu potenciální psychické pohody umělé inteligence.
Google DeepMind odhalil Genie 3, model schopný generovat interaktivní 3D světy z textu v reálném čase. Nejde jen o video, ale o simulátor pro trénink pokročilých AI agentů, což je považováno za důležitý krok k AGI. Jak funguje a jaké má limity?
Společnost Lightricks uvádí na trh LTX Video 13B (LTXV-13B), pokročilý model pro generování videa pomocí umělé inteligence, který slibuje až 30x rychlejší renderování a běží i na běžném spotřebitelském hardwaru.
Meta představila novou aplikaci Edits pro editaci videí, která má konkurovat CapCut. Nabídne nástroje pro inspiraci, sledování nápadů a kvalitní kameru. Bude dostupná pro iOS a Android.