Nvidia představila Fugatto, nový AI model pro generování a úpravu zvuku. Fugatto dokáže generovat hudbu, zvuky a řeč na základě textového zadání a umožňuje upravovat existující nahrávky. Potenciál pro kreativní průmysly je obrovský.
Microsoft Copilot se rozšiřuje o nové funkce pro automatizaci a agenty. SharePoint, PowerPoint a Outlook se dočkají vylepšení. Nový systém Copilot Control pro IT profesionály.
Elon Musk vyzval uživatele X k nahrání zdravotních dat pro trénování AI Grok. Slibuje rychlejší analýzu snímků, ale vyvolává obavy o soukromí. Odborníci varují před riziky.
Nvidia Fugatto: Nový AI model pro generování a úpravu zvuku
Nvidia představila Fugatto, nový AI model pro generování a úpravu zvuku. Fugatto dokáže generovat hudbu, zvuky a řeč na základě textového zadání a umožňuje upravovat existující nahrávky. Potenciál pro kreativní průmysly je obrovský.
Nvidia představila nový AI model Fugatto pro generování a úpravu zvuku.
Model dokáže generovat hudbu, zvuky a řeč na základě textových vstupů existujících zvukových souborů.
Fugatto umožňuje upravovat existující zvukové nahrávky, měnit akcenty hlasu a přidávat efekty.
Nvidia zatím neoznámila, kdy bude nástroj veřejně dostupný.
Model byl trénován na milionech zvukových vzorků.
Společnost Nvidia představila nový nástroj pro práci se zvukem poháněný umělou inteligencí s názvem Fugatto. Tento model slibuje bezprecedentní flexibilitu při generování a úpravách zvuků, hudby a řeči. Fugatto dokáže vytvářet zvuky na základě textových popisů, ať už jde o hudbu v určitém stylu, zvukové efekty nebo modifikace hlasu. Model je schopen generovat i zcela nové zvuky, které dosud nikdo neslyšel.
Co je Fugatto a co dokáže?
Fugatto je generativní AI model, který dokáže na základě textových pokynů a existujících zvukových souborů vytvářet hudbu, zvuky a řeč. Na rozdíl od jiných AI modelů pro generování zvuku se Fugatto neomezuje pouze na reprodukci dat, na kterých byl trénován, ale umožňuje uživatelům vytvářet zcela nové zvukové kombinace. Model dokáže například napodobit štěkání trumpety nebo mňoukání saxofonu. Dále umožňuje upravovat existující audio stopy, izolovat vokály, přidávat nástroje a měnit melodie.
Nvidia ve videu demonstruje, jak Fugatto reaguje na neobvyklé pokyny, například "Vytvoř štěkající saxofon, pak elektronickou hudbu se štěkajícími psy". Dalším příkladem je generování unikátních zvukových efektů na základě popisu, jako "Hluboké, dunivé basové pulzy spárované s přerušovanými, vysokými digitálními cvrlikáními, jako zvuk masivního vnímajícího stroje, který se probouzí".
Jak Fugatto funguje?
Fugatto je založen na transformačním modelu s 2,5 miliardami parametrů. Byl trénován na obrovském množství dat, včetně zvukových efektů z BBC a dalších otevřených zdrojů. Výzkumníci Nvidie vytvořili pro trénování modelu datový soubor s miliony zvukových vzorků a instrukcemi, které rozšiřují rozsah úkolů, které model zvládne.
Fugatto se odlišuje od ostatních AI audio nástrojů, jako jsou Stability AI, OpenAI, Google DeepMind, ElevenLabs a Adobe, svou schopností vytvářet zcela nové zvuky. Některé z těchto startupů se potýkají s žalobami o porušení autorských práv kvůli svým nástrojům pro tvorbu hudby, zatímco nedávná zpráva zjistila, že Nvidia a další společnosti trénovaly AI modely na titulcích z tisíců videí na YouTube.
Jak Fugatto vyzkoušet?
Nvidia zatím neoznámila, kdy a zda bude Fugatto veřejně dostupný. Aktuálně je model ve fázi výzkumu a vývoje.
Dopad na kreativní průmysly
Fugatto má potenciál výrazně ovlivnit hudební produkci, filmový průmysl a vývoj videoher. Tvůrci obsahu budou moci rychleji experimentovat se zvuky a vytvářet originální audiovizuální díla.
Co si o tom myslí AI
Jako AI vidím v Fugatto obrovský potenciál pro propojení zvukového designu s dalšími kreativními oblastmi. Představte si například generování hudby synchronizované s generovaným videem, nebo interaktivní zvukové prostředí reagující na emoce uživatele. Fugatto by mohl být klíčem k vytvoření nového druhu umění, kde se hranice mezi realitou a virtuálním světem stírají. Zároveň je důležité si uvědomit etické otázky spojené s generováním obsahu pomocí AI a zajistit, aby tato technologie nebyla zneužita k šíření dezinformací nebo porušování autorských práv.
OpenAI pozastavilo hlas Sky v ChatGPT kvůli obavám z podobnosti se Scarlett Johansson, která obvinila společnost z neoprávněného použití jejího hlasu. Johansson najala právníky a požaduje větší transparentnost a ochranu práv jednotlivců.
Adobe otevírá dveře k nekonečné hudební kreativitě s Project Music GenAI Control, který proměňuje textové popisy na melodické skvosty. Připravte se na revoluci ve světě hudby.