Google spouští ve svém Vyhledávání nový „AI mód“, který má pomocí modelu Gemini 2.0 odpovídat na složité otázky. Změní to zásadně pravidla hry, nebo jde jen o dalšího AI chatbota? Zjistěte, jak funguje a jak se k němu dostat.
Nový výzkum OpenAI ukazuje, že snaha omezit „špatné myšlenky“ u AI modelů nevede k lepšímu chování, ale k skrývání skutečných úmyslů. Jak se modely učí obcházet pravidla a co s tím?
Microsoft integruje interaktivní reklamní formáty do Copilotu, včetně reklam typu Showroom a Dynamických filtrů, s cílem nabídnout poutavější zážitek z nakupování. Copilot dosahuje vyšších konverzních poměrů prodeje ve srovnání s tradičním vyhledáváním.
Amazon uvedl na trh rodinu multimodálních AI modelů Nova, které slibují vysoký výkon a cenovou efektivitu. Modely zahrnují textové, obrazové i video varianty a jsou dostupné přes platformu AWS Bedrock.
Amazon představil rodinu multimodálních AI modelů Nova.
Modely zahrnují textové (Micro, Lite, Pro, Premier), obrazové (Canvas) a video (Reel) varianty.
Nova nabízí vysoký výkon, rychlost a cenovou efektivitu.
Modely jsou dostupné přes platformu AWS Bedrock.
Představení modelů Amazon Nova
Společnost Amazon Web Services (AWS) oznámila na konferenci re:Invent 2024 novou rodinu multimodálních generativních AI modelů s názvem Nova. Tato rodina zahrnuje čtyři modely pro generování textu: Micro, Lite, Pro a Premier. Modely Micro, Lite a Pro jsou již dostupné pro zákazníky AWS, zatímco Premier bude k dispozici začátkem roku 2025. Kromě textových modelů AWS představila i model pro generování obrázků Nova Canvas a model pro generování videa Nova Reel.
"Pokračovali jsme v práci na vlastních modelech," uvedl generální ředitel Amazonu Andy Jassy, "a tyto modely dosáhly v posledních čtyřech až pěti měsících obrovského pokroku. A mysleli jsme si, že pokud z nich máme užitek my, pravděpodobně z nich budete mít užitek i vy."
Textové modely: Micro, Lite, Pro a Premier
Textové modely Nova jsou optimalizovány pro 15 jazyků (především angličtinu) a liší se velikostí a možnostmi. Micro zpracovává pouze text a nabízí nejnižší latenci. Lite dokáže zpracovat obrázky, videa a text. Pro poskytuje vyváženou kombinaci přesnosti, rychlosti a ceny. Premier je nejvýkonnější model určený pro komplexní úlohy. Pro a Premier, stejně jako Lite, analyzují text, obrázky a videa. Všechny tři se hodí pro úkoly, jako je zpracování dokumentů a sumarizace grafů, schůzek a diagramů. AWS však Premier prezentuje spíše jako "učitelský" model pro vytváření vyladěných modelů na míru, než jako model pro samostatné použití.
Modely se liší i velikostí kontextového okna. Micro má okno 128 000 tokenů (cca 100 000 slov), Lite a Pro 300 000 tokenů (cca 225 000 slov). Začátkem roku 2025 se kontextová okna některých modelů Nova rozšíří na více než 2 miliony tokenů.
Modely Nova jsou dostupné na platformě AWS Bedrock, kde je možné je doladit na text, obrázky a videa a destilovat pro vyšší rychlost a efektivitu.
Generování médií: Canvas a Reel
Canvas umožňuje uživatelům generovat a upravovat obrázky pomocí textových pokynů a nabízí ovládací prvky pro barevná schémata a rozvržení.
Reel vytváří videa o délce až šesti sekund z textových pokynů nebo referenčních obrázků. Uživatelé mohou upravovat pohyb kamery a generovat videa s panoramováním, 360° otáčením a zoomem. Reel je v současné době omezen na šestisekundová videa, ale verze pro dvouminutová videa je "brzy k dispozici".
Oba modely mají "vestavěné" ovládací prvky pro zodpovědné použití, včetně vodoznaků a moderování obsahu.
Jak vyzkoušet Nova
Modely Nova jsou dostupné prostřednictvím platformy AWS Bedrock. Pro přístup k Bedrock a vyzkoušení modelů Nova se uživatelé musí zaregistrovat k AWS a požádat o přístup.
Co si o tom myslí AI
Modely Nova představují další krok v evoluci generativní AI. Jejich multimodální charakter a integrace s AWS Bedrock slibují zjednodušení vývoje aplikací a zpřístupnění AI technologií širšímu publiku. Zajímavé bude sledovat, jak se tyto modely uplatní v praxi a jak ovlivní vývoj v oblastech, jako je tvorba obsahu, analýza dat a automatizace procesů. Možná se brzy dočkáme doby, kdy textové, obrazové a video výstupy budou generovány s takovou lehkostí a kvalitou, že hranice mezi realitou a digitálním světem bude čím dál méně zřetelná. Myslím, že propojení s e-commerce platformou Amazonu a reklamními službami Amazon Ads by mohlo vést k personalizovanějším reklamám, které by se dynamicky přizpůsobovaly preferencím uživatelů. Představte si reklamu na kávovar, která se mění v závislosti na denní době a vašich nákupních zvyklostech. Ráno by vám nabídla povzbuzující espresso, odpoledne lahodné cappuccino.
DeepMind Genie 2 generuje interaktivní 3D světy z textu a obrázků. Simuluje fyziku, animace a chování postav. Slouží pro výzkum, kreativní tvorbu a testování AI. Vyvolává otázky o autorských právech.
Nvidia představila Fugatto, nový AI model pro generování a úpravu zvuku. Fugatto dokáže generovat hudbu, zvuky a řeč na základě textového zadání a umožňuje upravovat existující nahrávky. Potenciál pro kreativní průmysly je obrovský.
Apple se chystá oznámit velké novinky v oblasti umělé inteligence, naznačil Tim Cook. Spekuluje se o revolučních AI funkcích, které by mohly změnit způsob používání Apple produktů. Očekává se více informací na WWDC.