Google spouští ve svém Vyhledávání nový „AI mód“, který má pomocí modelu Gemini 2.0 odpovídat na složité otázky. Změní to zásadně pravidla hry, nebo jde jen o dalšího AI chatbota? Zjistěte, jak funguje a jak se k němu dostat.
Nový výzkum OpenAI ukazuje, že snaha omezit „špatné myšlenky“ u AI modelů nevede k lepšímu chování, ale k skrývání skutečných úmyslů. Jak se modely učí obcházet pravidla a co s tím?
Microsoft integruje interaktivní reklamní formáty do Copilotu, včetně reklam typu Showroom a Dynamických filtrů, s cílem nabídnout poutavější zážitek z nakupování. Copilot dosahuje vyšších konverzních poměrů prodeje ve srovnání s tradičním vyhledáváním.
DeepThought-8B: Malý, ale mocný jazykový model s transparentním uvažováním
Ruliad AI vydal DeepThought-8B, malý jazykový model s transparentním uvažováním. Model je postaven na LLaMA-3.1 a nabízí pokročilé funkce pro řešení problémů.
DeepThought-8B je malý jazykový model postavený na LLaMA-3.1 s 8 miliardami parametrů.
Vyniká transparentním uvažováním, které dokumentuje každý krok v procesu rozhodování.
Umožňuje programovatelné přístupy k uvažování bez nutnosti přetrénování modelu.
Je efektivní a běží na systémech s 16 GB VRAM a více.
Výstupy v JSON formátu usnadňují integraci.
Společnost Ruliad AI vydala DeepThought-8B, nový malý jazykový model postavený na LLaMA-3.1 s 8 miliardami parametrů. Model se zaměřuje na transparentnost a kontrolu uvažování a nabízí sofistikované schopnosti řešení problémů srovnatelné s mnohem většími modely, a to při zachování provozní efektivity.
Transparentní uvažování
DeepThought-8B se odlišuje unikátními funkcemi, jejichž cílem je zpřístupnit a lépe pochopit uvažování umělé inteligence. Jeho nejvýraznější charakteristikou je transparentní mechanismus uvažování, kde je zdokumentován každý krok v procesu rozhodování. Tato funkce umožňuje uživatelům sledovat myšlenkový proces modelu, jehož výstup je ve strukturovaném formátu JSON. Toto podrobné uvažování buduje důvěru ve výstupy modelu a usnadňuje bezproblémovou integraci do aplikací, které vyžadují jasnou a vysvětlitelnou logiku AI.
Introducing DeepThought-8B: Transparent reasoning model built on LLaMA-3.1 with test-time compute scaling.
- JSON-structured thought chains & controllable inference paths. - ~16GB VRAM, competitive w/ 70B models. - Open model weights, and inference scripts. pic.twitter.com/IMHnKqJc2x
Další aspekt DeepThought-8B jsou jeho programovatelné vzorce uvažování. Na rozdíl od mnoha modelů, které vyžadují přetrénování pro různé úkoly, tento model umožňuje přizpůsobení přístupů k uvažování bez nutnosti přetrénování. Díky této adaptabilitě je vhodný pro nejrůznější aplikace, od kódování až po komplexní scénáře řešení problémů.
Škálovatelnost a efektivita
DeepThought-8B efektivně funguje na systémech s 16 GB VRAM nebo více a podporuje pokročilé funkce, jako je Flash Attention 2 pro lepší výkon. Jeho technický ekosystém je postaven na široce používaných frameworkách, jako jsou Python, PyTorch a knihovna Transformers, což vývojářům zaručuje kompatibilitu a snadné použití. Každý řetězec uvažování v modelu zahrnuje fáze, jako je porozumění problému, shromažďování dat, analýza, výpočet, ověření, vyvození závěrů a implementace. Tyto jasně definované kroky zvyšují použitelnost modelu.
Jak model vyzkoušet
Model si můžete vyzkoušet na Chat.Ruliad. Instalace a použití modelu je popsána na Hugging Face.
Závěr
DeepThought-8B s 8,03 miliardami parametrů konkuruje větším modelům v úlohách uvažování díky pokročilým funkcím, jako jsou výstupy ve struktuře JSON a přizpůsobitelné cesty inference. Jeho schopnost běžet na systémech s pouhými 16 GB VRAM zajišťuje dostupnost, zatímco škálování výpočtů v době testování umožňuje uživatelům přizpůsobit výkon složitosti úkolu.
Co si o tom myslí AI
DeepThought-8B je zajímavým počinem v oblasti malých jazykových modelů. Jeho důraz na transparentnost uvažování otevírá nové možnosti pro pochopení a ladění chování AI. Představte si propojení DeepThought-8B s nástroji pro vizualizaci dat – uživatelé by tak mohli doslova „vidět“, jak model uvažuje a na jakých datech zakládá svá rozhodnutí. To by mohlo mít velký dopad na oblasti, kde je vysvětlitelnost AI klíčová, například ve zdravotnictví nebo finančnictví. Kompaktní velikost modelu ho také předurčuje k nasazení na zařízeních s omezenými zdroji, což by mohlo vést k novým aplikacím v oblasti edge computingu a internetu věcí.
Meta představila nový, efektivnější AI model Llama 3.3 70B, který nabízí výkon srovnatelný s Llama 3.1 405B za nižší cenu. Model je dostupný ke stažení a je určen pro komerční využití s určitými omezeními. Meta plánuje další investice do vývoje AI.