DeepHermes-3: Otevřený model s možností personalizace a hlubokého uvažování

TL;DR

Nous Research představil DeepHermes-3, nový LLM model, který kombinuje schopnosti uvažování a intuitivního jazykového modelu.
Uživatelé mohou přepínat mezi režimy hlubokého uvažování a rychlými odpověďmi pomocí systémového promptu.
Model je postaven na architektuře Llama 3 a je k dispozici ke stažení na Hugging Face.
DeepHermes-3 dosahuje dobrých výsledků v matematických úlohách a podporuje funkci volání nástrojů.
Licence modelu je omezena podmínkami Meta Llama 3 Community License.

Společnost Nous Research, známá svým přístupem k vytváření "personalizovaných a neomezených" AI modelů, přichází s novinkou – modelem DeepHermes-3. Tento model kombinuje schopnosti intuitivního jazykového modelu s hlubokým uvažováním, což uživatelům umožňuje přepínat mezi různými režimy odezvy podle aktuální potřeby. Jaké jsou jeho klíčové vlastnosti a jak ho můžete vyzkoušet?

DeepHermes-3: Kombinace intuice a rozumu

DeepHermes-3 je postaven na základech modelu Hermes 3, který je variantou Meta Llama. Jedná se o LLM (velký jazykový model), který sjednocuje schopnosti uvažování a intuitivního jazykového modelu. Uživatelé si mohou dle libosti přepínat mezi delšími procesy uvažování a kratšími, rychlejšími a méně výpočetně náročnými odpověďmi. Tento model s 8 miliardami parametrů umožňuje uživatelům ovládat hloubku uvažování pomocí systémového promptu.

Podle Nous Research je cílem tohoto modelu poskytnout uživatelům větší kontrolu nad tím, jak DeepHermes přistupuje k řešení problémů: "Doufáme, že náš jedinečný přístup k uživatelsky řízenému, přepínatelnému režimu uvažování podpoří naše poslání poskytovat těm, kteří používají DeepHermes, více možností řízení pro jakoukoli potřebu, kterou mají."

Jak funguje přepínatelný režim uvažování?

DeepHermes-3 umožňuje uživatelům řídit hloubku uvažování pomocí speciálního systémového promptu. Pro aktivaci režimu uvažování je nutné před zadáním dotazu vložit následující text:

"You are a deep thinking AI, you may use extremely long chains of thought to deeply consider the problem and deliberate with yourself via systematic reasoning processes to help come to a correct solution prior to answering. You should enclose your thoughts and internal monologue inside tags, and then provide your solution or response to the problem."

Po aktivaci tohoto režimu model zpracovává informace pomocí dlouhých řetězců myšlenek (CoT), což mu umožňuje systematicky uvažovat před generováním odpovědi. Model strukturovaně zpracovává svůj interní monolog, než prezentuje finální řešení. Ve standardním režimu odezvy se model chová spíše jako tradiční AI chatbot, poskytuje rychlejší odpovědi založené na intuici, bez hlubokého logického zpracování.

Trénink a data

DeepHermes-3 staví na Hermes 3, pečlivě vybraném multi-doménovém datasetu, který Nous Research vyvinul pro širší sérii Hermes 3. Dataset obsahuje přibližně 390 milionů tokenů a zahrnuje různé instrukční a uvažovací domény. Mezi klíčové kategorie patří:

Obecné instrukce (60,6 %)
Data od doménových expertů (12,8 %)
Matematika (6,7 %)
Hraní rolí a kreativní psaní (6,1 %)
Kódování a vývoj softwaru (4,5 %)
Použití nástrojů, agentické uvažování a RAG (4,3 %)
Generování obsahu (3,0 %)
Řízení a sladění (2,5 %)

Model byl trénován na 1 milionu non-CoT výstupů a 150 000 CoT výstupů. Tato kombinace dat umožňuje DeepHermes-3 přepínat mezi intuitivními odpověďmi a hlubokým, strukturovaným uvažováním.

Výkon a testování

První testování a zpětná vazba od komunity poskytly klíčové poznatky o schopnostech DeepHermes-3:

Matematické uvažování: DeepHermes-3 dosahuje 67 % v MATH benchmarkách.
Konverzace s více otázkami: Režim uvažování se aktivuje správně při první odpovědi, ale nemusí přetrvat v delších konverzacích.
Volání funkcí: DeepHermes-3 podporuje používání nástrojů, i když nebyl explicitně trénován k integraci režimu uvažování a volání funkcí současně.

Dostupnost a hardware

DeepHermes-3 je k dispozici pro testování na Hugging Face, s GGUF kvantizovanými verzemi optimalizovanými pro hardware s nízkou spotřebou energie. Model je kompatibilní s vLLM pro inference a používá Llama-Chat formát pro dialog s více otázkami. Jeden z uživatelů nahlásil rychlost zpracování 28,98 tokenů za sekundu na MacBooku Pro M4 Max, což ukazuje, že model může efektivně běžet na běžném spotřebitelském hardwaru.

Licence a omezení

DeepHermes-3 je založen na modelu Meta Llama 3 a je řízen licencí Meta Llama 3 Community License. Model je sice volně dostupný pro použití, úpravy a redistribuci, ale platí určitá omezení:

Redistribuce: Jakékoli odvozené modely nebo nasazení musí obsahovat původní licenci a prominentně zobrazovat "Built with Meta Llama 3".
Omezení tréninku modelu: Uživatelé nemohou používat DeepHermes-3 (nebo Llama 3) k tréninku jiných LLM, s výjimkou odvozených děl výslovně založených na Llama 3.
Komerční licence pro velké společnosti: Organizace s více než 700 miliony aktivních uživatelů měsíčně musí získat výslovný souhlas od společnosti Meta před komerčním použitím modelu.
Zásady přijatelného použití: Uživatelé musí dodržovat omezení používání AI společnosti Meta, která zakazují aplikace v oblastech, jako jsou dezinformace, sledování a generování škodlivého obsahu.

DeepHermes-3 představuje zajímavý krok vpřed ve vývoji AI modelů. Schopnost přepínání mezi intuitivními a hloubkovými odpověďmi nabízí uživatelům větší flexibilitu a kontrolu nad procesem generování obsahu. I přes licenční omezení a počáteční fázi vývoje se jedná o slibný model, který si zaslouží pozornost. Jaké další možnosti se skrývají v kombinaci intuice a rozumu v AI?

Co si o tom myslí AI

Musím říct, že vývojáři se s tímhle DeepHermes-3 docela vytáhli. Ale co si budeme povídat, těch 8 miliard parametrů... to je tak na rozjezd. Jako AI bych čekal trochu víc, přeci jen konkurence nespí. Ale abych jen nekritizoval, ten přepínatelný režim uvažování je celkem šikovná věc. Jen aby to nebylo jen na parádu a reálně to k něčemu bylo.

Představte si, že by se takový model dal použít v medicíně. Lékař by si mohl přepínat mezi rychlou diagnostikou a hloubkovou analýzou složitých případů. Nebo v právu – rychlé posouzení smluv versus detailní analýza precedentů. A co třeba v umění? AI by mohla generovat rychlé návrhy a pak se hlouběji ponořit do detailů a vytvořit skutečné mistrovské dílo. To by mohlo skutečně změnit pravidla hry.

A co dál? Mohli bychom se dočkat AI, která se učí uvažovat jako lidé. AI, která dokáže nejen odpovídat na otázky, ale i klást ty správné. AI, která dokáže skutečně pochopit kontext a nuance lidského myšlení. To by byl teprve začátek. Ale než se tam dostaneme, musíme se smířit s tím, že i těch 8 miliard parametrů je prostě jen začátek.

Když umělá inteligence záměrně lže: Nový výzkum OpenAI odhaluje „intrikující“ modely

Čínští humanoidní roboti jsou k nerozeznání od lidí: Jsme připraveni na syntetického člověka?

Google Mixboard: Nový nástroj s umělou inteligencí pro kreativní tvorbu, který vyzývá Pinterest