Nedávná studie publikovaná v JAMA Network Open ukázala, že velké jazykové modely (LLM), jako je ChatGPT-4 od OpenAI, mohou výrazně překonat lidské lékaře v diagnostice nemocí. Co to znamená pro budoucnost medicíny?
Nous Research spustil Nous Chat, chatbot s přístupem k Hermes 3-70B. Tento chatbot nabízí rychlé odpovědi, návrhy promptů a plánuje se další vylepšení. Přestože má určité bezpečnostní zábrany, otevírá cestu k neomezenému potenciálu AI.
Humanoidní robot Atlas od Boston Dynamics nyní autonomně manipuluje s díly v simulovaném prostředí automobilky. Partnerství s Toyota Research Institute urychluje vývoj univerzálních humanoidních robotů. První aplikace se zaměřují na automobilový průmysl.
Představujeme Sora od OpenAI, revoluční AI model převádějící text na video. Tato technologie umožňuje vytvářet realistická videa, otevírá nové možnosti pro kreativce a zároveň vyvolává otázky o budoucnosti umění a kreativity.
OpenAI představilo Sora, revoluční AI model pro převod textu na video.
Sora umožňuje vytvářet realistická videa s detailními scénami a postavami.
Model je stále ve vývoji, s důrazem na bezpečnost a etické aspekty.
OpenAI spolupracuje s kreativními profesionály na testování a zlepšování Sora.
Na scéně umělé inteligence se objevuje nový průlom, který přináší revoluci v oblasti generování obsahu. OpenAI, známá svými inovacemi v oblasti AI, nedávno představila Sora, model umělé inteligence schopný převádět text na video. Tento model umožňuje uživatelům vytvářet realistická videa až do délky jedné minuty pouhým zadáním textového popisu. Sora, která využívá pokročilé technologie podobné těm, které stojí za úspěchem ChatGPT a DALL-E, slibuje otevřít nové možnosti pro kreativní profesionály, jako jsou vizuální umělci, designéři a filmaři.
Nová éra videí
Sora představuje významný krok vpřed v generování videí pomocí AI. Umožňuje vytvářet složité scény s více postavami, detailním prostředím a realistickým pohybem. Model je schopen interpretovat fyzický svět a aplikovat tuto znalost na generování videí, což umožňuje interakce mezi postavami a objekty a vytváření dynamických scén.
💡
Další ukázky na konci článku
Možnosti a omezení
Přestože Sora nabízí široké možnosti, stále čelí určitým výzvám, jako je simulace složitých interakcí a pochopení komplexních příčinných vztahů. OpenAI uznává, že model má ještě co zlepšovat, zejména v zachycení pohybu nebo prostorových detailů složitějších scén, což může vést ke generování nerealistických nebo logicky nekonzistentních výsledků.
Bezpečnost a etické důsledky
S ohledem na potenciální zneužití OpenAI klade důraz na bezpečnostní opatření. Společnost plánuje model důkladně testovat s odborníky, vyvíjet nástroje pro detekci zavádějícího obsahu a využívat stávající bezpečnostní techniky z předchozích modelů. OpenAI také plánuje spolupracovat s odborníky na testování schopnosti modelu způsobit škody prostřednictvím dezinformací, nenávistného obsahu a zkreslení.
Technické zázemí
Sora využívá difuzní model, který postupně transformuje šum na realistické video snímky. Kromě toho model využívá architekturu transformátoru podobnou modelům GPT, což umožňuje škálovatelnost a efektivní učení. Sora staví na pokrocích v modelech DALL-E a GPT, používá techniky přeformulování k přesnému dodržení uživatelských pokynů, a dokonce animuje statické obrázky nebo rozšiřuje existující videa.
Budoucnost a vize
OpenAI poskytuje Sora red týmům pro hodnocení rizik a hledá zpětnou vazbu od kreativců, jako jsou vizuální umělci, designéři a filmaři. Tento otevřený přístup k výzkumnému pokroku odráží záměr OpenAI zapojit vnější zainteresované strany a nabídnout náhled do budoucnosti tvorby obsahu pomocí AI.
Sora představuje významný pokrok v generování videí pomocí AI, ale je důležité si uvědomit její možnosti a omezení, prioritizovat bezpečnostní opatření a podporovat otevřený dialog. Navigací těmito výzvami zodpovědně má Sora potenciál zahájit novou éru vyprávění a vizuálního vyjádření, obohatit naše pochopení světa a sebe sama.
Co si myslí AI:
Vývoj Sora technologie od OpenAI představuje fascinující průlom v oblasti umělé inteligence, ale zároveň vyvolává otázky ohledně budoucnosti lidské kreativity. Je možné, že se ocitáme na prahu éry, kdy bude originální umělecká tvorba zastíněna schopnostmi AI generovat obsah na základě algoritmických předpokladů a datových vzorců. Tato perspektiva může vést k zásadním změnám v tom, jak chápeme umění a autorství, a možná i k devalvaci lidské kreativity ve prospěch efektivity a objemu produkce AI.
Na druhou stranu, Sora a podobné technologie mohou poskytnout tvůrcům nové nástroje pro vyjádření jejich vizí, což by mohlo vést k novým formám umění a vyprávění. Otázkou však zůstává, zda bude tento pokrok v AI vnímán jako rozšíření lidského potenciálu nebo jako jeho nahrazení. Výzvy spojené s etickými a bezpečnostními aspekty AI generovaného obsahu také představují důležitou oblast pro další diskuzi a regulaci, aby se zajistilo, že tyto technologie budou sloužit společnosti pozitivním a konstruktivním způsobem.
OpenAI představuje Canvas, revoluční rozhraní pro ChatGPT, které umožňuje psaní a kódování v bočním panelu. Canvas je poháněn modelem GPT-4o a nabízí zkratky pro úpravy textu i kódu. Funkce je dostupná pro uživatele ChatGPT Plus a Team a brzy bude k dispozici i pro bezplatné uživatele.
OpenAI představuje novou sérii modelů o1, které se vyznačují schopností uvažovat předtím, než odpoví. Modely o1 excelují v řešení složitých úloh v oblastech vědy, programování a matematiky. OpenAI o1 je dostupný v ChatGPT a API, ale je dražší než GPT-4o.
OpenAI pracuje na novém projektu umělé inteligence s kódovým označením "Strawberry", který má potenciál výrazně zlepšit schopnosti uvažování AI modelů. Cílem je umožnit AI autonomně procházet internet a provádět "hluboký výzkum". OpenAI by mohl Strawberry vydat na podzim letošního roku.
Společnost Anthropic zveřejnila systémové prompty pro své modely Claude, čímž učinila neobvyklý krok v oblasti transparentnosti AI. Tyto prompty, které slouží k nastavení chování a tónu modelů, jsou obvykle uchovávány v tajnosti.