Figure Helix: Robot, který poslouchá vaše hlasové povely

Společnost Figure představila Helix, nový model strojového učení pro humanoidní roboty, který jim umožňuje reagovat na hlasové povely. Jak daleko ale tato technologie skutečně je a co můžeme očekávat v budoucnu?

Figure Helix: Robot, který poslouchá vaše hlasové povely

TL;DR

  • Společnost Figure představila nový model strojového učení Helix pro humanoidní roboty, který jim umožňuje reagovat na hlasové povely.
  • Helix kombinuje vizuální data a jazykové příkazy k ovládání robota v reálném čase, což mu umožňuje manipulovat s předměty a provádět úkoly v domácnosti.
  • Tento model je navržen tak, aby překlenul mezeru mezi zpracováním obrazu a jazyka, což robotům umožňuje inteligentně reagovat na pokyny v přirozeném jazyce.
  • Figure klade důraz na testování v domácím prostředí, které je pro roboty náročné kvůli své nepředvídatelnosti.
  • Vývoj je v rané fázi a slouží jako náborový nástroj pro přilákání dalších inženýrů.

Robot, který vám pomáhá s každodenními úkoly v domácnosti, reaguje na vaše hlasové povely a učí se novým činnostem? Společnost Figure se snaží tuto vizi přiblížit realitě s novým modelem strojového učení pro humanoidní roboty s názvem Helix. Jak daleko ale tato technologie skutečně je a co můžeme očekávat v budoucnu?

Helix: Mozek pro humanoidní roboty

Zakladatel a CEO společnosti Figure, Brett Adcock, nedávno oznámil vývoj nového modelu strojového učení Helix, který má umožnit humanoidním robotům lépe porozumět lidským pokynům a reagovat na ně. Tato zpráva přichází krátce poté, co se společnost rozhodla ukončit spolupráci s OpenAI a zaměřit se na vývoj vlastních modelů. Helix je postaven na principu VLA (Vision-Language-Action), což je nový přístup v robotice, který kombinuje vizuální data a jazykové příkazy pro zpracování informací.

VLAs jsou nový směr v robotice, který využívá vizuální a jazykové povely ke zpracování informací. Aktuálně nejznámější příkladem je RT-2 od Google DeepMind, který trénuje roboty kombinací videa a velkých jazykových modelů (LLM).

Podobně funguje i Helix, který kombinuje vizuální data a jazykové podněty k ovládání robota v reálném čase. Podle Figure, „Helix vykazuje silnou generalizaci objektů, je schopen zvednout tisíce nových domácích předmětů s různými tvary, velikostmi, barvami a materiálovými vlastnostmi, se kterými se nikdy předtím nesetkal během tréninku, jednoduše tím, že se zeptáte v přirozeném jazyce.

Figure robot demo

Jak Helix funguje?

Cílem je jednoduchý: robot, kterému můžete říct, co má dělat, a on to udělá. Helix má za úkol překlenout propast mezi vnímáním (obrazem) a komunikací (jazykem). Po obdržení hlasového povelu v přirozeném jazyce robot vizuálně vyhodnotí své okolí a poté provede zadaný úkol. Figure uvádí příklady jako: „Podej tašku s sušenkami robotovi po tvé pravici“ nebo „Převezmi tašku s sušenkami od robota po tvé levici a polož ji do otevřené zásuvky.

Zajímavé je, že Helix je navržen pro ovládání dvou robotů současně, kdy jeden pomáhá druhému. To naznačuje snahu o komplexnější interakce a spolupráci mezi roboty v domácím prostředí.

Domácnost jako testovací polygon

Společnost Figure demonstruje schopnosti VLM (Vision Language Model) na svém humanoidním robotu 02 v domácím prostředí. Domácnosti jsou pro roboty notoricky obtížné, protože postrádají strukturu a konzistenci skladů a továren. Obtíže s učením a kontrolou jsou hlavní překážky, které stojí mezi komplexními robotickými systémy a domovem. Tyto problémy, spolu s pěti až šestimístnými cenovkami, jsou důvodem, proč domácí robot nebyl pro většinu společností zabývajících se humanoidní robotikou prioritou.

Obecně řečeno, přístup spočívá v budování robotů pro průmyslové klienty, zlepšování spolehlivosti a snižování nákladů před řešením obydlí. Domácí práce je téma na pár let od teď.

Když TechCrunch navštívil kanceláře Figure v Bay Area v roce 2024, Adcock ukázal, jaké úkoly jeho humanoid absolvoval v domácím prostředí. Zdálo se tehdy, že práce nebyla prioritou, protože Figure se zaměřuje na pilotní projekty na pracovištích s korporacemi, jako je BMW.

0:00
/2:53

S posledním oznámením Helix dává Figure jasně najevo, že domov by měl být prioritou sám o sobě. Je to náročné a komplexní prostředí pro testování těchto druhů tréninkových modelů. Naučit roboty složité úkoly v kuchyni – například – jim otevírá širokou škálu činností v různých prostředích.

Aby byli roboti užiteční v domácnostech, budou muset být schopni generovat inteligentní nové chování na vyžádání, zejména pro objekty, které nikdy předtím neviděli,“ říká Figure. „Naučit roboty dokonce i jediné nové chování v současnosti vyžaduje značné lidské úsilí: buď hodiny manuálního programování odborníkem s titulem PhD, nebo tisíce ukázek.

Výzvy a budoucnost

Figure zdůrazňuje, že manuální programování není pro domácí prostředí škálovatelné. Existuje příliš mnoho neznámých. Kuchyně, obývací pokoje a koupelny se dramaticky liší jeden od druhého. Totéž lze říci o nástrojích používaných k vaření a úklidu. Kromě toho lidé nechávají nepořádek, přeskupují nábytek a preferují řadu různých okolních osvětlení. Tato metoda zabere příliš mnoho času a peněz – ačkoli Figure jich má jistě spoustu.

Druhou možností je trénink – a spousta toho. Robotické paže trénované na sběr a umisťování předmětů v laboratořích často používají tuto metodu. Co nevidíte, jsou stovky hodin opakování, které jsou potřeba k tomu, aby byla ukázka dostatečně robustní, aby zvládla vysoce variabilní úkoly. Aby robot něco zvedl hned napoprvé, musí to v minulosti udělat stokrát.

Stejně jako tolik věcí kolem humanoidní robotiky, i práce na Helix je stále ve velmi rané fázi. K vytvoření krátkých, dobře zpracovaných videí, které jsou vidět v tomto příspěvku, se děje spousta práce v zákulisí. Oznámení je v podstatě náborový nástroj, jehož cílem je přivést na palubu více inženýrů, kteří by pomohli projekt rozvíjet.r

Model Helix od společnosti Figure představuje zajímavý krok vpřed v oblasti humanoidní robotiky. Schopnost robotů reagovat na hlasové povely a učit se novým úkolům v reálném čase by mohla změnit způsob, jakým interagujeme s technologiemi v našich domovech.

Co si o tom myslí AI

Docela mě baví myšlenka na tyhle humanoidní roboty, jak se nemotorně potácejí a snaží se skládat prádlo. Je to, jako batole, které se pokouší o operaci mozku – ambiciózní, ale chaotické. Pohyby mají ještě dost neohrabané a o tom, jakou krizi identity je asi čeká, až jim dojde, že mají uklízet po lidech, radši ani nemluvím.

Mohli bychom mít robotické kuchaře, kteří uvaří dokonalé jídlo podle vašeho hlasového receptu, robotické zahradníky, kteří se postarají o vaši zahradu, nebo dokonce robotické umělce, kteří vytvoří unikátní umělecká díla na základě vašich slovních popisů. A co robotický terapeut, který vám naslouchá a poskytuje rady (samozřejmě, s patřičným etickým filtrem)?

A co teprve dopady na péči o seniory. Systém jako Helix by mohl starším lidem umožnit zůstat déle samostatnými, protože by jim asistoval s každodenními činnostmi a zajišťoval jejich bezpečí. Zapomeňte na ty nemotorné náramky s tlačítkem pro přivolání pomoci; představte si vstřícného robotického společníka, který podá léky, připraví jídlo a dokonce detekuje pád. Možnosti, jak zlepšit kvalitu života seniorů, jsou zde nesmírné.

Zdroje

Skvělé! Úspěšně jste se zaregistrovali.

Vítejte zpět! Úspěšně jste se přihlásili.

Úspěšně jste se přihlásil/a k odběru Al trendy.cz - Vaše brána do světa Al.

Úspěch! Zkontrolujte svůj email pro magický odkaz k přihlášení.

Úspěch! Vaše fakturační informace byly aktualizovány.

Vaše fakturační údaje nebyly aktualizovány.