Humanoide Roboter mit GenAI

ChatGPT erreicht die industrielle Robotik

Uhr
von Yannick Chavanne und Übersetzung: Yannick Züllig

Die generative KI steht im Mittelpunkt der Roboterrevolution, wobei Figure mit OpenAI zusammenarbeiten wird und Covariant ein Modell entwickelt, das selbstständig aus der physischen Welt lernen kann.

(Source: Figure)
(Source: Figure)

Der Aufschwung der LLMs, der maschinellen Lernmodelle, die man im Kern der GenAI-Tools findet, dürfte sich schnell auf den Bereich der Robotik übertragen. Die prominentesten Tech-Giganten auf dem KI-Markt haben dies offenbar verstanden. So waren die humanoiden Roboter des kalifornischen Start-ups Figure kürzlich Gegenstand einer Serie-B-Finanzierungsrunde in Höhe von 675 Millionen US-Dollar, wodurch das Unternehmen auf 2,6 Milliarden US-Dollar aufgewertet wurde. An dieser Finanzierung beteiligten sich Microsoft, OpenAI, NVIDIA, Jeff Bezos (über Bezos Expeditions) und Intel (das bereits im Juli 9 Millionen in Figure investiert hatte), heisst es in einer Pressemitteilung des Start-ups. 

Im Rahmen dieser Investition haben Figure und OpenAI ausserdem einen Kooperationsvertrag unterzeichnet, um die nächste Generation von KI-Modellen für humanoide Roboter zu entwickeln. Diese Zusammenarbeit soll die Forschung von OpenAI mit dem Know-how von Figure im Bereich der Hard- und Software für die Robotik verbinden. Das erklärte Ziel ist es, die Fähigkeit humanoider Roboter, natürliche Sprache zu verarbeiten, zu verbessern.

Partnerschaft mit BMW

Figure wurde 2022 von Brett Adcock, dem ehemaligen Gründer von Archer Aviation und Vettery, gegründet. Im Frühjahr 2023 verliess Figure den Stealth-Modus und enthüllte Figure 01, einen humanoiden Roboter, der zur Unterstützung von Lieferketten entwickelt wurde. Das Start-up-Unternehmen ist vor kurzem eine Partnerschaft mit BMW eingegangen. In einem ersten Schritt wird Figure Anwendungsfälle für seine Roboter in der Automobilproduktion identifizieren. Ihr Einsatz wird dann schrittweise in einem amerikanischen Werk von BMW erfolgen.

Figure plant, seine Roboter in den Bereichen Fertigung, Versand und Logistik, Lagerhaltung und Einzelhandel einzusetzen, wo der Arbeitskräftemangel laut CEO und Gründer Brett Adcock am schlimmsten ist. Er fasst seine Vision auf der Website seines Unternehmens wie folgt zusammen: "Wir bei Figure glauben, dass humanoide Allzweckroboter, die für eine menschliche Umgebung konzipiert sind, der Weg sind, den wir gehen müssen, um die grösste globale Wirkung zu erzielen. Aus diesem Grund ähnelt die Form unserer humanoiden Roboter dem menschlichen Körper". 

Mit Covariant über das LLM hinausgehen

Das Start-up-Unternehmen Figure hat sich auf einen umkämpften Markt begeben, der von Firmen wie Covariant besetzt ist, die ihre Lösungen schon länger entwickeln. Im Gegensatz zu Figure, das sich sowohl mit Hardware als auch mit Software befasst, hat sich Covariant auf Software für Roboter spezialisiert. Ausserdem zielt seine Technologie darauf ab, alle Arten von Fertigungsrobotern mit Strom zu versorgen, und legt den Schwerpunkt nicht auf humanoide Roboter. Covariant wurde 2017 in Kalifornien gegründet, schloss 2023 eine Series-C-Finanzierung in Höhe von 75 Millionen US-Dollar ab und zählt Industriekonzerne wie die Otto Group oder Würth Industrie Service zu seinen Kunden.

Covariant hat vor kurzem das RFM-1 (Robotics Foundation Model-1) eingeführt, ein Modell, das die GenAI nutzt und nach den Erläuterungen des Start-up-Unternehmens Fertigungs- oder Handhabungsrobotern ermöglicht, "Sprache und die physische Welt zu verstehen". RFM-1 ermöglicht es Robotern und Menschen, zusammenzuarbeiten und Probleme zu lösen, indem sie einfach miteinander kommunizieren. Wie die LLMs wird auch das Covariant-Modell von großen Datenmengen gespeist: Es wurde mit Texten, Bildern, Videos, aber auch mit Roboteraktionen und Sensordaten trainiert. Die zig Millionen Datensätze stammen aus einer großen Flotte von Lagerautomatisierungsrobotern, die bei den Kunden der Firma im Einsatz sind.   

Roboter-KI verbessert sich durch physische Interaktion

Das "Verständnis" der physischen Umgebung durch das RFM-1-Modell rührt insbesondere von seiner Fähigkeit her, Videos zu generieren, die die Reaktion von Objekten auf Roboteraktionen vorhersagen. "Die jüngsten Fortschritte in der generativen KI haben grossartige Fähigkeiten zur Erstellung von Videos gezeigt, aber diese Modelle sind immer noch stark von der physischen Realität abgekoppelt und in ihrer Fähigkeit, die Welt zu verstehen, mit der Roboter konfrontiert werden, eingeschränkt. Covariants RFM-1, das auf einem sehr grossen Datensatz trainiert wird, der reich an physischen Interaktionen mit Robotern ist, stellt einen bedeutenden Sprung nach vorne dar, um generalisierte KI-Modelle zu erstellen, die die physische Welt präzise simulieren können", betont Pieter Abbeel, Chief Scientist und Mitbegründer von Covariant.

In einem Blogbeitrag erklärt Covariant, dass es an die "Inkarnationshypothese" glaubt, nach der intelligentes Verhalten aus den physischen Interaktionen einer Entität mit ihrer Umgebung resultiert. Über den RFM-1 können Roboter extrem schnell selbstreflektierendes Lernen durchführen, wirbt das Start-up.

Eine schematische Darstellung wie das Covariant-System Dinge erkennt

Webcode
vVvLXL5i