Mit dem FORBES-NEWSLETTER bekommen sie regelmässig die spannendsten Artikel sowie Eventankündigungen direkt in Ihr E-mail-Postfach geliefert.
Skild AI hat 300 Mio. US-$ aufgebracht, um weiterhin seine Plug-and-Play-Roboterintelligenz zu entwickeln, mit der Hoffnung, dass Unternehmen diese in Roboter aller Art integrieren können.
Roboter, ob zweibeinige humanoide Modelle für einfache Fabrikaufgaben oder vierbeinige militärische "Roboterhunde" für den städtischen Kampf, benötigen Gehirne. Historisch gesehen waren diese hochspezialisiert und zweckgebunden. Doch ein Startup aus Pittsburgh behauptet, eine universell einsetzbare Intelligenz entwickelt zu haben, die in verschiedene Roboter integriert werden kann, um grundlegende Funktionen zu ermöglichen.
Skild AI, gegründet im Mai 2023 von den ehemaligen Carnegie-Mellon-Professoren Abhinav Gupta und Deepak Pathak, hat ein Basismodell geschaffen, das als "Allzweck-Gehirn" beschrieben wird. Dieses Modell kann in diverse Roboter eingebaut werden, um Aufgaben wie das Besteigen steiler Hänge, das Überwinden von Hindernissen und das Identifizieren und Aufheben von Gegenständen zu ermöglichen.
Das Unternehmen gab kürzlich bekannt, dass es in einer Series-A-Finanzierungsrunde 300 Mio. US-$ bei einer Bewertung von 1,5 Mrd. US-$ erhalten hat. Die Runde wurde von Lightspeed Ventures, Softbank, Coatue und Amazon-Gründer Jeff Bezos angeführt, mit Beteiligung von CRV, Felicis Ventures, Menlo Ventures, Amazon und General Catalyst.
Raviraj Jain, der Lightspeed-Partner, der auch die Seed-Runde des Unternehmens im Juli 2023 leitete, zeigte sich begeistert von den Modellen von Skild AI, als er sie im April letzten Jahres testete. Die Roboter konnten Aufgaben in unbekannten Umgebungen ausführen und waren nicht speziell für die Demonstrationen entwickelt worden. "Die Roboter konnten damals Treppen steigen, was ich beeindruckend fand, da es ein sehr komplexes Stabilitätsproblem ist", sagte er.
Noch beeindruckender waren die "emergenten Fähigkeiten" der Roboter, also neue Fähigkeiten, die ihnen nicht beigebracht wurden. Diese umfassen einfache Aufgaben wie das Wiederaufnehmen eines heruntergefallenen Gegenstands oder das Drehen eines Objekts. Diese Fähigkeiten zeigen, dass das Modell in der Lage ist, unvorhergesehene Aufgaben zu bewältigen – ein Merkmal, das bei fortschrittlichen künstlichen Systemen wie großen Sprachmodellen auftritt.
Skild AI hat dies durch das Training seines Modells mit einer riesigen Datenbank aus Text, Bildern und Videos erreicht – einer Datenbank, die nach eigenen Angaben 1000-mal größer ist als die der Konkurrenz. Zur Erstellung dieser Datenbank nutzten die Gründer, beide ehemalige KI-Forscher bei Meta, verschiedene Datensammlungstechniken, die sie über Jahre hinweg entwickelt und getestet haben.
Eine Methode bestand darin, menschliche Auftragnehmer zu engagieren, die Roboter fernsteuerten und Daten über deren Aktionen sammelten. Eine andere bestand darin, die Roboter zufällige Aufgaben ausführen zu lassen, die Ergebnisse aufzuzeichnen und durch Versuch und Irrtum zu lernen. Das KI-Modell wurde auch mit Millionen von öffentlichen Videos trainiert.
Als PhD-Student an der UC Berkeley entwickelte Pathak eine Methode, um "künstliche Neugier" in Roboter einzuprogrammieren, indem das System für Ergebnisse belohnt wird, deren Ausgang es nicht vorhersagen kann. "Je unsicherer der Agent über die Vorhersage der Auswirkungen seiner Aktionen ist, desto neugieriger wird er, um zu erkunden", erklärte er. Diese Technik motivierte die KI, mehr Szenarien zu navigieren und mehr Daten zu sammeln.
Seine Forschung zur neugiergetriebenen Lernmethode wurde 2017 veröffentlicht und mehr als 4000-mal zitiert. Pathak entwickelte auch eine Methode, mit der Roboter schriftliche Informationen aus großen Sprachmodellen wie GPT nutzen und in Aktionen umsetzen können.
"Im Jahr 2022 fanden wir eine Möglichkeit, diese Dinge in einem einzigen kohärenten System zusammenzuführen", sagte Pathak. "Die Idee, aus Videos zu lernen, aus Neugier zu lernen, aus realen Daten zu lernen, aber kombiniert mit dem Wissen aus Simulationen."
Skild AI steht im Wettbewerb mit einer Reihe von Robotikunternehmen, die dank des KI-Booms Milliarden US-$ an Risikokapital erhalten haben. Der Branchenriese OpenAI hat kürzlich sein Robotikteam wiederbelebt, um Modelle an Robotikunternehmen zu liefern. Dann gibt es Unternehmen wie Figure AI, das humanoide Roboter entwickelt und von Milliardär Brett Adcock geleitet wird, sowie Covariant, ein OpenAI-Spin-off, das ChatGPT für Roboter baut und dafür über 200 Mio. US-$ gesammelt hat.
Mitgründer Gupta behauptet, dass der Zugang von Skild AI zu großen Datenmengen das Unternehmen von anderen in diesem Bereich unterscheidet, lehnte jedoch ab, genau anzugeben, wie viele Daten für das Modell verwendet werden.
Ken Goldberg, Professor für Robotik und Automation an der UC Berkeley, stimmt zu, dass Daten der Schlüssel zur Skalierung der Robotik sind, aber Roboter benötigen eine spezielle Art von Daten, die im Internet nicht weit verbreitet sind. Zudem lassen sich mit Simulationen gesammelte Daten nicht immer in die reale Welt übertragen.
"Die gesamte Robotik ist derzeit begeistert von der Idee, dass wir etwas Analoges zu großen Sprachmodellen und großen Sprach-Bild-Modellen tun können, bei denen beide auf Internet-Daten im großen Maßstab zugreifen können, mit Milliarden von Beispielen", sagte er. Das sei keine einfache Aufgabe für die Robotik, aber Skild AI will das Problem durch die Kombination all seiner Datensammlungstechniken mit mehr Informationen aus Simulationen angehen.
Pathak und Gupta stellen sich für ihr Unternehmen eine Zukunft vor, die der von OpenAI ähnelt, bei der verschiedene Anwendungsfälle und Produkte auf dem Basismodell von Skild aufbauen, indem es fein abgestimmt wird. "Genau so wollen wir die Robotikbranche revolutionieren", sagte Gupta und fügte hinzu, dass sie schließlich künstliche allgemeine Intelligenz (ein hypothetisches KI-System, das menschliche Fähigkeiten rivalisieren oder übertreffen kann) für Roboter erreichen wollen, mit denen Menschen in der physischen Welt interagieren können.
"Ein GPT-3-Moment kommt in die Welt der Robotik", sagte Stephanie Zhan, Partnerin bei Sequoia Capital und bestehende Investorin in Skild AI. "Es wird eine monumentale Verschiebung auslösen, die ähnliche Fortschritte wie in der Welt der digitalen Intelligenz in die physische Welt bringt."
Text: Rashi Shrivastava