Mit dem FORBES-NEWSLETTER bekommen sie regelmässig die spannendsten Artikel sowie Eventankündigungen direkt in Ihr E-mail-Postfach geliefert.
„AlterEgo“ – so heißt eine wundersame Maschine, die es Menschen ermöglicht, mit dem heimischen Computer per gedachtem Befehl zu kommunizieren, ohne die Tastatur zu berühren oder den Mund aufzumachen. Ersonnen wurde das Gerät vom 25-jährigen Arnav Kapur. Nun will er das Gerät verfeinern.
Machen wir ein Gedankenexperiment, in dem wir in einem vergrößerten menschlichen Gehirn umherlaufen, etwa wie in einer Produktionshalle. Mit im Gepäck haben wir eine Frage: Woran liegt es, dass der Mensch, dem das Gehirn gehört, ein erlebendes Subjekt mit Innenperspektive ist? Unser Tourguide schildert beim Rundgang die Funktion der Nervenzellen, das schwindelerregende, chemische Konzert der Botenstoffe und den abstrusen Chor der Gehirnströme. „Spannend“, sagen wir zum Führer, nur: „Wo findet sich denn bitte das Bewusstsein?“ „Seltsame Frage“, antwortet der Erklärer. „Es steckt im Gesamtkunstwerk der Fabrik.“
Wenn man darüber ein wenig nachdenkt, landet man schnell bei der Idee zu „AlterEgo“. Erfunden hat das Gerät der junge MIT-Forscher Arnav Kapur mit seinem Team. Sein tragbares Gerät transkribiert die intern artikulierte Sprache des Benutzers. Die Idee ermöglicht es Menschen, mit Computern oder anderen zu kommunizieren, ohne Wörter zu sprechen, also ohne Mundbewegungen oder körperliche Handlungen auszuführen, mit denen wir mit der Welt um uns herum interagieren. „Das Gerät liest nicht die Gedanken oder nimmt sie auf. Vielmehr zeichnet es nur die bewussten Informationen auf, die man auch kommunizieren will. Dies geschieht durch den Einsatz von internen Sprachsystemen. Die Steuerung liegt in allen Bereichen beim Benutzer“, so Kapur.
Es ist, als ob man mit „Siri“ spricht, ohne den Mund zu öffnen. Kapur fand zunächst heraus, von welchem Teil des Gesichts die zuverlässigsten neuromuskulären Signale ausgehen. Dazu baten er und sein Team Probanden, dieselbe Reihe von Wörtern vier Mal vor sich hin zu denken. Zuvor wurden 16 verschiedene Elektroden an unterschiedliche Stellen im Gesicht geklebt. Das Forscherteam erkannte, dass die Signale von nur sieben dieser Stellen in der Lage waren, gedachte Wörter zu unterscheiden. Anhand dieser Informationen entwickelten die Wissenschaftler einen Prototyp. Der wird wie ein Telefonhörer um den Nacken gelegt und berührt das Gesicht auf beiden Seiten des Mundes sowie entlang des Kiefers. Die Sensoren des neuartigen mobilen Headsets erfassen jene neuronalen Ströme, wenn die passenden internen Sprach- und Denkzonen neurologisch aktiviert werden.
Dies ermöglicht es einem Benutzer, Datenströme an und von einem Computergerät oder einer anderen Person zu übertragen und zu empfangen, ohne den Nutzer aus seiner Umgebung zu trennen oder in seine Privatsphäre vorzudringen. Die künstliche Intelligenz (KI) in „AlterEgo“ findet dann die passende Antwort auf die gedachte Frage und gibt sie an den Nutzer zurück. Was erstaunt: Nur der Nutzer hört das Ergebnis der Suche – per Knochenleitungslautsprecher in seinem Kopf. Diese leiten den Schall nicht durch die Luft, sondern durch Vibrationen über den Knochen ins Innenohr – die Vibrationen werden von der Hörschnecke verarbeitet.
Das System funktioniert bereits. Nur in acht von 100 Versuchen wurden die Befehle nicht verstanden. Bei dieser Ministudie mit zehn Personen, die Teil von Kapurs Masterarbeit war, ging es darum, ein Zehn-Wort-Vokabular zu erkennen. Weiter heißt es in der Arbeit: „Die zukünftige Systemimplementierung sollte Algorithmen und Modelle enthalten, die sich mit hoher Erkennungsgenauigkeit auf mehrere Benutzer übertragen lassen, um die individuelle Benutzerkalibrierung und Trainingszeit zu reduzieren.“ Das erinnert an die erste Sprachsoftware, die man mühsam über 45 Minuten lang an den Klang der eigenen Stimme gewöhnen musste, bevor das Programm nutzbar war.
Kapur ist sehr jung, als er an der Eliteuniversität Massachusetts Institute of Technology (MIT) AlterEgo entdeckt. Er schafft es damit auf die Liste der besten 100 Erfindungen 2020 des Time Magazine in der Kategorie „Experimentelles“. Zudem gewinnt er 2019 den „Use it!“ Lemelson-MIT Student Prize, der mit 15.000 US-$ dotiert ist.
Aufgewachsen im indischen Neu-Delhi war Kapur schon immer fasziniert von Problemlösungen. „Seitdem wir Computer erfanden, versuchten wir, sie intelligenter zu machen. Vom Abakus, den raumfüllenden Maschinen zu Desktop-PCs und den Rechnern in unseren Hosentaschen. Nun bauen wir Geräte, die KI nutzen, um Aufgaben zu automatisieren, die eigentlich menschliche Intelligenz benötigen.“ Und weiter: „Wenn wir uns die Geschichte ansehen, so haben wir Computer immer als externe Hilfen angesehen, die ausführen, was wir ihnen sagen. Ich möchte aber alles miteinander verbinden und die Geräte zu einem Teil von uns machen.“
Im Moment wird diese „Mensch-Maschine-Schnittstelle“ in US-Krankenhäusern getestet. Dort wird die Erfindung von Patienten mit Kommunikationseinschränkungen genutzt, deren Handicaps beispielsweise durch einen Schlaganfall oder neurodegenerative Erkrankungen verursacht wurden. Im Falle der amyotrophen Lateralsklerose, kurz ALS, büßen die Betroffenen peu à peu die Fähigkeit ein, ihre Sprachmuskeln zu verwenden.
Jürgen Gall ist durchaus kritisch. Er arbeitet an der Universität Bonn am Institut für Wirtschaftsinformatik und künstliche Intelligenz und sagt zu AlterEgo: „Der Ansatz ist aktuell ungeeignet für den Massenmarkt, da er nur für eine einzelne Person funktioniert und nicht auf andere übertragbar ist. Für jeden einzelnen Menschen muss, mit sehr viel Aufwand, ein spezieller Datensatz erstellt werden.“ Doch Gall sagt auch: „Im skizzierten Anwendungsszenario ist der Ansatz sinnvoll. Inwieweit die Signale, insbesondere über einen längeren Zeitraum, stabil interpretiert werden können, muss noch evaluiert werden.“ Und dann gibt es da Experten wie Ben Shneiderman, der an der University of Maryland im Bereich Computerwissenschaften arbeitet. Er glaubt, dass es das Ziel der Software von morgen sei, bessere Ergebnisse für den Einzelnen zu fördern. „Die Zukunft liegt in diesen sozialen Designs“, sagt er. „Ein Design, das Vertrauen, Empathie und Verantwortung fördert und gleichzeitig die Privatsphäre schützt. Das ist das nächste große Ding.“
So könnte das AlterEgo-Gerät, für das ein Patentantrag eingereicht wurde und dessen Verkauf auf dem Massenmarkt geplant ist, zu so etwas gedeihen. Die Optionen für die Anwendungen von AlterEgo sind gigantisch. Stellen wir uns vor: die still notierten Notizen für den folgenden Feierabend, erledigt während eines öden Büromeetings. Oder die lautlose Kommunikation mit Smart-Home-Geräten. Im Moment arbeitet das Team noch an der Optimierung der Hardware, um die immensen Datenmengen mit kaum spürbarer Verzögerung zu verarbeiten. Doch was ist Kapurs Ziel? Der Erfinder hofft, dass wir uns vor KI nicht fürchten, sondern sie mit Freude als Werkzeug für einen einfacheren Alltag nutzen. „Als wir mit der Arbeit an der Maschine begannen, setzten wir das Thema Ethik bewusst nicht auf den zweiten Rang. Wir wollten sie integrieren. Deshalb haben wir das Design verändert und lesen nicht direkt aus dem Gehirn, sondern nutzen die bewusste Kommunikation, die ein Nutzer sendet.“ Weiterhin soll das Gerät bald nicht mehr sichtbar sein. Heißt, dass ein Gegenüber nicht sieht, ob so eine Technologie gerade vom Pendant angewendet wird. „Letztlich könnte eine hautfarbene Version, wie ein Aufkleber, unter dem Ohr des Nutzers sitzen“, sagt Kapur.
Text: Matthias Lauerer
Fotos: MIT Media Lab
Dieser Artikel erschien in unserer Ausgabe 6–21 zum Thema „NEXT“.