// HEISE ONLINE — INTELLIGENZA ARTIFICIALE
Meta dekodiert getippte Sätze aus Hirnströmen – ohne Operation
Metas KI-Modell Brain2Qwerty rekonstruiert getippte Sätze aus EEG- und MEG-Hirnströmen – ohne Implantate. Die KI erreicht im Schnitt 61 Prozent Wortgenauigkeit.
Meta AI’s KI-Modell Brain2Qwerty v2, das getippte Sätze aus nicht-invasiv aufgezeichneten Hirnströmen rekonstruieren kann, hat nun eine Wortgenauigkeit von 61 Prozent erreicht. Damit kommt es der Genauigkeit von Gehirn-Implantaten immer näher.
Wie die begleitende Studie im Fachjournal Nature zeigt, dekodiert das System aus Magnetoenzephalografie-Daten (MEG) mit einer durchschnittlichen Wortgenauigkeit von 61 Prozent; bei den besten Teilnehmenden sind es 78 Prozent. Mehr als die Hälfte aller Sätze enthält dabei höchstens einen Wortfehler. Das ist sicherlich noch kein alltagstaugliches Ergebnis, aber ein guter Schritt auf dem Weg dahin.
Denn auf solchen Verfahren beruhen große Hoffnungen. Nach aktuellem Stand der Technik müssen für solche Anwendungen Implantate ins Gehirn gesetzt werden. Diese Geräte haben eine hohe Präzision. Ein prominentes Beispiel ist ein ALS-Patient, der ein implantiertes BCI fast zwei Jahre lang nahezu täglich zu Hause nutzte – mit 256 Kontakten im Sprachmotorkortex, einer Kommunikationsgeschwindigkeit von 56 Wörtern pro Minute und über 99 Prozent Wortgenauigkeit bei einem Vokabular von 125.000 Wörtern. Solche Systeme erfordern allerdings neurochirurgische Eingriffe mit entsprechenden Risiken wie Hirnblutungen oder Infektionen. Beim Meta-System wäre das anders.
Ein praktisches Hindernis für den breiten Einsatz bleibt jedoch aktuell noch die MEG-Technologie selbst: Die Geräte benötigen magnetisch geschirmte Räume und sind stationär – für Consumer-Anwendungen oder den häuslichen Einsatz taugen sie vorerst nicht. Erst wenn günstigere Sensorik vergleichbare Signalqualität liefert, dürfte nicht-invasive Sprachdekodierung aus dem Labor in den Alltag gelangen.
Brain2Qwerty arbeitet als dreistufiges Deep-Learning-System. In der ersten Stufe extrahiert ein Modul Merkmale aus den EEG- oder MEG-Rohsignalen, anhand derer das Modell getippte Zeichen erkennen kann. Darauf aufbauend rekonstruiert ein Transformer-Modell die Zeichen- oder Wortfolge. In der dritten Stufe korrigiert ein vortrainiertes Sprachmodell die Roh-Ausgabe – analog zu Sprachmodellen, die bei automatischer Spracherkennung die Fehlerquote senken.
Für die Studie tippten 35 gesunde Probanden zuvor kurz memorierte Sätze auf einer QWERTY-Tastatur, während ihre Hirnaktivität per Elektroenzephalografie (EEG) oder MEG aufgezeichnet wurde. Visuelles Feedback beim Tippen gab es nicht – die Teilnehmer konnten also nicht sehen, welche Buchstaben sie eingaben.
Die Resultate auf der Grundlage von MEG-Messungen waren dabei deutlich besser als die auf EEG-Grundlage. Meta hat Code und Modelle von Brain2Qwerty als Open Source veröffentlicht.
Keine News verpassen! Jeden Morgen der frische Nachrichtenüberblick von heise online
Ausführliche Informationen zum Versandverfahren und zu Ihren
Widerrufsmöglichkeiten erhalten Sie in unserer
Datenschutzerklärung.