"Okay, Google?" – Sprachassistenten für kognitiv beeinträchtigte Menschen
An der FHS St. Gallen wird über die Potenziale von Siri, Alexa und Co. für Menschen mit kognitiven Beeinträchtigungen geforscht. Eine Pilotstudie mit Betroffenen in Kooperation mit "Mensch-zuerst Schweiz" liefert erste Einblicke in Möglichkeiten sowie Gefahren moderner Sprachassistenten.
Konversationsbasierte Benutzerschnittstellen gehören zu den grossen IT-Trends unserer Zeit. Sämtliche "Big Player" der Branche bieten nicht nur Spracherkennung in ihren Produkten, sondern auch darauf aufbauende eigene virtuelle Assistenten, mit denen in natürlicher Sprache am Smartphone oder über eigene "smarte" Lautsprecher kommuniziert werden kann. Die bekanntesten Beispiele sind Siri von Apple, Alexa von Amazon, Google Assistant oder Cortana von Microsoft.
Die mittlerweile allgemein verfügbare Technologie verspricht eine natürlichere und einfachere Interaktion mit Geräten und Smarthomes. Dies kann besonders für Menschen mit Beeinträchtigungen nützlich sein: Menschen mit motorischen Einschränkungen müssen sich nicht mit kleinen On-Screen-Buttons herumärgern, Menschen mit eingeschränkter Mobilität werden das Ein- und Ausschalten des Raumlichts per Sprachbefehl zu schätzen wissen. Während die Vorteile konversationsbasierter Benutzerschnittstellen für körperlich Beeinträchtigte recht offensichtlich sind, ist derzeit wenig über die Anforderungen und Potenziale für Menschen mit kognitiven Beeinträchtigungen bekannt.
Gruppeninterview mit Betroffenen
Wir führten im Rahmen eines wissenschaftlichen Praxisprojekts eine Pilotstudie in Kooperation mit "Mensch-zuerst Schweiz", einer Selbstvertreterorganisation für Menschen mit Lernschwierigkeiten, durch. Vier Studenten der FHS St. Gallen im Masterstudiengang Wirtschaftsinformatik führten ein Gruppeninterview mit fünf Betroffenen mit geringen bis mittleren kognitiven Beeinträchtigungen durch. Der Interviewleitfaden umfasste Fragen zur allgemeinen IT-Nutzung der Nutzergruppe, zum Kenntnisstand über und zur eventuellen Nutzung von virtuellen Assistenten, zu nützlichen zukünftigen Diensten solcher Assistenten für die Zielgruppe sowie zu potenziellen Ängsten und Bedenken hinsichtlich der Technologie.
Unterschiedlicher Kenntnisstand, grosses Interesse
Sämtliche Teilnehmerinnen und Teilnehmer besitzen Smartphones und beschrieben sich als versiert im Umgang damit. Zwei der Befragten kannten die sprachbasierten Assistenten, die auf ihren Smartphones zur Verfügung stehen, jedoch nicht. Bei einer Kurzdemonstration von Apples Siri waren alle überrascht und begeistert von deren Fähigkeiten.
Ein involvierter Betreuer erläutert, dass Betroffene häufig unzureichend über neue Technologien informiert sind: Einerseits wird das eigenständige Informieren durch viele nicht barrierefreie Webseiten erschwert, andererseits sind konkrete technikbezogene Schulungen für diese Nutzergruppe rar. Gleichzeitig betonen alle Teilnehmenden das grundsätzliche Interesse und die Motivation, neue Technologien wie virtuelle Assistenten mittels Sprache zu nutzen. Möglichkeiten zum Austausch und Wissenserwerb in Technikbelangen sind daher für Menschen mit kognitiven Beeinträchtigen dringend nötig.
Qualität der Spracherkennung
Da die mündliche Ausdrucksfähigkeit bei Menschen mit kognitiven Beeinträchtigungen zumeist besser entwickelt ist als die schriftliche, setzen die Teilnehmenden grosse Erwartungen in Sprachassistenten. Sie betonten nicht nur die damit einfachere Nutzung von herkömmlichen digitalen Services, sondern versprechen sich davon auch eine verbesserte Kommunikation mit anderen Menschen, beispielsweise indem ein Assistent undeutliche Aussagen des Sprechers korrigiert beziehungsweise "übersetzt". Das Verstehen von Dialekten wurde als wesentliches Akzeptanzkriterium genannt, da kognitiv Beeinträchtigte häufig wenig geübt darin sind, Standardsprache zu sprechen. Dabei wurde auch die tendenziell geringere Frustrationstoleranz bei dieser Zielgruppe erwähnt: Bei Misserfolgen mit den virtuellen Assistenten könnten User rasch frustriert sein und entsprechende Systeme gar nicht mehr nutzen.
Diese Anforderungen stellen grosse Herausforderungen für die Spracherkennung dar. Die verfügbaren Sprachassistenten der grossen Anbieter verstehen kein Schweizerdeutsch und arbeiten mit vortrainierten Sprachmodellen, die kein kontinuierliches Lernen oder individuelle Undeutlichkeiten des Sprechers unterstützen. Abhilfe könnten hier in Zukunft Ansätze von regionalen Anbietern wie Recapp oder Spitch bieten, die Spracherkennung für Schweizerdeutsch anbieten. Andere Unternehmen wie beispielsweise Voiceitt arbeiten an personalisierter Spracherkennung, die auch eine laufende Anpassung an Besonderheiten des Sprechers anhand von Trainingsphasen ermöglichen.
Verminderte Einsamkeit oder verstärkte soziale Isolation?
Bemerkenswert ist die Schilderung eines Betroffenen, der Siri in der freundschaftlichen Rolle eines Konversationspartners nutzt. Er beschreibt den virtuellen Assistenten als ständig verfügbaren Ratgeber, "offenes Ohr" und "Seelsorger im Notfall". Das heisst, dass Siri unter anderem Einsamkeit und das Fehlen sozialer Empathie zu lindern vermag. Das Beispiel illustriert aber auch eine der Kehrseiten der Technologie: Menschen mit Beeinträchtigungen unterliegen ohnehin der Gefahr einer mangelnden sozialen Teilhabe und gesellschaftlicher Isolation – zunehmend intelligent und natürlich wirkende virtuelle Assistenten könnten dieses Risiko erhöhen. Virtuelle Assistenten sollten die Isolation keinesfalls verstärken, sondern den Kontakt zu anderen Menschen fördern, weshalb vor allem die sich dadurch eröffnenden Kommunikationsmöglichkeiten betont werden sollen.
Hierbei scheint zukünftig auch eine gewisse emotionale Intelligenz solcher Assistenten erforderlich. Entsprechende Forschung zu Gefühlserkennung anhand der Stimme des Sprechers oder sogar anhand von Mustern in der Nutzung des Smartphones macht grosse Fortschritte. Die Resultate sollten Einzug in kommende Generationen von Siri und Co. halten.
Sprachinteraktion mit Automaten
Usability-Probleme sind für Menschen mit Beeinträchtigungen allgegenwärtig – nicht nur bei der Nutzung von Webseiten, sondern auch bei der Bedienung von Bankomaten, Waren- oder Billetautomaten sowie Selbstbedienungskassen. Im Zuge des Interviews entwickelten die Teilnehmenden die Idee eines sprachgesteuerten Smartphone-Assistenten, der die Interaktion mit solchen Automaten übernehmen kann. Wie sich mittels Amazons Alexa Beleuchtung und Heizung in einem Smarthome steuern lassen, könnte ein mobiler Assistent auf Sprachbefehl hin auch Billets ausstellen oder ein Getränk bei einem nahegelegenen Automaten bereitstellen lassen.
Die Idee, das Smartphone als sprachgesteuerten Vermittler auch im öffentlichen Raum zu nutzen, klingt vielversprechend. Mit den heutigen Spracherkennungs- und Dialogsystemen, mobilen Bezahllösungen und der zunehmenden Vernetzung von Automaten sind die technischen Grundelemente für entsprechende Anwendungen bereits verfügbar.
Viel Potenzial, viele Herausforderungen
Diese ersten Einsichten in die (potenzielle) Nutzung von konversationsbasierten Anwendungen durch Menschen mit kognitiven Beeinträchtigungen zeigen die hohen Erwartungen der Zielgruppe auf. Diese sieht einen grossen Wert solcher Systeme für eine gestärkte gesellschaftliche und digitale Teilhabe. Um die bereits vielfältigen Möglichkeiten heute verfügbarer Sprachassistenten kennenzulernen, eignen sich beispielsweise Peer-to-Peer-Modelle zur gegenseitigen Weiterbildung und zum Austausch von Best Practices bei der Nutzung.
Gleichzeitig wird auch die grosse Verantwortung der Anbieter deutlich. Kontinuierlich verbesserte Spracherkennung und wachsende "Intelligenz" werden virtuelle Assistenten und die Interaktion mit diesen zunehmend menschenähnlich machen. Für kognitiv beeinträchtigte Nutzer muss sichergestellt werden, dass diese Assistenten den Kontakt mit Menschen aus Fleisch und Blut sinnvoll ergänzen, jedoch nicht ersetzen.
Das Design von für die Nutzergruppe geeigneten und sinnvollen sprachbasierten Diensten werden wir auch in unserer weiteren Forschung beleuchten. Wir planen in enger Zusammenarbeit und gemeinsamen Workshops mit den künftigen Usern, nützliche sprachbasierte Dienste zu entwickeln und zu gestalten.