Zurück zur Übersicht

Wizard of Oz - as a Method in UI Design

Matthias Mahrhofer

Einleitung

Die Idee, Benutzern technischer Geräte eine nichtmenschliche Benutzerschnittstelle vorzutäuschen, die in Wahrheit von einem echten Menschen geführt wird, ist älter als der Computer: Bereits 1769 führte Wolfgang von Kempelen in ganz Europa einen Apparat vor, der eine türkisch gekleidete Figur gegen Publikum schach spielen lies. Sie gewann nicht nur häufig Partien gegen selbst bekannte zeitgenössische Schachspieler sondern korrigierte auch falsch gesetzte Spielzüge und kommentierte gelungene Züge mit Kopfnicken. Tickende Geräusche unterstützten die Illusion. Tatsächlich befand sich im Innern der Apparatur ein echter Mensch, der die Figur steuerte. Doch schon Jahrhunderte zuvor versteckten sich Priester hinter Götter- oder Orakelstatuen und liesen diese gottgegebene Schicksalssprüche verkünden. - So übrigens auch der Zauberer von Oz im gleichnamigen Film.

Problematik

Heutzutage lässt man sich von sprechenden Statuen oder von schachspielenden Maschinen nicht mehr sonderlich beeindrucken und so sollte man meinen, dass mächtige Zauberer, die sich in riesenhaften Statuen verstecken oder Menschen, die sich als technische Geräte ausgeben nicht mehr existieren. Hier gibt es jedoch Ausnahmen: In der Grundlagenforschung zur Mensch-Maschine-Interaktion will man häufig Daten zum Verhalten von Benutzern sammeln, wenn sie mit Systemen interagieren, die noch gar nicht implementiert sind. Es liegt nahe, solche Dialoge im Rollenspiel nachzuspielen, doch hier gibt es einige Probleme: Ein Mensch verhält sich, wenn er mit einem anderen echten Menschen interagiert, grundsätzlich anders als wenn er mit einer Maschine kommuniziert. Er ist höflich, seine Anfragen werden sehr komplex, er erwartet automatisch pragmatisches Verständnis bei seinem Gegenüber ("Können Sie mir sagen, wie spät es ist?" - "Es ist...") er legt ein anderes Turntaking-Verhalten an den Tag, verlässt sprunghaft seine Rolle, um im Offtalk über den Dialog zu sprechen und anschließend diesen weiterzuführen, etc. Als Alternative ein Provisorisches System aufzuziehen, das vorerst auf keinerlei Benutzeraktionen reagieren kann und erst nach vielen Durchläufen und genausovielen Ausbesserungen allmählich zur Interaktion gebracht wird, bevor diese endlich verbessert werden kann (was wieder zu einem massiven Rückschritt durch drastische Veränderungen führt) ist langwierig und ineffektiv. Idealerweise bräuchte man also einen Computer, der einerseits durchaus weiß, was der Benutzer will, aber andrerseits auch eine Vorstellung davon hat, wie das fertige System auf die von dem Benutzer tatsächlich ausgeführten Aktionen reagieren wird. Also ein Computer mit dem Verstand eines Menschen, ein moderner Schachtürke. Im Smartkom-Projekt des DFKI und des IPSK wurde ein Wizard of Oz (WOZ) verwendet, um User-Daten zu sammeln. Hier wurden über 300 Aufnahmen erstellt, in denen Versuchspersonen mit einer Persona "Aladdin" bzw später "Smartakus" interagierten, um Kinokarten zu bestellen, eine Stadtrundfahrt zu planen, ein Fax zu versenden oder andere Probleme des Alltags zu lösen. Das System interagierte mit Monitor- und Sprachausgabe sowie einer Persona, während die Versuchspersonen den Computer mit Sprach- und Gesteneingaben steuerten. An diesem Beispiel werde ich auf Voraussetzungen und Verwendungsmöglichkeiten von WOZ-E eingehen.

Voraussetzungen

Der User muss davon ausgehen, dass er es mit einer echten Computerschnittstelle zu tun hat. Dafür muss er schon zu Beginn so instruiert werden, dass er gar nicht auf den Gedanken kommt, er spreche mit einem echten Menschen. Er muss hierbei jedoch trotzdem neugierig bleiben und lebhaft mit dem System interagieren. Dabei soll er sich natürlcih verhalten und die Tatsache des Versuchs ignorieren - Nach Möglichkeit Offtalk über das System vermeiden. Auch das Interface selbst darf nicht den Eindruck erwecken, spontan erfunden zu sein. Dazu ist es auch hier notwendig, im Vorfeld genaue Menüstrukturen festzulegen, vorgefertigte Antworten bereitzulegen und Inkonsistenzen zu vermeiden. Versprecher und Tippfehler sind sorgfältig zu vermeiden. Da im Smartkom-Projekt eine sofortige online-Sprachausgabe erfolgen sollte, entschied man sich dafür, einen echten Menschen sprechen zu lassen. Er verwendete nach einem speziellen Training einen gleichmäßigen Sprachfluss, keinen Dialekt und eine minimale Intonation. Seine Stimme wurde des Weiteren durch einen Vocoder verzerrt. Das Menu-Interface sollte hier, obwohl es auf HTML aufgebaut war keinesfalls auf eine Website hindeuten. Die charakteristische Unterstreichung von Links und typische Symbole wurden vermieden und alternative Symbole verwendet. Ein für den Wizard sichtbarer Navigations-Frame war für die Versuchsperson unsichtbar. Der WOZ interpretiert immer Eingaben des Benutzers, sowohl per Sprache, als auch durch Tippen, drücken oder Zeigen auf dem Display. Gesten und Sprache werden hierfür per Kamera in das abgetrennte Zimmer übertragen. Zur Datenerfassung ist es interessant, die Dialoge vielseitig zu gestalten. Die "Intelligenz" des Systems muss der der geplanten Implementierung entsprechen. Smartakus z.B. verstand bei längeren Sätzen immer nur die ersten Informationen, der Rest wurde grundsätzlich ignoriert. An bestimmten Stellen, wenn der Dialog stagniert, ist es zu überlegen, ob der Wizard dem User Alternativen vorschlagen soll oder durch bewusstes falsches Verstehen den Dialog in eine andere Richtung führt. Hier ist zu beachten, dass aufgestellte Richtlinien bzgl. des Turn-Takings nicht missachtet werden. Es ist nicht erwünscht, ein perfektes System zu simulieren: Fehler in der Kommunikation sind bei WOZ-Experimenten in einem begrenzten Rahmen erwünscht, um dazu Daten zu erfassen. Ergeben sich nicht von selbst genügend, kann der Wizard bewusst Fehler provozieren. Durch anschließendes Interview mit den Usern muss in Erfahrung gebracht werden, ob die Täuschung tatsächlich gelungen ist. Weitere Fragen zum Dialog sind häufig aufschlussreich ("Waren Sie an einer Stelle besonders frustriert? Wo? - Was waren spezielle Stärken des Systems? - Schwächen? etc.)

Verwendungsmöglichkeiten

Primär sind WOZ-Experimente dazu gedacht, Daten zu Mensch-Maschine-Interaktion zu erfassen. Hierzu gehören nicht nur das Wissen über Stärken und Schwächen im Design der Struktur und des Layouts von Schnittstellen sondern auch über Benutzerverhalten. Wie formuliert er Fragen und Wünsche? Wie reagiert ein Benutzer, wenn er nicht zu dem gewünschten Ziel kommt, wie oft wiederholt er seine Versuche, bis er im Normalfall aufgibt? Wendet er sich dann einem anderen Ziel zu? Verwendet er vom System angebotene Abkürzungen und wenn, dann nach welcher Zeit? Im Smartkom-Projekt lag auch ein starker Fokus im Bereich Sprache, Gestik und Mimik. Die Sprachdaten wurden komplett auf Intonations- Wort- und Lautebene verschriftet, um Datenmaterial für Spracherkenner zu sammeln. Mit einer Kamera wurde die Mimik der Versuchsperson aufgenommen und nach emotionalen Gehalt eingeteilt. Sämtliche Gesten, die von einer Kamera über der Arbeitsfläche aufgenommen wurden sind gelabelt und unterteilt in Steuerungs-Gesten, mit denen dem System direkt Anweisungen gegeben werden (zeigen, deuten, markieren, etc.), in unterstützende Gesten (mit dem Finger lesen, ein Objekt mit dem Zeigefinger fokussieren, eine Route auf der Landkarte entlangfahren) und für die tatsächliche Kommunikation unwichtige Rest-Gesten (zufällig im Bild befindliche Hand, mit dem Stift wackeln, etc.). Aus diesen gelabelten Gesten konnte durch Interpretation des Beschleunigungs-Verhaltens tatsächlich ein Gestenerkenner trainiert werden.

Kitik

Auch wenn durch Wizard of Oz Experimente versucht wird, eine möglichst realitätsnahe Situation zu schaffen, bleibt sie nach wie vor nicht echt. WOZ-Studies können bei der Entwicklung eines Systems sehr hilfreich sein, dürfen jedoch nicht die einzige Informationsquelle sein. Tatsächliche Studien mit einem echten User Interface sind notwendig! Der Benutzer wird getäuscht, hierdurch ergeben sich Moralische, wenn nicht sogar rechtliche Probleme. Die Versuchspersonen müssen unbedingt spätestens nach Beendigung des Experimentes über den tatsächlichen Sachverhalt informiert werden, ihnen muss die Möglichkeit gegeben sein, ihre Daten löschen zu lassen.

Quellen:

http://www.phonetik.uni-muenchen.de/Forschung/Publications/Steininger-Handout-CogWiss-Bonn-01.ps http://www.ronaldbieber.de/Publications/Old/ProSemimar_IntelligentUI/Wizard/ Techdok Nr. 5 aus dem Smartkom-Projekt http://www.smartkom.org http://www.smartkom.org/image/Prototyp_Aufbau.jpg http://www.smartkom.org/image/gesamt.jpg http://www.phonetik.uni-muenchen.de/Forschung/Publications/Oppermann_off-talk.ps http://de.wikipedia.org/wiki/Schacht%C3%BCrke http://de.wikipedia.org/wiki/Wizard_of_Oz