Task Action Grammar

Dominik Schmidt, 5. Dezember 2004

Bei der „Task Action Grammar“ (nach S. J. Payne und T. R. G. Green, 1986) handelt es sich um eine Grammatik, die zur Beschreibung von Benutzeraktivitäten bei der Umsetzung einer Problemlösungsstrategie verwendet wird. Hierbei wird nur die Eingabeseite eines Systems betrachtet. Die „Task Action Grammar“ ermöglicht einerseits die frühzeitige Feststellung von Designfehlern durch eine Prüfung auf Konsistenz von Benutzungsschnittstellen und andererseits die Vorhersage von verschiedenen Aspekten, wie Lernzeiten oder Fehlerraten bei der Benutzung.

Die Verwendung einer Grammatik zur Beschreibung von Benutzeraktivitäten ist sinnvoll, da der Benutzer zur Interaktion mit der zur Verfügung gestellten Schnittstelle eine durch eine Grammatik beschreibbare Sprache einsetzt. Die „Task Action Grammar“ ist ähnlich wie vergleichbare Grammatiken (zu nennen ist hier zum Beispiel die BNF-Grammatik) aufgebaut und besteht auch aus denselben grundlegenden Elementen (Startsymbol, Terminale, Nicht-Terminale, Ersetzungsregeln).

Die „Task Action Grammar“ legt Wert auf kognitive Vorgänge. Sie wird zur Modellierung der Umsetzung von routinemäßig lösbaren Aufgaben (Elementaraufgaben) in (motorische) Aktionen verwendet.

Zur Modellierung wird eine abstrakte Aufgabe („Task“) in Elementaraufgaben („Simple Tasks“) zerlegt. Eine Elementaraufgabe ist hierbei eine grundlegende Aufgabe, die ohne eine Problemlösungsstrategie gelöst werden kann. Die Festlegung der Elementaraufgaben geschieht intuitiv und enthält Annahmen über den Denkprozess des Nutzers. Deshalb ist eine gründliche Analyse aus Sicht des Nutzers unabdingbar. Dies impliztiert auch, dass die Modellierung nicht automatisiert werden kann; es muss immer einer manuelle Bewertung erfolgen. Eine Modifikation wird unter Umständen beispielsweise bei Übersetzungen notwendig, da hier der Benutzer ein sich unterscheidendes Vorwissen besitzt.

Nach der Identifikation der Elementaraufgaben und deren Festhaltung in einem Verzeichnis, wird eine Liste von Dimensionen (oder auch Merkmalen beziehungsweise „Features“), auf denen die Elementaraufgaben beschrieben werden können, erstellt, und auch deren Merkmalsausprägungen („Feature Values“) in einer Liste festgehalten. Diese beiden getrennten Schritte werden dabei oft zusammengefasst. Zu den Elementaraufgaben werden Aktionen spezifiziert. Als letzter Schritt schließt sich der Festlegung der Ersetzungsregeln an.

Im Vergleich zu einer allgemeinen Grammatik lassen sich zunächst die folgenden Analogien feststellen. Die Aufgabe, die der Benutzer mit Hilfe der Schnittstelle umsetzen möchte, kann hier als Sprache angesehen werden. Das Startsymbol ist die Aufgabe selbst, die Terminale setzen sich aus der Liste der Aktionen zusammen und die Ersetzungsregeln sind ebenfalls vorhanden. Darüberhinaus hat die „Task Action Grammar“ im Vergleich zu anderen Grammatiken jedoch eine Besonderheit: Die zuvor identifizierten Dimensionen tauchen als eine Art von Parametern bei den Ersetzungsregeln auf. Dies ermöglicht die kompaktere Beschreibung der Elementaraufgaben.

Als Illustration zu der bis hier nur abstrakt beschriebenen Vorgehensweise folgt nun eine Beispielanwendung (entnommen aus [1]). Das Szenario beschreibt eine einfache Benutzungsschnittstelle eines Texteditors, mit Hilfe derer sich der Benutzer in dem angezeigten Text durch Benutzung einer Tastatur bewegen kann (Aufgabe). Er hat dabei folgende Optionen (Elementaraufgaben):

Bewege den Cursor um ein Zeichen vorwärts

Bewege den Cursor um ein Zeichen rückwärts

Bewege den Cursor um ein Wort vorwärts

Bewege den Cursor um ein Wort rückwärts

Als Aktion lässt sich hier die Bewegung des Cursors identifizieren. Die Dimensionen sind auf der einen Seite das Ausmaß (also entweder ein Zeichen oder ein Wort) und auf der anderen Seite die Richtung (entweder vorwärts oder rückwärts). Die Ausprägungen dieser Dimensionen bestehen aus den schon genannten Aspekten: Zeichen beziehungsweise Wort (Dimension Ausmaß) sowie vorwärts beziehungsweise rückwärts (Dimension Richtung).

Die Definition des Regelwerks für die Ersetzungen gestaltet sich hierarchisch, wobei soweit wie möglich generalisiert werden sollte. Die sogenannten T-Regeln stehen dabei auf der höchsten Stufe der Hierarchie, sie zerlegen die Elementaraufgaben in abstrakte Handlungsschritte:

Aufgabe(Richtung, Ausmaß) -> Symbol(Richtung) + Buchtstabe(Ausmaß)

Hierarchisch tieferstehende Regeln beschreiben Aktionen solange, bis sich motorische Aktionen direkt zuordnen lassen. Hier werden die folgenden Regeln zweiter Ebene verwendet:

Symbol(Richtung = vorwärts) -> „CTRL“

Symbol(Richtung = rückwärts) -> „META“

Buchstabe(Ausmaß = Zeichen) -> „w“

Buchstabe(Ausmaß = Wort) -> „c“

Wendet man nun die Ersetzungsregeln auf die Elementaraufgabe „Bewege den Cursor um ein Wort vorwärts“ an, erhält man:

Aufgabe(Richtung = vorwärts, Ausmaß = Wort) -> CRTL – c

Zur Prüfung auf semantische Konsistenz eines Modells schaut man sich die möglichen Ersetzungen an. Insbesondere zu beachten sind hierbei die Merkmalsausprägungen sowie die jeweiligen am Ende stehenden Terminale. Es lässt sich dann relativ leicht erkennen, ob die Benutzungsschnittstelle konsistent aufgebaut ist, und denselben Ausprägungen diesselben Aktionen zuordnet. Beispielsweise sollte in einem Zeichenprogramm die SHIFT-Taste immer diesselbe Semantik haben. Wird sie während der Erstellung einer Ellipse gedrückt, und das Ergebnis ist ein Kreis, so wäre es inkonsequent, bei der Erstellung eines Rechtecks durch das Drücken der SHIFT-Taste kein Quadrat zu bekommen. Durch die Abstraktion der „Task Action Grammar“ ließe sich dieses Szenario einfach und konsistent modellieren, indem zum Beispiel die Dimension „Spezialfall“ (für Kreis beziehungsweise Quadrat) eingeführt wird und eine entsprechende Ersetzungsregel definiert wird, die – falls die Merkmalsausprägung dieser Dimension „ja“ ist – als motorische Aktion das Drücken der SHIFT-Taste zuordnet.

Da grundlegend eine Beziehung zwischen Sprache und zugehöriger Grammatik besteht (die Komplexität der Grammatik reflektiert die der beschriebenen Sprache), lassen sich Folgerungen in Bezug auf die wahrscheinlich benötigten Lernzeiten ableiten. Je größer die Gesamtzahl der Regeln und die Anzahl der Dimensionen respektive ihrer Merkmale ist, desto komplexer gestaltet sich die Benutzung der Schnittstelle und desto längere Einarbeitungszeiten sind notwendig. Eine große Anzahl von T-Regeln im Vergleich zu untergeordneten Regeln bedeutet ein hohes Abstraktionsniveau und damit eine leichtere Erlernbarkeit der notwendigen Aktionen zum Durchführen einer Aufgabe.

Regeln, die mehrere Aufgaben gemein haben, begünstigen eine kurze Einarbeitungszeit, da sie einen Transfer ermöglichen. Auch lassen sich Aussagen zu potentiellen Fehlerquellen treffen. Stimmen beispielsweise große Abschnitte von Teilsequenzen unterschiedlicher Regeln überein, bedeutet dies eine erhöhte Verwechslungsgefahr.

Neben dem angespochenen Nutzen kann die Modellierung einer „Task Action Grammar“ jedoch bei umfangreichen Szenarien sehr schnell eine unüberschaubare Anzahl an Regeln produzieren. Daher wird es notwendig, Anwendungen so weit wie möglich zu vereinfachen, was aber unter Umständen das Ergebnis der Analyse verfälschen kann. Es ist außerdem sinnvoll, keine kompletten Systeme zu untersuchen, sondern lokale Analysen für einzelne Teilbereiche durchzuführen.

Die „Task Action Grammar“ als Analysehilfsmittel funktioniert jedoch nur, wenn die Annahmen über den Benutzer und seine Art zu denken zutreffen.

Literatur:

[1]: Prof. Dr. H. Wandke: Übersicht über analytische Modelle, Vorlesung Mensch-Rechner-Interaktion
[2]: Joe Moran, Joy Rahman, Matthew Roberts, Matthieu Schutz: Task Analysis
[3]: Andreas Bustos Glogger: Interaktions- und Benutzermodelle in HCI