Soziale Wirkungen virtueller Helfer - Nicole Krämer - E-Book

Soziale Wirkungen virtueller Helfer E-Book

Nicole Krämer

0,0

Beschreibung

Um Mensch-Technik-Interaktion in Zukunft effizienter und zufriedenstellender zu gestalten, eröffnen sich vielversprechende Möglichkeiten durch die Entwicklung und den Einsatz sogenannter virtueller Helfer. Durch deren Fähigkeit zu verbalem und nonverbalem Verhalten sollen diese Figuren dem Menschen einen intuitiven Zugang zu technischen Systemen ermöglichen. Dieses Buch stellt den Stand der Forschung dar und beschäftigt sich insbesondere mit psychologischen Beiträgen in den Bereichen Gestaltung und Evaluation der virtuellen Figuren. Ein besonderer Schwerpunkt wird dabei auf die unerwartet deutlichen sozialen Wirkungen der virtuellen Helfer gelegt: So reagieren menschliche Nutzer unwillkürlich mit unangemessen erscheinenden sozialen Verhaltensweisen wie zum Beispiel Höflichkeit oder sozial erwünschter Selbstdarstellung.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 571

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Um Mensch-Technik-Interaktion in Zukunft effizienter und zufriedenstellender zu gestalten, eröffnen sich vielversprechende Möglichkeiten durch die Entwicklung und den Einsatz sogenannter virtueller Helfer. Durch deren Fähigkeit zu verbalem und nonverbalem Verhalten sollen diese Figuren dem Menschen einen intuitiven Zugang zu technischen Systemen ermöglichen. Dieses Buch stellt den Stand der Forschung dar und beschäftigt sich insbesondere mit psychologischen Beiträgen in den Bereichen Gestaltung und Evaluation der virtuellen Figuren. Ein besonderer Schwerpunkt wird dabei auf die unerwartet deutlichen sozialen Wirkungen der virtuellen Helfer gelegt: So reagieren menschliche Nutzer unwillkürlich mit unangemessen erscheinenden sozialen Verhaltensweisen wie zum Beispiel Höflichkeit oder sozial erwünschter Selbstdarstellung.

Prof. Dr. Nicole C. Krämer lehrt im Bereich Sozialpsychologie/Medien und Kommunikation an der Universität Duisburg-Essen.

Medienpsychologie

Konzepte – Methoden – Praxis

Herausgegeben von Dagmar Unz Nicole C. Krämer Monika Suckfüll Stephan Schwan

Nicole Krämer

Soziale Wirkungen virtueller Helfer

Gestaltung und Evaluation von Mensch-Computer-Interaktion

Verlag W. Kohlhammer

Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwendung außerhalb der engen Grenzen des Urheberrechts ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen, Mikroverfilmungen und für die Einspeicherung und Verarbeitung in elektronischen Systemen.

Es konnten nicht alle Rechtsinhaber von Abbildungen ermittelt werden. Sollte dem Verlag gegenüber der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar nachträglich gezahlt.

1. Auflage 2008 Alle Rechte vorbehalten © 2008 W. Kohlhammer GmbH Stuttgart Umschlag: Gestaltungskonzept Peter Horlacher Gesamtherstellung: W. Kohlhammer Druckerei GmbH + Co. KG, Stuttgart Printed in Germany

ISBN 978-3-17-019542-4

E-Book-Formate

pdf:

epub:

978-3-17-028074-8

mobi:

978-3-17-028075-5

Inhaltsverzeichnis

Vorwort

1 Einleitung

2 Der Gegenstand: Agenten und ihre historischen Vorläufer

2.1 Von Agenten und Avataren – Begriffsbestimmung in der Welt virtueller Helfer

2.2 Entwicklungslinien

2.2.1 Geschichte der Mensch-Computer-Interaktion

2.2.2 Die Schaffung des künstlichen Menschen – historische und aktuelle Versuche

2.2.3 Der virtuelle Mensch – neue Formen des künstlichen Menschen

3 Die Psychologie virtueller Helfer

3.1 Mitarbeit bei der Entwicklung anthropomorpher Schnittstellen

3.1.1 Die Implementierung psychologischer Modelle

3.1.2 Orientierung an der Wirkung auf den Nutzer – die Gestaltung des nonverbalen Verhaltens

3.2 Evaluationsforschung

3.2.1 Kriterien bei der Evaluation virtueller Helfer

3.2.2 Methoden zur Evaluation

3.2.3 Strukturierung des Forschungsbereiches

4 Empirische Ergebnisse zur Wirkung virtueller Helfer

4.1 Methode und Vorgehen bei den eigenen Untersuchungen

4.2 Akzeptanz von virtuellen Helfern

4.2.1 Hinweise auf die Akzeptanz von Interface-Agenten

4.2.2 Determinanten der Akzeptanz

4.2.3 Relativierung der positiven Ergebnisse

4.2.4 Glaubwürdigkeit und Vertrauen – spezifische Akzeptanzaspekte

4.3 Effizienz und Effektivität virtueller Helfer

4.3.1 Lerneffekte durch pädagogische Agenten

4.3.2 Erinnerungsleistung im Rahmen anderer Anwendungszusammenhänge

4.3.3 Bedienungseffizienz

4.3.4 Effektivität hinsichtlich Einflussnahme und Persuasion

4.4 Soziale Wirkungen

4.4.1 Befunde

4.4.2 Erklärungsversuche

4.4.3 Zusammenfassendes Fazit zu sozialen Wirkungen

4.5 Moderierende Aspekte

4.5.1 Erscheinungsbild des Agenten

4.5.2 Verhalten des virtuellen Helfers

4.5.3 Eine Schnittstelle für alle? Nutzervariablen

4.5.4 Aufgabe und Anwendungsbereich

5 Offene Fragen und Ausblick – ein kritischer Blick auf den Forschungsbereich aus psychologischer Sicht

5.1 Empfehlungen für die weitere Forschung

5.2 Was lernen wir über den Menschen?

5.3 Beziehungen zu artifiziellen Entitäten

5.4 Ethische Fragen

5.5 Wie kann die Psychologie von dem Forschungsbereich profitieren?

5.6 Abschluss

Literatur

Stichwortverzeichnis

Vorwort

Die Entstehung des vorliegenden Buches ist natürlich undenkbar ohne einerseits institutionelle Förderung und auf der anderen Seite Unterstützung durch zahlreiche Personen. Ein Großteil der geschilderten Untersuchungen entstand im Rahmen des Projektes EMBASSI (Elektronische Multimodale Bedien- und Serviceassistenz), das in den Jahren 1999 bis 2003 im Leitprojekt Mensch-Technik-Interaktion des Bundesministeriums für Bildung und Forschung (BMBF) gefördert wurde. Im Verlauf dieses Projektes sowie bei der Erstellung des vorliegenden Buches haben mich zahlreiche Personen unterstützt, denen ich an dieser Stelle nochmals danken möchte.

Größten Dank schulde ich meinem Lehrer Prof. Dr. Gary Bente, der mich in jeder erdenklichen Hinsicht über Jahre unterstützt hat. Ich danke ihm für zahlreiche erhellende Diskussionen sowie für kontinuierliche Unterstützung bei der Lösung methodischer Probleme. Ein herzlicher Dank gilt ferner allen Angehörigen der Abteilung Sozialpsychologie und Medienpsychologie der Universität zu Köln, die mich seit 2001 begleitet und unterstützt haben. Vorrangig sind hier Dr. Sabine Rüggenberg und Dipl.-Psych. Heike Blens zu nennen, die sich im Rahmen des Forschungsprojektes EMBASSI als studentische Hilfskräfte über Gebühr engagiert haben und mit ihren jeweils hervorragenden Diplomarbeiten zum Forschungsprogramm beigetragen haben. Unmittelbar beteiligt an den Studien waren des Weiteren Dipl.-Psych. Antonia Grossner, Dipl.-Psych. David Will, Dipl.-Psych. Jeannette Eschweiler, Dipl.-Psych. Verena Lissy, Dipl.-Psych. Ingrid Ziegert, Dipl.-Psych. Sibylle Pennig und Dipl.-Medienwiss. Nina Haferkamp, denen ich für ihr Engagement danken möchte. Allen übrigen Mitgliedern der Abteilung und insbesondere Monika Wegener gilt mein Dank für die engagierte Mitarbeit und die stete Bereitschaft, mich zu unterstützen. Des Weiteren möchte ich den Kollegen des EMBASSI Gesamtteams danken: Dr. Julia Nitschke (ehemals HUB Berlin), Dipl.-Wirt.-Ing. Jens Piesk (Laboratory for Mixed Realities, Köln), Dipl.-Inform. Ido Iurgel (ZDGV, Darmstadt) und Dipl.-Psych. Christoph Meyer zu Kniendorf (ehemals HUB Berlin). Dr. Bettina Fromm danke ich herzlich für die Durchsicht von Teilen des Manuskripts sowie für ihre konstruktiven und kompetenten Hinweise zur Überarbeitung. Ebenfalls danken möchte ich Dr. Stefan Kopp (Universität Bielefeld), der mich nicht nur mit Literatur und anregenden Diskussionen versorgt hat, sondern auch Teile des Manuskriptes kritisch durchgesehen hat. Meiner Familie und Freunden, allen voran meinen Eltern und meinem Mann, Roland Mertens, möchte ich für die nie geringer werdende Unterstützung danken.

1 Einleitung

„Wie kann ich Ihnen behilflich sein?“, fragt die freundliche dunkelhaarige Frau am Bankschalter und lächelt.

„Ich möchte eine Überweisung tätigen.“

„Dann geben Sie doch bitte zunächst hier Ihre Kontonummer ein“, erläutert sie und deutet auf ein Feld, in das sich die Nummernfolge eintippen lässt.

So oder so ähnlich kann sich bereits heute die Konversation eines Menschen mit einem Interface-Agenten abspielen. Obgleich die Zukunftsvision, dass virtuelle Personen uns in verschiedensten Alltagssituationen als hilfreiche Assistenten begleiten werden, bislang noch nicht eingetroffen ist, sind diese anthropomorphen Figuren zumindest im Rahmen des World Wide Web zahlreich vertreten. Gleichwohl ist die Idee, einen menschenähnlichen Assistenten zu schaffen, der dem Menschen bei der Erledigung von Aufgaben zur Seite steht, nicht neu. Bis in das Altertum lässt sich die Faszination der Entwicklung künstlicher Menschen, die der Menschheit zu Diensten sind, zurückverfolgen. Aktuelle Entwicklungen in unserer zunehmend technisierten Welt liefern den Visionen neuen Nährboden: Seit die Verfügbarkeit von Computern so gestiegen ist, dass auch technische Laien mit diesen interagieren wollen und müssen, wird der intelligente, menschenähnliche Helfer als Schnittstelle der Zukunft propagiert. Sein wesentlicher Vorteil gegenüber herkömmlichen Benutzeroberflächen wird in der Möglichkeit zur natürlichsprachigen Interaktion gesehen, darin, mit ihm zu kommunizieren wie mit dem Servicepersonal im Elektroladen, in der Bank oder an der Kinokasse. Entsprechende Visionen wurden bereits früh etwa von Videoproduktionen genährt. Apple beispielsweise stellt in dem Video „Knowledge Navigator“ (Sculley, 1989; vgl. Catrambone, Stasko & Xiao, 2004) den virtuellen Agenten Phil vor. Negroponte prognostizierte entsprechend bereits 1989, dass „the emphasis in user interfaces will shift from the direct manipulation of objects on a virtual desktop to the delegation of tasks to three dimensional, intelligent agents“ … „these agents will be rendered holographically, and we will communicate with them using many channels, including speech and non-speech audio, gesture, and facial expression“ (zitiert nach Kopp, 2003, S. 1).

Trotz der Tatsache, dass momentan verfügbare Agenten lediglich vereinfachte Vorformen der angestrebten intelligenten Begleiter darstellen, lassen sie dennoch sowohl Funktion als auch Effekte späterer Agenten erahnen. Wie bei vielen Innovationen – insbesondere im Bereich der Medien – mischen sich in der öffentlichen Reaktion begeisterte und warnende Kommentare. Gleichwohl werden in der Öffentlichkeit bislang kaum die auf Forschungsebene angestrebten intelligenten und interaktiv sowie natürlichsprachig mit dem Menschen kommunizierenden Agenten diskutiert, wie sie etwa für pädagogische Programme, als Bedienungshilfe für die Heimelektronik, als virtuelle Bankberater oder Immobilienhändler entwickelt werden. Stattdessen werden in den Medien publikumswirksam eher die Miss-Wahlen digitaler Schönheiten präsentiert (www.spiegel.de/netzwelt/netzkultur/0,1518,330775,00.html) oder Kuriositäten im Zusammenhang mit Artefakten, wie ein Fliegen fressender Roboter (www.spiegel.de/wissenschaft/mensch/0,1518,317195,00.html).

Tatsächlich werden im Forschungsbereich mehr und mehr Prototypen entwickelt, die zum großen Teil noch keiner breiteren Öffentlichkeit vorgestellt oder zur Verfügung gestellt wurden. Dabei sind Anwendungsbereiche und Entwicklungen bereits so vielfältig, dass sich die Frage, ob die Helfer eines Tages auf breiter Front in unser Leben Einzug halten werden, gar nicht mehr zu stellen scheint. Fraglich ist somit weniger, ob diese Entwicklung fortschreiten wird, sondern nur noch, wie deren Ergebnis im Einzelnen aussehen wird. So formulieren etwa auch Elliott und Brzezinski (1998): „Designing software as a social interface is not something we can avoid because it happens whether we plan for it or not; we have no choice in doing it but only in doing it right“ (S. 12). Nicht nur die unmittelbar gestaltenden Disziplinen wie etwa Informatik und Künstliche Intelligenz, sondern mehr und mehr auch die Psychologie sind hiervon betroffen. Dies äußert sich etwa auch darin, dass die Forschung zu Interface-Agenten zu den wenigen Bereichen der Mensch-Technik-Interaktion gehört, die bereits von Beginn der Entwicklungen an stets Evaluationen mit einbezogen haben. Sogar ein systematischer Beitrag der Psychologie wurde schon früh vonseiten der Entwickler eingefordert.

Aber nicht nur im Bereich der Evaluation kann die psychologische Forschung entscheidende Beiträge leisten, auch bei der Gestaltung spielen psychologische Erkenntnisse eine nicht unwesentliche Rolle. Da erklärtes Ziel der Anwendungen die möglichst natürliche und intuitive Kommunikation mit den künstlichen Figuren ist, müssen die Agenten in ihrem Kommunikationsverhalten dem von Menschen möglichst nahekommen. Um dies zu ermöglichen, muss nicht nur das verbale Verhalten mithilfe von Linguisten und Computerlinguisten in Dialogmodulen nachgebildet werden. Darüber hinaus muss auch ein möglichst detailliertes Wissen über mikroskopische Aspekte der menschlichen (nonverbalen) Kommunikation und Interaktion vorhanden sein, das traditionell am ehesten in der Psychologie zu finden ist bzw. durch psychologische Forschung gewonnen werden kann. Ferner wird propagiert, dass die Agenten, um konsistent handeln zu können und glaubwürdig zu sein, sowohl über eine Persönlichkeit als auch über emotionale Zustände verfügen müssen. Auch in diesem Zusammenhang wird psychologische Expertise gesucht bzw. werden publizierte Theorien und Modelle rezipiert und implementiert. Inwieweit das Vorgehen der Implementierung von künstlichen Emotionen allerdings sinnvoll ist, um das angestrebte Ziel der effektiven positiven Beeinflussung des Nutzers zu erreichen, wird bislang zu wenig hinterfragt (vgl. Kap. 3.1.1.2).

Im Rahmen dieses Buches sollen – neben der Diskussion solch grundsätzlicher Fragen – insbesondere Untersuchungen zur Wirkung der virtuellen Agenten eine Rolle spielen. Auf Basis der Ableitung von Designempfehlungen aus empirischen Ergebnissen soll ein Beitrag zur zukünftigen Gestaltung von Interface-Agenten geleistet werden. Die entsprechende Forschung orientiert sich zwangsläufig an der klassischen Evaluationsforschung sowie an Methoden der Usability-Forschung aus dem Bereich der Mensch-Computer-Interaktion und deren klassischen Evaluationskriterien Effizienz, Effektivität und Akzeptanz. In Ergänzung dieser Aspekte sollen hier vor allem die – verglichen mit herkömmlichen Schnittstellen – neuartigen sozialen Wirkungen der Interface-Agenten im Vordergrund stehen. Bereits frühe Untersuchungen im Bereich von virtuellen Helfern zeigten das erstaunliche Ergebnis, dass die Nutzer im Umgang mit den künstlichen Agenten automatisch ähnliche soziale Verhaltenweisen zeigten, wie in der Interaktion mit anderen Menschen zu beobachten. Nachgewiesen wurde dies bereits für soziale Erleichterung, Kooperation, sozial erwünschtes Verhalten und anderes mehr (Rickenberg & Reeves, 2000; Sproull, Subramani, Kiesler, Walker & Waters, 1996; Parise, Kiesler, Sproull & Waters, 1999; Walker, Sproull & Subramani, 1994). Die Diskussion, ob dieses Phänomen letztlich eine oberflächliche Anpassung an die gegebene Menschenähnlichkeit darstellt oder durch die tief verwurzelte soziale Natur des Menschen unwillkürlich gespeist wird, gehört zu den spannendsten Kontroversen im Bereich der Erforschung anthropomorpher Schnittstellen. Entsprechende Ergebnisse und unterschiedliche Beiträge zu dieser Diskussion sollen daher einen weiteren Schwerpunkt ausmachen.

Insbesondere wird diskutiert, inwieweit diese Phänomene Rückschlüsse auf die soziale Natur des Menschen erlauben. In diesem Zusammenhang stellt sich weiterhin die Frage, woher das Interesse an der Gestaltung künstlicher Menschen überhaupt rührt und ob dies tatsächlich lediglich durch den Wunsch motiviert ist, möglichst natürliche Schnittstellen zu schaffen oder etwa auch auf den Wunsch nach Soziabilität oder Ähnliches zurückzuführen ist. Somit werden im Rahmen der Darstellungen an verschiedenen Stellen immer wieder Fragen aufgeworfen und bearbeitet, die letztlich den Menschen und seine soziale Natur fokussieren. Damit gehen die Fragestellungen des Forschungsbereiches deutlich über die normalerweise getätigten Betrachtungen im Rahmen der Mensch-Computer-Interaktion hinaus. Es werden nicht nur die üblichen allgemein- bzw. kognitionspsychologischen Aspekte thematisiert, sondern vermehrt auch soziale Zusammenhänge. Neben klassischen Themen der Ingenieur-Psychologie (Usability, Mensch-Computer-Interaktion) werden somit auch medienpsychologische und sozialpsychologische Theorien und Erkenntnisse eine Rolle spielen.

Im Sinne einer Lesehilfe wird nun der Aufbau des Buches geschildert: Im zweiten Kapitel folgen zunächst ausführliche Darstellungen zum Gegenstand und seiner historischen Entwicklung. Nach einer Begriffsbestimmung wird eine Übersicht über die verschiedenen relevanten Entwicklungslinien wie die Entwicklung von Mensch-Computer-Schnittstellen und Versuche zur Schaffung künstlicher Menschen gegeben. Abgeschlossen wird das Kapitel durch eine Präsentation des momentanen Entwicklungsstandes. Hier werden die aktuell von verschiedenen Forschergruppen präsentierten Interface-Agenten vorgestellt. Im Rahmen des dritten Kapitels werden die beiden erwähnten Beteiligungsfelder psychologischer Forschung behandelt: Sowohl die Möglichkeiten der Mitarbeit bei der Gestaltung – unter besonderer Berücksichtigung der Diskussion, ob Agenten Persönlichkeit und Emotionen benötigen – als auch die Vorgehensweisen bei der Evaluationsforschung werden vorgestellt und diskutiert. Im umfangreichsten vierten Kapitel schließlich werden die empirischen Ergebnisse zur Wirkung virtueller Helfer vorgestellt. Dazu wird die mittlerweile recht umfangreiche internationale Literatur aufgearbeitet und mit eigenen Ergebnissen ergänzt. Letztere wurden im Wesentlichen in sechs experimentellen Untersuchungen gewonnen, die im Rahmen des EMBASSI-Projektes durchgeführt wurden. Das Akronym EMBASSI steht für Elektronische Multimodale Bedien- und Service Assistenz. Das Projekt wurde in den Jahren 1999–2003 als eines der Leitprojekte Mensch-Technik-Interaktion vom Bundesministerium für Bildung und Forschung (BMBF) gefördert. Neben 18 weiteren Partnern aus Industrie und Forschung, die Assistenz- und Dialogmodule sowie graphische Benutzerschnittstellen entwickelten, war die Abteilung Differentielle Psychologie und Kommunikationsforschung der Universität zu Köln (unter Leitung von Prof. Dr. Gary Bente) in Zusammenarbeit mit der Kölner Kunsthochschule für Medien (Laboratory for Mixed Realities) mit der „Entwicklung und Evaluation von anthropomorphen Interface-Agenten“ betraut. Hinsichtlich Akzeptanz, Effizienz, sozialen Wirkungen und moderierenden Aspekten werden die gewonnenen eigenen Erkenntnisse in Bezug zum internationalen Forschungsstand gesetzt. Zum Abschluss werden in Kapitel 5 zusammenfassende Schlussfolgerungen gezogen sowie Ausblicke auf mögliche Weiterentwicklungen gegeben.

2 Der Gegenstand: Agenten und ihre historischen Vorläufer

Um den Gegenstandsbereich einzugrenzen und gleichzeitig näher zu bestimmen, werden in diesem Kapitel Definitionen, Entwicklungslinien und aktueller Entwicklungsstand verfügbarer Systeme geschildert.

2.1 Von Agenten und Avataren – Begriffsbestimmung in der Welt virtueller Helfer

Zur Bezeichnung virtueller Charaktere wird inzwischen eine Vielzahl von Begriffen weitgehend synonym verwendet (vgl. auch Krämer & Bente, 2002). Die Rede ist von Avataren, anthropomorphen Schnittstellen, autonomen Agenten, „Interface Agents“, „Embodied Conversational Agents“, virtuellen Assistenten oder gar „Virtual Friends“. Einige der Begriffe sind aufgrund ihrer Herkunft allerdings irreführend im Zusammenhang mit dem hier zu fokussierenden Gegenstand. Dies gilt etwa für den Begriff „Avatar“, der ursprünglich aus der indischen Mythologie stammt und dort die körperliche Repräsentation eines Gottes auf Erden bezeichnet. Laut Bath (2001) verwendeten Programmierer den Begriff Anfang der 1980er Jahre erstmals für virtuelle Stellvertreter von Personen in militärisch inspirierten Simulationsspielen. Der Begriff wurde im Weiteren für jegliche Repräsentation eines Menschen auf dem Bildschirm verwendet – z. B. für die Darstellung eines von einem anderen Ort auf die gleiche Applikation zugreifenden Gesprächs- oder Spielpartners im Chat oder MUD. Obwohl dieser Terminus somit nur auf Umwegen als für die Mensch-Computer-Interaktion treffend bezeichnet werden kann – versteht man nämlich die anthropomorphe Abbildung als „Verkörperung“ und Repräsentation des Rechners –, erfreut er sich auch in diesem Zusammenhang inzwischen größter Beliebtheit. Insbesondere die im WWW auftretenden virtuellen Figuren werden mittlerweile vorzugsweise als „Avatare“ bezeichnet (z. B. Kyoto Date oder E-Cyas), auch wenn von einer direkten menschlichen Steuerung keine Rede sein kann. Die auf diesem Wege entstandene Begriffsverschmelzung schreitet weiter fort, wird aber immer wieder durch explizite Abgrenzung bekämpft (s. Bailenson, Beall, Blascovich, Raimundo & Weisbuch, 2001; Bailenson & Blascovich, 2004). In der Tat lassen sich aber auch Mischformen von Avataren und Agenten beobachten, die dann meist als Avatar bezeichnet werden: „An avatar can be and often is a hybrid of an embodied agent and an avatar: the human controls the symbolically meaningful verbal and nonverbal gestures and an agent controls the more mundane automatic behaviors“ (Bailenson & Blascovich, 2004, S. 68).

Der Begriff „Agent“ bedeutet zunächst einmal, dass es sich um eine (selbstständig) handelnde Entität mit verschiedenen Eigenschaften handelt. Eine allgemeine Definition geben Balakrishnan und Honavar (2001): „In very simplistic terms, an agent may be defined as an entity that perceives its environment through sensors and acts upon it through effectors ... However, for the agent to be useful, they must also be capable of interpreting perceptions, reasoning, and choosing actions autonomously and in ways suited to achieving their intended goals. Since the agents are often expected to operate reliably in unknown, partially known, and dynamic environments, they must also posess mechanisms to learn and adapt their behaviors through their interactions with their environments. In addition, in some cases, we may also reqiure the agents to be mobile and move or access different places or parts of their operating environments. Finally, we may expect the agents to be persistent, rational, etc., and to work in groups, which requires them to collaborate and communicate ...“ (S. 1). Solche Agenten sind also notwendigerweise mit Anteilen künstlicher Intelligenz versehen, die eine direkte Steuerung durch menschliche Agenten überflüssig machen. Unterformen sind etwa robots, die mit physikalischen Sensoren ausgestattet sind, und softbots, die über virtuelle Sensoren verfügen und als kleine intelligente Programme etwa den E-Mail-Verkehr erleichtern oder Chat-Rooms kontrollieren. Die hier fokussierten Interface-Agenten sind somit im Prinzip Softbots, die zusätzlich durch ein menschenähnliches Äußeres repräsentiert werden. Einschränkend muss allerdings bemerkt werden, dass noch nicht alle Figuren, die heute im Bereich der Embodied Conversational Agents entwickelt und evaluiert werden, den Namen Agent oder Softbot im oben definierten Sinne wirklich verdienen. Auch Erickson (1997) weist auf potentielle Verwechslungen hin und unterscheidet zwei Formen von Agenten. Er will autonome oder semi-autonome Computerprogramme, die Intelligenz, Adaptivität oder Responsivität enthalten, als „adaptive functionality“ bezeichnet wissen. Den Aspekt dessen, was dem Nutzer präsentiert wird (Stimme, Gesicht), bezeichnet Erickson (1997) dagegen als „agent metaphor“ und warnt davor, beide Aspekte als zwangsläufig verbunden zu sehen: „It is important to recognize that the metaphor and functionality can be decoupled. The adaptive functionality that allows the ‚agent to perform its task need not be portrayed as a talking head or animated character“ (S. 2). Andererseits müssen die virtuellen Figuren nicht in jedem Fall mit dahinter liegender Funktionalität verbunden sein: Im besten Fall werden Interface-Agenten vor allem auf den Dialog mit dem Benutzer hin optimiert, während die Möglichkeit zum Lernen, zur Adaption sowie die intelligente Assistenz eher im Hintergrund stehen. Um auf diesen spezifischen Aspekt zu verweisen und Missverständnisse zu vermeiden, empfiehlt sich somit die Bezeichnung „Embodied Conversational Agents“, der momentan im englischen Sprachraum wahrscheinlich gebräuchlichste Terminus. Cassell, Sullivan, Prevost und Churchill (2000a) formulieren den Begriff folgendermaßen: „Embodied conversational agents are computer-generated cartoon-like characters that demonstrate many of the same properties as humans in face-to-face conversation, including the ability to produce and respond to verbal and nonverbal communication. ... With an embodied conversational agent, the visual dimension of interacting with an animated character on a screen plays an intrinsic role. Not just pretty pictures, the graphics display visual features of conversation in the same way that the face and hands do in face-to-face conversation among humans“ (Klappentext). Konversationelle Agenten verfügen also per definitionem über verbale und nonverbale Interaktionskompetenzen und ausgeprägte Dialogfähigkeiten. Die hier gewählte Bezeichnung lässt allerdings die Frage offen, ob es sich bei der Verkörperung des technischen Systems um eine beliebige visuelle Repräsentation (etwa auch eine Comicfigur, ein Tier oder auch eine Pflanze) handelt oder um eine möglichst realistisch dargestellte menschliche Figur. Für letztgenannten Spezialfall wird in der Literatur zumeist der Begriff „anthropomorpher Interface-Agent“ verwendet. Je nach Anwendungsbereich werden die Begriffe ferner weiter differenziert: Besonderer Beliebtheit erfreut sich so auch etwa der Begriff „pedagogical agents“.

Für die weiteren Ausführungen werden vor diesem Hintergrund ausschließlich Begriffe genutzt, die dadurch gekennzeichnet sein sollen, dass sie ein möglichst geringes Potential an Missverständnissen bergen, wie dies etwa auf anthropomorphe Interfaces, Embodied Conversational Agents, virtuelle Helfer, anthropomorphe Interface-Agenten oder den Spezialfall der pädagogischen Agenten zutrifft.

Festzuhalten bleibt, dass das wichtigste Bestimmungsmerkmal für die hier zu behandelnden Agenten eine verkörperte Interaktion mit dem Benutzer darstellt. Insbesondere die Verkörperung respektive das Embodiment nimmt dabei eine zentrale Rolle ein. Allerdings finden sich auch wiederum recht unterschiedliche Definitionen des Begriffs Embodiment. Während Pelachaud, Carofiglio, De Carolis, de Rosis und Poggi (2002) Verkörperung pragmatisch als die Gegebenheit von menschenähnlichen „physischen“ Elementen sehen, die nonverbale Kommunikation ermöglichen, präsentieren Dautenhahn, Ogden und Quick (2002) eine wesentlich sophistiziertere Analyse. Ihre Minimaldefinition von Embodiment, die vom Tier bis hin zu Artefakten gültig sein soll, geht über bisherige Definitionen hinaus, die einfach alles berücksichtigen, was über einen Körper verfügt (Pfeifer & Scheier, 1999). Ihrer Meinung nach handelt es sich bei Verkörperung um einen quantifizierbaren Aspekt, der sich auf die spezifische Beziehung, die zwischen einem verkörperten System und der Umgebung besteht, bezieht. Dieser Aspekt, der auch als „social embeddedness“ bezeichnet wird, geht letztlich zurück auf Maturana und Varela (1980), die von strukturell gekoppelten Systemen sprechen. Embodiment sei somit: „That which establishes a basis for structural coupling by creating the potential for mutual pertubatation between system and environment. Embodiment is in that sense not solely a feature of a system in an environment, but it is grounded in the relationship between the two“ (S. 400). Als Konsequenz lässt sich somit feststellen, dass beispielsweise ein Roboter umso eher als verkörpert gelten kann, je mehr er in der Lage ist, selbst die Umwelt zu beeinflussen (respektive zu „verstören“) oder von ihr beeinflusst zu werden: „All robots are embodied but some are more embodied than others“ (S. 405). Die stärker verkörperten Systeme hätten vor diesem Hintergrund – und im Sinne der modernen Form der Künstlichen-Intelligenz-Forschung – auch mehr Möglichkeiten, kognitive Fähigkeiten auszubilden. Die Definition sei gleichzeitig aber auch befreit von materiellen Gegebenheiten – auch eine Software könne in diesem Sinne verkörpert oder gar „socially embedded“ sein. Barsalou, Niedenthal, Barbey und Ruppert (2003) legen eine von diesen Ansichten divergierende Definition von Embodiment vor, die wiederum die Wichtigkeit der physischen Repräsentation betont. In einem inspirierenden Artikel mit dem Titel „Social embodiment“ beleuchten sie aus sozialpsychologischer Sicht, inwiefern soziale Aspekte und Körperlichkeit eng miteinander verbunden sind. Sie unterscheiden vier Typen von Verkörperungs-Effekten:

Soziale Stimuli beeinflussen nicht nur kognitive, sondern auch körperliche Zustände (vgl. die bekannten Experimente zum Priming mit Altersstereotypen durch Bargh, Chen & Burrows, 1996).

Die Wahrnehmung körperlicher Zustände bei anderen ruft Mimikry hervor (vgl. Bernieri & Rosenthal, 1991; Bavelas, Black, Lemery & Mullett, 1986; Diskussion zu Spiegelneuronen nach Rizolatti, Fadiga, Fogassi & Gallese, 2002).

Körperliche Zustände rufen affektive Zustände hervor (Cacioppo, Priester & Bernston, 1993; vgl.

facial feedback

Theorie, Strack, Martin & Stepper, 1988).

Die Passung von körperlichen und kognitiven Zuständen moduliert die Performanz (vgl. Chen & Bargh, 1999).

Vor dem Hintergrund dieser Zusammenhänge entwickeln die Autoren eine „Theory of social embodiment“ und argumentieren, dass Körperlichkeit äußerst zentral für sämtliche menschlichen Funktionen ist: „The body is involved extensively in human activity. For this reason alone, it should not be surprising that bodily states have a central presence in human knowledge. ... Given the fundamental importance of action for effective intelligence, it should not be surprising that embodiment is central to cognition in both social and nonsocial domains“ (S. 84). So unterschiedlich die verschiedenen Definitionen somit sind, lassen sie dennoch alle nur den Schluss zu, dass Verkörperung tatsächlich ein wichtiger Aspekt ist, um Agenten zu hilfreichen autonomen Entitäten zu machen.

Alleine mit einem Körper beziehungsweise der Kopplung mit der Umgebung ist man allerdings noch nicht am Ziel. Abschießend soll daher nochmals auf die Definitionskriterien für Embodied Agents verwiesen werden: Cassell, Bickmore, Campbell, Vilhjálmsson und Yan (2000b) formulieren ein sehr anspruchsvolles Anforderungsprofil für Embodied Conversational Agents. Zu den wichtigsten Leistungsmerkmalen gehören neben der Fähigkeit, Sprache und Gestik des Nutzers zu verstehen, die Generierung eigener verbaler und nonverbaler Reaktionen, die Dialogsteuerung, die Erkennung und Bewertung der Diskursentwicklung und gegebenenfalls die kreative Einführung neuer Gesprächsinhalte. Wie im Weiteren zu sehen sein wird, erreichen aber nur wenige der aktuellen Systeme bereits diese Anforderungen (vgl. Kap. 2.2.3).

2.2 Entwicklungslinien

Im Folgenden werden zwei sehr unterschiedliche Entwicklungslinien beschrieben, die zum heutigen Entwicklungsstand bei virtuellen humanoiden Charakteren beitragen. Zunächst wird die Entwicklung der Mensch-Computer-Interaktion vorgestellt, die durch ihr aktuelles Ziel der intuitiven und natürlichen Benutzbarkeit mittlerweile fast zwangsläufig bei der Implementierung von menschenähnlichen Kommunikationsformen angelangt ist. Auf der anderen Seite wird gezeigt, dass die Erstellung künstlicher Personen die Menschheit schon seit jeher fasziniert hat. Entsprechende Beispiele aus Historie und Fiktion werden geschildert, um im Anschluss zu diskutieren, ob möglicherweise neben dem Wunsch nach intuitiver Bedienbarkeit noch weitere Motive dazu führen, dass technischen Helfern nicht nur mit menschlichem Aussehen, sondern auch mit menschlichen Eigenschaften und Emotionen versehen werden. Zum Abschluss des Kapitels wird der aktuelle Forschungsstand präsentiert: Es wird diskutiert, inwieweit die Bemühungen verschiedener Forschergruppen auf ihrem Weg zum humanoiden Berater bereits erfolgreich waren.

2.2.1 Geschichte der Mensch-Computer-Interaktion

Bereits seit Beginn der Verfügbarkeit von Großrechnersystemen existieren Bestrebungen, die Interaktion zwischen menschlichem Benutzer und technischem System zu verbessern. Die Notwendigkeit dazu resultiert aus der Tatsache, dass die Maschinensprache, die Computer verarbeiten können, nicht eben zu den geläufigen Kommunikationssystemen des Menschen gehört. Im Folgenden sollen die über die Jahre stark veränderten Interaktionsformen chronologisch aufgeführt werden. Diese können jeweils mit einer Leitmetapher beschrieben werden (vgl. Tab. 2.1; s. Krämer, 2004; vgl. zur Geschichte der Interface-Metaphern auch Preece, 1994). Das Verständigungsproblem wurde zu Beginn zunächst einmal gar nicht gelöst: Die menschlichen Nutzer lernten die Maschinensprache. Sie waren gezwungen, Zahlenreihen einzugeben, die lediglich auf elementarer Ebene zu symbolischen Befehlen zusammengefasst wurden. Zu Beginn der 1970er Jahre wurde dann eine dialogorientierte Kommandosprache eingeführt, die erstmals eine tatsächliche Interaktion ermöglichte, vor allem da der Rechner nach relativ kurzer Zeit Hilfs-, Warn- oder Fehlermeldungen ausgab (vgl. Turk, 2001). Bereits Ende der 1970er Jahre starteten zusätzlich Versuche, statt der oft undurchsichtigen und schwer erlernbaren Kommandosprache die natürliche Sprache einzusetzen, um dem Nutzer die Möglichkeit der Kommunikation auf Grundlage eines ihm vertrauten Vokabulars zu bieten. In dieser Zeit mehrten sich Forderungen nach Orientierung hin zum menschlichen Benutzer; tatsächlich aber wurde bis in die 1980er Jahre hinein wenig erreicht, das diesem Ziel gerecht würde. Draper und Norman (1986) führen dies auf die Tatsache zurück, dass sich der menschliche Benutzer als beliebig anpassbar erwiesen hatte: Aufgrund der hohen Fähigkeit des Menschen, sich an die kommunikativen Erfordernisse anzupassen, umständliche Bedienungsroutinen und fremde Sprachen zu erlernen, erwies sich eine Optimierung der technischen Seite als nicht zwingend notwendig: „People are so adaptable that they are capable of shouldering the entire burden of accomodation to an artifact“ (S. 1). Der Bedarf an einfach handhabbaren Interfaces stieg erst im Zuge der Verfügbarkeit von sogenannten Personal Computern und deren rascher Verbreitung nicht nur an den Arbeitsstellen, sondern auch in Privathaushalten.

Tab. 2.1: Übersicht über die Entwicklung der Interface-Metapher

Interface

Einsatzbereich, Aufgabenspektrum

Nutzergruppe

Wissenschaftliche Disziplin zur Gestaltung

Maschinensprache

Bedienung vereinzelter Großrechner

Spezialisten

Informatik

Kommandosprache

Bedienung arbeitserleichternder Maschinen am Arbeitsplatz

Informatiker, spezifisch ausgebildete Nutzerinnen/Nutzer

Informatik

Graphische Benutzeroberfläche

Einsatz von PCs an fast allen Arbeitsplätzen, zunehmend in Privathaushalten

Alle Berufsgruppen, erforderliches Know-how ist Teil der Ausbildung; nicht vorgebildete Privatnutzer erarbeiten sich die Bedienung

Informatik/Ingenieur- wissenschaften, Ingeni- eurpsychologie, Design

Dialog-Metapher (natürlichsprachliche Interaktion)

Im Entwicklungsstadium

Ziel: voraussetzungsfreie Nutzung für alle

Informatik/Ingenieur- wissenschaften,Computerlinguistik,Ingenieurpsychologie

Anthropomorphe Schnittstellen

Im Entwicklungsstadium

Ziel: voraussetzungsfreie Nutzung für alle

Informatik/Ingenieur- wissenschaften, Com- puterlinguistik, Design,Medienpsychologie

Virtuelle Realität, Augmented Reality

Im Entwicklungsstadium

Ziel: voraussetzungsfreie Nutzung für alle

Informatik/Ingenieur- wissenschaften,Medienpsychologie

Wichtigste Voraussetzung jeglicher Interaktion zwischen Mensch und Computer sind zunächst einmal Schnittstellenmerkmale, die den Austausch von Information überhaupt erst ermöglichen. Differenziert werden hier Aspekte des Outputs, das heißt der Gestaltung der Benutzeroberfläche und Aspekte des Inputs – im Sinne der Möglichkeiten, die dem Benutzer zur Eingabe von Befehlen etc. zur Verfügung stehen. Ausgabegeräte (output devices, wie die visuelle Ausgabe auf dem Bildschirm, Sound, Sprachausgabe) sind folglich Vorrichtungen, die Informationen von einer elektronischen, internalen Repräsentation des Computersystems in eine für den Menschen wahrnehmbare und verarbeitbare Information umwandeln. Ein Eingabegerät (input device, wie z. B. Tastatur, Maus, Trackball, berührungssensitiver Bildschirm, Sensoren zur automatischen Bewegungserfassung, Datenhandschuhe) ist dagegen ein Element, das zusammen mit geeigneter Software die vom Nutzer gesendete Information in Daten umwandelt, die der Computer weiterverarbeiten kann (Preece, 1994). Ein erster Versuch, intuitiv zu bedienende Schnittstellen zu gestalten, stellen die heute noch gebräuchlichen graphischen Benutzeroberflächen (graphical user interface, GUI) dar. Diese beruhen auf den 1984 von Apple aufgestellten WIMP-Prinzipien (Windows, Icons, Menu, Pointer) und ermöglichen auf der Basis graphischer Repräsentationen (ein Dokument wird beispielsweise als beschriebenes Blatt symbolisiert, das auf einem virtuellen Schreibtisch bzw. desktop liegt) die direkte Manipulation der Objekte – beispielsweise durch Zeigen, Anklicken, Bewegen (drag and drop) (vgl. Faulkner, 1998; Mayhew, 1992; Shneiderman, 1998). An dieser Stelle ist zum ersten Mal die Bezeichnung Interface-Metapher angebracht: Das Grundprinzip der Metaphern im Interface-Design gleicht dem aus Sprache und Denken. Es existiert eine wie auch immer geartete Ähnlichkeit zwischen einer aus dem Alltag bekannten Vorgehensweise oder einem Gegenstand einerseits und der Benutzeroberfläche beziehungsweise einzelnen Interface-Funktionen andererseits. Ein Papierkorb etwa nimmt Dinge auf, die nicht mehr gebraucht werden: Er ist daher als Icon auf dem Desktop eine einleuchtende Anzeige dafür, dass Dinge, die hier hinterlegt werden, der elektronischen Vernichtung anheimfallen. Die Lernvorgänge werden aufgrund der Analogie als intuitiv angenommen. Hinzu kommt, dass eine einmal verstandene Funktion angeblich nie mehr vergessen wird. Dies alleine wird bereits als benutzerfreundlich bewertet. Weitere zentrale Vorteile, die das WIMP-Modell mit sich bringt, bestehen in der einfachen Umkehrbarkeit der Aktionen sowie der Möglichkeit zur direkten Überprüfung des Ergebnisses. Mittlerweile wurden allerdings auch einige zentrale Nachteile festgestellt: So lässt sich das ursprüngliche Anliegen, dem Benutzer ständig alle Systemdaten und Funktionen visuell zugänglich zu machen, aufgrund der gestiegenen Anzahl an Funktionalitäten nicht mehr realisieren beziehungsweise führt zu großer Unübersichtlichkeit. Das Prinzip, alle Aktionen in Teilschritte zu unterteilen, führt ferner bei ungeübten Benutzern zur kognitiven Überlastung, während sich erfahrene Nutzer in ihrer Arbeitseffizienz beeinträchtigt fühlen, da das System keine flexible Handhabung erlaubt. Die Prämisse der aktiven Benutzersteuerung bringt zwar den Vorteil der maximalen Kontrolle für den Benutzer mit sich (vgl. Shneiderman, 1998), beinhaltet aber den Nachteil, dass eine Steuerung durch den Nutzer auch zwingend erforderlich ist, was einen erheblichen kognitiven und zeitlichen Aufwand erfordert. Im Zuge dieser Erkenntnisse entwickelten sich Bestrebungen, die bislang vorherrschende Rahmen-Metapher des Computers als Werkzeug abzulösen durch ein Paradigma, innerhalb dessen der Computer als Assistenz dient (vgl. Ball et al., 1997; Maes, 1994). Ein Assistenzsystem lässt sich als informationsverarbeitendes Subsystem in einem Mensch-Maschine-System bezeichnen, das den Benutzer unterstützt, indem es für die Zielerreichung notwendige Teilaufgaben innerhalb einer Gesamtaufgabe übernimmt (Timpe, 1998). Ähnlich wie ein persönlicher Sekretär sollen Assistenzsysteme informieren, zusätzliche Handlungsvorschläge unterbreiten oder auch selbstständig erforderliche Handlungen ausführen. Obgleich Assistenzsysteme in absehbarer Zeit die bislang vorherrschende Werkzeugmetapher im Bereich der Mensch-Computer-Interaktion (MCI) nicht gänzlich ablösen werden (Maes, 1994), so ist doch zu erwarten, dass diese zumindest als Ergänzung bestehender Systeme immer mehr an Bedeutung gewinnen. Entsprechende softwaretechnische Umsetzungen wurden auf Basis der beschriebenen Agententechnologie bereits entwickelt und eingesetzt. Der Einsatz dieser intelligenten Assistenz erfordert aber wiederum andere Schnittstellen, die im besten Fall tatsächlich intuitiv, das heißt ohne spezifische Vorkenntnisse nutzbar sein sollten – vor allem, da im Laufe der nächsten Jahre keine Bevölkerungsgruppe mehr eine Konfrontation mit dieser Technologie wird vermeiden können und es darauf ankommen wird, möglichst ohne Missverständnisse Aufgaben zu delegieren. Die Entwicklung solcher Schnittstellen wird ebenfalls bereits stark vorangetrieben. Zum einen werden bereits in den 1970er Jahren begonnene Entwicklungsbemühungen im Bereich der natürlichsprachigen Interaktion (natural language) wieder aufgenommen: Sprachdialogsysteme werden entwickelt und implementiert, die die Sprache des Benutzers analysieren und verstehen, eine entsprechende natürlichsprachige Antwort generieren und diese per Sprachsynthese ausgeben (vgl. Baecker, Grudin, Buxton & Greenberg, 1995). Vor dem Hintergrund der Annahme zur Wichtigkeit auch nonverbaler Kommunikationsanteile in diesem Prozess wird darüber hinaus gefordert, sowohl eingabe- (Nutzer) als auch ausgabeseitig (Computer) nonverbale Verhaltensweisen wie Mimik, Gestik, Bewegungsverhalten zu berücksichtigen (vgl. Thórisson, 1996; Cassell, Bickmore, Campbell, Vilhjálmsson & Yan, 2000) – was vor allem durch Embodied Conversational Agents erreicht werden soll. Die vermenschlichte Darstellung liegt unter anderem natürlich auch deshalb nahe, da bereits die Assistenzmetapher eine Anthropomorphisierung darstellt. DeLaere, Lundgren und Howe (1998) fassen den potentiellen Nutzen menschenähnlicher Interfaces zusammen: „Theoreticians in both human factors and cognitive science have begun to call for more user-centred and humanizing Implementierungs of technology that complement human abilities instead of competing with them. One implication is that interface designs which incorporate elements that evoke or simulate human social interaction should result in more natural and infomative usersystem communications. This idea is known as the ‚dialog partner metaphor in promoting user-centredness for computer interface design“ (S. 44). Insbesondere durch die mögliche Nutzung der natürlichen Kommunikationskanäle Sprache, Gestik und Mimik und der somit strukturellen Ähnlichkeit mit der Face-to-Face-Kommunikation wird dieser Interaktionsform eine intuitivere Nutzbarkeit und somit leichtere Handhabung, größere Effizienz und Akzeptanz zugesprochen (vgl. Brennan, 1990; Bolt, 1987; Thórisson, 1996). Takeuchi und Naito (1995, S. 454) formulieren in diesem Sinne ihre Erwartungen an die neuen Technologien: „We surmise that once people are accustomed to synthesized faces, performance becomes more efficient, and a long partnership further improves performance. Human-like characterization is one good form of autonomous agents, because people are accustomed to interact with other humans“. Zusätzlich weist Erickson (1997) darauf hin, dass die Metapher den Vorteil habe, dass sie eine spezifische Eigenschaft der autonomen Charaktere repräsentiere, die insbesondere Desktop-Ikons nicht symbolisieren: „Agents can go places“.

Ein weiterer aktueller Entwicklungsstrang im Bereich der Interfacegestaltung ist die Nutzung von virtuellen Realitäten oder sogenannten erweiterten Realitäten (augmented reality), die in Zukunft die Interaktion nicht nur auf Basis des herkömmlichen Bildschirms, sondern in komplexen immersiven künstlichen oder erweiterten Welten ermöglichen werden (vgl. etwa Lok & Hodges, 2004). Ebenfalls bereits entwickelt werden Schnittstellen, die für den Benutzer gar nicht mehr als solche erkennbar sind oder in Alltagsgegenstände wie beispielsweise Kleidung integriert werden. Diese unter der Bezeichnung ubiquitous computing oder wearable computing bekannt gewordenen Interface-Konzepte werden mit hoher Wahrscheinlichkeit die Schnittstellen der Zukunft prägen (vgl. Preece, 1994).

Auch hinsichtlich der psychologischen Beteiligung lässt sich ein geschichtlicher Verlauf nachzeichnen: Die beständig weiter wachsenden Funktionalitäten der Rechnersysteme führten (und führen!) zu einem gestiegenen Anspruch an die menschengerechte Gestaltung (vgl. Zühlke, 2002). Die sogenannte user centredness ist heute wichtiger denn je – vor allem vor dem Hintergrund der immer größer werdenden und somit immer weniger vorgebildeten Nutzergruppe. Ordnet man den aufgeführten Entwicklungsstufen eine Beteiligung der unterschiedlichen Disziplinen am Gestaltungsprozess zu (vgl. Tab. 2.1), so wird deutlich, dass im Rahmen der ersten Interaktionsformen wie Maschinensprache und Kommandosprache (command language) praktisch keine psychologischen Erkenntnisse berücksichtigt wurden. Dennoch fällt der Beginn des experimentalpsychologischen Interesses an der Mensch-Computer-Interaktion in diese Zeit: 1973 soll der erste Artikel einer psychologischen Evaluation (von zwei Computersprachen) im International Journal of Man-Maschine Studies erschienen sein (vgl. Gaines, 1985; Nyce & Löwgren, 1995). Die bald darauf entstandenen graphischen Benutzeroberflächen wurden im Rahmen der Ingenieurpsychologie untersucht – unter Berücksichtigung vor allem klassischer ergonomischer Fragen. Neben dieser bereits sehr anwendungsorientierten psychologischen Disziplin beteiligten sich hier auch Arbeitspsychologen, die Funktionen und Gestaltung vor allem vor dem Hintergrund des damaligen Hauptanwendungsfeldes analysierten, sowie die stärker an den Grundlagen interessierten Kognitionspsychologen (vgl. Mangold, 1997). Im Zuge der neueren Entwicklungen (anthropomorphe Schnittstellen und virtuelle Realitäten) wird nun auch die Medien- und Sozialpsychologie ein wichtiger Forschungspartner – zum einen da sich die Nutzergruppe so vergrößert hat, dass man von einem neuen universal genutzten Medium sprechen kann, das beispielsweise durchaus auch sozialpsychologische Implikationen hat. Zum anderen verschwimmen die Grenzen zwischen neuen und klassischen Medien immer mehr: Für die Zukunft ist eine Integration von klassischen und neuen Medien zu erwarten, Fernsehen, Internet, Computer etc. werden auf Dauer nicht länger in getrennten Geräten aufzufinden sein und bereits heute dienen Multimediacomputer zur Unterhaltung, zur Information, zur Kommunikation und als Arbeitswerkzeug. Die aktuelle medien- und sozialpsychologische Forschung in diesem Bereich fokussiert dabei weniger auf die Gestaltung von Mensch-Computer- oder Mensch-Maschine-Schnittstellen am Arbeitsplatz; dies stellt nach wie vor einen klassischen Arbeitsbereich der Ingenieurpsychologie und Ergonomie dar. Die Medien- und Sozialpsychologie interessierte sich erstmals im Laufe der 1990er Jahre für Fragen aus dem Bereich der Schnittstellengestaltung – zunächst vor allem im Zusammenhang mit dem neuen Medium Internet (Untersuchungen zum Umgang mit Hypertexten; vgl. z. B. Tergan, 2002; sowie zur sozio-emotionalen Dimension des Internet, vgl. Döring, 1999). Seit dem Jahr 2000 wird den anthropomorphen Schnittstellen (vgl. Bente & Krämer, 2000) und virtuellen Realitäten ebenfalls verstärkt Interesse entgegengebracht (vgl. Bente, Krämer & Petersen, 2002).

2.2.2 Die Schaffung des künstlichen Menschen – historische und aktuelle Versuche

„Olimpia saß, wie gewöhnlich, vor dem kleinen Tisch, die Ärme darauf gelegt, die Hände gefaltet. Nun erschaute Nathanael erst Olimpias wunderschön geformtes Gesicht. Nur die Augen schienen ihm gar seltsam starr und tot. Doch wie er immer schärfer und schärfer durch das Glas hinschaute, war es, als gingen in Olimpias Augen feuchte Mondesstrahlen auf. Es schien, als wenn nun erst die Sehkraft entzündet würde; immer lebendiger und lebendiger flammten die Blicke. Nathanael lag wie festgezaubert im Fenster, immer fort und fort die himmlisch-schöne Olimpia betrachtend.“Aus E.T.A. Hoffmann, Der Sandmann

Gibt man im Google die Worte „künstliche Menschen“ ein, erscheinen 15.800 Quellen, bei „artificial humans“ sogar 21.100 [gültig für September 2007]. Dies mag für die heutige Popularität des Konzeptes der menschenähnlichen Nachbildungen sprechen. Auch die Aufbereitung des Themas in der Literatur hat eine lange Tradition: Dotzler, Gendolla und Schäfer (1992) tragen 1 778 Referenzen auf Erzählungen, Romane, Briefe und Berichte zu „MaschinenMenschen“ zusammen, die in der Zeit von 1420 bis 1991 entstanden sind. Laut den Autoren hat „nach Gott … wohl kein Fabelwesen der Literatur und Künste eine längere Karriere, differenziertere Varianten, vergleichbare Kontroversen hinter sich wie der künstliche Mensch“ (S. 9). Dass die Idee, einen künstlichen Menschen zu schaffen, die Menschheit aber bereits seit Jahrhunderten beschäftigt, lässt sich zuallererst an entsprechenden Mythen und Geschichten nachvollziehen. Von griechischen Sagen bis hin zu aktuellen Kinofilmen zieht sich das Sujet der Nachbildung des Menschen durch die fiktionalen Erzählformate. Während dabei in den ersten Jahrhunderten die Technizität der Formung des Körpers im Vordergrund stand, geht es heutzutage vor allem um die Frage, ob und wie menschenähnlichen Maschinen eine „Seele“ gegeben werden kann bzw. ob diese eine solche entwickeln könnten.

Die älteste Darstellung der künstlichen Erschaffung von Menschen findet sich bei Hesiod – die sich ironischerweise auf die (unerlaubte) Schaffung des Menschen selbst durch einen Halbgott bezieht: Laut Hesiods Darstellung der Prometheus-Sage schuf dieser das Menschengeschlecht. Er formte Menschen aus Ton, denen dann Athene Leben einhauchte. Ebenfalls in der klassischen Mythologie beschreibt Aeschylos, dass Daedalos Puppen mit beweglichen Gliedmaßen erstellte. Auch bei Ovid findet sich das Thema der künstlichen Erstellung durch Menschenhand: In Metamorphosen schildert er die Geschichte von Pygmalion, der sich aufgrund der Tatsache, dass er reale Frauen ablehnt, eine weibliche Statue schafft, in die er sich verliebt und die durch Venus zum Leben erweckt wird. Die erste von Dotzler et al. (1992) erwähnte Publikation stammt aus dem Jahre 1420 (Johannes Fontana: Automatenfiguren). Im Zeitalter der Romantik schreibt E.T.A. Hoffmann mit „Der Sandmann“ eine Erzählung, die auf seinen eigenen Beobachtungen von in dieser Zeit präsentierten „Automaten“ (s. u.) beruhen (vgl. auch die 1814 – ein Jahr vor dem „Sandmann“ – verfasste Erzählung „Der Automat“, die offensichtlich durch die Schachmaschine von Kempelen inspiriert ist, die nachfolgend hier noch beschrieben wird). Der verträumte Nathanael verliebt sich in Olimpia, eine weibliche Maschine, und verfällt dem Wahnsinn, als er seinen Irrtum entdeckt. Drux (1994, S. 89, vgl. Mracek, 2001) zeigt in einer Analyse des „Sandmann“, dass das Motiv der belebten Holzpuppe sich „um 1800 in allen künstlerischen Disziplinen [findet] und verweist auf umfassende kulturgeschichtliche Problembereiche, etwa auf den Widerspruch zwischen rationalistischer Zergliederung und romantischer Durchdringung der Natur“. Im Jahre 1818 schließlich verfasst Mary Shelley mit „Frankenstein“ (im Untertitel „Der moderne Prometheus“), einen Roman, der bis heute als der Prototyp moderner Geschichten zur Erschaffung von künstlichen Menschen gelten kann – insbesondere solcher aus Fleisch und Blut. Aus Knochen und Innereien von Verstorbenen erschafft Dr. Frankenstein ein Wesen, das durch einen Stromschlag zum Leben erweckt wird. Menschliche Maschinen wiederum werden 1920 in R.U.R. (Rossum Universal Robots) von Karel Capek thematisiert, der in diesem Stück das Wort Roboter (von tschechisch robota für „Fronarbeit“) prägte und ihm zum Siegeszug verhalf (vgl. etwa die Geschichten von Isaac Asimov).

In modernen Filmen schließlich wird primär die Thematik behandelt, dass den fast perfekten Nachbildungen nur noch eines fehlt: Die menschliche Seele. So sind die Maschinen auf der Suche nach Emotionen, nach Liebe oder versuchen, sich in einer von Emotionen und komplexem Sozialverhalten geprägten menschlichen Welt zurechtzufinden – wie etwa die Replikanten in „Blade Runner“ (der Titel der Romanvorlage von Philip K. Dick von 1968 lautet bezeichnenderweise „Do androids dream of electric sheep?“), die umprogrammierte Zerstörungsmaschine in „Terminator“, Lt. Commander Data in „Star Trek“, David in „A. I.“ und Sonny in „I, Robot“. „I, Robot“ und „Stepford wives“ thematisieren schließlich auch auf unterschiedliche Art die ebenfalls mit dem Thema verknüpfte Angst des Menschen, dass Maschinen eines Tages unseren Platz einnehmen werden oder die Menschheit unterwerfen.

Auch tatsächliche Versuche, Automaten zu schaffen, lassen sich weit zurückverfolgen: Manhart (1991) berichtet, dass bereits im hellenistischen Ägypten Maschinen konstruiert wurden, die sowohl in ihrer Erscheinung als auch in ihren Bewegungen Menschen glichen. Basierend auf geschickten Mechanismen konnten die Statuen sprechen, gestikulieren und prophezeien, indem sie – um Rat gefragt – mit einem Kopfnicken oder Armbewegungen antworteten. Die ersten nicht-fiktionalen Berichte über die Erstellung künstlicher Menschen in der Neuzeit nehmen sich allerdings noch relativ phantastisch aus und sind historisch unbestätigt: So soll Albertus Magnus (um 1200–1280) 30 Jahre damit verbracht haben, einen Androiden (vgl. Brockhaus-Definition: ein zu bestimmten Tätigkeiten fähiger Automat in Menschengestalt) zu schaffen und ihn sprechen zu lassen (Wood, 2002). In weiteren Quellen wird dieser beschrieben als ein Automat – ähnlich einem Klosterbruder gestaltet –, der unliebsame Besucher abhalten sollte (vgl. Felderer, 1996; Mracek, 2001). In der Renaissance sollen insbesondere Alchemisten an der Erschaffung künstlicher Menschen Interesse gezeigt haben. So berichtet Wood (2002, S. XV), dass Cornelius Agrippa und andere glaubten, „that humans could be grown from mandrake roots“. Auch Paracelsus (1493–1541) publizierte Anweisungen, wie ein solcher Homunkulus (der diejenige Unterform der Androiden bezeichnet, die nicht mechanisch ist, sondern aus organischer Substanz besteht) geschaffen werden kann (vgl. Wood, 2002; Manhart, 1991). Im Jahr 1580 schließlich soll der Oberrabbiner der Stadt Prag, Rabbi Loew, eine menschliche Figur aus Lehm geschaffen haben, die er Joseph Golem nannte und zum Schutz der jüdischen Gemeinde einsetzte (Manhart, 1991). Auch René Descartes (1596–1650) soll einen Androiden namens Francine besessen haben, den er möglicherweise selbst erfunden hat (Mracek, 2001).

Im 18. Jahrhundert erreichten die Bestrebungen im Zuge der Entwicklung erster technologischer Errungenschaften einen neuen Höhepunkt. Laut Wood (2002, S. XVI) werden im Jahrhundert der Aufklärung die Ambitionen der Necromancer wiederbelebt „in the well-respected name of science“. Eine der heute noch häufig erwähnten Persönlichkeiten war der Franzose Vaucanson, der einen der Statue aus den Tuilerien nachgebildeten Flötenspieler (Bildhauer Antoine Coysevox) entwickelte und ihn am 11. Februar 1738 in Paris erstmals der Öffentlichkeit präsentierte. Die Maschine konnte durch unterschiedliche Lippen- und Mundstellungen, durch eine bewegliche Metallzunge und variierbaren Luftdruck zwölf unterschiedliche Melodien spielen und stellte somit eine für die damalige Zeit beachtliche Leistung dar. Wood (2002) dokumentiert den Detailreichtum: „Vaucanson had arrived at those sounds by mimicking the very means by which a man would make them. There was a mechanism to correpond to every muscle“ (S. 20). Nachfolgend stellte er einen Automaten vor, der sich vor allem durch Fähigkeiten auszeichnete, die für eine Maschine eigentlich irrelevant waren. Eine sich realistisch bewegende Ente konnte fressen, verdauen und die Reste wieder ausscheiden. Der erreichte Detailreichtum mag alleine dadurch verdeutlicht werden, dass beispielsweise jeder Flügel aus vierhundert Teilen bestand. Der Plan, im Anschluss eine anatomische Maschine zu bauen, die den Blutkreislauf nachempfindet und bluten kann, schlug allerdings fehl. Obwohl ein ungeheurer Aufwand betrieben wurde, um – auch mit Unterstützung und im Auftrag des Königs Louis XV. – das in Südamerika neu entdeckte Gummi für die Blutgefäße nach Frankreich zu transportieren, wurde die Maschine nie beendet. Ein ähnliches Ziel hatte Vaucansons Konkurrent Le Cat, der aufgrund seiner Profession als Arzt einen weniger mechanischen und mehr auf die Körperfunktionen ausgerichteten Ansatz verfolgt. Ein Zeitzeuge schrieb an die Akademie der Wissenschaften in Paris: „[LeCat’s] automaton will have breath, circulation, quasi-digestion, secretions, heart, lungs, liver and bladder, and, God forgive us, everything else. But it will become feverish, it will have to be bled and purged, and it will resemble a man too much“ (Cideville, zitiert nach Wood, 2002, S. 49). Des Weiteren konstruierten Pierre Jaquet-Droz und sein Sohn Henri-Louis im Jahre 1774 zwei mechanische Jungen: einen, der schreibt und einen, der malt. Außerdem präsentierten sie 1776 die sogenannte „Musical Lady“, die Cembalo spielt und laut Wood dabei lebensecht wirkt: „Her bosom would heave lightly, as if she were breathing“ (S. XIII).

Weitere Versuche rund um den künstlichen Menschen richteten sich auf Simulationen des Denkens. 1769 entwickelte der Ungar Wolfgang von Kempelen einen automatischen Schachspieler. Diese aus Holz geschnitzte, türkisch aussehende Figur saß an einem Schränkchen mit darauf stehendem Schachbrett und konnte Kopf und Augen sowie die rechte Hand zum Verschieben der Schachfiguren bewegen. Der Automat tourte zunächst mit Kempelen und später mit Maelzel durch Europa und Amerika. Er gewann fast jedes Spiel – auch gegen solch illustre Gegenspieler wie Napoleon oder Katharina die Große. Die Maschine erlangte insbesondere dadurch große Berühmtheit, dass sie – bis auf eine inspiriert ausgedachte Mechanik zur Steuerung der Hand – letztlich eine Fälschung war: Verschiedene erstklassige Schachspieler waren über die Zeit in dem Schränkchen verborgen gewesen und hatten die Züge des Gegners durch an der Unterseite des Schachbretts befestigte Magnete verfolgt und entsprechend reagiert. Zwar versuchte Kempelen immer wieder, ähnlich einem Zauberer, die Illusion perfekt zu machen – etwa durch ein aufwendiges Präsentieren jeder Nische innerhalb des Schränkchens –, andererseits machte er nie einen Hehl daraus, dass die Maschine für ihn selbst nur ein Spielzeug darstellte und es sich um eine Illusion handelte. Doch trotz dieser Aussagen und zahlreichen Hinweisen auf ein nicht-automatisches Funktionieren der Maschine hielt sich der Glaube daran so hartnäckig, dass erst auf seiner letzten Reise nach Amerika endgültige Beweise gegen den sogenannten „Türken“ erbracht werden konnten, die letztlich die Öffentlichkeit überzeugten.

Die Frage, warum die Illusion so lange aufrechterhalten wurde und warum so viele Menschen geneigt waren, die Maschine tatsächlich für autonom und menschenähnlich zu halten, ist auch im Zusammenhang mit der vorliegenden Arbeit diskussionswürdig, da sie Hinweise auf die Faszination der Erschaffung künstlicher Menschen gibt. So war es laut Wood (2002) gar nicht relevant, ob der Automat tatsächlich authentisch war oder nicht, eigentlich handelte es sich um ein philosophisches Spiel – und tatsächlich wurde ja parallel zu den Vorführungen in zahlreichen Publikationen diskutiert, was möglich erschien und was nicht. Bis 1800 erschienen über hundert Texte über Kempelen und den Androiden und nicht wenige gingen auch noch 50 Jahre nach dessen erstem Erscheinen von einem echten Schachautomaten aus (vgl. Standage, 2002; Mracek, 2001). Auch Mathematiker wie Johann Jacob Hindenburg oder Carl Friedrich Ebert hielten den Türken für einen echten Automaten, der durch elektrische oder magnetische Ströme extern gelenkt wurde. Im beginnenden Zeitalter der Vernunft war man geneigt, an das menschliche Vermögen der Realisation solch komplexer Dinge zu glauben. Auch Standage (2002) geht davon aus, dass zu dieser Zeit ein weit verbreiteter Glaube an die Omnipotenz von Wissenschaft und technischer Machbarkeit herrschte – ein Klima, das dazu führte, dass man nahezu alles geglaubt hätte. So fällt beispielsweise die erste – tatsächlich eine Sensation auslösende – öffentliche Vorführung eines Heißluftballons in diese Zeit. Auch Mracek (2001, S. 1) thematisiert das aus der Fortschrittsgläubigkeit entstandene Wunschdenken als Ursache für die weitreichende Faszination der künstlichen Menschen: „Bei gleichzeitiger Demonstration der Grenzen der Menschdarstellung spiegelt sie meines Erachtens alle Wunschvorstellungen um menschliches Vermögen ihrer Zeit wider“. Weiterhin verweist er darauf, dass sich dieses Phänomen auch in der Literatur der Zeit wiederfindet. So ist ein Motiv in „Der Sandmann“ von E.T.A. Hoffmann die Belebung der Maschine durch den Blick des Beobachters (vgl. Drux, 1994). Dies erinnert laut Mracek (2001) an das „kolportierte Rezeptionsverhalten gegenüber dem schachspielenden Türken, der sein langes Dasein offenbar dem Phänomen verdankte, daß er als Maschine – in seinen Fähigkeiten dem Menschen adäquat – wahrgenommen werden wollte. Der Blick des Beobachters schloß die Tatsache aus, keine autarke, sondern eine von einem Menschen dirigierte Maschine vorgeführt zu bekommen“ (2. Überschrift, 15. Absatz).

Die Reaktion auf die Automaten erschöpfte sich allerdings nicht in der Faszination, die in der Diskussion um die Echtheit zum Ausdruck kommt, sondern umfasste auch die Verbreitung von Angst und Schrecken. Je ähnlicher die Maschinen den Menschen waren (z. B. dadurch, dass sie sogar „atmeten“, wie Vaucansons Flötenspieler, vgl. Wood, 2002), umso mehr musste man sich die Frage stellen, was Menschlichkeit im Vergleich noch ausmachte und ob die Einzigartigkeit des Menschen gefährdet sei. Ängste dieser Art wurden noch zusätzlich dadurch genährt, dass in dieser Zeit auch der Mensch mehr und mehr als „mechanisch“ beschrieben wurde. Besonders deutlich wird eine solche „Technomorphisierung“ (Mracek, 2001) beispielsweise in der 1748 von dem Arzt und Philosophen Julien Offray de La Mettrie verfassten Schrift „L’Homme-Machine“. La Mettrie beschrieb den Menschen als eine sich selbst steuernde Maschine, die sich wie ein Uhrwerk vollständig mithilfe physikalischmechanischer Prinzipien erklären lasse (Mracek, 2001; vgl. auch Mazzolini, 1994). In der Konsequenz vertrat er die Meinung, dass Erbauer wie Vaucanson ihre Kunst lediglich verfeinern müssten, um auch einen dieser menschlichen Mechanik entsprechenden Androiden zu bauen. Vor diesem Hintergrund formulieren Aurich, Jacobsen und Jatho (2000), dass Begegnungen mit künstlichen Menschen die Frage nahelegen: „Bin ich wirklich?“

Standage (2002) führt die Ambivalenz vor allem auf eine andere Angst zurück, die er auch gegenüber der heutigen Technologie beobachtet: Der Angst, letztlich überflügelt und verdrängt zu werden: „There are obvious similarities to the rise of the computer era in modern times. The creations of Vaucanson, Kempelen, and their contemporaries are arguably the ancestors of almost all modern machinery; automata occupied the same intersection of technology, entertainment, and commerce that computers do today. Then, as now, many people were ambivalent about the new machines. On one hand, they were fascinated – public exhibitions of automata were wildly popular in London and Paris during the 18th century – but they were also concerned that humans might end up being superseded“ (3. Kapitel). Tatsächlich finden sich solche Ängste auch im Umgang mit aktuellen Maschinen: Wood (2002) berichtet von einem Gespräch mit dem Schachweltmeister Gary Kasporov, in dem sie ihn fragt, was seiner Meinung nach mit der Maschine gemacht worden war, damit diese ihn schlagen konnte. Er antwortet wütend: „No, maschine cannot beat me!“ Auch Jahre nach dem verlorenen Spiel gegen Deep Blue geht er also davon aus, dass ein Mensch seine Hand im Spiel hatte und nur die kombinierte Macht von Mensch und Maschine zum Sieg geführt hat.

Aber auch eine weitere Ambivalenz, die den künstlichen Menschen inne liegt, wird als Ursache für die gemischten Reaktionen aufgeführt (Sykora, 2000, S. 118): „Die seit Jahrhunderten ungebrochene Faszination künstlicher Menschen mit ihren unterschiedlichen medialen Umsetzungen … entzündet sich an zwei widersprüchlichen Eigenschaften. Zum einen dienen die Androiden als Beweise einer gestalterischen Potenz, die den Menschen im doppelten Sinn transzendiert, indem er – den Göttern gleich – sein eigenes Ebenbild schafft. Zum anderen birgt das bildnerische Menschenimitat bis heute Spuren magischer Kraft, die in den Kunstfiguren als eigenständige Macht lebendig zu werden droht. Als Kippfigur zwischen Ding und Mensch wohnt den anthropomorphen Kreaturen das Potential einer Emanzipation von ihren Schöpfern inne.“

Bei dem Versuch der Erklärung der mindestens teilweise erschreckten Rezeptionshaltung darf ebenfalls nicht vergessen werden, dass das Nachbilden von Menschen auch blasphemische Züge trug. So formuliert Stanislav Lem (zitiert nach Seeßlen, 2000, S. 15): „Das Programm der künstlichen Anfertigung des Menschen stellt in unserem Kulturkreis eine Gotteslästerung dar. … Deshalb sind die „Urroboter“, diese literarischen Prototypen aus früheren Jahrhunderten, gewöhnlich böse oder zumindest unheimlich, wie zum Beispiel der Golem.“

So, wie man die Rezeptionsprozesse und die Wirkungen auf die Öffentlichkeit analysieren kann, stellt sich auch die Frage nach den Motiven der Hersteller künstlicher Menschen, die Wood (2002) als „Humanity’s age-old obsession with moving dolls and speaking robots, intelligent machines and bionic men. […] inventors and magicians laboured for centuries to simulate life mechanically“ (vgl. Klappentext) bezeichnet. Die Autorin fragt weiterhin treffend: „Why were all these people – the greatest scientists of the Enlightenment, the most powerful men in France, the ruler of the kingdom – so wrapped up in a plan to make life out of nothing?“ (S. 54). Die Obsession verwundert tatsächlich – zumal Androiden laut Wood (2002, S. XVII) als „forever unliving and yet never dead“ philosophisch mit dem Thema Tod und Sterblichkeit verknüpft sind und man annehmen kann, dass die Erschaffung solche Aspekte aktualisiert: „Every time an inventor tries to simulate life mechanically, he is in fact accentuating his own mortality“ (Wood, 2002, S. XVII). Sie selbst schlägt als ein mögliches Motiv „womb envy“ vor, da die Erschaffer überwiegend Männer sind. Ein Beispiel, das auf das mögliche Motiv der Schaffung von „Nachkommen“ hindeutet, ist das des Erfinders Edison. Er entschied sich, seinen Phonographen nicht mit einer von vielen möglichen Hüllen herstellen und verkaufen zu lassen, sondern ihm ein menschenähnliches Äußeres zu geben (vgl. Wood, 2002). So wird Edisons sprechende Puppe „Euphonia“, die er „my baby“ nennt, in hohen Stückzahlen von 500 pro Tag hergestellt. Zeitzeugen berichten, dass „no child of Edison’s brain has ever received such fostering care“ (vgl. Wood, 2002, S. 118). Hier muss allerdings entgegnet werden, dass die Tatsache der männlichen Übermacht im 18. Jahrhundert weniger durch „womb envy“ als vielmehr durch die Geschlechtsrollen bedingt sein kann. Betrachtet man die Forschungslandschaft heute, so fällt im Gegenteil eher auf, dass mit der Entwicklung von anthropomorphen Schnittstellen und Robotern auffallend viele Frauen befasst sind. Perkowitz (2004) schlägt alternativ vor, dass vorrangig der Wunsch nach Selbsterkennung (in Bezug auf das „Mensch-Sein“) die Erschaffung künstlicher Menschen motiviert, da sich auf diesem Wege zentrale Fragen des Daseins beantworten ließen. „Could such a creation operate intelligently in the real world? Could it be truly self-directed? And could it be consciously aware of its own internal state, as we are? These deep questions might never be entirely settled. We hardly know ourselves if we are creatures of free will, and consciousness remains a complex phenomenon, remarkably resistant to scientific definition and analysis. One attraction of the study of artificial creatures is the light it focuses on us: To create artificial minds and bodies, we must first better understand ourselves“ (S. 11). Versuche, wie etwa die von Vaucanson, einen Blutkreislauf zu simulieren, können in diesem Sinne – zumindest teilweise – als Entwicklungen im Sinne von Lern- und Lehrmedien verstanden werden, und in der Tat war die Maschine für den Anatomieunterricht vorgesehen.

Ein weiteres – und aktuell immer realistischer werdendes – Ziel liegt sicherlich in der Anwendungsrelevanz hinsichtlich der potentiellen Realisierbarkeit von Unsterblichkeit. Marvin Minsky etwa wird mit den Worten zitiert (Sesink, 1993, S. 8): „Eines Tages, wenn wir wissen, wie der Verstand arbeitet, werden wir begreifen, dass es nicht notwendig ist, krank zu sein oder im Alter das Gedächtnis zu verlieren oder zu sterben. Man kann dann alle Elemente einer Persönlichkeit in einen anderen Körper, einen Maschinenkörper, verpflanzen, der erhalten wird und kontinuierlich wächst, so dass wir nicht auf ewig mit unseren Begrenzungen leben müssen.“

Abschließend soll nun die neuere Geschichte der Androiden des 20. und 21. Jahrhunderts geschildert werden, die zum einen auf der Robotik, zum anderen auf der Künstlichen Intelligenz (KI) Forschung fußt. Manhart (1991) stellt sogar explizit eine Verbindung zwischen den Jahrhunderte langen Versuchen der Entwicklung künstlicher Menschen und der modernen KI-Forschung her: „Der Wunsch, sich selbst ein Ebenbild zu schaffen, ist ein uralter Menschheitstraum, der die Phantasie der Menschen in Mythen und Märchen immer wieder anregte. Die KI ist die bislang fundierteste und aussichtsreichste Bemühung, diese Phantasien zu realisieren“ (1. Paragraph). Das aktuelle Spektrum der KI reicht von natürlichsprachlichen Systemen über die Assistenz beim Autofahren und bei der Bedienung von Heimelektronik (siehe www.embassi.de) bis hin zu Schachcomputern auf dem Niveau von Großmeistern oder zu Expertensystemen etwa für medizinische Diagnosen (vgl. Manhart, 1991).

Ihren Anfang nahm die KI-Forschung zu Beginn des 19. Jahrhunderts (1822) mit dem Entwurf einer analytischen Maschine durch den englischen Mathematiker Charles Babbage (vgl. Manhart, 1991; Mracek, 2001). Diese Maschine, die Logarithmen berechnen sollte und mit einem Speicher, einer Bibliothek und einem Kommunikationssystem über Lochkarten konzipiert war, wurde allerdings nie gebaut. Sie gilt dennoch als Urbild heutiger Computerarchitekturen (vgl. Manhart, 1991), da sie im Gegensatz zu den einfachen Rechenmaschinen von Schickard, Pascal und Leibniz bereits alle wesentlichen Funktionen heutiger Rechner enthält. Ein weiteres abstraktes Konzept, das nie verwirklicht wurde, aber bereits den Weg wies, war die universelle Rechenmaschine von Alan Turing (1912–1954). Nachhaltig beeinflusst hat Turing (1950) die Forschung zur künstlichen Intelligenz aber auch durch seine Reflexionen zur Frage, ob Maschinen denken können oder ob das Ziel lediglich sein könne, dass Maschinen Intelligenz zugeschrieben wird. Unabhängig von diesen Konzepten entwickelte der deutsche Ingenieur Konrad Zuse 1941 den ersten praktisch verwendbaren Digitalcomputer (Z3), der ebenfalls als Universalmaschine, die nicht nur ein Additionswerkzeug darstellt, sondern den amtierenden Schachweltmeister besiegen könne, konzipiert wurde (vgl. Manhart, 1991). Diese Entwicklungen sind deswegen so wichtig, weil sie im Folgenden die Trägersubstanz der KI darstellten. Levy (1992, S. 5) subsummiert diese Zusammenhänge auf fast poetische Art und Weise: „Artificial life, or a-life, is devoted to the creation and study of lifelike organisms and systems built by humans. The stuff of this life is nonorganic matter, and its essence is information: computers are the kilns from which these new organisms emerge. Just as medical scientists have managed to tinker with life’s mechanisms in vitro, the biologists and computer scientists of a-life hope to create life in silico.“

Die engere Geschichte der KI, die Ihren Anfang 1956 bei einem Workshop in Dartmouth nahm und sich von Problemlösemaschinen über in begrenzten Mikrowelten operierende Systeme hin zu neuronalen Netzen entwickelte, soll hier nicht näher thematisiert werden.

Einen ausführlichen Überblick bieten etwa McCorduck (1987), Görz und Nebel (2003) oder Russell und Norvig (2004). Lediglich eine aktuelle Diskussion um die Voraussetzung zur Schaffung menschenähnlicher Intelligenz erscheint relevant für die hier zu fokussierenden Themen: Seit einigen Jahren – und sichtbar etwa auch an neueren Forschungswettbewerben wie dem Robocup, bei dem unterschiedliche Roboterklassen sich im Fußballspielen messen – wird vertreten, dass eine Intelligenz nur erreicht werden kann, wenn auch sensorischer Input und eine Auseinandersetzung mit der Umwelt gegeben sind (vgl. Dautenhahn et al., 2002; Dautenhahn & Christaller, 1997). Da dies nur durch eine Verkörperung (sogenanntes Embodiment) zu erreichen ist, genießt insbesondere die Robotik momentan größte Aufmerksamkeit (vgl. die in Kap. 2.1 ausführlichere Diskussion zum Embodiment).

Die Roboterforschung erfreut sich spätestens seit den 1950er Jahren (Beginn entsprechender Entwicklungen am MIT) großer Beliebtheit. Mittlerweile gibt es mit dem Roboter Kismet von Cynthia Breazeal (2000; Breazeal et al., 2004a, b) einen ersten Roboter, der Bedürfnisse hat (z. B. ein Spielbedürfnis). Der Roboter Kismet nimmt Blickkontakt auf, wenn er angesprochen wird, kann menschliche Gesichter aufspüren und darauf reagieren und braucht sozialen Kontakt. Auch hier wird als Motiv angegeben, dass letztlich etwas über die Natur des Menschen gelernt werden soll (vgl. Wood, 2002). In Tokio versucht Ichiro Kato mit Hadaly eine „perfekte Frau“ zu bauen und sein Nachfolger Atsuo Takanishi am Robotics Labor an der Wasada Universität in Tokio arbeitet an einer Neukonstruktion von Vaucansons Flötenspieler mit Lunge, beweglichen Lippen und einer flexiblen Zunge. Ferner wird „Wabian“, eine gigantische Gehmaschine, die tanzen kann, gebaut, die sich als Reinkarnation von Hoffmanns Olimpia verstehen lässt.

Mittlerweile zeigen bereits kommerziell erhältliche Roboter Fähigkeiten auf hohem Niveau: Die jüngste Entwicklung von Sony, ein 58 cm großer, menschenähnlich aussehender Roboter (SDR-4X), kann singen, tanzen, Menschen wiedererkennen und einfache Dialoge führen. Der Roboter steht in der Tradition des AIBO, jenes Roboterhundes, der als erstes künstliches Wesen nicht als Sklave, sondern als Gefährte für den Menschen konstruiert wurde. Auch das Roboterkind Pino, das nach dem Erwerb erst gehen lernen muss, spricht eher soziale Neigungen an, als dass es spezifische Dienste leisten würde.