1 Einleitung

Die Interaktion von Menschen und Robotern gewinnt in einer Vielzahl von Arbeitsbereichen kontinuierlich an Bedeutung. Neben dem stetigen Wachstum der Bedeutung von Industrie- und Servicerobotik (International Federation of Robotics 14,15,a, b), kommt es vor allem auch in sozialen Anwendungsfeldern, wie im Bildungs- und Gesundheitswesen, zu immer umfangreicherer robotischer Assistenz (Belpaeme et al. 2018; Scoglio et al. 2019). Domänenübergreifend zeigt sich dabei der Trend zur kollaborativen Interaktion, bei der Menschen mit Robotern in zeitlicher und räumlicher Abhängigkeit zusammenarbeiten (Onnasch und Roesler 2021). Dadurch ergeben sich neue Herausforderungen für eine erfolgreiche Mensch-Roboter-Interaktion (MRI) (Sheridan 2016). Während in früheren koexistierenden Strukturen insbesondere leistungsbezogene Faktoren des Roboters wie Sicherheitssysteme und technische Zuverlässigkeit im Fokus standen, rücken durch die Kollaboration nun andere Merkmale in den Vordergrund, die stärker auf die Erfahrung der direkten Interaktion zwischen Roboter und Mensch fokussieren (Matheson et al. 2019). Eine zentrale Frage im Zusammenhang kollaborativer Robotik ist daher, wie durch die Gestaltung von Robotern eine intuitive und angenehme Interaktion unterstützt werden kann (Bartneck et al. 2009; Hancock et al. 2011; Roesler et al. 2021).

1.1 Die Bandbreite von Morphologie

Da sich die Kategorisierung der Robotermorphologie des entwickelten Fragebogens auf der Taxonomie von Onnasch und Roesler (2021) bezieht, wird der theoretische Hintergrund genutzt, um die in dieser Taxonomie aufgeführten Konzepte einzuführen. Für eine umfassende und systematische Literaturübersicht empfehlen sich aktuelle Überblicksartikel zum Thema Anthropomorphismus (Złotowski et al. 2015; Rothstein et al. 2021; Roesler et al. 2022) und Zoomorphismus (Nanay 2021; Löffler et al. 2020). Technomorphismus wird in den angeführten Veröffentlichungen häufig als Gegenpol zu Anthropomorphismus und Zoomorphismus konzeptualisiert und dementsprechend mitbetrachtet.

Grundlegend kann die Morphologie des Roboters als sichtbare und erfahrbare Schnittstelle der Interaktion von besonderer Bedeutung sein, da sie per Design an die Aufgabenanforderungen sowie an die Erwartungen und Fähigkeiten des Menschen angepasst werden kann. In diesem Zusammenhang stellt die Übertragung menschähnlicher Charakteristika auf Roboter eine vielversprechende und häufig genutzte Gestaltungsstrategie dar. Es wird davon ausgegangen, dass eine menschähnliche, also anthropomorphe, Gestaltung zu einer Aktivierung von Mensch-Mensch-Interaktionsschemata führt und damit zu einer intuitiveren Zusammenarbeit von Menschen mit Robotern beiträgt (Duffy 2003; Roesler et al. 2021). Das übergeordnete Ziel der Robotergestaltung ist dabei zumeist die Förderung einer positiven Wahrnehmung in Bezug auf Intelligenz, Sicherheit oder Attraktivität (Bartneck et al. 2009) und einer positiven Einstellung in Bezug auf Vertrauen, Akzeptanz und Empathie (Bröhl et al. 2016; Hancock et al. 2011). Diese können wiederum gewünschtes Verhalten, wie die Nutzung von Robotern nach sich ziehen (Sanders et al. 2019). Darüber hinaus kann die Gestaltung auch direkt Einfluss auf das Verhalten des Menschen nehmen. So können Kommunikation und Bewegungen dazu genutzt werden, gemeinsame Handlungen von Menschen und Robotern besser zu koordinieren (Clodic et al. 2017; Onnasch et al. 2023).

Beispiele für diesen Ansatz finden sich in verschiedensten Anwendungsbereichen und Realisationsformen. So kann z. B. die Implementierung eines Robotergesichts Hinweise auf menschähnliche Interaktionsmöglichkeiten geben, da über das Aussehen auch implizite Annahmen zur Funktionalität transportiert werden (Goetz et al. 2003; Onnasch und Roesler 2021). Augen suggerieren, dass der Roboter sehen kann und die Darstellung eines Mundes oder von Ohren weist auf verbale Kommunikationskanäle hin. Neben dem reinen Aussehen des Roboters spielen auch die Kommunikation, Bewegungen oder der Kontext, in dem ein Roboter präsentiert wird, eine zentrale Rolle in der Wahrnehmung des Roboters (Goetz et al. 2003; Onnasch und Roesler 2021). Studien in der industriellen MRI konnten beispielsweise zeigen, dass eine anthropomorphe Bewegungsgestaltung eines Roboterarms zu einer verbesserten Nachvollziehbarkeit und Vorhersagbarkeit der Bewegungen führen kann (Dragan und Srinivasa 2016; Kuz et al. 2013; Mayer et al. 2013). Ein anderes Beispiel illustriert, dass im Servicebereich die Anwendung von verbalen Etiquette-Strategien in Bezug auf die Roboterkommunikation einen positiven Effekt auf das Verhalten von Personen hatte (Zhang et al. 2011; Zhu und Kaber 2012). Zudem zeigt sich, dass bereits das reine Beschreiben von Robotern zu unterschiedlichen Einstellungen und Verhalten gegenüber dem Roboter führen kann (Darling 2015). So verbesserte sich z. B. die Interaktion mit sozialen Robotern, wenn diese durch Namen und Geschichten personifiziert wurden (Darling 2017; Westlund et al. 2016). Die angeführten Studien zeigen, wie sehr der Kontext, in dem ein Roboter verbal eingeführt wird, das sogenannte Framing, den Menschen beeinflussen kann (Darling 2015). Der Kontext geht allerdings noch über ein rein verbales Framing hinaus, da auch Interaktionsszenarien selbst aufgrund ihrer benötigten Sozialität (Goetz et al. 2003) einen Einfluss haben können. Die Dimension Kontext umfasst also die Zuschreibung von Eigenschaften, die durch verbale und visuelle Umgebungshinweise induziert wird.

Die angeführten Studien verdeutlichen, dass die Robotergestaltung als multidimensionales Konstrukt (Aussehen, Kommunikation, Bewegung, Kontext) in allen Bereichen, in denen Roboter heute eingesetzt werden, eine bedeutende Rolle spielt und differenzierte Effekte auf die Wahrnehmung als auch auf das Verhalten des Menschen hat.

Allerdings ist der Erfolg dieses Gestaltungsansatzes stark abhängig von der Anwendungsdomäne (Goetz et al. 2003; Roesler et al. 2021; 2022) und der Art der Gestaltung (Onnasch und Hildebrandt 2021; Onnasch und Roesler 2019; Roesler et al. 2020). Ein Negativbeispiel stellt das anthropomorphe Aussehen von Robotern in der industriellen Domäne dar, da dieses zu geringerer wahrgenommener Zuverlässigkeit und sogar suboptimaler Aufmerksamkeitsverteilung führen kann (Onnasch und Hildebrandt 2021; Roesler et al. 2020). Hier ist ein technomorphes Aussehen einem anthropomorphen zumeist vorzuziehen. Schon frühe Studien im Bereich Mensch-Roboter Interaktion zeigten, dass das Roboteraussehen und -verhalten zu der jeweiligen Sozialität und Ernsthaftigkeit der Aufgabe passen sollte (Goetz et al. 2003). Im Zuge der sogenannten Matching-Hypothese wurde Technomorphismus als Maschinenähnlichkeit als Gegensatz zu Anthropomorphismus als eigene Kategorie eingeführt. Spätere Studien ergänzten die Forschung zur Matching-Hypothese dann durch zoomorphe Roboter, also tierähnliche Gestaltungsansätze (Li et al. 2010). Während technomorphe Gestaltungsansätze oftmals im Industriebereich erfolgreich implementiert werden, finden zoomorphe Merkmale eher im sozialen Bereich Verwendung. Besonders in der Kind-Roboter-Interaktion zeigt sich zum Beispiel, dass zoomorphe Gestaltungsansätze Lernerfolg und Spaß am Lernen steigern können (Gordon et al. 2016).

Zusammenfassend lässt sich herausstellen, dass die Gestaltung von Robotern in Bezug auf Aussehen, Kommunikation, Bewegung und Kontext in allen Domänen der MRI eine hohe Bedeutung aufweist (Goetz et al. 2003; Roesler et al. 2021; 2022). Um generalisierbare Gestaltungsempfehlungen geben zu können, ist es daher nicht nur von zentraler Bedeutung, die Auswirkungen von Gestaltung zu untersuchen, sondern auch die Gestaltung selbst erfassbar zu machen. Nur wenn man die subjektive Wahrnehmung der jeweiligen Morphologie eines Roboters und der ihr zugrundeliegenden Gestaltungsmerkmale (Aussehen, Kommunikation, Bewegung und Kontext) differenziert erfassen kann, ist es möglich die Effekte dieser Morphologie auf die MRI abzuschätzen.

1.2 Bisherige Erfassungsmethoden der Morphologie

Eine Erfassung unterschiedlicher Anthropomorphismusgrade wurde bisher vor allem in Zusammenhang mit Arbeiten zum Uncanny Valley thematisiert (Ho und MacDorman 2010; Mara et al. 2022; Mori et al. 2012). Im Rahmen dieses postulierten Zusammenhangs wird angenommen, dass ab einem bestimmten Punkt anthropomorphes Aussehen zu unangenehmen Gefühlen oder einer Verletzung von Erwartungen führt. Aus der Forschungshistorie des Uncanny Valley ergab sich die bisher am häufigsten genutzte Methode zur Differenzierung verschiedener Grade der Robotermorphologie die Anthropomorphismus-Skala aus dem Godspeed Fragebogen (Bartneck et al. 2009; Weiss und Bartneck 2015). Die Skala umfasst semantische Differentiale (z. B. unecht – natürlich, künstlich – realistisch), die auf fünf Stufen bewertet werden können (Bartneck et al. 2009). Das Ziel des Godspeed Ι: Anthropomorphismus (GΙA) ist es, den Vergleich unterschiedlicher Morphologien von Robotern zu ermöglichen (Bartneck et al. 2009). Inhaltlich beziehen sich diese Differentiale primär auf die Wahrnehmung der äußeren Gestalt, während andere Aspekte wie z. B. Kommunikation und der Kontext nicht adressiert werden. Damit können sich Vergleiche auf Basis dieses Fragebogeninstruments nicht auf alle Gestaltungsdimensionen der Morphologie eines Roboters beziehen. Darüber hinaus weisen aktuelle Studien darauf hin, dass der eindimensionale Ansatz des GΙA nicht geeignet ist kleinere Unterschiede innerhalb einzelner Gestaltungsebenen abzubilden. So konnte der GΙA keine Unterschiede für einen anthropomorph oder technomorph beschriebenen humanoiden Roboter aufzeigen (Onnasch und Roesler 2019) oder zwischen einem industriellen Roboter mit oder ohne Gesicht differenzieren (Onnasch und Hildebrandt 2021; Roesler et al. 2020). In beiden Beispielen zeigten sich allerdings Unterschiede in der menschlichen Wahrnehmung und dem Verhalten gegenüber den Robotern, so dass hier von einer wahrgenommenen Unterschiedlichkeit ausgegangen werden kann und damit von einer möglichen mangelnden Sensitivität des GΙA. Ähnliche Resultate zeigten sich für eine revidierte Version des Godspeed Ι (RGΙA) (Ho und MacDorman 2010); so konnten auch mit diesem Messinstrument keine Unterschiede in der erwähnten Manipulation des Kontexts via Framing (Onnasch und Roesler 2019) oder Aussehens (Onnasch und Hildebrandt 2021; Roesler et al. 2020) durch die Skala wahrgenommene Menschenähnlichkeit aufgezeigt werden. Dies liegt auch darin begründet, dass die Extrema der semantischen Differenziale der beiden meist genutzten Fragbögen (GΙA, Bartneck et al. 2009; RGΙA, Ho und MacDorman 2010) oft Eigenschaften nennen, die einzigartig für lebende Entitäten sind (z. B. hat kein Bewusstsein – hat ein Bewusstsein). Diese extremen Unterschiede und die eher grobe Einteilung in 5 Stufen bieten daher nicht genug Raum, um kleinere Unterschiede der Wahrnehmung abzubilden.

Andere Fragebögen beziehen sich vor allem auf die Zuschreibung menschlicher Eigenschaften, wie mentale Kapazitäten und Prozesse (Ruijten et al. 2019) oder die grundlegende menschliche Tendenz unbelebte Entitäten zu anthropomorphisieren (Waytz et al. 2010). Die Erfassung der allgemeinen Tendenz zu anthropomorphisieren ist jedoch nicht als Methode geeignet, um die wahrgenommene Morphologie von Robotern zu untersuchen.

Phillips und Kolleg:innen (2018) bieten einen nicht fragebogenbasierten Ansatz zur systematischen Erfassung des wahrgenommenen Anthropomorphismus hinsichtlich des Aussehens. Dafür wurde das Aussehen von Robotern auf Bildern analysiert. Die Analyse beinhaltet die Einordnung von Robotereigenschaften wie Körperform, Gesicht und Oberflächentextur und liefert damit eine differenzierte Bewertung des Aussehens von Robotern. Aspekte wie Bewegung, Kommunikation und Kontext werden allerdings nicht abgebildet.

1.3 Notwendigkeit neuer Methoden zur Erfassung der Morphologie

Neben den bereits aufgeführten Kritikpunkten aktueller Erfassungsmethoden ist die wohl größte Forschungslücke, dass sich die Hauptzahl der bestehenden Ansätze ausschließlich auf die anthropomorphe Gestaltung von Robotern konzentriert (Bartneck et al. 2009; Ho und MacDorman 2010; Phillips et al. 2018). Die Erfassung von zoomorphen Gestaltungsmerkmalen wird nur indirekt vorgenommen, da häufig einfach die beschriebenen Fragebögen zu Anthropomorphismus verwendet werden (Löffler et al. 2020). Die dritte Gestaltungsmöglichkeit, ein technomorphes Design, wird stets als Gegenteil zu Anthropomorphismus oder Zoomorphismus interpretiert, z. B. im GΙA. Während dies für einige Items auch sinnvoll erscheint (z. B. wie ein Mensch – wie eine Maschine), kann diese implizite Schlussfolgerung bei anderen Items des GΙA allerdings angezweifelt werden (z. B. bewegt sich steif – bewegt sich flüssig).

Ziel dieser Arbeit ist daher die Entwicklung eines Sets von drei Fragebögen (einen für jede Variante der Morphologie), welche die unterschiedlichen Ausprägungen der jeweiligen Morphologien auf Basis von relevanten Dimensionen (Aussehen, Kommunikation, Bewegung und Kontext) erfassen. Die theoretische Basis für die Unterscheidung der verschiedenen Dimensionen liefert dabei die Taxonomie der MRI von Onnasch und Roesler (2021), die in Bezug auf die jeweilige Morphologie von Robotern, diese Dimensionen unterscheidet. Diese werden jeweils bezüglich ihres Grades an anthropomorphen, zoomorphen und technomorphen Charakteristika eingeschätzt. Der gewählte Ansatz der Entwicklung mehrerer Fragebögen zur Robotermorphologie (RoMo) mit einzelnen Fragebögen zu Anthropomorphismus (RoMo-A), Zoomorphismus (RoMo-Z) und Technomorphismus (RoMo-T) bietet dabei nicht nur die Möglichkeit die Gestaltung über das Aussehen hinaus zu erfassen, sondern auch für jede Morphologie spezifisch einzelne Skalen auszuwählen, die dem Untersuchungsziel entsprechen, und andere Skalen wegzulassen, die in diesem Kontext irrelevant sind. Soll beispielsweise nur die Wirkung eines tierähnlichen Aussehens von Robotern auf die menschliche Wahrnehmung untersucht werden (Löffler et al. 2020), reicht es aus, nur diesen Teilaspekt zu erfassen (Skala Aussehen des RoMo-Z) um die Stimuli bezüglich des zoomorphen Aussehens zu unterscheiden. Mithilfe des Fragebogen-Sets soll damit ermöglicht werden, ökonomisch und sensitiv die Morphologie von Robotern zu erfassen.

Um ein solches Set an Fragebögen zu entwickeln, wurden zwei Online-Studien durchgeführt. In der ersten Studie wurde das Set an Fragebögen entwickelt. In der zweiten Studie wurde eine Validierung des Fragebogen-Sets mit einer neuen Stichprobe durchgeführt wurde.

2 Studie 1: Fragebogenentwicklung

Um die drei möglichen morphologischen Varianten von Robotern zu erfassen (anthropomorph vs. zoomorph vs. technomorph), wurden Aussehen, Kommunikation, Bewegung und Kontext als a priori angenommene Dimensionen genutzt. Auf dieser Grundlage wurden Items gesammelt und generiert, die möglichst breit die einzelnen Dimensionen abdecken.

2.1 Generierung der Items

Die Itemgenerierung basierte auf Charakteristiken, die wesentlich für Menschen, Tiere und Technologien in Bezug auf die vier Dimensionen sind. Eine gewisse semantische Redundanz war für die Ausgangsitems intendiert, da die Merkmale eine möglichst umfassende Ausgangslage für die folgende Itemreduktion bieten sollten. Die initiale Sammlung der Charakteristika umfasste 17 Aussehensmerkmale (z. B. Kopf und Proportionen), 22 Kommunikationsmerkmale (z. B. Sprache und Geräusche), 17 Bewegungsmerkmale (z. B. Geschwindigkeit und Art der Annäherung) und 20 Kontextmerkmale (z. B. Name und Einsatzgebiet). Wichtig ist, dass Merkmale gesucht wurden, hinsichtlich derer sich die Roboter über die Morphologien hinweg vergleichen lassen.

In einem kurzen Pretest wurden die gesammelten Merkmale auf ihr semantisches Verständnis und die angenommene Zuordnung zu den jeweiligen Dimensionen mit vier Personen überprüft. Basierend auf dem Pretest und der dazugehörigen Diskussion der Autor:innen wurden fünf Items exkludiert, eines umsortiert und eines umformuliert. Die Schwelle für die Entfernung von Items wurde konservativ gehandhabt, da alle verbleibenden Merkmale in einer ausführlicheren Erhebung untersucht wurden.

Im nächsten Schritt wurde die Liste der gesammelten 71 Merkmale zu vollwertigen, in Frageform gestalteten Items entwickelt. Diese zielten darauf ab, zu erfassen, inwieweit ein Robotermerkmal als menschähnlich, tierähnlich und technisch wahrgenommen wird. Dazu wurde der Itemstamm ergänzt: Wie menschenähnlich/tierähnlich/technisch ist das jeweilige Merkmal des Roboters? Jedes Merkmal führte daher zu drei separaten Fragen. Das Antwortformat ist als kontinuierliche Prozentskala konzipiert, die eine Bewertung von 0 %, d. h., dass zu dem jeweiligen Aspekt überhaupt kein Ausmaß wahrgenommen wird (verankert mit gar nicht), bis 100 %, d. h., dass das spezifische Ausmaß zu dem jeweiligen Aspekt vollständig wahrgenommen wird (verankert mit voll und ganz), ermöglicht. Diese Items wurden im Rahmen einer ersten Online-Studie untersucht.

2.2 Methode

2.2.1 Versuchspersonen

Insgesamt füllten 162 Versuchspersonen das Set an Fragebögen vollständig aus. Die Teilnehmer:innen wurden auf verschiedene Weisen rekrutiert. Die Studie wurde auf den entsprechenden Internetportalen der Technischen Universität Berlin (TU) und der Humboldt-Universität zu Berlin (HU) beworben. Darüber hinaus wurden persönliche Kontakte gebeten, an der Studie teilzunehmen und weitere Bekannte über die Studie zu informieren. Außerdem wurden Hinweise zur Studie auf verschiedenen sozialen Medienplattformen verbreitet. Für Studierende der beiden genannten Universitäten wurde die Teilnahme mit einer Versuchspersonenstunde vergütet. An beiden Universitäten benötigen Studierende diese Stunden für ihren Studienabschluss in Psychologie (HU) bzw. Human Factors (TU). Für alle anderen Teilnehmer:innen wurde betont, dass Sie einen bedeutsamen Beitrag zur Wissenschaft leisten und es wurde keine finanzielle Entschädigung angeboten. Die Teilnahme erfolgte auf freiwilliger Basis und konnte jederzeit abgebrochen werden.

Ein N = 162 wurde angestrebt, da so ein ausbalanciertes Design umgesetzt werden konnte (siehe Versuchsmaterialen). Insgesamt umfasste die Stichprobe 63 % weibliche, 36,4 % männliche und 0,6 % non-binäre Personen. Die Stichprobe hatte ein Durchschnittsalter von M = 32,94 (SD = 13,95). Von den 162 Teilnehmer:innen gab die Mehrheit (71 %) an, überhaupt keine Erfahrung (64) oder kaum Erfahrung (51) im Umgang mit Robotern zu haben. Circa ein Viertel (24,7 %) der Proband:innen gab an, ein wenig Erfahrung zu haben, und 4,3 % gaben an, sehr viel Erfahrung im Umgang mit Robotern zu haben.

2.2.2 Versuchsmaterialien

Um ein Gesamtbild eines Roboters zu erzeugen, das alle Dimensionen umfasste (Aussehen, Kommunikation, Bewegung und Kontext), bestand das Stimulusmaterial aus mehreren Modulen.

Das erste Modul war ein Bild des jeweiligen Roboters in der jeweiligen Umgebung, um Aussehen und Kontext zu illustrieren (Abb. 1). Für die Dimension Aussehen wurden drei Roboter aus der ABOT-Datenbank (Phillips et al. 2018) verwendet und anschließend modifiziert, indem sie in verschiedene Stockfotos eingefügt wurden (abgerufen von Pixabay). Der Roboter Yumi wurde ausgewählt, um ein menschenähnliches Aussehen zu repräsentieren, während Keecker für eine technische Darstellung verwendet wurde. Schließlich diente iCat als tierähnlicher Roboter. Da die Oberfläche von iCat gelb ist und damit in starkem visuellem Kontrast zu den beiden anderen Robotern (beide weiß) stand, wurde iCat digital weiß eingefärbt. Um sicherzustellen, dass der Fragebogen auch geringfügige Unterschiede im Erscheinungsbild der Roboter erfassen kann, haben wir Roboter ausgewählt, die bis auf wenige äußerliche Merkmale (z. B. tierähnliche Ohren) so ähnlich wie möglich sind. Dies bedeutet, dass sie in Bezug auf Größe und Farbe nahezu identisch sind, um eine möglichst homogene Ausgangsbasis zu schaffen. Dies ermöglichte es uns, gezielt die spezifischen äußerlichen Merkmale zu untersuchen, die bereits bei geringer Ausprägung mit der jeweiligen Morphologie assoziiert sind.

Abb. 1 Fig. 1
figure 1

Bildmodul der Online-Studie mit zoomorphem (linke Spalte), technomorphem (mittlere Spalte) und anthropomorphem (rechte Spalte) Roboter im Kontext eines Kindergartens (erste Zeile), Arbeitsplatzes (zweite Zeile) und Wohnzimmers (dritte Zeile). (Die farbigen und hochaufgelösten Bildmodule können via https://osf.io/srv8c/ abgerufen werden)

Image module of the online study with zoomorphic (left column), technomorphic (middle column) and anthropomorphic (right column) robot in the context of a kindergarten (first line), workplace (second line) and living room (third line). (The color and high-resolution image modules can be accessed via https://osf.io/srv8c/)

Jedes Roboterbild wurde zusätzlich in drei verschiedene Hintergrundbilder eingefügt, die die Kontextdimension illustrierten: Ein Bild zeigt einen Kindergarten (zoomorpher Kontext), ein anderes ein Büro (technomorpher Kontext) und ein drittes ein Wohnzimmer (anthropomorpher Kontext). Der Kindergarten wurde gewählt, da besonders in dieser Altersgruppe viel mit Tieren und zoomorphen Objekten, wie Spielzeugen, interagiert wird.

Das Textmodul Kontext wurde an das jeweilige Bildmodul gekoppelt präsentiert (Tab. 1). Ergänzt wurden diese dann durch jeweils ein Textmodul Bewegung und ein Textmodul Kommunikation (Tab. 1).

Tab. 1 Table 1 Textmodule für die drei unterschiedlichen Morphologien (Anthropomorphismus, Zoomorphismus und Technomorphismus) und Dimensionen (Aussehen, Kommunikation, Bewegung, Kontext)Text modules for the three different morphologies (anthropomorphism, zoomorphism and technomorphism) and dimensions (appearance, communication, movement, context)

Durch die Kombination von neun möglichen Bildern mit integriertem Kontexttext, drei möglichen Kommunikationstexten und drei möglichen Bewegungstexten ergaben sich insgesamt 81 mögliche Stimuluskombinationen. Pro Versuchsperson wurde immer nur eine Kombination präsentiert (z. B. anthropomorphes Aussehen x zoomorphen Kontext x anthropomorphe Kommunikation x technomorpher Bewegung).

2.2.3 Erhobene Variablen

Als Kontrollvariable wurde erhoben, ob Personen Deutsch auf Muttersprachniveau sprechen. Außerdem wurden für die Stichprobenbeschreibung die soziodemografischen Variablen Alter und Geschlecht erfasst.

Die wahrgenommene Robotermorphologie wurde mit jeweils 71 Items für Anthropomorphismus, Zoomorphismus und Technomorphismus erhoben.

Die Fragen umfassten 71 Merkmale zu den Dimensionen Aussehen, Kommunikation, Bewegung und Kontext, die zusammen mit den 3 Antwortstämmen (menschähnlich, tierähnlich, technisch) präsentiert wurden. Diese Fragen wurden auf einer Skala von 0–100 % bewertet.

2.2.4 Ablauf

Die Versuchspersonen führten die Online-Studie in Ihrem eigenen Webbrowser an einem ruhigen Ort ihrer Wahl durch. Nachdem sie ihr Einverständnis erklärt hatten, wurden soziodemografische Informationen abgefragt. Danach starteten allgemeine Instruktionen zum Studienablauf in denen erläutert wurde, dass im Folgenden ein Bild eines Roboters mit dazugehörigem Text präsentiert wird. Die Aufgabe bestand darin das Bild und den dazugehörigen Text aufmerksam zu rezipieren und unterschiedliche Fragen dazu zu beantworten. Jede Versuchsperson bewertete nur eine aller möglichen Stimuluskombinationen. Die Bild-Textkombination verblieb statisch zentriert am oberen Rand des Browsers und die Fragen erschienen in Blöcken, durch die die Person scrollen konnte. Ein Block umfasste jeweils eines der 71 Merkmale mit den drei Antwortstämmen (menschähnlich, tierähnlich, technisch). Die 71 Merkmale wurden in zufälliger Reihenfolge präsentiert. Die Studie endete nach der Beantwortung aller Fragen.

2.3 Analyse

Alle Analysen wurden einzeln für die Items eines Fragebogens (RoMo‑A, RoMo‑Z, RoMo-T) durchgeführt. Zunächst wurde die Korrelation eines Items mit dem Gesamtscore der jeweiligen Skala (die Trennschärfe) berechnet, da diese charakterisiert, ob alle Items inhaltlich dasselbe Merkmal messen. Dabei wurden idealerweise Werte > 0,5 angestrebt. Zusätzlich wurde als Maß für die interne Konsistenz der Skalen jeweils Cronbach’s α berechnet und Items, die bei Entfernung zu einer Verbesserung des Cronbach’s α führten, wurden entfernt.

Im nächsten Schritt wurde die Inter-Item-Korrelation pro Skala betrachtet. Zum einen sollte eine hohe Korrelation zwischen den Items einer Skala gegeben sein damit das gleiche Konstrukt gemessen wird (Werte < 0,3). Zum anderen sollten im Sinne der angestrebten Itemreduktion, Items mit starken Korrelationen (Werte > 0,7), wenn zusätzlich auch inhaltliche Redundanz zugrunde lag, entfernt werden. Die inhaltliche Redundanz wurde durch zwei der Autor:innen diskutiert und entschieden.

Daraufhin wurde mit den verbliebenen Items eine Faktorenanalyse durchgeführt. Vor der Durchführung der Faktorenanalyse wurde die Angemessenheit der Stichprobe und Daten für das Verfahren mittels Kaiser-Meyer-Olkin Kriterium (KMO) und Bartlett-Test geprüft. Die KMO Werte sollten mindestens > 0,6 sein und der Bartlett-Test signifikant (Tabachnick et al. 2007). Die exploratorische Faktorenanalyse wurde dann mit den zuvor reduzierten Items für den jeweiligen Fragebogen zu Anthropomorphismus, Zoomorphismus und Technomorphismus durchgeführt.

Die exploratorische Faktorenanalyse wurde gewählt, um die Faktorenstruktur zu untersuchen und die Items auf eine ökonomische Anzahl zu reduzieren. Da theoriebasiertkeine Korrelation zwischen den Komponenten angenommen wurde, wurde eine orthogonale Rotation (Varimax) gewählt. Die Anzahl der Faktoren wurde auf Basis von theoretischen Überlegungen, Screeplot und Eigenwerten festgelegt (Cattell 1966; Kaiser 1960). Dabei wurden die Items mit den höchsten Kommunalitäten gewählt. Mit den resultierenden Items pro Skala wurde die finale Faktorenanalyse des jeweiligen Fragebogens durchgeführt. Die Tab. 2, 3 und 4 zeigen das Ergebnis der finalen Faktorenanalyse für die reduzierten Items des RoMo‑A, RoMo‑Z und RoMo‑T mit allen Faktorladungen über 0,40 um die Übersichtlichkeit zu erhöhen (Stevens 2012). Um einen ökonomischen Fragebogen zu kreieren, wurden die drei Items mit der höchsten Ladung für die finalen Fragebogenversionen ausgewählt. Es wird empfohlen, dass in Fragebögen nicht weniger als drei Items pro Faktor zu verwenden sind, daher wurde eine angestrebte Itemzahl von drei pro Faktor festgelegt (Raubenheimer 2004).

Tab. 2 Table 2 Items und Faktorenladungen des RoMo‑A, Studie 1Items and factor loadings of the RoMo‑A, study 1
Tab. 3 Table 3 Items und Faktorenladungen des RoMo‑Z, Studie 1Items and factor loadings of the RoMo‑Z, study 1
Tab. 4 Table 4 Items und Faktorenladungen des RoMo‑T, Studie 1Items and factor loadings of the RoMo‑T, study 1

Im letzten Schritt wurden die Fragebögen auf ihre Sensitivität untersucht. Dafür wurden die Ratings der Stimuli (z. B. Beschreibung einer anthropomorphen Kommunikation) miteinander auf der jeweiligen Skala (z. B. Skala Kommunikation des RoMo-A) verglichen. Pro Fragebogen wurde je Skala eine einfaktorielle ANOVA mit dem zwischen-Subjekt Faktor Ausprägung (anthropomorph vs. zoomorph vs. technomorph) durchgeführt. Bei einem signifikanten Haupteffekt des Faktors wurden Bonferroni adjustierte post-hoc-Tests durchgeführt, um zu untersuchen, welche Ausprägungen die jeweilige Skala signifikant unterschiedlich abbildet.

2.4 Ergebnisse

2.4.1 Anthropomorphismus: Der RoMo-A

Die Itemreduktion und Skalenanalyse resultierten in 50 Items, die in die erste Faktorenanalyse eingingen. Sowohl der signifikante Bartlett’s Test (Χ2(1225) = 6563,33, p < 0,001) als auch das KMO-Kriterium (KMO = 0,94) zeigten eine geeignete Passung der Stichprobe und der Daten. Auch wenn die Eigenwerte eine sechs-faktorielle Lösung ergaben, konnte eine vier-faktorielle Lösung durch den Screeplot und die zugrundeliegende Theorie gerechtfertigt werden. Die erste Faktorenanalyse führte zur Auswahl der drei bestgeeigneten Items pro Skala. Die erneute Faktorenanalyse der 12 Items des RoMo‑A sind in Tab. 2 dargestellt. Der erste Faktor schließt die Items der Dimension Kommunikation ein und konnte 17 % der Varianz aufklären. Der zweite Faktor umfasst die Items der Dimension Aussehen und konnte 19 % der Varianz aufklären. Sowohl der dritte (Bewegung) als auch vierte (Kontext) Faktor erklärten jeweils 16 % der Varianz. Damit konnte der RoMo‑A insgesamt 69 % der Varianz aufklären.

Zudem zeigte der Fragebogen eine gute interne Konsistenz (α = 0,89). Auch die einzelnen Dimensionen Aussehen (α = 0,90), Bewegung (α = 0,84), Kommunikation (α = 0,88) und Kontext (α = 0,81) zeigten sehr gute bis gute interne Konsistenzen.

Die Ergebnisse der einzelnen Skalen des RoMo‑A in Bezug zu den jeweiligen Stimuli ist in Abb. 2 grafisch dargestellt. Die Analyse der Skala Aussehen zeigte einen signifikanten Haupteffekt (F(159,2) = 16,51, p < 0,001). Dabei zeigten die post-hoc-Tests, dass der anthropomorphe Roboter Yumi signifikant anthropomorph aussehender wahrgenommen wurde als der zoomorphe Roboter iCat (p = 0,008) und der technomorphe Roboter Keecker (p < 0,001). Darüber hinaus wurde der zoomorphe Roboter signifikant anthropomorpher im Aussehen wahrgenommen als der technomorphe Roboter (p = 0,021). Auch für die Skala Kommunikation zeigte sich ein signifikanter Haupteffekt (F(159,2) = 26,96, p < 0,001). Die anthropomorphe Beschreibung der Kommunikation wurde als signifikant anthropomorpher wahrgenommen als die zoomorphe (p < 0,001) und technomorphe (p < 0,001) Beschreibung der Kommunikation. Ein vergleichbares Bild zeigt sich auch für die Skala Bewegung (F(159,2) = 12,52, p < 0,001). Anthropomorph beschriebene Bewegungen wurden als signifikant anthropomorphere Bewegungen wahrgenommen als zoomorph (p = 0,001) und technomorph (p < 0,001) beschriebene Bewegungen. Für die Skala Kontext zeigte sich auch ein signifikanter Haupteffekt (F(159,2) = 11,75, p < 0,001). Allerdings zeigten die post-hoc-Tests, dass nur der technomorph präsentierte Kontext als signifikant weniger anthropomorph wahrgenommen wurde als der anthropomorph (p < 0,001) und zoomorph (p < 0,001) präsentierte Kontext.

Abb. 2 Fig. 2
figure 2

Mittelwerte und Standardfehler separat für die präsentierten Stimuli (technomorph, anthropomorph, zoomorph) pro Skala des RoMo‑A, Studie 1

Means and standard errors separately for the presented stimuli (technomorphic, anthropomorphic, zoomorphic) per scale of the RoMo‑A, study 1

2.4.2 Zoomorphismus: Der RoMo-Z

Die Itemreduktion und Skalenanalyse resultierten in 45 Items, die in die erste Faktorenanalyse eingingen. Auch hier zeigten der signifikante Bartlett’s Test (Χ2(990) = 6174,84, p < 0,001) und das KMO-Kriterium (KMO = 0,94) eine geeignete Passung der Stichprobe und der Daten. Die Eigenwerte ergaben eine fünf-faktorielle Lösung allerdings konnte auch hier eine vier-faktorielle Lösung durch den Screeplot und die zugrundeliegende Theorie gerechtfertigt werden. Erneut wurden durch die erste Faktorenanalyse die drei Items ausgewählt, die jeweils am stärksten auf dem jeweiligen Faktor luden. Die Ergebnisse der zweiten Analyse sind in Tab. 3 dargestellt. Der erste Faktor umfasst die Items der Dimension Aussehen und konnte 20 % der Varianz aufklären. Der zweite Faktor beinhaltet die Items der Dimension Kommunikation und konnte 18 % der Varianz aufklären. Der dritte Faktor umfasst die Items der Dimension Kontext und erklärte 16 % der Varianz. Die Items der Dimension Bewegung lagern auf dem vierten Faktor und klärten 15 % der Varianz auf. Damit konnte die Analyse 68 % der Gesamtvarianz aufklären.

Insgesamt zeigte der RoMo‑Z eine gute interne Konsistenz (α = 0,89). Auch die einzelnen Dimensionen Aussehen (α = 0,91), Bewegung (α = 0,89), Kommunikation (α = 0,79) und Kontext (α = 0,83) zeigten akzeptable bis sehr gute interne Konsistenzen.

Die Ergebnisse der einzelnen Skalen des RoMo‑Z in Bezug zu den jeweiligen Stimuli ist in Abb. 3 grafisch dargestellt. Die Analyse der Skala Aussehen zeigte einen signifikanten Haupteffekt (F(159,2) = 16,08, p < 0,001). Der zoomorpher Roboter iCat wurde als signifikant zoomorph aussehender wahrgenommen als der technomorphe Roboter Keecker (p < 0,001) und der anthropomorphe Roboter Yumi (p < 0,001). Ein ähnliches Ergebnis zeigte sich auch für die Skala Kommunikation (F(159,2) = 21,61, p < 0,001). Kommunikation, die als zoomorph beschrieben wurde, wurde auch signifikant zoomorpher wahrgenommen als technomorph (p < 0,001) oder anthropomorph (p < 0,001) beschriebene Kommunikation. Auch für die Skala Bewegung konnte ein signifikanter Haupteffekt gefunden werden (F(159,2) = 16,59, p < 0,001). Die post-hoc-Tests zeigten, dass zoomorph beschriebene Bewegungen auch signifikant zoomorpher wahrgenommen wurde als technomorph (p < 0,001) oder anthropomorph (p = 0,005) beschriebene Bewegungen. Außerdem wurden anthropomorph beschriebene Bewegungen zoomorpher wahrgenommen als technomorph (p = 0,033) beschriebene Bewegungen. Auch für die vierte Skala Kontext zeigte sich ein signifikanter Haupteffekt (F(159,2) = 37,82, p < 0,001). Wie bei allen vorherigen Skalen wurde auch der Kontext signifikant zoomorpher wahrgenommen, wenn dieser zoomorph dargestellt wurde im Vergleich zu einer technomorphen (p < 0,001) oder anthropomorphen (p < 0,001) Kontextdarstellung.

Abb. 3 Fig. 3
figure 3

Mittelwerte und Standardfehler separat für die präsentierten Stimuli (technomorph, anthropomorph, zoomorph) pro Skala des RoMo‑Z, Studie 1

Means and standard errors separately for the presented stimuli (technomorphic, anthropomorphic, zoomorphic) per scale of the RoMo‑Z, study 1

2.4.3 Technomorphismus: Der RoMo-T

Es resultierten 42 Items aus der Itemreduktion und Skalenanalyse. Die Daten verfügten über eine geeignete Passung, was der signifikante Bartlett’s Test (Χ2(861) = 3704,637, p < 0,001) und das KMO-Kriterium (KMO = 0,87) zeigten. Die Eigenwerte ergaben eine acht-faktorielle Lösung, allerdings konnte erneut eine vier-faktorielle Lösung durch den Screeplot und die zugrundeliegende Theorie gerechtfertigt werden. Auf Basis der ersten Faktorenanalyse wurden die bestgeeigneten Items ausgewählt. Die Ergebnisse der zweiten Faktorenanalyse mit den zwölf Items ist in Tab. 4 dargestellt. Die Faktorenanalyse zeigte, dass der erste Faktor (Items der Dimension Aussehen) und der vierte Faktor (Items der Dimension Bewegung) jeweils 13 % der Varianz aufklärten. Am meisten Varianz (16 %) klärte der zweite Faktor (Items der Dimension Kommunikation) auf. Der dritte Faktor umfasste die Items der Dimension Kontext und erklärte weitere 14 %. Insgesamt konnte der RoMo‑T damit 56 % der Gesamtvarianz aufklären.

Die Analyse konnte zudem eine akzeptable interne Konsistenz des Fragebogens zeigen (α = 0,79). Dies zeigte sich auch für die einzelnen Dimensionen Aussehen (α = 0,73), Bewegung (α = 0,72), Kommunikation (α = 0,82) und Kontext (α = 0,75).

Die Ergebnisse der einzelnen Skalen des RoMo‑T in Bezug zu den jeweiligen Stimuli ist in Abb. 4 grafisch dargestellt. Die Analyse der Skala Aussehen ergab einen signifikanten Haupteffekt (F(159,2) = 5,70, p = 0,004). Die post-hoc-Tests zeigten allerdings nur, dass der technomorphe Roboter signifikant technomorpher aussehend wahrgenommen wurde als der zoomorphe (p = 0,004) Roboter iCat. Darüber hinaus konnte kein signifikanter Haupteffekt für die Skala Kommunikation gefunden werden. Die Analyse der Skala Bewegung ergab hingegen einen signifikanten Haupteffekt (F(159,2) = 11,18, p < 0,001). Hier zeigten die post-hoc-Tests, dass technomorph beschriebene Bewegung signifikant technomorpher wahrgenommen wurde als zoomorph (p < 0,001) und anthropomorph (p < 0,001) beschriebene Bewegung. Die post-hoc-Tests nach dem signifikanten Haupteffekt der Skala Kontext (F(159,2) = 27,29, p < 0,001) zeigten, dass der technomorph dargestellte Kontext signifikant technomorpher wahrgenommen wurde als der zoomorph dargestellte Kontext (p < 0,001). Darüber hinaus wurde auch der anthropomorph dargestellte Kontext signifikant technomorpher wahrgenommen als der zoomorph (p < 0,001) dargestellte Kontext.

Abb. 4 Fig. 4
figure 4

Mittelwerte und Standardfehler separat für die präsentierten Stimuli (technomorph, anthropomorph, zoomorph) pro Skala des RoMo‑T, Studie 1

Means and standard errors separately for the presented stimuli (technomorphic, anthropomorphic, zoomorphic) per scale of the RoMo‑T, study 1

2.5 Diskussion

Ein Ziel der Entwicklung der RoMo-Fragebögen war es, eine Möglichkeit zur Einschätzung der Robotermorphologie in Bezug auf Anthropomorphismus (RoMo-A), Zoomorphismus (RoMo-Z) und Technomorphismus (RoMo-T) zu schaffen. Der aktuelle Forschungsstand der MRI fokussierte sich bisher stark auf Anthropomorphismus in der sozialen MRI (Duffy 2003; Roesler et al. 2021). Damit stellen die Fragebögen eine bedeutsame Erweiterung der bisherigen Messinstrumente der Robotermorphologie über Anthropomorphismus hinaus dar. Dies ist bedeutsam, da zum einen auch Zoomorphismus einen bedeutsamen Gestaltungsansatz in der sozialen MRI darstellt, besonders in der Therapie von Störungen im Autismus-Spektrum (Szymona et al. 2021) und Demenz (Kang et al. 2020). Zum anderen spielt Technomorphismus vor allem in der industriellen und servicedominierten Domäne eine bedeutende Rolle um den Werkzeugcharakter auch kollaborativer Roboter aufrecht zu erhalten (Roesler und Onnasch 2020). Die entwickelten Fragebögen, die alle akzeptable bis sehr gute interne Konsistenzen zeigten, auch auf Subskalenebene, sind daher ein nützliches Instrument in allen Bereichen der MRI.

Ein wichtiges Ziel war zudem, dass die jeweiligen Fragebögen auch eine Betrachtung der einzelnen Facetten der Morphologie hinsichtlich Aussehens, Kommunikation, Bewegung und Kontext ermöglichen. Damit schließen die resultierenden Fragebögen eine große Forschungslücke, die durch eine bisher eindimensionale Erfassung der Morphologie bestand (Bartneck et al. 2009; Ho und MacDorman 2010; Löffler et al. 2020). Diese modellbasierende Mehrdimensionalität (Onnasch und Roesler 2021) ermöglicht eine differenzierte Untersuchung, welche Merkmale der Morphologie, zu welchem Grad vorhanden sind und um im nächsten Schritt zu bestimmen, was einen positiven Einfluss auf menschliches Wahrnehmen und Verhalten hat. In bisherigen Überblicksarbeiten fehlte es an geeigneten Maßen, um innerhalb der Dimensionen Abstufungen vorzunehmen, anstelle eines nicht-quantifizierbaren Vergleichs im Sinne von mehr oder weniger Morphologiemerkmalen (Roesler et al. 2021). Damit bieten die Fragebögen einen guten Ansatzpunkt auch unterschiedliche Roboter und Studiendesigns vergleichbarer zu machen. Außerdem können die RoMo-Fragebögen und einzelnen Skalen auch in der Roboterentwicklung zum Einsatz kommen. Damit kann bereits in einer frühen Phase des Designs untersucht werden, wie unterschiedliche Designs wahrgenommen werden.

Insgesamt liegt damit der größte Vorteil der RoMo-Fragebögen im Gegensatz zu anderen etablierten Fragebögen (Bartneck et al. 2009; Ho und MacDorman 2010) in der Mehrdimensionalität. Dabei konnte die Analyse der einzelnen Skalen zeigen, dass die Fragebögen weitestgehend die jeweilige Dimension der Morphologie sensitiv abbilden. Für den RoMo‑A zeigten alle Skalen, dass jeweils die anthropomorphe Ausprägung des Aussehens, der Kommunikation, der Bewegung und des Kontexts signifikant anthropomorpher wahrgenommen wurde als die technomorphen Ausprägungen. Dies galt bis auf den Kontext auch für die zoomorphen Ausprägungen. Dies ist allerdings durch den gewählten Kontext eines Kindergartens zu erklären. Post hoc erscheint es logisch, dass soziale Kontexte wie der des Kindergartens zu einer anthropomorphen Kontexteinschätzung führen (Goetz et al. 2003; Roesler et al. 2022). Der RoMo‑Z zeigte auf allen Skalen signifikant höhere Werte der zoomorphen Stimuli im Vergleich zu anthropomorphen und technomorphen Stimuli. Während der RoMo‑A und RoMo‑Z sehr gut zwischen den Stimuli differenzieren, ergibt sich ein gemischtes Bild für den RoMo‑T. Dies kann damit zusammenhängen, dass Roboter grundlegend eher als Technologie wahrgenommen werden (Roesler et al. 2022), wofür auch die insgesamt sehr viel höheren Mittelwerte sprechen. Dennoch zeigt sich zumindest für alle Skalen deskriptiv der erwartete Effekt mit höherem wahrgenommenen Technomorphismus der jeweiligen technomorphen Stimuli. Statistisch signifikant ist dies teilweise bestätigt, wobei die Kommunikation eine Ausnahme bildet.

Zusammenfassend bieten die RoMo-Fragebögen damit eine weitestgehend sensitive Möglichkeit Anthropomorphismus, Zoomorphismus und Technomorphismus in Bezug auf Aussehen, Kommunikation, Bewegung und Kontext zu erfassen. Die Formulierung der Items erlaubt zudem nicht nur eine Anwendung auf spezifische Roboter, Aufgaben oder Interaktionen, sondern eine breite Nutzung in der MRI. Um die Faktorenstruktur zu überprüfen und die Sensitivität weiter zu untersuchen ist allerdings eine Kreuzvalidierung und ein Vergleich mit anderen etablierten Fragebögen erforderlich.

3 Online-Studie 2: Fragebogenvalidierung

Das Ziel der zweiten Studie war die Validierung der Endfassung des RoMo Fragebogen-Sets zur Messung von wahrgenommenem Anthropomorphismus, Zoomorphismus und Technomorphismus in der MRI. Um sicherzustellen, dass der aktuelle Fragebogen eine verbesserte Differenzierung ermöglicht, wurde ein Methodenvergleich mit anderen etablierten Fragebögen zur Erfassung von Anthropomorphismus in der MRI durchgeführt. Daher wurde neben den in Studie 1 entwickelten RoMo-Fragebögen auch der GΙA (Bartneck et al. 2009) und der RGΙA (Ho und MacDorman 2010) erhoben. Dieser Vergleich hatte das Ziel, die Effektivität und Genauigkeit des neuen Fragebogens im Vergleich zu früheren eindimensionalen Fragebögen zu evaluieren.

3.1 Methode

3.1.1 Stichprobe

Die Kreuzvalidierung erfolgte mit 162 Versuchspersonen, um erneut eine gleichmäßige Verteilung der Versuchspersonen auf die 81 einzelnen Stimuluskombinationen zu gewährleisten. Die Proband:innen wurden über die gleichen Kanäle wie in der ersten Studie rekrutiert, wobei keine der Versuchspersonen an der ersten Studie teilgenommen hat. Die Stichprobe setzte sich aus 46 % weiblichen, 52 % männlichen und 2 % non-binären Personen zusammen. Das durchschnittliche Alter betrug 32,6 Jahre (SD = 12,83). Von den Versuchspersonen hatten auch in dieser Stichprobe die meisten Personen keine (43) oder kaum Erfahrung (73) mit Robotern. Erneut hatte circa ein Viertel der Teilnehmer:innen ein bisschen Erfahrung (43) und nur sehr wenige viel Erfahrung (3) mit Robotern.

3.1.2 Versuchsmaterialien und -ablauf

Die Stimuli und der Ablauf der Studie wurden parallel zur ersten Online-Studie gehalten und nur um den GΙA und RGΙA direkt nach der Darbietung der final entwickelten Fragebögen erweitert. Der GΙA (Bartneck et al. 2009) und der RGΙA (Ho und MacDorman 2010) umfassen jeweils 5 semantische Differentiale. Beide Skalen wurden auf einer 5‑stufigen Skala bewertet.

3.2 Analyse

Wie in der ersten Studie wurde die Angemessenheit der Daten und der Stichprobe vor der Durchführung der Faktorenanalyse mit Hilfe des KMO-Kriteriums und Bartlett’s Tests geprüft. Danach wurden exploratorische Faktorenanalysen mit orthogonaler Rotation (Varimax) für den jeweiligen Fragebogen RoMo‑A, RoMo‑Z und RoMo‑T durchgeführt. Die Anzahl der Faktoren wurde erneut auf Basis von theoretischen Überlegungen, Screeplot und Eigenwerten festgelegt (Cattell 1966; Kaiser 1960). Die Tab. 5, 6 und 7 zeigen das Ergebnis der Faktoranalysen der einzelnen RoMo-Fragebögen mit allen Faktorladungen über 0,40 (Stevens 2012).

Tab. 5 Table 5 Items und Faktorenladungen des RoMo‑A, Studie 2Items and factor loadings of the RoMo‑A, study 2
Tab. 6 Table 6 Items und Faktorenladungen des RoMo‑Z, Studie 2Items and factor loadings of the RoMo‑Z, study 2

Im nächsten Schritt wurden, parallel zum Vorgehen der ersten Studie, einfaktorielle ANOVAs und im Falle eines signifikanten Haupteffekts Bonferroni-korrigierte post-hoc-Tests berechnet.

Exklusiv für den RoMo‑A wurden noch zusätzliche Analysen durchgeführt, um die Sensitivität des hier vorgestellten Fragebogens mit etablierten Erhebungsinstrumenten (GΙA, RGΙA) zu vergleichen. Dafür wurden auch für den GΙA und den RGΙA einfaktorielle ANOVAs berechnet. Zudem wurde untersucht, inwiefern der Gesamtscore des RoMo‑A unterschiedliche Grade von Anthropomorphismus unterscheiden kann (von keiner anthropomorphen Ausprägung bis hin zu einer anthropomorphen Ausprägung aller vier Dimensionen Aussehen, Kommunikation, Bewegung, Kontext). Dazu wurde eine lineare Regression durchgeführt, um zu untersuchen, ob der RoMo‑A mit dem Grad des Anthropomorphismus der Stimuli zusammenhängt. Dieses Vorgehen wurde zusätzlich für den GΙA und RGΙA durchgeführt.

3.3 Ergebnisse

3.3.1 Anthropomorphismus: Der RoMo-A

Die Stichprobengröße und Angemessenheit der Daten konnte durch den signifikanten Bartlett’s Test (Χ2(66) = 732,33, p < 0,001) und das als gut zu bewertende KMO-Kriterium (KMO = 0,79) bestätigt werden. Sowohl die Eigenwerte als auch die visuelle Inspektion des Screeplots ergaben vier zu extrahierende Faktoren. Die Ergebnisse der Faktorenanalyse des RoMo‑A sind in Tab. 5 dargestellt. Der erste Faktor umfasst die Items der Dimension Kommunikation und konnte 14 % der Varianz aufklären. Die anderen Faktoren leisteten mit je 15 % einen Beitrag zur Varianzaufklärung. Damit konnte der RoMo‑A insgesamt 59 % der Varianz aufklären. Die Aufteilung der Items entsprach exakt der vierfaktoriellen Struktur aus der ersten Studie. Die Gesamtskala (α = 0,82) und alle Subskalen: Aussehen (α = 0,81), Bewegung (α = 0,78), Kommunikation (α = 0,79) und Kontext (α = 0,78) zeigten eine akzeptable bis gute interne Konsistenz.

Die Analyse der einzelnen Skalen des RoMo‑A in Bezug zu den jeweiligen Stimuli ist in Abb. 5 dargestellt. Der Vergleich des unterschiedlichen Aussehens der Roboter (Yumi vs. iCat vs. Keecker) zeigte einen signifikanten Haupteffekt (F(159,2) = 18,78, p < 0,001). Die post-hoc-Tests lassen erkennen, dass der anthropomorph aussehende Roboter signifikant anthropomorpher auf der Skala Aussehen wahrgenommen wurde als der zoomorphe (p < 0,001) und der technomorphe (p < 0,001) Roboter. Überraschenderweise zeigte sich weder für den GΙA (F(159,2) = 1,03, p = 0,359) noch den RGΙA (F(159,2) = 0,97, p = 0,382) ein signifikanter Unterschied zwischen den drei Roboterbildern. Die Analyse der Skala Kommunikation zeigte einen signifikanten Haupteffekt für den Vergleich der anthropomorph, zoomorph und technomorph beschriebenen Kommunikation (F(159,2) = 39,98, p < 0,001). Die Kommunikation wurde in der anthropomorph beschriebenen Bedingung als signifikant anthropomorpher wahrgenommen als in der zoomorph (p < 0,001) und technomorph (p < 0,001) beschriebenen Bedingung. Auch in Bezug zur Kommunikation zeigten weder der GΙA (F(159,2) = 0,73, p = 0,482) noch der RGΙA (F(159,2) = 0,77, p = 0,467) einen signifikanten Haupteffekt. Für die Analyse der unterschiedlich beschriebenen Bewegungen zeigte sich für die Skala Bewegung ein signifikanter Haupteffekt (F(159,2) = 4,01, p = 0,020). Dabei zeigte sich, dass anthropomorph beschriebene Bewegungen signifikant anthropomorpher wahrgenommen wurden als technomorph beschriebene Bewegungen (p = 0,030). Wie bereits bei Aussehen und Kommunikation, konnte auch bei unterschiedlich beschriebenen Bewegungen weder ein signifikanter Haupteffekt für den GΙA (F(159,2) = 1,618, p = 0,202) noch den RGΙA (F(159,2) = 0,442, p = 0,643) gefunden werden. Die Analyse der Skala Kontext zeigte einen signifikanten Haupteffekt (F(159,2) = 8,51, p < 0,001). Wie bereits in der ersten Online-Studie wurde der technomorph charakterisierte Kontext signifikant weniger anthropomorph eingeschätzt als der anthropomorph (p = 0,001) und zoomorph (p = 0,002) beschriebene Kontext. Erneut konnten weder der GΙA (F(159,2) = 0,203, p = 0,817) noch der RGΙA (F(159,2) = 0,357, p = 0,701) einen signifikanten Unterschied zwischen den unterschiedlichen Bedingungen aufzeigen.

Abb. 5 Fig. 5
figure 5

Mittelwerte und Standardfehler separat für die präsentierten Stimuli (technomorph, anthropomorph, zoomorph) pro Skala des RoMo‑A, Studie 2

Means and standard errors separately for the presented stimuli (technomorphic, anthropomorphic, zoomorphic) per scale of the RoMo‑A, study 2

Zuletzt wurde analysiert, inwiefern die unterschiedlichen Fragebögen den Grad des Anthropomorphismus vorhersagen können. Die Analysen identifizierten den Mittelwert des RoMo‑A als Prädiktor für die Anzahl der anthropomorphen Merkmale (maximal vier Merkmale: Aussehen, Kommunikation, Bewegung, Kontext) (b = 3,60, t(160) = 2,88, p = 0,005). Der Gesamt-Mittelwert erklärt einen signifikanten Anteil der Varianz der anthropomorphen Merkmale (R2 = 0,05, F(1,160) = 8,31, p = 0,004). Weder der GΙA (b = −0,08, t(160) = −1,46, p = 0,146) noch der RGΙA (b = 0,01, t(160) = 0,23, p = 0,817) konnten die Anzahl der anthropomorphen Merkmale vorhersagen (Abb. 6).

Abb. 6 Fig. 6
figure 6

Mittelwerte und Standardfehler pro Merkmalsanzahl für den gesamt-Score des RoMo‑A, den GΙA und den RGΙA

Means and standard errors per feature number for the total score of the RoMo‑A, the GΙA and the RGΙA

3.3.2 Zoomorphismus: Der RoMo-Z

Sowohl der signifikante Bartlett’s Test (Χ2(66) = 836,43, p < 0,001) als auch das KMO- Kriterium (KMO = 0,77) bestätigen die Angemessenheit der Daten und Stichprobe. Die Eigenwerte sowie die visuelle Inspektion des Screeplots ergaben vier zu extrahierende Faktoren.

Die Faktorenanalyse des RoMo‑Z ist in Tab. 6 dargestellt. Der erste Faktor umfasst die Items der Dimension Bewegung und konnte 16 % der Varianz aufklären. Der zweite Faktor, der die Items der Dimension Aussehen beinhaltet, konnte 17 % der Varianz aufklären. Weitere 14 % der Varianz wurden vom dritten Faktor (Items der Dimension Kontext) und weitere 15 % der Varianz vom vierten Faktor (Items der Dimension Kommunikation) aufgeklärt. Alle Skalen des RoMo‑Z konnten zusammen 62 % der Varianz aufklären. Die Aufteilung der Items entsprach exakt der vierfaktoriellen Struktur aus der ersten Studie. Die Gesamtskala (α = 0,82) und alle Subskalen, Aussehen (α = 0,86), Bewegung (α = 0,79), Kommunikation (α = 0,77) und Kontext (α = 0,79), zeigten eine akzeptable bis gute interne Konsistenz.

Die Analyse der einzelnen Skalen des RoMo‑Z in Bezug zu den jeweiligen Stimuli ist in Abb. 7 dargestellt. Die Analyse ergab einen signifikanten Haupteffekt für das wahrgenommene zoomorphe Aussehen der unterschiedlichen Roboterstimuli (F(159,2) = 29,02, p < 0,001). Die post-hoc-Tests zeigten, dass der zoomorphe Roboter iCat als signifikant zoomorpher wahrgenommen wurde als der technomorphe Roboter Keecker (p < 0,001) und der anthropomorphe Roboter Yumi (p < 0,001). Auch für die Kommunikation konnte gezeigt werden (F(159,2) = 24,99, p < 0,001), dass die zoomorph beschriebene Kommunikation als signifikant zoomorpher wahrgenommen wurde als die technomorph (p < 0,001) und anthropomorph (p < 0,001) beschriebene Kommunikation. Darüber hinaus konnte auch für die wahrgenommene Bewegung ein signifikanter Haupteffekt gefunden werden (F(159,2) = 17,85, p < 0,001). Roboter, deren Bewegungen zoomorph beschrieben wurden, wurden signifikant zoomorpher wahrgenommen als Roboter mit technomorph (p < 0,001) und anthropomorph (p < 0,001) beschriebenen Bewegungen. Auch in Bezug auf den Kontext, in dem der Roboter präsentiert wurde, konnte ein Haupteffekt detektiert werden (F(159,2) = 21,24, p < 0,001). Der zoomorph dargestellte Kontext wurde als signifikant zoomorpher wahrgenommen als der technomorph (p < 0,001) und anthropomorph (p < 0,001) dargestellte Kontext.

Abb. 7 Fig. 7
figure 7

Mittelwerte und Standardfehler separat für die präsentierten Stimuli (technomorph, anthropomorph, zoomorph) pro Skalen des RoMo‑Z, Studie 2

Means and standard errors separately for the presented stimuli (technomorphic, anthropomorphic, zoomorphic) per scales of the RoMo‑Z, study 2

3.3.3 Technomorphismus: Der RoMo-T

Auch für den RoMo‑T zeigten sowohl der signifikante Bartlett’s Test (Χ2(66) = 766,10, p < 0,001) als auch das KMO-Kriterium (KMO = 0,85) die Angemessenheit der Daten und Stichprobe. Die Eigenwerte ergaben eine dreifaktorielle Struktur, allerdings konnte die visuelle Inspektion des Screeplots und die theoretische Basis auch die Extraktion von vier Faktoren rechtfertigen.

Die Faktorenanalyse des Fragebogens ist in Tab. 7 dargestellt. Der erste Faktor erklärte 15 % der Varianz, dabei luden primär die Items der Dimension Bewegung auf diesem Faktor. Überraschender Weise lud auch ein Kommunikations-Item und ein Kontext-Item mit > 0,4 auf diesem Faktor. Der zweite Faktor umfasste weitestgehend die Items der Dimension Kontext und erklärte 13 % der Varianz. Eines der Kontext-Items lud allerdings mit 0,38 schwächer als erwartet auf dem Faktor.

Tab. 7 Table 7 Items und Faktorenladungen des RoMo‑T, Studie 2Items and factor loadings of the RoMo‑T, study 2

Der dritte Faktor umfasste eindeutig die Items der Skala Aussehen und erklärte 17 % der Varianz. Der letzte Faktor erklärte 11 % der Varianz und bildete alle Items der Dimension Kommunikation ab. Die Aufteilung der Items entsprach damit nicht exakt der vierfaktoriellen Struktur aus der ersten Studie. Die Gesamtskala (α = 0,87) und alle Subskalen: Aussehen (α = 0,83), Bewegung (α = 0,72), Kommunikation (α = 0,72) und Kontext (α = 0,75) zeigten eine akzeptable bis gute interne Konsistenz.

Die Analyse der Sensitivität der einzelnen Skalen für unterschiedlich technomorphe Stimuli ist in Abb. 8 dargestellt. Die Analyse der Skala Aussehen ergab einen signifikanten Haupteffekt (F(159,2) = 22,13, p < 0,001). Im Detail konnte durch die post-hoc-Tests gezeigt werden, dass der technomorphe Roboter Keecker als technomorpher wahrgenommen wurde, als der zoomorphe Roboter iCat (p < 0,001) und der anthropomorphe Roboter Yumi (p = 0,007). Zudem wurde Yumi als signifikant technomorpher aussehend wahrgenommen als iCat (p = 0,001). Die Analyse der Skala Kommunikation zeigte keinen signifikanten Unterschied zwischen den unterschiedlichen Kommunikationsbeschreibungen (F(159,2) = 1,38, p = 0,255). Die Analyse der Skala Bewegung (F(159,2) = 5,53, p = 0,005) zeigte wiederum, dass technomorph beschriebene Bewegungen als signifikant technomorpher wahrgenommen wurden, als zoomorph beschriebene Bewegungen (p = 0,005). Zuletzt zeigte sich auch für die Skala Kontext ein signifikanter Haupteffekt (F(159,2) = 12,29, p < 0,001). Der technomorph charakterisierte Kontext wurde als signifikant technomorpher wahrgenommen als der zoomorph (p < 0,001) und anthropomorph (p = 0,012) charakterisierte Kontext.

Abb. 8 Fig. 8
figure 8

Mittelwerte und Standardfehler separat für die präsentierten Stimuli (technomorph, anthropomorph, zoomorph) pro Skalen des RoMo‑T, Studie 2

Means and standard errors separately for the presented stimuli (technomorphic, anthropomorphic, zoomorphic) per scales of the RoMo‑T, study 2

4 Diskussion und Schlussfolgerungen

Auf Basis der MRI-Taxonomie von Onnasch und Roesler (2021) wurde ein Set an multidimensionalen Fragebögen zur Erfassung des wahrgenommenen Anthropomorphismus, Zoomorphismus und Technomorphismus entwickelt. Die theoriegeleitete Entwicklung und empirische Validierung resultierten in einer ökonomischen, flexiblen und sensitiven Alternative zu bereits existierenden Verfahren zur Erfassung des wahrgenommenen Anthropomorphismus in robotischen Designs, sowie der Möglichkeit zur gesonderten Erfassung von Zoomorphismus und Technomorphismus (Bartneck et al. 2009; Ho und MacDorman 2010). Ökonomisch sind die RoMo-Fragebögen sowohl bei der Erfassung eines Gesamteindrucks einer Morphologie via 12 Items wie auch insbesondere bei der Erfassung von einzelnen Dimensionen der Robotermorphologie mit nur drei Items. Die Nutzungsmöglichkeiten einzelner Dimensionen machen den Fragebogen zudem flexibel einsetzbar für unterschiedlichste Fragestellungen in Forschung und Praxis. Der größte Vorteil zeigt sich in der Sensitivität der Skalen, die verwendeten Stimuli zu differenzieren.

Die Skalen des RoMo‑A konnten in der ersten und zweiten Studie alle anthropomorphen Merkmale signifikant von technomorphen Merkmalen unterscheiden. Es zeigte sich auch weitgehend eine Differenzierung von anthropomorphen und zoomorphen Merkmalen. Eine Ausnahme bildete in beiden Studien der Vergleich des anthropomorphen und zoomorphen Kontexts. Hier zeigten sich keine signifikanten Unterschiede. Dies kann damit zusammenhängen, dass das Setting des Kindergartens durch den klaren Bezug zur sozialen Domäne ebenfalls als stark anthropomorph wahrgenommen wurde. Da weder der GΙA (Bartneck et al. 2009) noch der RGΙA (Ho und MacDorman 2010) die unterschiedlichen Stimuli differenzierten, kann der entwickelte RoMo‑A als geeignete Alternative genutzt werden, um besonders feine Unterschiede zu detektieren. Die Schlussfolgerung, dass der neue Fragebogen sensitiver als die bisher genutzten Fragebögen ist, konnte zudem durch den signifikanten Zusammenhang der Anzahl der implementierten anthropomorphen Merkmale mit dem Gesamt-Mittelwert des multidimensionalen RoMo‑A illustriert werden. Weder der RΙA (Bartneck et al. 2009) noch der RGΙA (Ho und MacDorman 2010) waren in diesem Fall prädiktiv, da sich für beide etablierten Fragebögen keine signifikanten Zusammenhänge mit der Anzahl der anthropomorphen Merkmale ergaben.

In beiden Studien konnten die Skalen des RoMo‑Z alle zoomorphen Merkmale signifikant von technomorphen und anthropomorphen Merkmalen unterscheiden. Dadurch schließt der Fragebogen eine bestehende Forschungslücke, da die Bewertung zoomorpher Gestaltung trotz ihres häufigen Vorkommens in der sozialen MRI bisher kaum Beachtung fand. Zudem gewinnt Zoomorphismus auch im Servicebereich zunehmend an Bedeutung, wie die Beispiele von Lio, dem Roboterschwan für Pflegeeinrichtungen (Mišeikis et al. 2020) oder BellaBot, der Roboterkatze für die Gastronomie (van Doorn et al. 2023), verdeutlichen. Der RoMo‑Z kann somit in unterschiedlichsten Domänen zum Einsatz kommen.

Die Skalen des RoMo‑T zeigten nur teilweise eine signifikante Differenzierung der Stimuli. Außerdem zeigten sich insgesamt sehr viel höhere Mittelwerte als in den anderen Fragebögen. Beides könnte ein Indiz dafür sein, dass Roboter an sich stets primär als technomorph wahrgenommen werden (Roesler et al. 2022). Ähnlich wie in vorherigen Fragebögen (Bartneck et al. 2009; Ho und MacDorman 2010; Löffler et al. 2020) würden wir daher dafür argumentieren, geringe Ausprägungen des RoMo‑A und RoMo‑Z als höheren Technomorphismus zu interpretieren. Der RoMo‑T bietet damit keinen expliziten Mehrwert, der über die anderen beiden Fragebögen hinaus geht.

Natürlich sind die hier präsentierten Studien nicht frei von Limitationen. Eine bedeutsame Limitation, die in zukünftiger Forschung adressiert werden sollte, ist die studentische Stichprobe. In Anbetracht der Tatsache, dass sowohl ältere Menschen als auch Kinder spezifische Gruppen sind, die in der sozialen MRI untersucht werden, sollten sie als wichtiger Teil der Zielgruppe betrachtet werden. Darüber hinaus sollten zukünftige Untersuchungen auch andere formale Bildungs- und Berufshintergründe einbeziehen, wie über eine studentische Stichprobe hinaus gehen. Dementsprechend wird vorgeschlagen, den Fragebogen mit unterschiedlichen Stichproben zu validieren.

Die größte Einschränkung besteht jedoch darin, dass die Entwicklung ausschließlich auf speziellen Bildern und Texten basierte. In einem ersten Schritt sollte die Validität auch für andere Vignetten mit insbesondere Robotern die stärker in Ihrem Aussehen variieren und anderen Umgebungsbildern der jeweiligen Kontexte validiert werden.

Dennoch lässt sich zusammenfassend festhalten, dass der RoMo‑A und der RoMo‑Z sinnvolle Instrumente für die MRI-Forschung und die Entwicklung von Robotern darstellen. Da die Formulierungen der Items nicht auf bestimmte Roboter oder Einsatzgebiete abzielten, können die Fragebögen domänenübergreifend für eine Vielzahl von Robotern eingesetzt werden. Darüber hinaus können die einzelnen Skalen flexibel ausgewählt werden, um eine optimale Anpassung an die Forschungsfrage und das Entwicklungsziel zu gewährleisten. Die RoMo-Fragebögen leisten damit einen vielversprechenden Beitrag für zukünftige Forschung, um die Gestaltungsmerkmale und daraus folgende Wirkungen in der MRI zu untersuchen. Dies ist besonders wegen der domänenübergreifenden Zunahme von direkter Zusammenarbeit von Menschen und Robotern von zentraler Bedeutung.