1 Hypothesen

Wenn Lehrpersonen eine Kompetenzerwartung an Lernende ausgebildet haben, wird diese über das Verhalten der Lehrpersonen an die Lernenden vermittelt (vgl. Brophy & Good, 1976; Nickel, 1985; Tauber, 1997). Schon Rosenthal und Jacobson (1971) argumentierten, dass sich Lehrkräfte, die eine*einen intellectual bloomer (schnellentwickelndes Kind) erwarteten, diesem Kind freundlicher und unterstützender begegneten. Diese Annahmen konnten meta-analytisch von Harris und Rosenthal (1985; Rosenthal, 1994; vgl. Ludwig, 2018) bestätigt werden, indem sie vier Faktoren als bedeutsam für die Vermittlung von Erwartungen ausmachten: die Atmosphäre (climate), das Feedback, den Input der Lehrpersonen und die Output-Möglichkeiten (s. Kapitel 6).

Es gibt nur wenige Befunde zur Mediation der Lernendenkompetenzerwartungen an Lehrpersonen (s. Kapitel 11): Jamieson et al. (1987) konnten ausmachen, dass sich Schüler*innen adäquater und weniger störend verhielten, wenn sie eine kompetente und motivierte Lehrperson erwarteten. Die Proband*innen in der Galatea-Bedingung in der ersten Studie von Feldman und Prohaska (1979) zeigten (marginal signifikant) ein zugewandteres Verhalten (immediacy; d = 0.342). Unter den von ihnen betrachteten Variablen waren für diesen Trend das Vorbeugen (d = 0.974) und der Blickkontakt (d = 0.512) verantwortlich, während die räumliche Nähe (d = 0.187) und die seitliche Orientierung (d = −0.342) kaum eine Rolle spielten. Ähnliches Verhalten in Abhängigkeit der Kompetenzerwartung konnte auch bei Lehrpersonen gefunden werden (Chaikin et al., 1974; vgl. Harris & Rosenthal, 1985).

Es ergibt sich also die Hypothese, dass sich Lernende mit hohen Kompetenzerwartungen (Galatea-Effekt) an Lehrpersonen im nonverbalen Verhalten von Lernenden mit geringen Kompetenzerwartungen an Lehrpersonen (Golem-Effekt) unterscheiden. Die bisherigen Befunde verweisen zwar auf ein zugewandteres Verhalten, wenn eine kompetente Person erwartet wird, aber die Studienergebnisse für das Lernendenverhalten sind rar und über 30 Jahre alt (Feldman & Prohaska, 1979; Jamieson et al., 1987), weswegen keine gerichteten Annahmen getroffen werden. Aus den genannten Befunden und Ableitungen ergeben sich folgende Hypothesen:

Hypothesenkomplex::

Lernende, die eine kompetente Lehrperson erwarten, verhalten sich hinsichtlich (1.) des Blickkontakts, (2.) des Vorbeugens, (3.) des Abstützens des Kopfes auf dem Arm, (4.) des Verschränkens der Arme, (5.) des Lächelns, (6.) des Stirnrunzelns, (7.) des Nickens und (8.) des Kopfschüttelns anders als Lernende, die eine inkompetente Lehrperson erwarten.

Die Auswahl des relevanten nonverbalen Verhaltens basiert auf den Variablen, die Feldman und Prohaska (1979) untersuchten. Außerdem wurden ergänzende Verhaltensweisen betrachtet, um mehr Informationen zum Verhalten zu erhalten. So wurden das Abstützen des Kopfes auf dem Arm sowie das Verschränken der Arme als Gesten der Entspannung nach Mehrabian (1969) herangezogen sowie Nicken und Lächeln als Gesichtsausdruck (Chaikin et al., 1974; vgl. Mehrabian, 1969). Nach Mehrabian (1969) ist die Zugewandtheit (immediacy) ein Set von Verhaltensweisen (u. a. Berührung, Abstand, Vorbeugen, Blickkontakt), das Sympathie für andere widerspiegelt, wenn die Person nicht angespannt ist. Die Entspanntheit (relaxation) ist das zweite Set von Verhaltensweisen (u. a. asymmetrische Arm- und Beinhaltung, seitliches Abstützen), das Mehrabian (1969) beschreibt, und mit Status assoziiert: Je höher die Entspanntheit ist, desto höher ist der Status im Vergleich zu der*dem Interaktionspartner*in. Darüber hinaus wird, so Mehrabian (1969), die Einstellung zueinander in Interaktionen auch über Gesichtsausdrücke (u. a. Lächeln, Stirnrunzeln, Nicken, Kopfschütteln) kommuniziert.

Zudem soll überprüft werden, ob sich in Abhängigkeit von den Kompetenzerwartungen ein Lernzuwachs ergibt. Die Ergebnisse zum Lern- und Leistungserfolg bzw. Wissenszuwachs in Abhängigkeit der Lernendenkompetenzerwartungen an Lehrpersonen sind uneindeutig: Die meisten Studien berichteten einen Lernvorteil (u. a. bei Adediwura & Tayo, 2007; Edwards et al., 2009; Jamieson et al., 1987; Reber et al., 2017), andere keinen (u. a. Lewandowski et al., 2012; Towler & Dipboye, 2006) und ein paar Studien konnten teilweise einen Lernerfolg ausmachen, z. B. bei bestimmten Tests (privacy lesson; Feldman & Prohaska, 1979) und in bestimmten Bedingungen (bei schlechten Vorträgen; Leventhal et al., 1977).

Hypothese 9::

Lernende, die eine kompetente Lehrperson erwarten, erzielen ein besseres Ergebnis in einem Wissenstest als Lernende, die eine inkompetente Lehrperson erwarten.

Da in der Studie mit Videomaterial gearbeitet wurde (s. u.), wird die Attraktivitätsbeurteilung aufgrund des „beauty is good“ stereotype (Dion et al., 1972; Eagly et al., 1991; Langlois et al., 2000) als Kontrollvariable herangezogen sowie auf Grundlage des stereotype content model (s. Kapitel 5) für die Wärmebeurteilung kontrolliert. Aufgrund der Zusammenhänge zwischen der Kompetenz-, Wärme- und Attraktivitätsbeurteilung könnte in der bivariaten Überprüfung die Wirkung der Kompetenzmanipulation (s. u.) überschätzt werden: So zeigte sich u. a. in Studie 1, die die Wahrnehmung von Lehrkräften mithilfe von Fallvignetten mit Porträts überprüfte, dass weibliche Lehrkräfte kompetenter beurteilt wurden (d = 0.586). Unter Kontrolle der Wärme- und Attraktivitätsbeurteilung war der Effekt jedoch kleiner (ηp2 = .057 entspricht d = 0.492). Zudem soll in multivariaten Analysen ein Interaktionseffekt zwischen Lernendenkompetenzerwartungen und dem Geschlecht einer Lehrperson auf das nonverbale Verhalten der Lernenden und einen Wissenstest explorativ überprüft werden.

2 Methodik

2.1 Stichprobe

An der Untersuchung nahmen insgesamt 71 Personen teil, von denen acht ausgeschlossen wurden, weil sie an der Cover-Story (s. u.) zweifelten, und eine weitere, weil diese Person große Schwierigkeiten mit der deutschen Sprache aufwies. Somit ergab sich eine Stichprobe von 62 Proband*innen. Davon waren 50 weiblich und zwölf männlich. Das Durchschnittsalter betrug 24.8 Jahre (SD = 8.94; Spannweite: 18–53). Der Großteil der Teilnehmenden studierte (n = 53, davon 36 Psychologie und 9 Lehramt), neun Personen studierten nicht (mehr).

2.2 Vorgehen

Die experimentelle Laboruntersuchung erfolgte im Zeitraum vom 10.11.2016 bis zum 06.03.2017. Die Proband*innen wurden über Lehrveranstaltungen der Technischen Universität Braunschweig, E-Mail-Verteiler für Psychologie-Studierende der Technischen Universität Braunschweig, über das elektronische Schwarze Brett der Technischen Universität Braunschweig, über Aushänge in Supermärkten und über einen Sportverein akquiriert. Bei der Akquise wurde die Cover-Story verwendet, es handle sich um eine Überprüfung einer skandinavischen Lehrkräfte-Supervisionsmethode in Deutschland. Die Proband*innen erhielten entweder 5 € Aufwandsentschädigung, die Möglichkeit, an einer Gutscheinverlosung im Wert von 20 € teilzunehmen, oder eine Versuchspersonenstunde im Rahmen des Psychologie-Studiums.

Es wurden pro Durchgang bis zu vier Personen eingeladen, die zeitgleich im selben Raum teilnehmen konnten (Experimentalraum s. Abbildung 15.1). Durchschnittlich waren 1.82 Proband*innen (SD = 1.02) in insgesamt 39 Durchgängen präsent. Durchgeführt wurden alle Durchgänge der Untersuchung vom gleichen Experimentator (Autor der Arbeit), der nicht blind gegenüber den Versuchsbedingungen war. Der Experimentator orientierte sich dabei an einem Leitfaden.

Abbildung. 15.1
figure 1

Labor und Versuchsaufbau (Studie 3)

Zu Beginn der Untersuchung wurde erneut die Cover-Story aufgegriffen und erklärt, dass die skandinavischen Länder in internationalen Schulvergleichsstudien sehr gut abschneiden würden, dort Supervisionen für Lehrkräfte stattfänden und dass das Ziel des Projekts die Überprüfung einer bestimmten skandinavischen Supervisionsmethode für Deutschland sei. Danach wurde auf die Freiwilligkeit, die (relative) Anonymität und den Datenschutz hingewiesen.

Anschließend erfolgte eine kurze Agenda für das Vorgehen. Dabei wurde behauptet, dass es zwei Teile gebe. Zum ersten Teil wurde gesagt, dass die Lehrkraft einen Vortrag halten wird, der via Live-Stream in den Raum übertragen wird. Weitergehend wurde behauptet, dass die Lehrkraft die Teilnehmenden sehen wird, wofür drei Kameras aus unterschiedlichen Winkeln aufgebaut wurden (links, rechts und unter dem Monitor; s. Abbildung. 15.1). Die Kameras, die das nonverbale Verhalten der Teilnehmenden erfassten, mussten gemäß der Cover-Story aus technischen Gründen Videos abspeichern, weswegen eine Einverständniserklärung der Proband*innen eingeholt wurde. Nach dem Einholen der Einverständniserklärung erhielten die Proband*innen ein vermeintliches Zeugnis (Examenszeugnis und ein Arbeitszeugnis) der Lehrkraft (mit den Fächern Deutsch und Biologie). Über das Zeugnis wurde die Kompetenzerwartung manipuliert: Entweder erhielten die Teilnehmenden ein sehr gutes Zeugnis (mit einer Examensnote von 1.3 und einem guten Arbeitszeugnis; Galatea-Bedingung) oder ein befriedigendes Zeugnis (mit einer Examensnote von 3.3 und einem mäßigen Arbeitszeugnis; Golem-Bedingung; Zeugnisse s. Zusatzmaterial). Während des Lesens wurden die Kameras eingeschaltet. Nahm nur eine einzelne Person an einem Durchgang teil, wurden anstatt der drei möglichen nur zwei Kameras eingeschaltet.

Nach dem Lesen der Zeugnisse wurde der Vortrag der Lehrkraft angekündigt. Der Experimentator bat die Proband*innen, während des Vortrags nicht miteinander zu sprechen, und kündigte an, der Lehrkraft das Zeichen für den Start zu geben. Anschließend ging der Experimentator aus dem Raum, öffnete eine Tür in der Nähe und sagte, dass die Lehrkraft anfangen könne. Nach etwa 10–30 Sekunden Wartezeit startete der Experimentator von außen ein Video im Raum, in dem die Proband*innen saßen, das über einen Laptop auf einem Monitor abgespielt wurde. Die Teilnehmenden saßen in einem Abstand zwischen 2.50 bis 3.50 Meter Entfernung zum Monitor und der Experimentator war während des Vortrags nicht im Raum.

Es wurde eines von zwei unterschiedlichen Videos mit einer vermeintlichen Lehrkraft gezeigt. Untersuchungen zur Lehr-Lern-Interaktion mit Videos sind weitverbreitet (u. a. Edwards et al., 2009; Haefele, 1988; Lewandowski et al., 2012; Perry et al., 1979; Reavis, 1979; Towler & Dipboye, 2006). Die beiden Videos unterschieden sich inhaltlich nicht, in beiden ging es um das Thema Nägelkauen (Vortragstext in Anlehnung an Williams et al., 2006; s. Zusatzmaterial). Das Thema Nägelkauen wurde gewählt, weil davon ausgegangen wurde, dass hierzu wenig Vorwissen besteht. Die Videos unterschieden sich im Geschlecht der dargestellten Lehrkraft: Entweder wurde eine weibliche Lehrkraft gezeigt oder eine männliche (s. Abbildung 15.2). Dabei wurden beide Versionen von der gleichen Darstellerin eingesprochen, um persönliche Eigenschaften (z. B. Vortragsstil) konstant zu haltenFootnote 1.

Abbildung 15.2
figure 2

Konföderierte in der weiblichen (links) und der männlichen (rechts) Bedingung (Studie 3)

Das Video der weiblichen Lehrkraft-Bedingung dauerte 27:09 Minuten und das der männlichen Bedingung 25:56 Minuten. Die Videos wurden mit einer Panasonic-Kamera (HDC-SD 800) aufgenommen und mit Shotcut 16 bearbeitet (Farb- und Helligkeitskorrekturen; Weichzeichnung; 36 Bilder/Sekunde) sowie geschnitten (Porträt, etwa Zwerchfell aufwärts; Auflösung von 1200 × 900 Pixel). Außerdem wurde die Stimmhöhe mit Audacity 2.1 jeweils in einen „androgynen“ Bereich verschoben. Dafür wurde ein circa einmütiger Ausschnitt der Audiospur zu Beginn der beiden Vortragsversionen bearbeitet, schrittweise in Seminaren des Instituts für Pädagogische Psychologie der Technischen Universität Braunschweig überprüft und so lange weiterbearbeitet, bis eine ungefähre Gleichverteilung des geschätzten Lehrkraft-Geschlechts erzielt wurde (insgesamt wurden acht Seminare besucht mit 137 teilnehmenden Studierenden). Dadurch wurde die Tonhöhe der männlichen Version um 3.0 Halbtöne reduziert (Bewertung im letzten besuchten Seminar: 39 % (n = 7) für weiblich, 61 % (n = 11) für männlich) und die der weiblichen Version um 3.2 Halbtöne (Bewertung im letzten besuchten Seminar: 42 % (n = 8) für weiblich, 58 % (n = 11) für männlich). Dies zeigt, dass die Darstellerin in der männlichen Version bereits tiefer sprach. Zusätzlich wurden der Pegel und die Lautstärke angepasst.

Nach Ende des Vortrags ging der Experimentator wieder in den Raum und teilte einen Fragebogen aus. Dieser beinhaltete die Einschätzung der vermeintlichen Lehrkraft, einen Wissenstest und Fragen zu soziodemografischen Daten. Danach wurden die Proband*innen über das Untersuchungsanliegen in vollem Umfang aufgeklärt und sie wurden gebeten, die genaue Fragestellung bis zum Ende der Untersuchung geheim zu halten. Außerdem wurden die Proband*innen gefragt, ob sie die Cover-Story glaubten, ob die aufgenommenen Videos von ihnen zum eigentlichen Zweck genutzt werden dürfen, und in der männlichen Bedingung, ob Zweifel am Geschlecht der Lehrkraft (erst offen, dann geschlossen) bestanden. Starke Zweifel an der Cover-Story äußerten acht Proband*innen und keine der teilnehmenden Personen zweifelte am Geschlecht der Lehrkraft in der männlichen Bedingung. Alle Proband*innen waren einverstanden, dass die Videos von ihnen im Rahmen der vorliegenden Arbeit genutzt werden dürfen.

Insgesamt handelte es sich also um ein 2 × 2-Design, bei dem einerseits die Kompetenzerwartungen über die Zeugnisse manipuliert wurden sowie andererseits das Geschlecht der Lehrkraft systematisch variierte. Zu Beginn der Untersuchung wurden die Bedingungen zufällig per Los bestimmt, im weiteren Verlauf wurde vermehrt auf eine gleiche Zellbesetzung Wert gelegt. Die Daten wurden mittels IBM SPSS Statistics 25 ausgewertet.

2.3 Instrumente und Variablen

Als abhängige Variablen wurden das nonverbale Verhalten der Proband*innen und das Wissen über Inhalte des Vortrags erfasst. Die Beurteilung der Kompetenz wurde als Manipulationsüberprüfung erfragt und zusätzlich wurden die Beurteilung der Wärme im Sinne des stereotype content model sowie die Beurteilung der Attraktivität aufgrund des „beauty is good“ stereotype als Kontrollvariablen für multivariate Analysen herangezogen (Fragebogen s. Zusatzmaterial).

Kompetenzbeurteilung: Die Einschätzung der Kompetenz wurde mittels der vier Adjektive der ersten und zweiten Studie (kompetent, effizient, fähig, intelligent) auf einer siebenstufigen Likert-Skala (1 =  „stimme gar nicht zu“ bis 7 = „stimme vollkommen zu“) erfasst. Die Reliabilität (Cronbachs Alpha) war mit α = .803 zufriedenstellend.

Wärmebeurteilung: Die Einschätzung der Wärme wurde mit vier Adjektiven der ersten beiden Studien (warmherzig, gutmütig, wohlwollend, sympathisch) in der gleichen Liste wie die Kompetenzbeurteilung mit einer siebenstufigen Likert-Skala erfasst. Es konnte für die Wärmebeurteilung eine gute interne Konsistenz mit einem Cronbachs Alpha von α = .796 erzielt werden.

Attraktivitätsbeurteilung: Die Einschätzung der Attraktivität wurde wie in der ersten Studie mit folgendem Item auf einer siebenstufigen Likert-Skala (1 = „sehr unattraktiv“ bis 7 = „sehr attraktiv“) erhoben: „Wie optisch attraktiv empfinden Sie die Lehrkraft?“

Auf Grundlage der Ergebnisse der Studie 1 und 2 sowie aufgrund der kleinen Stichprobengröße (N = 62) wurde auf faktoranalytische Überprüfungen verzichtet. Die internen Konsistenzen werden als ein Indiz für eine angemessene Passung betrachtet.

Nonverbales Verhalten: Aspekte des nonverbalen Verhaltens wurden auf Basis von Mehrabian (1969) und bereits existierender Studien (Chaikin et al., 1974; Feldman & Prohaska, 1979; Ho & Mitchell, 1982) ausgewählt: Vorgebeugt sein (Zeit), gerade sitzend (Zeit), zurückgelehnt sitzend (Zeit), Kopf auf dem Arm abgestützt (Zeit), Arme verschränkt (Zeit), Blickkontakt zum Monitor (Zeit), Weggucken (Häufigkeit), Lächeln (Zeit und Häufigkeit), Stirnrunzeln (Zeit und Häufigkeit), Kopfnicken (Zeit und Häufigkeit) und Kopfschütteln (Zeit und Häufigkeit; Manual s. Zusatzmaterial). Von den Videos wurden jeweils 164.4 Sekunden lange Ausschnitte kurz vor dem Ende des Vortrags (weibliche Bedingung: ab 26:57 Minuten; männliche Bedingung: ab 25:41 Minuten) ausgewählt, in denen in der männlichen und weiblichen Lehrkraft-Bedingung der gleiche Inhalt präsentiert wurde. Das Ende wurde herangezogen, weil davon ausgegangen wurde, dass sich zu diesem Zeitpunkt die Proband*innen an die Situation (z. B. die Kameras) gewöhnt hatten. Außerdem zeigte sich in der Studie von Herrell (1971), dass nur zum Ende Unterschiede bezüglich der (Wärmeerwartungs-)Manipulation beobachtbar waren. Die Videoausschnitte wurden dabei ohne Ton und mit 25 Bildern/Sekunde gespeichert. Die Bearbeitung und das Schneiden der Videos erfolgten mit Shotcut 16.

Das nonverbale Verhalten wurde in einem ersten Schritt von zwei trainierten Auswerterinnen, die blind gegenüber der Fragestellung waren, beurteilt. Dafür wurde das Programm Avidemux 2.6 verwendet. Im Gegensatz zu Shotcut ist Avidemux ressourcenschonender und einfacher in der Anwendung für die Auswertung. Aufgrund des Formats von 25 Bildern/Sekunde entsprach die Zeit von einem Bild zum nächsten 0.04 Sekunden. Im Anschluss daran wurden die Übereinstimmungen mittels Korrelationen und in Anlehnung an die Bland–Altman-Methode (Differenz der Mittelwerte darf nicht signifikant von null verschieden sein; vgl. Grouven et al., 2007) berechnet. Dabei zeichnete sich ab, dass einige Variablen kaum übereinstimmend beurteilt wurden (gerade sitzend, zurückgelehnt sitzend, Lächeln, Stirnrunzeln) und andere Verhaltensweisen kaum auftraten (Kopfnicken, Kopfschütteln), die dann von der weiteren Betrachtung ausgeschlossen wurden. Danach wurden in moderierten Gesprächen größere Abweichungen in den Auswertungen (Zeit: über 5 Sekunden; Häufigkeit: über 1 Mal) der übrigen Variablen diskutiert und ggf. angepasst. Am Ende konnten fünf Variablen mit hoher Übereinstimmung herangezogen werden: Vorgebeugt sein (Zeit), Kopf auf dem Arm abgestützt (Zeit), Arme verschränkt (Zeit), Blickkontakt (Zeit) und Weggucken (Häufigkeit; s. Zusatzmaterial, inkl. Interraterreliabilität). Als Werte für das Verhalten wurden die Mittelwerte der beiden Auswerterinnen herangezogen.

Wissen: Das Wissen wurde mit zehn Fragen im Single Choice-Format erfasst. Von diesen zehn Fragen wurden zwei ausgeschlossen, da diese nicht exakt über den Vortrag beantwortbar waren bzw. nicht eindeutig formuliert wurden und ein weiteres Item aufgrund einer psychometrisch zu hohen Itemschwierigkeit (von mehr als 95 % richtig beantwortet; Kelava & Moosbrugger, 2020; Itemanalyse s. Zusatzmaterial). Somit war ein Testergebnis von 0 bis 7 möglich. Die Items hingen jedoch nicht bedeutsam untereinander zusammen (maximales |r| = .228, p = .075; Cronbachs Alpha: α = .244).

Weitere Variablen: Zusätzlich zu den zentralen Variablen wurden soziodemografische Daten erfasst. Außerdem wurden die Uhrzeit des geplanten Beginns des Untersuchungsdurchgangs und bisheriges eigenes Nägelkauen zur Kontrolle erfasst. Die Uhrzeit wurde berücksichtigt, weil sie (bzw. der zirkadiane Rhythmus) die kognitive Leistung und Konzentration beeinflussen kann (u. a. Blatter & Cajochen, 2007). Da das Untersuchungsmaterial das Thema Nägelkauen aufgriff, wurde außerdem das Nägelkauen der Proband*innen erfragt.

Tabelle 15.1 Kennwerte der Variablen (Studie 3)
Tabelle 15.2 Mittelwerte, Standardabweichungen und Normalverteilungsüberprüfungen der Skalen getrennt nach Gruppen (Studie 3)

3 Ergebnisse

Die Kennwerte der Variablen sind in Tabelle 15.1, die Kennwerte nach Gruppen in Tabelle 15.2 sowie die Korrelationen in der Tabelle 15.3 aufgelistet (Itemanalysen s. Zusatzmaterial). Da kaum Normalverteilungen vorlagen (Shapiro–Wilk-Test) und die Quantil-Quantil-Diagramme auffällig waren, wurde der Schwerpunkt der Auswertung auf robuste und nicht-parametrische Berechnungen gelegt.

Tabelle 15.3 Korrelationen der Variablen (Studie 3)

Für die bivariaten Analysen wurden Mann–Whitney-U-Tests herangezogen, da wenig Proband*innen teilnahmen und die Variablen häufig nicht normalverteilt sind (s. Tabelle 15.2). Die Ergebnisse der Mann–Whitney-U-Tests sind in Tabelle 15.4 dargestellt. Es gab signifikante Unterschiede in den Bedingungen der Kompetenzmanipulation beim Blickkontakt, sowohl Dauer (U = 339.0, p = .047; d = 0.521; 1−β = .504; AdjustierungFootnote 2: p = .047) als auch Häufigkeit des Wegguckens (U = 321.0, p = .025; d = 0.594; 1−β = .612; Adjustierung: p = .047). D. h., Teilnehmende in der Bedingung mit hohen Kompetenzerwartungen zeigten weniger Blickkontakt zum Monitor. Ein marginal signifikanter Effekt ergab sich beim Abstützen des Kopfes (U = 358.5, p = .059; d = 0.495; 1−β = .464), wobei Proband*innen in der Galatea-Bedingung weniger lang den Kopf abstützten. Die Kompetenzmanipulation hatte keinen signifikanten Effekt auf die anderen Variablen des nonverbalen Verhaltens oder auf das Ergebnis im Wissenstest. Damit kann nur die Hypothese für den Blickkontakt angenommen werden.

Tabelle 15.4 Ergebnisse der Mann–Whitney-U-Tests für das nonverbale Verhalten und den Wissenstest in Abhängigkeit der Kompetenzmanipulation (Studie 3)
Tabelle 15.5 Ergebnisse der linearen Regressionsanalysen (Studie 3)
Tabelle 15.6 Ergebnisse der binär logistischen Regressionsanalysen (Studie 3)

Zur Überprüfung der Hypothesen unter Berücksichtigung von Kontrollvariablen wurden robuste Regressionsanalysen mit Bootstrap (vgl. Urban & Mayerl, 2018) berechnet. Aufgrund der Verteilung der Variablen Vorgebeugt sein (von 11 Personen gezeigt), Kopf abgestützt (von 27 Personen gezeigt) und Arme verschränkt (von 16 Personen gezeigt) wurden für diese binär logistische Regressionsanalysen berechnet (Verhalten wurde gezeigt oder nicht gezeigt). Anzumerken ist, dass für diese logistischen Regressionsanalysen die geforderte Fallanzahl von mindestens 25 je Gruppe (aufseiten der abhängigen Variablen; vgl. Backhaus et al., 2016) unterschritten wurde. Für die Dauer des Blickkontakts, die Häufigkeit des Wegguckens und das Ergebnis im Wissenstest wurden lineare Regressionen mit Bootstrap berechnet. In allen Regressionsanalysen waren die Kompetenzmanipulation und das Geschlecht der Lehrkraft sowie deren Interaktion die Regressoren. Die Attraktivitäts- („beauty is good“ stereotype) und Wärmebeurteilung (stereotype content model) sowie die Uhrzeit (aufgrund des zirkadianen Rhythmus; u. a. Blatter & Cajochen, 2007) wurden als Kontrollvariablen berücksichtigt.

Es zeigten sich signifikante Korrelationen zwischen dem Alter (rS = .308, p = .016) und dem Geschlecht der Proband*innen (rS = −.343, p = .006) mit der Kompetenzmanipulation, sodass die älteren häufiger in der Galatea-Bedingung waren und die weiblichen Teilnehmenden häufiger in der Golem-Bedingung. In den Korrelationsanalysen zeigte sich auch, dass das Alter und das Geschlecht der Proband*innen zusammenhingen (rS = −.375, p = .003), dass also die teilnehmenden Frauen jünger waren als die Männer. Außerdem nahmen die älteren Proband*innen zu einer späteren Tageszeit teil als die jüngeren (rS = .375, p = .003). Deswegen wurde das Alter der Proband*innen als zusätzliche Kontrollvariable in den Regressionsanalysen berücksichtigt. Das Geschlecht wurde jedoch aufgrund der kleinen männlichen Stichprobe (n = 12) nicht als Kontrollvariable berücksichtigt. Es gab keine signifikanten Zusammenhänge mit dem eigenen regelmäßigen Nägelkauen (in der Vergangenheit oder in der Gegenwart) mit einer der abhängigen Variablen, weswegen das Nägelkauen nicht als Kontrollvariable in das Modell aufgenommen wurde.

Regressionsanalytisch (s. Tabelle 15.5 und Tabelle 15.6) zeigte sich, dass insgesamt wenig Varianz des nonverbalen Verhaltens aufgeklärt werden konnte (korrigiertes R2 ≤ .102; Nagelkerkes R2 ≤ .210). Ein signifikanter Effekt für die Kompetenzmanipulation ergab sich beim Weggucken (Häufigkeit; β = .346, pbt = .015; Adjustierung: p = .030) sowie marginal signifikante Effekte beim Blickkontakt (Zeit; β = −.240, pbt = .079; Adjustierung: p = .079) und beim Abstützen des Kopfes (OR = 0.550, pbt = .074). Unter der Berücksichtigung der kleinen Stichprobe (N = 62) können also bei Annahme von marginal signifikanten Ergebnissen (vgl. Hager, 2004) die Hypothesen 1 und 3 unter Vorbehalt angenommen werden.

Zusätzlich zu den hypothesenprüfenden, multivariaten Regressionsanalysen wurde explorativ die Beurteilung der Kompetenz als Regressand betrachtet, da diese sich zwischen der Galatea- und der Golem-Bedingung nicht unterschied (U = 389.0, pexakt = .281), was jedoch zu erwarten gewesen wäre. Es zeigte sich, dass nur die Wärmebeurteilung ein signifikanter Regressor für die Kompetenzbeurteilung war (β = .509, pbt < .001), die Kompetenzmanipulation aber nicht (β = .509, p1−bt = .332; s. Zusatzmaterial).

4 Zusammenfassung, Interpretationen und Limitationen

Die dritte Studie widmete sich dem Einfluss der Kompetenzerwartungen auf das nonverbale Verhalten. Mit einem experimentellen Design, in dem die Kompetenzerwartungen systematisch manipuliert wurden, zeigte sich, dass positive Kompetenzerwartungen (Galatea-Bedingung) mit weniger Blickkontakt – sowohl zeitlich kürzer als auch häufigerem Abbruch des Blickkontakts – und (marginal signifikant) weniger langem Abstützen des Kopfes einhergehen. Dies weist auf unterschiedliches Verhalten in Abhängigkeit der Kompetenzerwartung hin, widerspricht jedoch die bisherigen Befunde, die zeigten, dass Personen sich zugewandter verhalten, wenn sie eine kompetente Lehrperson erwarten, im Vergleich zu Personen, die eine inkompetente Lehrperson erwarten.

Ein zugewandteres Verhalten Lernender bei höheren Lernendenkompetenzerwartungen an Lehrpersonen konnte von Feldman und Prohaska (1979) ausgemacht werden. Für die Dauer des Blickkontakts ergab sich ein mittlerer Effekt (d = 0.521), bei Feldman und Prohaska (1979) zeigte sich ein ähnlicher Effekt (d = .512), allerdings in entgegengesetzter Richtung (mehr Blickkontakt bei der Galatea-Bedingung). Die Effektstärke bezüglich des Vorbeugens fällt auch entgegengesetzt und zusätzlich geringer aus (d = −0.372) als der Unterschied, der bei Feldman und Prohaska (1979) beschrieben ist (d = 0.974), was auch auf das unterschiedliche Erhebungsverfahren zurückführbar sein kann. So erfassten Feldman und Prohaska (1979) den genauen Grad des Vor- und des Zurückbeugens. Darüber hinaus gab es bei Feldman und Prohaska (1979) dyadische Interaktionen, in der hier durchgeführten Studie haben ein bis vier Proband*innen pro Untersuchungsdurchgang eine videografierte Lehrperson erlebt.

Die teilweise widersprechenden Ergebnisse zum nonverbalen Verhalten könnten mit zwei unterschiedlichen Motivationszuständen resp. mittels zweier „Langeweileprofile“ erklärt werden: So lag bei Feldman und Prohaska (1979) eine dyadische Face-to-Face-Interaktion vor, die vermutlich aktivierender ist als das Betrachten eines Monitors wie in der hier durchgeführten Studie. Es kann vermutet werden, dass in einem aktivierenden Setting Lernende ihr Desinteresse, das durch die Kompetenzerwartungen beeinflusst sein kann, durch Zurücklehnen, seitliches Eindrehen und Weggucken signalisieren. Bei einem monotonen Vortrag könnte sich Desinteresse der Zuhörenden in ein „einsinkendes“ Verhalten (z. B. Kopf auf dem Arm abgestützt) abbilden. Das Abstützen des Kopfes auf den Armen kann als entspannte Haltung (relaxation) interpretiert werden, was nach der Theorie von Mehrabian (1969) mit Status assoziiert ist. Personen mit höherem Status zeigen nach Mehrabian (1969) eine entspanntere Körperhaltung, sodass im Fall von Lernenden eine entspanntere Körperhaltung so interpretiert werden kann, dass die Lernenden die jeweilige Lehrperson nicht als Expert*in wahrnehmen und somit nicht ernst nehmen. Sowohl das aktivierende Face-to-Face- als auch das monotone Vortragssetting haben dann gemeinsam, dass Lernende in der Galatea-Bedingung eine Haltung mit mehr Muskeltonus zeigen, nur wird beim Vortrag weitere Stimulation für kurze Zeit außerhalb des Settings gesucht (Weggucken), was wiederum zu einer Reduzierung von Müdigkeit führen könnte.

Das Geschlecht der Lehrperson hat in dieser Studie keinen signifikanten Effekt auf das nonverbale Verhalten und auch keinen bedeutsamen Effekt auf den Wissenstest. Dies kann auf eine geringe Bedeutung des Lehrpersonengeschlechts in der Lehr-Lern-Interaktion hinweisen (Basow et al., 2013; Bavishi et al., 2010; Goebel & Cashen, 1979; Riniolo et al., 2006; s. auch Studie 1 und Studie 2). Allerdings kann dies auch daran gelegen haben, dass das Videomaterial in der männlichen Bedingung eine weniger stereotype „maskuline“ Person darstellte und somit als wenig repräsentativ für die Kategorie „Mann“ wahrgenommen wurde.

Dass die Kompetenzmanipulation keinen Einfluss auf die Kompetenzbeurteilung am Ende des Vortrags hatte, kann darauf hinweisen, dass die Erfassung der Kompetenzbeurteilung einem subjektiven Maßstab folgt, sodass sich eine Form des shifting standards (Biernat et al., 1991; Foschi, 2000) zeigte. Ursprünglich wurde die shifting standards theory herangezogen, um die Bewertung von Mitgliedern unterschiedlich stereotypisierter Gruppenmitglieder zu erklären. Beispielsweise wird mit subjektiven Maßstäben (Skala von „sehr klein“ bis „sehr groß“) die Körpergröße von Männern und Frauen ähnlicher beschrieben als mit objektiven (Schätzung in Zentimetern). Erklärt werden kann dies damit, dass bei subjektiven Maßstäben andere Vergleichsgruppen herangezogen werden, also Frauen werden mit anderen Frauen verglichen und Männer mit anderen Männern. Für die erzielten Studienbefunde heißt dies, dass in der Galatea-Bedingung ein höherer Standard bei der Kompetenzbewertung angelegt wurde als in der Golem-Bedingung. Eine Lehrperson, deren Examen mit „sehr gut“ bewertet wurde, wird anhand dieser Note subjektiv bewertet. So können z. B. Gedanken gewesen sein, dass die Lehrperson für „sehr gut“ nicht „gut genug“ im Vortrag war – analog könnte die Lehrperson mit der Note „befriedigend“ als „besser als erwartet“ erachtet worden sein, was zu positiveren subjektiven Bewertungen geführt haben könnte. Eine Beurteilung der Kompetenz durch eindeutig objektive Maße zur Überprüfung der Kompetenzmanipulation müsste in ähnlich angelegten Studien künftig berücksichtigt werden.

Weiterhin methodisch kritisch anzumerken ist zum einen die kleine Proband*innen-Zahl (N = 62; wegen fehlender Werte 61 für die Regressionsanalysen) und die damit einhergehende geringe statistische Power (vgl. Döring & Bortz, 2016; Hager, 2004). Dies steht aber in Relation zum sehr aufwendigen Studiendesign und der aufwendigen Auswertung der Videos. Die Auswertung der aufgezeichneten Videos wurde zusätzlich durch die Perspektive der Kameras beeinträchtigt. So waren einige Verhaltensweisen nicht eindeutig zu beobachten (z. B. Zurücklehnen) und die bei Feldman und Prohaska (1979) vorgenommenen Maßeinheiten (z. B. Körperorientierung in Grad) konnten hier nicht verwendet werden. Darüber hinaus unterschieden sich die Kompetenzbedingungen hinsichtlich der Proband*innen-Zusammensetzung: So gab es mehr männliche und mehr ältere Proband*innen in der Galatea-Bedingung, was zu Konfundierungen geführt haben könnte (vgl. u. a. Döring und Bortz, 2016) – wobei das Alter in den multivariaten Analysen als Kontrollvariable berücksichtigt wurde, das Geschlecht aufgrund der sehr geringen männlichen Teilnehmendenzahl (n = 12) nicht. Außerdem sind Versuchsleitungseffekte (Klein et al., 2012; Rosenthal, 1966, 2009; Rosenthal & Fode, 1973) nicht auszuschließen, wobei diesen mit einem Leitfaden für das Vorgehen begegnet wurde.

Eine besonders wichtige Einschränkung, die Beachtung finden muss, ist, dass die Cover-Story (Supervision von Lehrkräften) die Proband*innen nur indirekt in eine Lernendenposition brachte. Die Proband*innen hatten nicht die Aufgabe, die Inhalte des Vortrags zu lernen, sondern die Lehrperson zu bewerten. Dies könnte erklären, warum es keine signifikanten Unterschiede im Wissenstest zwischen der Golem- und Galatea-Bedingung gab. Weitergehend ist einschränkend anzumerken, dass aufgrund der fehlenden Testung zum Vorwissen es unklar ist, ob die Proband*innen nicht doch einen höheren Wissenszuwachs in der Galatea-Bedingung hatten. Für das nonverbale Verhalten jedoch sollte sich aufgrund der Cover-Story kein Unterschied ergeben, da Lernende auch immer die Lehrpersonen sowie das Unterrichtsangebot (bewusst oder unbewusst) evaluieren und bewerten (vgl. Nickel, 1985). Um dies jedoch mit Sicherheit aussagen zu können, bedarf es weitergehender Untersuchungen.

Positiv an der Studie sind jedoch folgende Punkte hervorzuheben: Es handelte sich um ein experimentelles Vorgehen, sodass Kausalaussagen möglich sind. Neben der Galatea- und der Golem-Bedingung wäre eine Kontrollgruppe (ohne Erwartungsmanipulation) sinnvoll gewesen, was jedoch eine größere Stichprobe erfordert hätte. Weitergehend wurden keine üblichen Selbsteinschätzungsverfahren genutzt, sondern Verhaltensmaße betrachtet. Verhaltensbeobachtungen haben gegenüber Befragungen eine Reihe von Vorteilen, werden jedoch aufgrund des Aufwands deutlich seltener genutzt (s. u. a. Döring & Bortz, 2016), obwohl sie „in besonderem Maße dem Anspruch der Psychologie gerecht [werden], menschliches Verhalten und Erleben zu beschreiben und zu erklären“ (Weber, 2012, S. 34).

Die bisherigen drei Studien waren Laboruntersuchungen, um Annahmen des transaktionalen Modells von Nickel (1985; s. Kapitel 7) zu Ursachen und Auswirkungen kognitiver Schemata in Kausalanalysen zu betrachten. In der finalen vierten Studie sollen die Überlegungen zur Wirkung von Lernendenkompetenzerwartungen an Lehrpersonen im realen Lehr-Lern-Setting in einer Feldstudie untersucht werden.