Ein neues Instrument zur Erfassung der Einstellungen zu Portfolioarbeit in der Lehrerinnen- und Lehrerbildung (EPP-L)

Fütterer, Tim; Feder, Lina; Cramer, Colin

doi:10.1007/s42010-022-00161-y

Ein neues Instrument zur Erfassung der Einstellungen zu Portfolioarbeit in der Lehrerinnen- und Lehrerbildung (EPP-L)

A new questionnaire to assess the attitudes towards portfolio work in teacher education (EPP-L)

Allgemeiner Teil
Open access
Published: 16 December 2022

Volume 51, pages 361–393, (2023)
Cite this article

Download PDF

You have full access to this open access article

Unterrichtswissenschaft Aims and scope Submit manuscript

Ein neues Instrument zur Erfassung der Einstellungen zu Portfolioarbeit in der Lehrerinnen- und Lehrerbildung (EPP-L)

Download PDF

2352 Accesses
Explore all metrics

Zusammenfassung

Portfolioarbeit ist aufgrund von Potenzialen für Professionalisierungsprozesse (z. B. Entwicklung von Reflexionsfähigkeit) ein weit verbreitetes und teilweise sogar verbindlich vorgeschriebenes Konzept in der Lehrerinnen- und Lehrerbildung. Für die Wirksamkeit einer Portfolioarbeit (d. h. für die Entfaltung der Potenziale) erweisen sich positive Einstellungen der Anwenderinnen und Anwender zu Portfolioarbeit als bedeutsam. Bislang liegen allerdings keine Befunde zu Einstellungen zu Portfolioarbeit vor, die über Spezifika vereinzelter, standortspezifischer Portfoliokonzeptionen hinausreichen. Ein Grund hierfür ist, dass Instrumente zur Erfassung von Einstellungen bislang nicht konzeptionsübergreifend nutzbar sind. Dieser Beitrag stellt ein neues Instrument zur Erfassung von Einstellungen von Lehramtsstudierenden zu Portfolioarbeit (EPP-L) vor, das unabhängig von spezifischen Konzeptionen eingesetzt werden kann. Ausgehend von einem Pool aus 45 Items, die auf Basis theoretisch abgeleiteter und systematisch identifizierter Potenziale von Portfolioarbeit entwickelt wurden, konnten in einem iterativen Prozess (z. B. kognitive Pretests, Expertenratings) 18 finale Items entwickelt werden. Die psychometrische Überprüfung des EPP‑L erfolgte anhand von N₁ = 424 und N₂ = 374 Lehramtsstudierenden. Der EPP‑L erweist sich als reliabel (interne Konsistenz) und valide (Konstrukt- und Kriteriumsvalidität). Theoriekonform zeigen sich starke Zusammenhänge der Einstellungen mit dem wahrgenommenen Nutzen von Portfolioarbeit und keine bis schwache Zusammenhänge mit konstruktivistischen und transmissiven lerntheoretischen Überzeugungen. Differential Item Functioning Analysen zeigen die Messinvarianz des EPP‑L über die Variable Geschlecht. Konfirmatorische Faktorenanalysen bestätigen einen Generalfaktor. Der EPP‑L bietet die Möglichkeit, Evidenz zur Portfolioarbeit in der Lehrerinnen- und Lehrerbildung über vereinzelte Programmevaluationen hinaus zu generieren.

Abstract

Portfolio work is a widespread and sometimes even mandatory concept in teacher education due to its potentials for professionalization processes (e.g., development of reflective skills). For the effectiveness of portfolio work (i.e., for the development of its potentials), positive attitudes of users toward portfolio work were shown to be important. However, so far, no findings exist on attitudes toward portfolio work that go beyond specifics of isolated, location-specific portfolio concepts. One reason for the lack of findings is that instruments to capture attitudes cannot be used across concepts. This paper presents a new instrument to capture pre-service teachers’ attitudes toward portfolio work (EPP-L) that can be used independently of specific portfolio conceptions. Based on a pool of 45 items developed along theoretically derived and systematically identified potentials of portfolio work, 18 items were developed in an iterative process (e.g., cognitive pretests, expert ratings). Psychometric testing of the EPP‑L was conducted using N₁ = 424 and N₂ = 374 pre-service teachers. The EPP‑L proved to be reliable (internal consistency) and valid (construct and criterion validity). Consistent with theory, for example, attitudes showed strong correlations with perceived usefulness of portfolio work and non to weak correlations with constructivist and transmissive learning theory beliefs. Differential item functioning analyses showed that the EPP‑L was measurement invariant across the variable gender. Confirmatory factor analyses confirmed a general factor. The EPP‑L provides the first opportunity to generate evidence on portfolio work in teacher education beyond isolated program evaluations.

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Portfolioarbeit ist in der Ausbildung von Lehrpersonen weit verbreitet und gilt als relevantes Konzept in der Lehrerinnen- und Lehrerbildung. So wird der Portfolioarbeit national wie international ein hohes Innovationspotenzial zugeschrieben (Barton und Collins 1993; Feder und Cramer 2019; Fütterer 2019; Gläser-Zikuda und Hascher 2007; Hascher und Sonntagbauer 2013; Strudler und Wetzel 2008). Zum Beispiel wird konstatiert, dass Portfolioarbeit die Reflexivität angehender Lehrpersonen fördert, indem berufsrelevante Handlungssituationen auf der Grundlage von Professionswissen bearbeitet werden (Borko et al. 1997; Gläser-Zikuda 2009; Häcker 2012). Allerdings wird argumentiert, dass sich die Potenziale nur bei der Sicherstellung von Gelingensbedingungen entfalten (Fütterer 2019), etwa wenn die Anwenderinnen und Anwender positive Einstellungen zu Portfolioarbeit haben (Imhof und Picard 2009; Ziegelbauer 2016). In dieser Arbeit werden Einstellungen als evaluative Reaktionen auf Einstellungsobjekte (hier: Portfolioarbeit) definiert (Ajzen 2001; Albarracín et al. 2018) und durch das Ausmaß an Zustimmung oder Ablehnung ausgedrückt (Kopietz und Echterhoff 2016). Nicht berücksichtigt werden in dieser Studie affektive Aspekte von Einstellungen (d. h. Gefühle oder Emotionen).

Einstellungen sind mit Ausprägungen menschlichen Handelns verknüpft (Ajzen 1987; Glasman und Albarracín 2006): Für die Portfolioarbeit wird daher angenommen, dass Einstellungen zu Portfolioarbeit mit der Arbeitsweise von angehenden Lehrpersonen bei der Bearbeitung (z. B. Kontinuität) von Portfolios zusammenhängen. Weil Einstellungen mittels Selbsteinschätzungen niedrigschwellig zu erfassen sind und deren Erhebung zugleich den ersten Schritt einer Evaluationsmaßnahme kennzeichnet (Kirkpatrick und Kirkpatrick 2006), existieren in diesem Bereich die meisten empirischen Befunde in der Portfolioforschung (Feder und Cramer 2019; Hofmann et al. 2016). In deren Zusammenschau zeigen angehende Lehrpersonen häufig negative Einstellungen zur Portfolioarbeit, wobei die Befundlage heterogen ist. Je nach Standort wurden positive (z. B. Christen und Hofmann 2013) oder negative Einstellungen (z. B. Streblow et al. 2013) festgestellt. Derartige Befunde sind allerdings kaum vergleichbar, da die Einstellungen unterschiedlich und meist unter Bezugnahme auf standortspezifische Merkmale der Portfoliokonzeptionen operationalisiert wurden (Gläser-Zikuda et al. 2020). Validierte Instrumente wurden bislang kaum eingesetzt. Angesichts des Mangels an geteilten Kerncharakteristika von Portfolioarbeit überrascht die Heterogenität der Operationalisierungen nicht. Für die Lehrerinnen- und Lehrerbildung ergibt sich aus dem Fehlen von Instrumenten für eine standardisierte Erfassung von Einstellungen zur Portfolioarbeit, dass sich bisher kaum abschätzen lässt, ob die der Portfolioarbeit zugesprochenen Potenziale beispielsweise hinsichtlich der Reflexionsfähigkeit von (angehenden) Lehrpersonen tatsächlich Wirkung entfalten. In diesem Zusammenhang bietet die systematische Identifikation grundlegender Potenziale von Portfolioarbeit (Feder und Cramer 2018) erstmalig die Möglichkeit, ein Instrument zur Erfassung von Einstellungen zu Portfolioarbeit standortunabhängig zu entwickeln. Im Beitrag wird deshalb in einem ersten Schritt die Entwicklung eines solchen Instrumentes dokumentiert. Das Instrument wurde basierend auf einer Vorstudie (Feder et al. 2021) iterativ über Pretests entwickelt. In einem zweiten Schritt werden zwei Validierungsstudien mit N₁ = 424 und N₂ = 374 Lehramtsstudierenden zur Prüfung der Reliabilität, Konstruktvalidität, Kriteriumsvalidität und geschlechtsspezifischen Testfairness des finalen Instruments vorgestellt.

1 Theoretischer Hintergrund

1.1 Portfolioarbeit und deren Potenziale

Portfolioarbeit ist in der deutschsprachigen Ausbildung von Lehrpersonen weit verbreitet und in einigen Bundesländern der Bundesrepublik Deutschland sogar verbindlich vorgeschrieben (Monitor-Lehrerbildung 2019). Obwohl eine spezifische Definition von Portfolioarbeit weder sinnvoll noch möglich ist, gelten zum einen das Sammeln von Dokumenten eigener Leistungen und zum anderen die reflexive Bezugnahme auf diese Dokumente als zentrale Merkmale von Portfolioarbeit (Fütterer 2019). Während Portfolioarbeit in Deutschland überwiegend in der ersten (Studium) und zweiten Phase (Referendariat) etabliert ist, kommt sie in der dritten Phase (berufsbegleitende Fort- und Weiterbildung) seltener zum Einsatz (Gläser-Zikuda et al. 2020). Der Begriff Portfolioarbeit vereint eine Vielzahl höchst unterschiedlicher Konzepte (Gläser-Zikuda et al. 2020; Häcker 2012). Portfoliokonzepte unterscheiden sich etwa im Hinblick auf den zeitlichen Umfang der Portfolioarbeit oder den Grad der institutionellen Verbindlichkeit (Häcker und Lissmann 2007). Die verschiedenen Konzepte adressieren unterschiedliche Potenziale von Portfolioarbeit, die je nach Anwendungskontext stark divergieren (Koch-Priewe 2013); teilweise werden sogar gegenläufige Potenziale adressiert (z. B. Reflexivitätsförderung versus Leistungsmessung). In einer systematischen Inhaltsanalyse deutschsprachiger Literatur zur Portfolioarbeit in der Ausbildung von Lehrpersonen haben Feder und Cramer (2018) neun empirisch voneinander abgrenzbare Potenziale herausgearbeitet.

Die Potenziale beziehen sich auf die Unterstützung der individuellen professionellen Entwicklung (angehender) Lehrpersonen (Aspekt Professionalisierungsinstrument) oder auf die Optimierung von Strukturen lehrerbildender Studiengänge (Aspekt Strukturinstrument). Diese Potenziale werden je nach Standort und Portfoliokonzeption unterschiedlich stark adressiert und können Ausgangspunkt für eine konzeptionsübergreifende Analyse von Einstellungen zu Portfolioarbeit sein.

1.2 Einstellungen zu Portfolioarbeit

Für die Entfaltung von Potenzialen einer Portfolioarbeit gelten positive Einstellungen der Anwenderinnen und Anwender zur Portfolioarbeit als zentrale Voraussetzung (Brouër 2005, 2007; Fütterer 2019; Hascher und Sonntagbauer 2013; Imhof und Picard 2009; Klampfer 2013; Ziegelbauer 2016; für Einstellungen allgemein siehe: Ajzen 1987; Ajzen und Fishbein 1980). Entsprechend wird im Rahmen von Evaluationsmaßnahmen vorgeschlagen, zunächst Einstellungen der Anwenderinnen und Anwender zu erfassen (Kirkpatrick und Kirkpatrick 2006). Zur Portfolioarbeit liegen bereits Befunde zu den Einstellungen von Anwenderinnen und Anwendern vor (vgl. Bryant und Chittum 2013; Feder und Cramer 2019; Feder et al. 2021; Hofmann et al. 2016), die gemischt ausfallen. Einerseits zeigen sich vereinzelt positive Einstellungen (z. B. Artmann und Herzmann 2016; Christen und Hofmann 2013), andererseits legen Befunde aus Reviews nahe, dass angehende Lehrpersonen eher negative Einstellungen zu Konzepten der Portfolioarbeit haben (Cakir und Balcikanli 2012; Feder und Cramer 2019; Feder et al. 2021; Hofmann et al. 2016). Zum Beispiel zeigt sich bei Evaluationen standortbezogener Portfoliokonzepte teilweise deutliche Ablehnung (z. B. Pineker und Störtländer 2013; Streblow et al. 2013). Allerdings resultieren die Befunde überwiegend aus Konzeptevaluationen einzelner Hochschulen, weshalb der Vergleich bisheriger Befunde kaum möglich ist (Feder et al. 2019). Unter anderem wegen der konzeptionsspezifischen Forschung zu Portfolioarbeit und der daraus resultierenden Schwierigkeit, Befunde miteinander vergleichen zu können, liegen erwartungskonform kaum umfassende Überblicksarbeiten zur empirischen Befundlage zu Portfolioarbeit vor und insgesamt wird ein „großes Forschungsdefizit“ (Hofmann et al. 2016, S. 35) attestiert. Das in dieser Studie vorgestellte Instrument nimmt dieses Desiderat und bietet die Möglichkeit, über einzelne Programmevaluationen hinaus Erkenntnisse zur Portfolioarbeit und dessen Steuerung und Entwicklung zu gewinnen. Dadurch eröffnen sich erste Ansatzpunkte, um Chancen und Grenzen von Portfolioarbeit in der Lehrerinnen- und Lehrerbildung kritisch-konstruktiv zu prüfen.

1.3 Operationalisierung der Einstellungen zu Portfolioarbeit

Die Messung von Einstellungen zur Portfolioarbeit erfolgte bislang überwiegend mittels (Gruppen)Interviews und -diskussionen (Artmann und Herzmann 2016; Ziegelbauer und Gläser-Zikuda 2016) sowie Fragebogenerhebungen (z. B. Brouër 2007; Fütterer 2019; Pineker und Störtländer 2013; Schlag 2015; Streblow et al. 2013; Ziegelbauer 2016). Wenn eine standardisierte Erfassung mittels Fragebogen erfolgte, wurden Einstellungen unterschiedlich definiert und unter Verwendung verwandter Konstrukte operationalisiert. So bewerteten etwa in der Studie von Streblow et al. (2013) Lehramtsstudierende anhand von 20 Items den Nutzen der Portfolioarbeit in der ersten Phase u. a. bezogen auf die dortige, standortspezifische Handreichung. Fütterer (2019) untersuchte Einstellungen zur Portfolioarbeit ebenfalls über die Bewertung ihres Nutzens in der zweiten Phase der Lehrerinnen- und Lehrerbildung, u. a. bezüglich Phasenspezifika. Unter Diplomhandelslehramtsstudierenden wurde ein Fragebogen zur Akzeptanz der Portfolioarbeit eingesetzt, der auf den spezifischen Anwendungskontext abzielt (Brouër 2007; Brouër und Gläser-Zikuda 2010). Schlag (2015) untersuchte mit einer Skala aus sechs Items die Akzeptanz der portfoliobasierten Dokumentation eines Praktikums u. a. unter Rekurs auf das dort bereitgestellte Material. Diese und weitere Instrumente sind mit Blick auf ihre Entwicklung wenig dokumentiert, stark konzept- bzw. standortspezifisch und nicht konsequent validiert (z. B. ohne Rekurs auf Gütekriterien). Zusammenfassend existiert national und international kein theoretisch fundiertes, validiertes Instrument.

1.4 Zielsetzungen und Annahmen

Das Ziel dieses Beitrages ist, ein reliables, valides und bezüglich Geschlechtsgruppen faires Instrument zur Erfassung von Einstellungen von Lehramtsstudierenden zu den systematisch identifizierten Potenzialen von Portfolioarbeit zu entwickeln. Ein reliables und valides Instrument zur Erfassung von Einstellungen zu Portfolioarbeit unabhängig von standortspezifischen Portfoliokonzeptionen erscheint besonders hinsichtlich der Vergleichbarkeit von Befunden aus unterschiedlichen Studien zur Portfolioarbeit notwendig, um einen ersten Schritt für belastbarere Aussagen zur Tragfähigkeit des Einsatzes von Portfolios in der Lehrerinnen- und Lehrerbildung über Hochschulen hinweg zu ermöglichen. Ein bezüglich Geschlechtergruppen faires Instrument ist besonders deshalb wichtig, weil sich in aktuellen Studien gezeigt hat, dass sich angehende Lehrpersonen hinsichtlich verschiedener Personenmerkmale (z. B. Selbstwirksamkeit, Selbstreflexion, Enthusiasmus) unterscheiden (Holzberger et al. 2021). Zudem zeigen Frauen und Männer konkret bei der Portfolioarbeit unterschiedliche Arbeitsweisen (z. B. bezüglich des Umfangs ihrer Reflexionen oder ihrer Gewissenhaftigkeit bei der Bearbeitung; Fütterer 2019). Auch zeigte sich, dass Nutzerinnen der Portfolioarbeit ein höheres Potenzial zuschreiben (Feder et al. 2021), die Portfolios besser organisieren (Dreyer 2015), mehr Artefakte einbinden (Taylor et al. 2012) oder längere Texte zu Reflexionsaufgaben schreiben (Fütterer 2019). Das potenzialbezogene Instrument zu Einstellungen zur Portfolioarbeit sollte demzufolge sensitiv für potenzielle Geschlechtsunterschiede sein. Zugleich sind Portfolios im Studium Werkzeuge, um Lernprozesse zu organisieren. Auch diesbezüglich unterscheiden sich Frauen und Männer, wenn sich etwa Frauen in Lernprozessen mehr mit anderen Lernenden austauschen (z. B. Caspi et al. 2008) und Austauschprozesse lernwirksamer nutzen, indem sie sich stärker argumentativ in Diskussionen einbringen und eher Feedback von anderen annehmen (z. B. Noroozi et al. 2022). Auch unterscheiden sich Frauen und Männer bezüglich der intellektuellen Risikobereitschaft (d. h. das Ausmaß, in welchem im akademischen Kontext Situationen [wie beispielsweise Prüfungssituationen] aufgesucht werden, in welchen man mangelnde Fähigkeiten offenbaren könnte; Byrnes et al. 1999) oder bezüglich ihrer strategischen Ansätze im Umgang mit Stress im akademischen Kontext (z. B. Bonneville-Roussy et al. 2017). Für die Erfassung der Einstellung angehender Lehrpersonen zu Portfolioarbeit bedeutet dies, dass Frauen und Männer mit derselben Einstellung zu Portfolioarbeit beispielsweise auf ein Item zum Potenzial von Portfolios für die Gestaltung von Austausch gleich antworten sollten, doch Frauen machen generell positivere Erfahrungen mit dem Austausch beim Lernen. Es muss also sichergestellt werden, dass sich im Antwortverhalten der Geschlechtergruppen tatsächlich die Einstellung zu Portfolioarbeit ausdrückt. Die Items des Instruments müssen daher so gestaltet sein, dass kein Geschlecht diskriminiert wird (Testfairness; Chen et al. 2017; De Ayala 2009; Jin und Chen 2020).

Wir gehen von einer umso positiveren Einstellung zur Portfolioarbeit aus, je mehr Potenzial dieser insgesamt zugeschrieben wird. Entsprechend der unterschiedlichen Potenziale von Portfolioarbeit (Feder und Cramer 2019) und den empirischen Einsichten aus korrelativen Vorstudien zum Zusammenhang dieser Facetten (Feder et al. 2021) kann nicht von einem eindimensionalen Konstrukt Einstellung zu Portfolioarbeit ausgegangen werden. Die Berücksichtigung von Einstellungen zu unterschiedlichen Aspekten einer Portfolioarbeit erscheint zugleich mit Blick auf Erkenntnisse aus der Einstellungsforschung plausibel, wonach Personen gleichzeitig mehrere und sogar ambivalente Einstellungen zum selben Einstellungsobjekt (hier: Portfolioarbeit) haben können (Ajzen 2001), welche die Vorhersagekraft von Einstellungen auf tatsächlich realisiertes Verhalten moderieren können (Glasman und Albarracín 2006). Um in dieser Studie eine grundlegende Einstellung zu Portfolioarbeit abbilden zu können und zugleich unterschiedlich ausgeprägte Einstellungen zu verschiedenen Aspekten (d. h. Potenzialen) von Portfolioarbeit zuzulassen, nehmen wir an, dass eine Bi-Faktor-Struktur oder ein Modell zweiter Ordnung geeignet ist, um die Beziehung zwischen den Potenzialen und das übergeordnete Konstrukt (g-Faktor) abzubilden. Folglich sollten einerseits die expliziten Einstellungen zu den Potenzialen von Portfolioarbeit (Einstellungsobjekte) jeweils als eindimensionale Konstrukte sowie andererseits das übergeordnete Konstrukt (g-Faktor) Einstellung zu Portfolioarbeit erfasst werden (Tab. 1).

Tab. 1 Kategorien der Potenziale von Portfolioarbeit

Full size table

Reliabel ist das Instrument, wenn es eine hohe interne Konsistenz zeigt. Valide ist das Instrument, wenn sich starke Zusammenhänge des g‑Faktors mit verwandten (konvergente Validität als Aspekt der Konstruktvalidität) bzw. nicht-verwandten Konstrukten (divergente Validität) sowie externen Kriterien (Kriteriumsvalidität) zeigen. Auf Grundlage des Forschungsstandes wurden für die Validierungsstudie erwartete Zusammenhänge zwischen dem g‑Faktor (Einstellungen zu Portfolioarbeit) und anderen Konstrukten formuliert (Axiome: Hartig et al. 2012).

Da Einstellungen zu Portfolioarbeit bisher häufig im Sinne deren Akzeptanz operationalisiert wurden (Klampfer 2013; Schlag 2015; Ziegelbauer 2016), erwarten wir positive Zusammenhänge zwischen den operationalisierten, potenzialbezogenen Einstellungen und den bereits vorliegenden Akzeptanzskalen zu Portfolioarbeit (konvergente Validität). Portfolioarbeit in der Lehrerinnen- und Lehrerbildung zielt u. a. darauf ab, dass angehende Lehrpersonen ihren eigenen Lernprozess reflektieren. Nehmen Lehrpersonen jedoch nicht ihren eigenen Lernprozess in den Blick, sondern den Lernprozess ihrer Schülerinnen und Schüler, liegt ein Perspektivwechsel vor, bei welchem sich Einstellungen entwickeln können. Einstellungen zur Portfolioarbeit, in welchen der eigene Lernprozess reflektiert wird, und Einstellungen zu Lernprozessen von Schülerinnen und Schülern, stellen unterschiedliche Konstrukte dar. Aus diesem Grund nehmen wir an, dass sich keine bis geringe Zusammenhänge zwischen potenzialbezogenen Einstellungen und konstruktivistischen und transmissiven lerntheoretischen Überzeugungen (divergente Validität) zeigen. Da Einstellungen eng mit motivationalen Konstrukten zusammenhängen (Fütterer 2019; Klampfer 2013; Ziegelbauer et al. 2013), erwarten wir zudem positive Zusammenhänge mit dem Interesse, dem wahrgenommenen Nutzen sowie der intrinsischen Motivation bezüglich Portfolioarbeit (Kriteriumsvalidität).

2 Methode

Das Instrument (EPP-L) wurde in einem iterativen Verfahren zunächst sowohl theoretisch fundiert als auch empirisch konstruiert (rationale und induktive Testkonstruktion: Bühner 2011) und anschließend empirisch validiert.

2.1 Konstruktion des Instrumentes

Zu Beginn der Konstruktion des Instrumentes stand die Inhaltsvalidität im Fokus. Zu jedem der theoretisch und systematisch identifizierten Potenziale (Feder et al. 2019) wurden fünf Items entwickelt. Die Iteminhalte orientierten sich dabei an den Kategorienbezeichnungen, Beschreibungen und Ankerbeispielen der theoretischen Vorarbeiten (Feder und Cramer 2018, 2019). Der anfängliche Itempool bestand aus 45 Items, die sich auf 9 Inhaltsaspekte verteilen (Beispielitem: „Ich denke, dass Portfolios zur Reflexion anregen“; Onlinematerial 1). Alle Items wurden mittels einer fünfstufigen Antwortskala erhoben (1 = trifft überhaupt nicht zu bis 5 = trifft voll und ganz zu), wobei eine hohe Ausprägung eine hohe Potenzialzuschreibung und damit eine positive Einstellung ausdrückte. Hinsichtlich der Zumutbarkeit (z. B. zeitliche Belastung von Testpersonen) und Testökonomie (z. B. Kosten und Dauer zukünftiger Erhebungen), wurde eine Reduktion der Itemanzahl so angestrebt, dass jedes Potenzial durch drei Items jeweils eindimensional erfasst wird.

Um sicher zu stellen, dass die Items tatsächlich die neun Inhaltsaspekte repräsentieren, wurden erstens die 45 Items fünf Expertinnen und Experten für Portfolioarbeit zur kritischen Beurteilung vorgelegt (Onlinematerial 2). Um zweitens die Verständlichkeit der Items und Probleme bei der Bearbeitung aus Anwendungsperspektive zu gewährleisten, wurden mit sieben Lehramtsstudierenden kognitive Tests (Lenzner et al. 2015) mittels der Methode des lauten Denkens durchgeführt (vgl. Bühner 2011; Moosbrugger und Kelava 2012). Drittens wurden die 45 Items einem Pretest unter N_P1 = 183 Lehramtsstudierenden unterzogen (Alter in Jahren: M = 20.84, SD = 2,59; 68 % weiblich, 31 % männlich; 72 % im 1. Fachsemester, 7 % im 2. Fachsemester, 13 % im 3. Fachsemester), um anhand explorativer Faktorenanalysen (EFA; Rotation = Geomin [Robustheitsanalyse: Rotation = Varimax], Schätzer = Maximum Likelihood) Informationen zu empirisch zugrundeliegenden Faktoren und entsprechenden Ladungsmustern der Items zu erhalten (faktorielle Validität; Tab. 9 und 10 im Anhang). Entscheidungen zum Ein- oder Ausschluss von Items wurden primär auf der Grundlage der Ladungsmuster getroffen. Zudem sollten Items unterschiedlicher Schwierigkeit (0,20 ≤ p_i ≤ 0,80) beibehalten werden, wobei mittelschwierige Items (0,45 ≤ p_i ≤ 0,55) überrepräsentiert sein sollen (Bühner 2011; Kelava und Moosbrugger 2012). Zudem wurden Items aufgrund der Einschätzungen der Expertinnen und Experten aus inhaltlichen Gründen nicht weiter einbezogen. Im Zweifelsfall wurden inhaltliche Argumente bei der Itemselektion stärker gewichtet als Statistiken. Nachdem viertens ein zweiter Pretest mit zwei Messzeitpunkten in derselben Stichprobe (N_P2 = 305 Lehramtsstudierende, Alter in Jahren: M = 21,34, SD = 2,79; 64 % weiblich, 36 % männlich; 71 % im 2. Fachsemester, 20 % im 4. Fachsemester, 7 % im 6. Fachsemester) durchgeführt wurde, bei welchem auf ein vierstufiges Antwortformat (1 = trifft überhaupt nicht zu, 2 = trifft eher nicht zu, 3 = trifft eher zu, 4 = trifft voll und ganz zu) umgestellt wurde, um Antworttendenzen zur Mitte hin vorzubeugen, liegt im Ergebnis das Instrument (EPP‑L) bestehend aus 18 Items (6 Skalen mit je 3 Items) vor (Tab. 2).

Tab. 2 Überblick über die Items des Instrumentes EPP‑L

Full size table

2.2 Validierung des EPP‑L

2.2.1 Stichproben

Zur Validierung des Instrumentes wurden Stichproben aus zwei Studien herangezogen. Die erste Stichprobe setzt sich aus N₁ = 424 Lehramtsstudierenden zusammen (M_Alter = 20,53, SD_Alter = 2,16, weiblich[w] = 58 %, männlich [m] = 40 %): 330 Bachelorstudierende (M_Alter = 19,82, SD_Alter = 1.70, w = 65 %, m = 32 %) sowie 94 Masterstudierende (M_Alter = 23.13, SD_Alter = 1.71, w = 32 %, m = 68 %). Es handelt sich um Gelegenheitsstichproben, die an zwei deutschen Universitäten über verpflichtende Einführungsveranstaltungen akquiriert wurden. Weil für alle Skalen des EPP‑L Messinvarianz zwischen beiden Lehramtssubgruppen vorlag (Messinvarianztestung nach Kleinke et al. 2017; Beurteilung von Root Mean Square Error Of Approximation [RMSEA], Comparative Fit Index [CFI], Standardized Root Mean Square Residual [SRMR]), wurden diese zusammengefasst. N₁ als größere der beiden Stichproben diente als Grundlage für die meisten Validierungsanalysen. Weil Einstellungen jedoch erfahrungsabhängig sind (Glasman und Albarracín 2006), wurde zur Absicherung der Befunde zusätzlich auf eine zweite Stichprobe zurückgegriffen, in der die Befragten über mehr Erfahrung (d. h. mehr Lerngelegenheiten) mit Portfolioarbeit verfügten: N₂ = 374 Lehramtsstudierende im Master oder auf Staatsexamen (M_Alter = 23.37, SD_Alter = 4.49, w = 78 %, m = 21 %). Diese zweite Gelegenheitsstichprobe wurde an zwölf deutschen Hochschulen über Dozierende im Lehramt akquiriert.

2.2.2 Instrumente zur Validierung

In den beiden Stichproben wurden unterschiedliche Validierungsinstrumente eingesetzt, was im Folgenden jeweils in Klammern ausgewiesen wird. Die Akzeptanz des Einsatzes von Portfolios wurde hinsichtlich der konvergenten Validität über vier Instrumente erfasst: eine Adaption der Skala von Schlag (2015; AZ1) mit 6 Items (z. B. „Ich würde das Portfolio anderen Studierenden empfehlen“) und guter interner Konsistenz (α = 0,84 [N₁]), eine Adaption der Skala von Klampfer (2013; AZ2) mit drei Items (z. B. „Die Arbeit mit dem Portfolio gefällt mir gut“) und einer guten internen Konsistenz (α = 0,80 [N₁]) sowie einer Skala von Ziegelbauer (2016; AZ3) mit sechs Items (z. B. „Ich nehme an, dass das Portfolio ein gutes Instrument zur Unterstützung meiner Professionalisierung als Lehrer/in ist“) und ebenfalls guter interner Konsistenz (α = 0,76 [N₁]).

Zur Prüfung der divergenten Validität wurden transmissive (TRA) und konstruktivistische (KON) lerntheoretische Überzeugungen anhand zweier Skalen von Kunter et al. (2013, siehe auch Kunter et al. 2017) herangezogen. Die Skala zu konstruktivistischen lerntheoretischen Überzeugungen besteht aus sechs Items (z. B., „Man sollte Schüler(inne)n erlauben, sich eigene Wege zur Bearbeitung von Aufgaben auszudenken, bevor die Lehrkraft vorführt, wie diese zu beantworten sind“) und zeigt in den vorliegenden Daten eine gute interne Konsistenz (α = 0,84 [N₁]). Die Skala zu transmissiven lerntheoretischen Überzeugungen besteht aus fünf Items (z. B. „Schüler(innen) lernen durch die Demonstration von Beispielaufgaben am besten“) und zeigt vorliegend ebenfalls gute interne Konsistenz (α = 0,74 [N₁]).

Zur Prüfung der Kriteriumsvalidität wurde eine Skala zum Interesse an der Portfolioarbeit von Klampfer (2013) bestehend aus zwei Items (z. B. „Ich denke, dass die Arbeit mit E‑Portfolios nützlich für die Weiterentwicklung in der Schulpraxis ist“) genutzt (INT). Zudem wurde der wahrgenommene Nutzen der Portfolioarbeit (NUZ) mit zwei Skalen erfasst: zum einen mit den sechs Items (z. B. „Ich nehme an, dass Portfolioarbeit für mein Studium hilfreich ist“) der Skala von Ziegelbauer (2016; NUZ1), die in den vorliegenden Daten eine sehr gute interne Konsistenz (α = 0,92 [N₁] bis 0,93 [N₂]) aufweist; zum anderen mit den fünf Items (z. B. „Was ich beim Arbeiten an und mit dem Portfolio lerne, ist später im Beruf sehr nützlich für mich“) der Skala von Wolfsgruber (2020; NUZ2), die vorliegend eine gute interne Konsistenz (α = 0,78 [N₂]) zeigt. Darüber hinaus wurde die Motivation zur Portfolioarbeit (MOT) mit den vier Items der Skala von Ziegelbauer (2016) zur intrinsischen Motivation für Portfolioarbeit im Lehramtsstudium erfasst (z. B. „Ich arbeite mit dem Portfolio, weil es mir Spaß macht“), die in den vorliegenden Daten ebenfalls eine gute interne Konsistenz aufweist (α = 0,85 [N₁] bis 0,88 [N₂]).

Um diese Instrumente einsetzen zu können, wurden einzelne Items, in denen auf konzeptspezifische Aspekte abgezielt wurde, verallgemeinert adaptiert (z. B. wurde bei einem Item das Wort Arbeitsheft gestrichen). Alle Indikatoren wurden mittels vierstufiger Antwortskala erhoben (1 = trifft überhaupt nicht zu, 2 = trifft eher nicht zu, 3 = trifft eher zu, 4 = trifft voll und ganz zu).

2.2.3 Statistische Analysen

Für die Datenaufbereitung wurden die Software SPSS (v24.0.0.2) und R 4.0.2 (R Core Team 2021), für alle statistischen Analysen das Statistikprogramm Mplus 8 (Muthén und Muthén 1998–2017) verwendet.

Um eine Vergleichbarkeit zu anderen Studien zu ermöglichen, wurde Cronbach’s Alpha (α) als Maß der internen Konsistenz berechnet. Zudem wurde McDonald’s Omega (ω), welches die interne Konsistenz robuster schätzt (Hayes und Coutts 2020), für jede eindimensionale Skala als auch Omega-Subskala-spezifisch (ω_Skala‑S) berechnet (Schermelleh-Engel und Gäde 2020). Zudem wurden die Itemschwierigkeiten p_i und Itemtrennschärfen r_it berechnet (Döring und Bortz 2016).

Die Konstruktvalidität des Instrumentes wurde zunächst mittels der Dimensionalität und Faktorstruktur der Items geprüft. Anhand explorativer Faktorenanalysen (EFA) mit einer obliquen Rotation (Geomin; Browne 2001) und einer Maximum-Likelihood (ML) Schätzung wurde geprüft, ob die 18 Items des EPP‑L tatsächlich, wie theoretisch angenommen, am besten durch sechs Inhaltsaspekte (d. h. sechs Faktoren) abgebildet werden. χ²-Differenztests ermöglichten den Vergleich der Passung der Modelle mit zwei bis sechs Faktoren (Satorra und Bentler 2001). Die latente Faktorenstruktur in konfirmatorischen Faktorenanalysen (CFA) wurde mit gegenüber nicht-normalverteilten Daten robustem Maximum-Likelihood-Schätzverfahren (MLR) geprüft. Dafür wurde das Mehrfaktorenmodell (mit sechs Faktoren), ein Modell zweiter Ordnung und ein Bi-Faktor Modell aufgestellt. Um zu prüfen, ob ein Generalfaktor (Einstellung zur Portfolioarbeit) angenommen werden kann, wurde das Mehrfaktorenmodell gegen ein Modell zweiter Ordnung und ein Bi-Faktor Modell mit χ²-Differenztests geprüft. Zur Beurteilung der Dominanz eines Generalfaktors wurde Omega-hierarchisch (ω_H) berechnet (Schermelleh-Engel und Gäde 2020).

Die inhaltliche Bedeutung der Faktoren des Instrumentes EPP‑L wurde geprüft, indem die konvergente und divergente Validität untersucht wurde. Dafür wurde ein korrelativer Ansatz in Strukturgleichungsmodellen herangezogen (Geiser 2010; Moosbrugger und Kelava 2012): Die jeweiligen Instrumente wurden separat latent modelliert und mit der Einstellung zur Portfolioarbeit korreliert und so Messfehler berücksichtigt.

Die praktische Relevanz des Instrumentes wurde durch Analyse der Kriteriumsvalidität geprüft. Dabei wurden die Konstrukte auf Basis der Instrumente latent modelliert und ebenfalls mit der Einstellung zur Portfolioarbeit korreliert.

Um ein mit Blick auf die Testfairness unterschiedliches Antwortverhalten zwischen den Geschlechtern auf dieselben Items der Einstellungen zu Portfolioarbeit zu identifizieren, wurden für jedes Item Mehrere-Indikatoren-mehrere-Ursachen-Modelle (multiple-indicators multiple causes; MIMIC: Jöreskog und Goldberger 1975; DIF-Analyse) berechnet, um akkurate Schätzungen auch bei kleinen Stichproben zu ermöglichen (Jin und Chen 2020). Wie von Chun et al. (2016) empfohlen, wurde zunächst ein Baseline-Modell aufgestellt, bei welchem das gemessene latente Konstrukt (in diesem Fall ein Generalfaktor Einstellung zu Portfolioarbeit) auf die dichotome Geschlechtsvariable (0 = männlich, 1 = weiblich) regressiert wurde. Gegen dieses Baseline-Modell wurden dann 18 MIMIC-Modelle, die sich vom Baseline-Modell dadurch unterschieden, dass die jeweiligen Regressionen der 18 Items auf die Geschlechtsvariable einbezogen wurden, getestet (χ²-Differenztests). Es wurde also geprüft, ob ein Modell, bei welchem das Geschlecht die Ausprägung (d. h. das Antwortverhalten) auf einem der 18 Items des EPP‑L vorhersagt, besser zu den Daten passt. Sollte diese Passung besser sein als im Baseline-Modell (bei welchem die Vorhersage der Ausprägung auf einem Item durch das Geschlecht nicht berücksichtigt wird), dann läge eine geschlechterspezifische Diskriminierung (DIF) durch dieses Item vor, weil in den Modellen zugleich die Ausprägung der generellen Einstellung zu Portfolioarbeit kontrolliert wird. Zudem wurde geprüft, ob die Regressionen der Items auf die Geschlechtsvariable statistisch signifikant sind. Für Robustheitsanalysen wurden die Skalenvarianzen als Schätzer extremen Antwortverhaltens als zusätzliche Prädiktoren in die MIMIC Modelle aufgenommen (Chen et al. 2017).

Zur Bewertung der Größe der Korrelationen (Effektstärken) orientieren wir uns an Cohen (1988), bezogen auf die interne Konsistenz an Taber (2018), bezüglich der Itemschwierigkeiten und -trennschärfen an Döring und Bortz (2016) und hinsichtlich der Modellfitwerte an Schermelleh-Engel et al. (2003).

2.2.4 Umgang mit fehlenden Werten

Für die 4 % fehlenden Werte in Stichprobe N₁ und die 0,4 % fehlenden Werte in Stichprobe N₂ zeigt sich bezogen auf die 18 Items des Instrumentes, die Items der Validierungsinstrumente und die verfügbaren demografischen Variablen (Alter, Geschlecht, Fachsemester) mit dem Test nach Little (1988), dass die Annahme, wonach die fehlenden Werte völlig zufällig fehlen (MCAR Bedingung), nicht verworfen werden muss (p > 0,05). Die modellbasierte Schätzung Full Information Maximum Likelihood (FIML) wurde als adäquate Methode zur Behandlung der fehlenden Werte eingesetzt (Graham 2012; Lüdtke et al. 2007; Schafer und Graham 2002). Dabei wurde das Alter der Teilnehmenden (mit Ausnahme der EFA, bei denen keine Hilfsvariablen aufgenommen werden konnten) als kontinuierliche Hilfsvariable verwendet, indem der Befehl auxiliary (m) in Mplus 8 verwendet wurde.

3 Ergebnisse

3.1 Mittelwerte und Reliabilitäten der Skalen sowie Schwierigkeiten der Items

Für die Berechnung der Mittelwerte und der Reliabilitäten der Skalen sowie der Itemschwierigkeiten wurde auf die größere Stichprobe (N₁ = 424 Lehramtsstudierende) zurückgegriffen. Die in Tab. 3 abgebildeten und geschlechterdifferenzierten Mittelwerte und Standardabweichungen sind nahe dem theoretischen Skalenmittelwert und die Mittelwerte liegen unter Frauen durchweg höher. Nur bezüglich der Skalen Entwicklung von Reflexivität und Möglichkeit der Innovierung der Ausbildung sind die geschlechtsspezifischen Unterschiede nicht statistisch signifikant. Gemessen an Cohen’s d sind die Mittelwertunterschiede für die Gesamtskala am bedeutsamsten.

Tab. 3 Manifeste Mittelwerte und Standardabweichungen und Mittelwertunterschiede zwischen Geschlechtern der Skalen sowie der Gesamtskala

Full size table

Es zeigen sich gute interne Konsistenzwerte der sechs Skalen und der Gesamtskala, auch bei separaten Analysen für Frauen und Männer (Tab. 4).

Tab. 4 Itemstatistiken und Reliabilitäten der Skalen

Full size table

Die Schwierigkeitsparameter liegen zwischen 53 % und 81 %, wobei das Item EPP-L17 (\(p_{i}\)= 0,81) das einfachste (stärkste Zustimmung) und EPP-L37 (\(p_{i}\)= 0,53) das schwierigste Item (geringste Zustimmung) ist. Bis auf das Item EPP-L9 (r_it = 0,41) weisen alle Items hohe Trennschärfen auf.

3.2 Die Validität des EPP‑L

3.2.1 Konstruktvalidität

Der Vergleich der Fit-Statistiken der Modelle von einem Faktor bis sechs Faktoren im Rahmen explorativer Faktorenanalysen zeigt: Das Modell mit sechs Faktoren passt anhand der Fit-Indizes (Schermelleh-Engel et al. 2003) gut zu den Daten (Tab. 11 im Anhang).

Erwartungskonform laden diejenigen Items, die jeweils theoretisch den sechs Skalen des EPP‑L zugeordnet wurden, auch empirisch auf einem gemeinsamen Faktor, während die übrigen Items geringe Ladungen (λ < 0,300) auf dem jeweiligen Faktor aufweisen (Tab. 12 im Anhang). Lediglich Item 9 weist eine geringe Ladung (λ = 0,272) auf dem zugeordneten Faktor (F1: Entwicklung von Reflexivität) auf, die Ladungen des Items auf den anderen Faktoren reicht von λ = −0,020 (F4: Möglichkeit des Sammelns und der Dokumentation) bis λ = 0,237 (F3: Möglichkeit der Innovierung der Ausbildung). Allerdings lädt Item 9 auf Faktor F1 höher als auf allen anderen Faktoren. Zudem sind die Ladungen der drei Items 9, 5 und 17 von allen 18 Items die einzigen statistisch signifikanten. Die Beträge der Ladungen aller anderen Items sind niedriger als 0,165 (bei 13 Items sogar λ < 0,100). Insgesamt kann auf Basis der Ladungsmuster von einer zuverlässigen Zuordnung der Items zu den sechs Faktoren ausgegangen werden, wodurch eine gute inhaltliche Interpretation der Faktoren möglich ist. Die Existenz der sechs Faktoren bedeutet, dass sich die Einstellungen zu unterschiedlichen Aspekten der Portfolioarbeit voneinander differenzieren lassen. Die inhaltliche Bedeutsamkeit dieser sechs Faktoren ergibt sich beim Blick auf die jeweils zugehörigen Items (Tab. 2). So bezieht sich beispielsweise die Einstellung einer Person gegenüber Entwicklung von Reflexivität auf die Eignung von Portfolioarbeit, Reflexionsfähigkeit zu fördern. Davon zu unterscheiden ist z. B. die Einstellung gegenüber Entwicklung von Selbstständigkeit, welche die Relevanz von Portfolioarbeit für eigenverantwortliches Handeln betont.

Bis auf eine Ausnahme korrelieren alle sechs Skalen zu diesen Faktoren gering bis moderat positiv (Cohen 1988) und statistisch signifikant. Eine Ausnahme bildet die Beziehung zwischen der Skala Möglichkeit der Innovierung der Ausbildung und der Skala Möglichkeit der Leistungsmessung, die nicht statistisch signifikant korrelieren (Tab. 5).

Tab. 5 Korrelation der sechs Faktoren der explorativen Faktorenanalyse

Full size table

Die Prüfung der latenten Struktur der sechs Skalen auf Grundlage der Stichproben N₁ und N₂ erfolgte, indem das Mehrfaktorenmodell (M7) sowohl gegen das Modell zweiter Ordnung (M8) als auch gegen das Bi-Faktor Modell (M9) getestet wurde (Tab. 6 und 13 im Anhang). Die χ²-Differenztests (N₁: M7–M9: ∆χ² = 29.548, ∆df = 3, p < 0,001; N₁: M8–M9: ∆χ² = 22.586, ∆df = 9, p = 0,007; N₁: M7–M9: ∆χ² = 18.784, ∆df = 3, p < 0,001; N₁: M8–M9: ∆χ² = 35.538, ∆df = 9, p < 0,001) und die Modell-Fit-Indizes legen die Existenz eines Generalfaktors Einstellung zu Portfolioarbeit nahe.

Tab. 6 Schätzungen der konfirmatorischen Faktorenanalysen

Full size table

Vergleiche zwischen dem Modell zweiter Ordnung und dem Bi-Faktor Modell können kaum sinnvoll realisiert werden (Mansolf und Reise 2017). Vielmehr passen aufgrund der Modell-Fit-Indizes beide Modelle gut zu den Daten. Weil jedoch nur das Bi-Faktormodell durchweg gute Modell-Fit-Statistiken aufweist und zudem sparsamer ist, wurde für die folgenden Validierungsanalysen das Bi-Faktor Modell herangezogen. Alle Statistiken (z. B. standardisierte Ladungen) der drei Modelle basierend auf N₁ sind in Abb. 1 dargestellt.

Mit Blick auf AIC und aBIC passen die Modelle mit Generalfaktor im Vergleich zum Mehrfaktormodell nur unwesentlich anders zu den Daten: das Modell zweiter Ordnung passt etwas schlechter, das Bi-Faktor Modell passt etwas besser. Das Omega-hierarchisch von ω_H = 0,65 bezüglich des Bi-Faktor Modells verdeutlicht allerdings, dass durch den Generalfaktor ein substanzieller Anteil der wahren Varianz an der Gesamtvarianz der Items erklärt wird.

3.2.2 Konvergente und divergente Validität sowie Kriteriumsvalidität

Zur Prüfung der konvergenten und divergenten Validität sowie der Kriteriumsvalidität wird der Generalfaktor Einstellung zu Portfolioarbeit aus dem Bi-Faktor Modell mit den entsprechenden latenten Konstrukten korreliert (N₁: Tab. 7; N₂: Tab. 8).

Tab. 7 Korrelationen zwischen den latenten Konstrukten zur Überprüfung der Validität

Full size table

Tab. 8 Korrelationen zwischen den latenten Konstrukten zur Überprüfung der Validität

Full size table

Erwartungskonform zeigen sich starke positive Zusammenhänge mit den Konstrukten, die ebenfalls Einstellungen zu (d. h. meist Akzeptanz von) Portfolioarbeit messen (r > 0,81, p < 0,001). Zudem sind die Zusammenhänge mit dem Interesse an der Portfolioarbeit (INT), der Motivation zur Portfolioarbeit (MOT) und dem wahrgenommenen Nutzen der Portfolioarbeit (NUZ) wie erwartet statistisch signifikant und mittel bis stark positiv. Des Weiteren zeigt sich erwartungsgemäß ein schwacher, statistisch signifikanter Zusammenhang mit dem Konstrukt transmissive Überzeugungen (TRA) sowie kein Zusammenhang mit konstruktivistischen lerntheoretischen Überzeugungen (KON).

3.3 Testfairness

Im Kontext dieser Studie läge Uniform Differential Item Functioning (DIF) vor, wenn Individuen mit gleichen Einstellungen zu Portfolioarbeit unterschiedliche Wahrscheinlichkeiten besitzen, den Antwortkategorien eines Items des Generalfaktors Einstellung zu Portfolioarbeit deshalb zuzustimmen, weil sie einem bestimmten Geschlecht angehören (0 = männlich, 1 = weiblich). Ein einheitlich gruppenabhängiges Item (Englisch uniform DIF, im Folgenden kurz DIF) läge vor, wenn das Item konsistent über alle Ausprägungen der Einstellungen zu Portfolioarbeit hinweg von unterschiedlichen Geschlechtsgruppen unterschiedlich beantwortet wird. Das Baseline Modell, gegen welches alle MIMIC-Modelle pro Item getestet wurden, zeigt einen guten Fit (AIC = 17.917.436, BIC = 18.303,454, aBIC = 17.998,826, RMSEA = 0,047, 90 %-KI [0,039; 0,056], CFI = 9,58, TLI = 0,947, SRMR = 0,039). Der Vergleich der erweiterten MIMIC-Modelle unter Verwendung der Stichprobe N₁, die einen direkten Effekt des Geschlechts auf einzelne Items enthalten, zeigt, dass zwei der 18 Items (EPP-L24 und 29) der Skala Möglichkeit der Leistungsmessung einheitlich gruppenabhängige Items sind (siehe grau hinterlegte Zeilen in Tab. 14 im Anhang). Alle anderen Items diskriminierten keine Geschlechtsgruppe, werden also nicht konsistent von einem Geschlecht anders beantwortet als vom anderen. Um die Robustheit der Ergebnisse zu testen, wurden die gleichen MIMIC-Modelle pro Item erneut geprüft und dabei der direkte Effekt der individuellen Skalenvarianz auf die jeweiligen Items berücksichtigt, um extremes Antwortverhalten zu kontrollieren. Die DIF Effekte bestätigen die Ergebnisse.

4 Diskussion

Portfolioarbeit ist ein zentraler, teilweise verpflichtender Baustein der Professionalisierung von angehenden Lehrpersonen. Bislang lag kein validiertes Instrument vor, das losgelöst von spezifischen Portfoliokonzeptionen und Anwendungskontexten Einstellungen von Lehramtsstudierenden zur Portfolioarbeit erfassen konnte. In diesem Beitrag wurde die Entwicklung und Validierung eines Instrumentes (EPP-L) vorgestellt, welches die Einstellungen eindimensional und sechs ihnen zugrundeliegende Inhaltsaspekten von Portfolioarbeit mit insgesamt 18 Items erfasst. Mit dem EPP‑L liegt erstmals ein theoretisch fundiertes, reliables und valides Instrument vor, welches konzeptionsübergreifend Einstellungen zu Portfolioarbeit standardisiert erfasst. Es kann einen Beitrag zur Qualitätssicherung bei der Gestaltung von Professionalisierungsprozessen in der Lehrerinnen- und Lehrerbildung leisten.

Ein solches Instrument ist insbesondere deshalb erforderlich, weil sich in der Literatur und Praxis der Lehrerinnen- und Lehrerbildung zwar vielfältige Potenzialzuschreibungen an die Portfolioarbeit finden (Feder und Cramer 2018), es bislang aber kaum Evidenz für Effekte dieser postulierten Potenziale von Portfolioarbeit gibt (Feder und Cramer 2019). Das hier entwickelte Instrument zu Einstellungen zur Portfolioarbeit ist angesichts der großen Verbreitung von Portfolioarbeit in der Lehrerinnen- und Lehrerbildung und den damit verbundenen Ressourcen (bei zugleich wenigen belastbaren Befunden im deutschsprachigen Raum) ein wichtiger Ausgangspunkt, um ein genaueres und belastbares Bild von deren tatsächlichen Erträge zu erhalten. Perspektivisch legt sich eine Adaption auch mit Blick auf die zweite Phase (Referendariat) und dritte Phase (Fort- und Weiterbildung) der Lehrerinnen- und Lehrerbildung nahe.

Zugleich bietet das Instrument EPP‑L die Möglichkeit, Chancen und Grenzen von Portfolioarbeit in der Ausbildung von Lehrpersonen insgesamt kritisch-konstruktiv zu prüfen. Sollte die sich konform zum Forschungsstand zeigende Skepsis angehender Lehrpersonen gegenüber Portfolioarbeit erhärten, sich also eine potenzielle „Prozessillusion“ (Hascher und Sonntagbauer 2013) der Portfolioarbeit mit Blick auf die Professionalisierung bestätigen, so muss auch infrage gestellt werden, in welchem Umfang Portfolioarbeit diejenige Aufmerksamkeit erfährt, die ihr derzeit etwa bildungspolitisch oder im Rahmen der Qualitätsoffensive Lehrerbildung zuteilwird. In diesem Zusammenhang muss einschränkend darauf hingewiesen werden, dass Schlussfolgerungen zu konkretem Verhalten von angehenden Lehrpersonen bezüglich der Portfolioarbeit basierend auf Einstellungen nur eingeschränkt möglich sind. Zwar haben sich Zusammenhänge zwischen Einstellungen und Verhalten in unterschiedlichen Bereichen als substantiell erwiesen (Glasman und Albarracín 2006), gleichzeitig zeigten sich jedoch Moderationen durch unterschiedliche Variablen, wie beispielsweise das Ausmaß direkter Erfahrungen mit dem Einstellungsobjekt (hier: Portfolioarbeit). Zudem ist limitierend die Erfassung von Einstellungen nicht mit tatsächlich realisierten Potenzialen beziehungsweise Wirkungen von Portfolioarbeit gleichzusetzen. Um beispielsweise die Effekte von Portfolioarbeit auf die Professionalisierung von (angehenden) Lehrpersonen zu untersuchen, müssten zukünftig Interventionsstudien (z. B. randomisierte kontrollierte Studien) in der Lehrerinnen- und Lehrerbildung durchgeführt werden.

Über die Frage der Einstellungen zu Portfolioarbeit und damit perspektivisch zum Nutzungsverhalten hinaus ist weiterhin zu klären, ob Portfolioarbeit die institutionell als bedeutsam erachteten Anforderungen (z. B. an eine Steigerung von Kohärenz zwischen Phasen, Komponenten und Akteuren der Lehrerinnen- und Lehrerbildung) erfüllt. Kohärenz im Sinne einer sinnhaften Verknüpfung der Elemente in der Lehrerinnen- und Lehrerbildung könnte sich letztlich auch eher über eine informell-individuelle Relationierungsleistung (Cramer 2020) und damit weniger durch Portfolioarbeit als vielmehr in der Interaktion der Akteure (Lehramtsstudierende und Dozierende) einstellen. Dabei kann ein Portfolio einen unterstützenden Beitrag leisten, z. B. indem es derjenige Ort ist, an dem verschiedene Komponenten des Lehramtsstudiums (Fachwissenschaften, Fachdidaktiken, Bildungswissenschaften, Schulpraxis) bewusst aufeinander bezogen werden. Dadurch werden verschiedene Perspektiven auf denselben Gegenstand eingenommen. Erst dann schöpft Portfolioarbeit ihr besonderes Potenzial aus, zeit- und ortsunabhängig in einem meta-reflexiven Sinne zu einer Relationierung der disziplinär, paradigmatisch und theoretisch sehr heterogenen Elemente der Lehrerinnen- und Lehrerbildung beizutragen (Cramer et al. 2019). Dieser Beitrag zur Professionalisierung kann von der Portfolioarbeit aber nur dann ausgehen, wenn die Einstellungen Studierender (und Dozierender) ihr gegenüber entsprechend positiv sind und die Akteure in der Lehrerinnen- und Lehrerbildung sich mehrheitlich bestimmten Zielen der Portfolioarbeit verpflichten. Genau hier leistet das Instrument über seine wissenschaftliche Relevanz hinaus auch einen Beitrag zur Evaluation und Weiterentwicklung der Lehrerinnen- und Lehrerbildung.

Dabei verdeutlichen die Modellfitindizes, dass in der Forschungspraxis sowohl die Modellierung über ein Bi-Faktormodell als auch über ein Mehrfaktormodell vertretbar ist, wenngleich der Generalfaktor einen substanziellen Anteil der wahren Varianz der Items aufklärt. Das wiederum bedeutet, dass die einzelnen Skalen des Instrumentes EPP‑L in zukünftiger Forschung parallel eingesetzt und ausgewertet werden können und eine aufwendigere Modellierung eines Bi-Faktormodells nicht zwingend notwendig erscheint. Es liegt damit ein gut handhabbares Instrument vor, das effizient eingesetzt werden kann.

4.1 Limitationen

Zur adäquaten Einschätzung der Güte des EPP‑L sollten zwei Limitationen bedacht werden: Erstens ist das Instrument zwar weitestgehend messinvariant bezüglich des Geschlechts, allerdings sind bezüglich zwei der Items unter Frauen höhere Antwortkategorien wahrscheinlicher als unter Männern, obwohl dieselbe Einstellung zu Potenzialen von Portfolioarbeit vorliegt. Dies könnte beispielsweise daran liegen, dass Frauen und Männer Leistungsbeurteilungssituationen unterschiedlich gegenüberstehen und die Worte in den Items daher unterschiedliche Assoziationen auslösen und/oder die Items unterschiedlich verstanden werden. Zwar lässt sich annehmen, dass der Itempool des EPP‑L insgesamt zur Erfassung des Generalfaktors Einstellung zu Portfolioarbeit geeignet ist, doch sollte die unterschiedliche Funktionsweise des EPP‑L bezüglich des Geschlechts insbesondere bei der Interpretation der Skala Möglichkeit der Leistungsmessung berücksichtigt werden. Hier ist nicht auszuschließen, dass bezogen auf Frauen und Männer unterschiedliche Konstrukte erfasst werden. Sollte sich die Verletzung der Testfairness bei den beiden Items in künftiger Forschung als robust erweisen, so ist es ratsam, auf den Einsatz dieser Skala zu verzichten. Künftig kann zudem nach der Relevanz alternativer erklärender Variablen (personenbezogene Variablen wie z. B. Selbstwirksamkeit) gefragt werden. Neben der dichotomen Unterscheidung Frau/Mann wurde keine weitere Gendergruppe (divers) einbezogen, da empirisch abgesicherte Aussagen angesichts der geringen Inzidenz dieser Gruppe in der Stichprobe kaum möglich sind. Schlussfolgerungen zum Verhalten des Instrumentes für diese Gendergruppe sind aus den Analysen in dieser Studie nicht möglich.

Zweitens erscheint es lohnend, die Items des EPP‑L weiter zu optimieren. So wäre zu überlegen, ob einzelne Items so ausgetauscht werden können, dass eine höhere Streuung der Zustimmungswerte (d. h. der Schwierigkeitsindizes) erzielt wird (vgl. Döring und Bortz 2016). Zudem weist das Item EPP-L9 („Ich traue Portfolioarbeit zu, dass sie das Nachdenken über Erfahrungen in der Praxis aus unterschiedlichen Blickwinkeln vertieft“) eine niedrige Ladung bezüglich des Faktors Entwicklung von Reflexivität auf. Dieses Item könnte zukünftig umformuliert oder gegebenenfalls ersetzt werden.

4.2 Ausblick

Das Instrument EPP‑L beansprucht aufgrund seiner theoretischen Fundierung auf den zuvor identifizierten Potenzialen von Portfolioarbeit, unabhängig von Standorten und spezifischen Konzeptionen eingesetzt werden zu können. Damit verbindet sich großes Potenzial zur Bearbeitung des Desiderats, über einzelne Konzeptevaluationen hinaus Erkenntnisse zur Portfolioarbeit und Einsatz in der Lehrerinnen- und Lehrerbildung zu gewinnen. Es ergeben sich Anhaltspunkte für eine Optimierung der Portfolioarbeit, indem deutlich wird, welche Potenziale seitens der Nutzenden als besonders tragfähig angesehen werden und welche erwarteten Potenziale keine Entsprechung finden. Alternativ könnten sehr kritische Einstellungen bestimmte Portfoliokonzeptionen generell in Frage stellen und so Reformbedarf markieren. Wie sich die Einstellungen insgesamt quantifizieren, muss durch standortübergreifende (internationale) Forschung in größeren Stichproben geklärt werden, um das Potenzial von Portfolioarbeit insgesamt zu evaluieren. Erste Überlegungen dazu werden im Rahmen des Forschungsnetzwerks Portfolioarbeit in der Bildung (https://uni-tuebingen.de/de/168549) angestellt. Solche Forschung kann dazu beitragen, Synergien zwischen den bislang stark unterschiedlichen Portfoliokonzeptionen in der Ausbildung von Lehrpersonen konzeptionell zu stärken und diese so evidenzbasierten Forschungs- und Entwicklungsprozessen zugänglich zu machen.

Literatur

Ajzen, I. (1987). Attitudes, traits, and actions: Dispositional prediction of behavior in personality and social psychology. Advances in Experimental Social Psychology, 20, 1–63. https://doi.org/10.1016/S0065-2601(08)60411-6.
Article Google Scholar
Ajzen, I. (2001). Nature and operation of attitudes. Annual Review of Psychology, 52(1), 27–58. https://doi.org/10.1146/annurev.psych.52.1.27.
Article Google Scholar
Ajzen, I. & Fishbein, M. (1980). Understanding attitudes and predicting social behavior. Englewood Cliffs, N.J: Prentice-Hall.
Google Scholar
Albarracín, D., Sunderrajan, A., Lohmann, S., Chan, S. & Jiang, D. (2018). The psychology of attitudes, motivation, and persuasion. In D. Albarracín & B. T. Johnson (Hrsg.), Basic Principles. The handbook of attitudes. London: Routledge.
Artmann, M. & Herzmann, P. (2016). Portfolioarbeit im Urteil von Studierenden. Ergebnisse einer Interviewstudie zur LehrerInnenbildung im Kölner Modellkolle. In S. Ziegelbauer & M. Gläser-Zikuda (Hrsg.), Portfolio als Innovation in Schule, Hochschule und LehrerInnenbildung. Perspektiven aus Praxis, Forschung und Lehre (S. 131–146). Bad Heilbrunn: Klinkhardt.
Google Scholar
Barton, J. & Collins, A. (1993). Portfolios in teacher education. Journal of Teacher Education, 44(3), 200–210. https://doi.org/10.1177/002248719304400307.
Article Google Scholar
Bonneville-Roussy, A., Evans, P., Verner-Filion, J., Vallerand, R. J. & Bouffard, T. (2017). Motivation and coping with the stress of assessment: gender differences in outcomes for university students. Contemporary Educational Psychology, 48, 28–42. https://doi.org/10.1016/j.cedpsych.2016.08.003.
Article Google Scholar
Borko, H., Michalec, P., Timmons, M. & Siddle, J. (1997). Student teaching portfolios: a tool for promoting reflective practice. Journal of Teacher Education, 48(5), 345–357. https://doi.org/10.1177/0022487197048005004.
Article Google Scholar
Brouër, B. (2005). Portfolio – Ein Beitrag zur schulpraktischen Kompetenzentwicklung. karlsruher pädagogische beiträge, 61, 7–23.
Google Scholar
Brouër, B. (2007). Pädagogische Portfolios in der Diplomhandelslehrer-Ausbildung. In E. M. Hertle & P. F. E. Sloane (Hrsg.), Portfolio – Kompetenzen – Standards. Neue Wege in der Lehrerbildung für berufsbildende Schulen (S. 31–45). Paderborn: Eusl-Verlagsgesellschaft.
Google Scholar
Brouër, B. & Gläser-Zikuda, M. (2010). Förderung selbstregulativer Fähigkeiten im Kontext selbstorganisierten Lernens. In J. Seifried, E. Wuttke, R. Nickolaus & P. F. E. Sloane (Hrsg.), Lehr-Lern Forschung in der kaufmännischen Berufsbildung. Ergebnisse und Gestaltungsaufgaben (Bd. 23, S. 123–136). Stuttgart: Franz Steiner.
Browne, M. W. (2001). An overview of analytic rotation in exploratory factor analysis. Multivariate Behavioral Research, 36(1), 111–150. https://doi.org/10.1207/S15327906MBR3601_05.
Article Google Scholar
Bryant, L. H. & Chittum, J. R. (2013). ePortfolio effectiveness: A(n ill-fated) search for empirical support. International Journal of EPortfolio, 3(2), 189–198.
Google Scholar
Bühner, M. (2011). Einführung in die Test- und Fragebogenkonstruktion (3. Aufl.). München: Pearson.
Google Scholar
Byrnes, J. P., Miller, D. C. & Schafer, W. D. (1999). Gender differences in risk taking: A meta-analysis. Psychological Bulletin, 125(3), 367–383. https://doi.org/10.1037/0033-2909.125.3.367.
Article Google Scholar
Cakir, A. & Balcikanli, C. (2012). The use of the EPOSTL to foster teacher autonomy: ELT student teachers’ and teacher trainers’ views. Australian Journal of Teacher Education. https://doi.org/10.14221/ajte.2012v37n3.7.
Article Google Scholar
Caspi, A., Chajut, E. & Saporta, K. (2008). Participation in class and in online discussions: gender differences. Computers & Education, 50(3), 718–724. https://doi.org/10.1016/j.compedu.2006.08.003.
Article Google Scholar
Chen, H.-F., Jin, K.-Y. & Wang, W.-C. (2017). Modified logistic regression approaches to eliminating the impact of response styles on DIF detection in Likert-Type scales. Frontiers in Psychology, 8, 1143. https://doi.org/10.3389/fpsyg.2017.01143.
Article Google Scholar
Christen, A. & Hofmann, M. (2013). E‑Reflexionsportfolio an der Pädagogischen Hochschule St. Gallen (PHSG, Schweiz). Entwicklungen im Studienjahr 2009/2010. In D. Miller & B. Volk (Hrsg.), E‑Portfolio an der Schnittstelle von Studium und Beruf (S. 133–146). Münster: Waxmann. http://www.pedocs.de/frontdoor.php?source_opus=9811&la=de.
Google Scholar
Chun, S., Stark, S., Kim, E. S. & Chernyshenko, O. S. (2016). MIMIC methods for detecting DIF among multiple groups: exploring a enw sequential-free baseline procedure. Applied Psychological Measurement, 40(7), 486–499. https://doi.org/10.1177/0146621616659738.
Article Google Scholar
Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2. Aufl.). Hillsdale, NJ: Erlbaum.
Google Scholar
Cramer, C. (2020). Kohärenz und Relationierung in der Lehrerinnen- und Lehrerbildung. In C. Cramer, J. König, M. Rothland, & S. Blömeke (Hrsg.), Handbuch Lehrerinnen- und Lehrerbildung (S. 269–279). Bad Heilbrunn: Klinkhardt utb. https://doi.org/10.35468/hblb2020-031.
Cramer, C., Harant, M., Merk, S., Drahmann, M., & Emmerich, M. (2019). Meta-Reflexivität und Professionalität im Lehrerinnen- und Lehrerberuf. Zeitschrift für Pädagogik, 65(3), 401–423. https://doi.org/10.25656/01:23949.
De Ayala, R. J. (2009). The theory and practice of item response theory. New York, NY: Guilford Press.
Döring, N. & Bortz, J. (2016). Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler (5. Aufl.). Heidelberg: Springer.
Dreyer, J. M. (2015). Reliability of recognition of prior learning (RPL) assessments for teaching practice courses in open distance electronic learning (ODeL). International Journal of Educational Sciences, 8(1), 111–117. https://doi.org/10.1080/09751122.2015.11917597.
Feder, L. & Cramer, C. (2018). Potenziale von Portfolioarbeit in der Lehrerbildung. Eine Analyse der Portfolioliteratur. DDS – Die Deutsche Schule, 110(4), 354–368. https://doi.org/10.31244/dds.2018.04.06.
Feder, L. & Cramer, C. (2019). Portfolioarbeit in der Lehrerbildung. Ein systematischer Forschungsüberblick. Portfolio in teacher education. A research synthesis. Zeitschrift für Erziehungswissenschaft, 22(5), 1225–1245. https://doi.org/10.1007/s11618-019-00903-2.
Article Google Scholar
Feder, L. & Cramer, C. (in Begutachtung). Research on portfolios in teacher education: A systematic review. Manuskript zur Veröffentlichung eingereicht.
Feder, L., Cramer, C., Bohl, T. & Wenz, K. (2019). Portfolioarbeit in der Lehrerbildung. Potenziale – empirische Forschungslage – konzeptuelle Kontextualisierung. In BMBF (Hrsg.), Verzahnung von Theorie und Praxis im Lehramtsstudium (S. 40–47).
Feder, L., Fütterer, T. & Cramer, C. (2021). Einstellungen Studierender zur Portfolioarbeit. Theoriebasierte Erfassung und erste deskriptive Befunde. In N. Beck, T. Bohl, & S. Meissner (Hrsg.), Vielfältig herausgefordert. Forschungs- und Entwicklungsfelder der Lehrerbildung auf dem Prüfstand. Diskurse und Ergebnisse der ersten Förderphase der Qualitätsoffensive Lehrerbildung an der Tübingen School of Education (S. 209–221). Tübingen: Tübingen University Press. https://doi.org/10.15496/publikation-52627.
Fütterer, T. (2019). Professional Development Portfolios im Vorbereitungsdienst. Die Wirksamkeit von Lernumgebungen auf die Qualität der Portfolioarbeit. Wiesbaden: Springer. https://doi.org/10.1007/978-3-658-24064-6.
Geiser, C. (2010). Datenanalyse mit Mplus. Eine anwendungsorientierte Einführung (1. Aufl.). Wiesbaden: Springer VS.
Book Google Scholar
Gläser-Zikuda, M. (2009). Potenziale und Grenzen von Lerntagebuch und Portfolio im Bildungsbereich. In M. Gläser-Zikuda (Hrsg.), Lerntagebuch und Portfolio auf dem Prüfstand (2. Aufl., S. 95–100). Landau: Empirische Pädagogik.
Gläser-Zikuda, M. & Hascher, T. (Hrsg.). (2007). Lernprozesse dokumentieren, reflektieren und beurteilen. Lerntagebuch und Portfolio in Bildungsforschung und Bildungspraxis. Bad Heilbrunn: Klinkhardt.
Gläser-Zikuda, M., Feder, L. & Hofmann, F. (2020). Portfolioarbeit in der Lehrerinnen- und Lehrerbildung. In C. Cramer, J. König, M. Rothland & S. Blömeke (Hrsg.), Handbuch Lehrerinnen- und Lehrerbildung (S. 706–712). Bad Heilbrunn: Klinkhardt utb. https://www.handbuch-lehrerbildung.net/download/85-portfolioarbeit-in-der-lehrerinnen-und-lehrerbildung/.
Google Scholar
Glasman, L. R. & Albarracín, D. (2006). Forming attitudes that predict future behavior: a meta-analysis of the attitude-behavior relation. Psychological Bulletin, 132(5), 778–822. https://doi.org/10.1037/0033-2909.132.5.778.
Article Google Scholar
Graham, J. W. (2012). Missing data. Analysis and design. New York, NY: Springer. https://doi.org/10.1007/978-1-4614-4018-5.
Book Google Scholar
Häcker, T. (2012). Portfolioarbeit im Kontext einer reflektierenden Lehrer/innenbildung. In R. Egger & M. Merkt (Hrsg.), Lernwelt Universität (S. 263–289). Wiesbaden: VS. https://doi.org/10.1007/978-3-531-18941-3_15.
Chapter Google Scholar
Häcker, T. & Lissmann, U. (2007). Möglichkeiten und Spannungsfelder der Portfolioarbeit – Perspektiven für Forschung und Praxis. Empirische Pädagogik, 21(2), 209–239.
Google Scholar
Hartig, J., Frey, A. & Jude, N. (2012). Validität. In H. Moosbrugger & A. Kelava (Hrsg.), Testtheorie und Fragebogenkonstruktion (2. Aufl., S. 143–171). Berlin, Heidelberg: Springer.
Chapter Google Scholar
Hascher, T. & Sonntagbauer, C. (2013). Portfolio in der Lehrer/innenbildung – Bilanz, Rahmung und Ausblick. In B. Koch-Priewe, T. Leonhard, A. Pineker & J. C. Störtländer (Hrsg.), Portfolio in der LehrerInnenbildung. Konzepte und empirische Befunde (S. 287–298). Bad Heilbrunn: Klinkhardt.
Google Scholar
Hayes, A. F. & Coutts, J. J. (2020). Use omega rather than Cronbach’s Alpha for estimating reliability. But ... Communication Methods and Measures, 14(1), 1–24. https://doi.org/10.1080/19312458.2020.1718629.
Article Google Scholar
Hofmann, F., Wolf, N., Klaß, S., Grassmé, I. & Gläser-Zikuda, M. (2016). Portfolios in der LehrerInnenbildung. Ein aktueller Überblick zur empirischen Befundlage. In M. Boos, A. Krämer & M. Kricke (Hrsg.), Portfolioarbeit phasenübergreifend gestalten: Konzepte, Ideen und Anregungen aus der LehrerInnenbildung (S. 23–39). Münster: Waxmann.
Google Scholar
Holzberger, D., Maurer, C., Kunina-Habenicht, O. & Kunter, M. (2021). Ready to teach? A profile analysis of cognitive and motivational-affective teacher characteristics at the end of pre-service teacher education and the long-term effects on occupational well-being. Teaching and Teacher Education, 100, 103285. https://doi.org/10.1016/j.tate.2021.103285.
Article Google Scholar
Imhof, M. & Picard, C. (2009). Views on using portfolio in teacher education. Teaching and Teacher Education, 25(1), 149–154. https://doi.org/10.1016/j.tate.2008.08.001.
Article Google Scholar
Jin, K.-Y. & Chen, H.-F. (2020). MIMIC approach to assessing differential item functioning with control of extreme response style. Behavior Research Methods, 52(1), 23–35. https://doi.org/10.3758/s13428-019-01198-1.
Article Google Scholar
Jöreskog, K. G. & Goldberger, A. S. (1975). Estimation of a model with multiple indicators and multiple causes of a single latent variable. Journal of the American Statistical Association, 70(351), 631–639. https://doi.org/10.2307/2285946.
Article Google Scholar
Kelava, A. & Moosbrugger, H. (2012). Deskriptivstatistische Evaluation von Items (Itemanalyse) und Testwertverteilungen. In H. Moosbrugger & A. Kelava (Hrsg.), Testtheorie und Fragebogenkonstruktion (2. Aufl. S. 75–102). Berlin, Heidelberg: Springer.
Chapter Google Scholar
Kirkpatrick, D. L. & Kirkpatrick, J. D. (2006). Evaluating training programs: the four levels (3. Aufl.). San Francisco: Berrett-Koehler.
Google Scholar
Klampfer, A. (2013). E‑Portfolios als Instrument zur Professionalisierung in der Lehrer- und Lehrerinnenausbildung. Glückstadt: Hülsbusch.
Kleinke, K., Schlüter, E., & Christ, O. (2017). Strukturgleichungsmodelle mit Mplus: Eine praktische Einführung (2. Aufl.). Berlin: de Gruyter.
Book Google Scholar
Koch-Priewe, B. (2013). Das Portfolio in der LehrerInnenbildung – Verbreitung, Zielsetzungen, Empirie, theoretische Fundierungen. In B. Koch-Priewe, T. Leonhard, A. Pineker & J. C. Störtländer (Hrsg.), Portfolio in der LehrerInnenbildung. Konzepte und empirische Befunde (S. 41–73). Bad Heilbrunn: Klinkhardt.
Google Scholar
Kopietz, R. & Echterhoff, G. (2016). Einstellungen (Attitudes). In D. Bierhof & H.-W. Frey (Hrsg.), Sozialpsychologie (S. 581–616). Göttingen: Hogrefe.
Google Scholar
Kunter, M., Linninger, C., Schulze-Stocker, F., Kunina-Habenicht, O. & Lohse-Bossenz, H. (2013). Evaluation des reformierten Vorbereitungsdienstes in Nordrhein-Westfalen. Frankfurt am Main: Goethe-Universität.
Google Scholar
Kunter, M., Baumert, J., Leutner, D., Terhart, E., Seidel, T., Dicke, T., Holzberger, D., Kunina-Habenicht, O., Linninger, C., Lohse-Bossenz, H., Schulze-Stocker, F. & Stürmer, K. (2017). Dokumentation der Erhebungsinstrumente der Projektphasen des BilWiss-Forschungsprogramms von 2009 bis 2016. http://nbn-resolving.de/urn:nbn:de:hebis:30:3-428005. Zugegriffen: 15.11.2022.
Lenzner, T., Neuert, C. & Otto, W. (2015). Kognitives Pretesting. GESIS Survey Guidelines. Mannheim: GESIS – Leibniz-Institut für Sozialwissenschaften. https://doi.org/10.15465/GESIS-SG_010.
Little, R. J. A. (1988). A test of missing completely at random for multivariate data with missing values. Journal of the American Statistical Association, 83(404), 1198–1202. https://doi.org/10.1080/01621459.1988.10478722.
Article Google Scholar
Lüdtke, O., Robitzsch, A., Trautwein, U. & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen Forschung. Psychologische Rundschau, 58(2), 103–117. https://doi.org/10.1026/0033-3042.58.2.103.
Article Google Scholar
Mansolf, M. & Reise, S. P. (2017). When and why the second-order and bifactor models are distinguishable. Intelligence, 61, 120–129. https://doi.org/10.1016/j.intell.2017.01.012.
Article Google Scholar
Monitor Lehrerbildung (2019). Vorgaben zur Führung eines Portfolios. https://www.monitor-lehrerbildung.de/web/diagramm/blfrage26_1.
Moosbrugger, H. & Kelava, A. (Hrsg.). (2012). Testtheorie und Fragebogenkonstruktion (2. Aufl.). Heidelberg: Springer.
Muthén, L. K., & Muthén, B. O. (1998). Mplus user’s guide. Los Angeles: Muthén & Muthén.
Google Scholar
Noroozi, O., Banihashem, S. K., Taghizadeh Kerman, N., Parvaneh Akhteh Khaneh, M., Babayi, M., Ashrafi, H. & Biemans, H. J. A. (2022). Gender differences in students’ argumentative essay writing, peer review performance and uptake in online learning environments. Interactive Learning Environments. https://doi.org/10.1080/10494820.2022.2034887.
Article Google Scholar
Pineker, A. & Störtländer, J. C. (2013). Gestaltung von praktikumsbezogenen Reflexionsanlässen im Rahmen des „Bielefelder Portfolio Praxisstudien“ – Zwei hochschuldidaktische Varianten und ihre Evaluation. In B. Koch-Priewe, T. Leonhard, A. Pineker & J. C. Störtländer (Hrsg.), Portfolio in der LehrerInnenbildung. Konzepte und empirische Befunde (S. 193–211). Bad Heilbrunn: Klinkhardt.
Google Scholar
R Core Team (2021). R: A language and environment for statistical computing. http://www.R-project.org. Zugegriffen: 01.11.2021.
Satorra, A. & Bentler, P. M. (2001). A scaled difference chi-square test statistic for moment structure analysis. Psychometrika, 66(4), 507–514. https://doi.org/10.1007/BF02296192.
Article Google Scholar
Schafer, J. L. & Graham, J. W. (2002). Missing data: our view of the state of the art. Psychological Methods, 7(2), 147–177. https://doi.org/10.1037//1082-989X.7.2.147.
Article Google Scholar
Schermelleh-Engel, K. & Gäde, J. C. (2020). Modellbasierte Methoden der Reliabilitätsschätzung. In H. Moosbrugger & A. Kelava (Hrsg.), Testtheorie und Fragebogenkonstruktion (S. 335–368). Berlin, Heidelberg: Springer. https://doi.org/10.1007/978-3-662-61532-4_15.
Chapter Google Scholar
Schermelleh-Engel, K., Moosbrugger, H. & Müller, H. (2003). Evaluating the fit of structural equation models: Tests of significance and descriptive goodness-of-fit measures. Methods of Psychological Research Online, 8(2), 23–74.
Google Scholar
Schlag, M. (2015). Das strukturierte Portfolio zur Dokumentation des Orientierenden Praktikums für Lehramtsstudierende. Mainz: Johannes Gutenberg-Universität Mainz. https://doi.org/10.25358/openscience-1814.
Streblow, L., Rumpold, V. & Valdorf, N. (2013). Einschätzung der Portfolioarbeit durch Lehramtsstudierende – Empirische Ergebnisse einer studienverlaufsbegleitenden Befragung in Bielefeld. In B. Koch-Priewe, T. Leonhard, A. Pineker & J. C. Störtländer (Hrsg.), Portfolio in der LehrerInnenbildung. Konzepte und empirische Befunde (S. 122–135). Bad Heilbrunn: Klinkhardt.
Google Scholar
Strudler, N. & Wetzel, K. (2008). Costs and benefits of electronic portfolios in teacher education. Journal of Computing in Teacher Education, 24(4), 135–142. https://doi.org/10.1080/10402454.2008.10784599.
Article Google Scholar
Taber, K. S. (2018). The use of Cronbach’s Alpha when developing and reporting research instruments in science education. Research in Science Education, 48(6), 1273–1296. https://doi.org/10.1007/s11165-016-9602-2.
Article Google Scholar
Taylor J., Dunbar-Hall, P. & Rowley, J. L. (2012) The e-portfolio continuum: Discovering variables for e-portfolio adoption within music education. Australasian Journal of Educational Technology, 28(8), 1362–1381. https://doi.org/10.14742/ajet.776.
Article Google Scholar
Wolfsgruber, M. (2020). Einstellung und Motivation bei der Portfolioarbeit. Eine empirische Untersuchung der Arbeit mit dem Entwicklungsportfolio am Standort Linz. Linz: Linz School of Education.
Google Scholar
Ziegelbauer, S. (2016). Akzeptanz als Bedingung der erfolgreichen Implementation und Anwendung der pädagogisch-didaktischen Innovation Portfolio. In S. Ziegelbauer & M. Gläser-Zikuda (Hrsg.), Portfolio als Innovation in Schule, Hochschule und LehrerInnenbildung. Perspektiven aus Praxis, Forschung und Lehre (S. 73–85). Bad Heilbrunn: Klinkhardt.
Google Scholar
Ziegelbauer, S. & Gläser-Zikuda, M. (Hrsg.). (2016). Portfolio als Innovation in Schule, Hochschule und LehrerInnenbildung. Perspektiven aus Praxis, Forschung und Lehre. Bad Heilbrunn: Klinkhardt.
Ziegelbauer, S., Ziegelbauer, C., Limprecht, S. & Gläser-Zikuda, M. (2013). Bedingungen für gelingende Portfolioarbeit in der Lehrerinnen- und Lehrerbildung – Empiriebasierte Entwicklung eines adaptiven Portfoliokonzepts. In B. Koch-Priewe, T. Leonhard, A. Pineker & J. C. Störtländer (Hrsg.), Portfolio in der LehrerInnenbildung. Konzepte und empirische Befunde (S. 112–121). Bad Heilbrunn: Klinkhardt.
Google Scholar

Download references

Förderung

Dieses Forschungsprojekt wurde unterstützt von der Tübingen Postdoctoral Academy for Research on Education (PACE) des Hector-Instituts für Empirische Bildungsforschung an der Universität Tübingen; PACE wird vom Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg gefördert. Das diesem Artikel zugrundeliegende Vorhaben wird im Rahmen der gemeinsamen „Qualitätsoffensive Lehrerbildung“ von Bund und Ländern mit Mitteln des Bundesministeriums für Bildung und Forschung unter dem Förderkennzeichen 01JA1911 gefördert. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt beim Autor.

Funding

Open Access funding enabled and organized by Projekt DEAL.

Author information

Authors and Affiliations

Hector-Institut für Empirische Bildungsforschung, Universität Tübingen, Europastraße 6, 72072, Tübingen, Deutschland
Tim Fütterer
Tübingen School of Education, Universität Tübingen, Tübingen, Deutschland
Tim Fütterer, Lina Feder & Colin Cramer
Institut für Erziehungswissenschaft, Universität Tübingen, Tübingen, Deutschland
Lina Feder & Colin Cramer

Authors

Tim Fütterer
View author publications
You can also search for this author in PubMed Google Scholar
Lina Feder
View author publications
You can also search for this author in PubMed Google Scholar
Colin Cramer
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Tim Fütterer.

Ethics declarations

Interessenkonflikt

T. Fütterer, L. Feder und C. Cramer geben an, dass kein Interessenkonflikt besteht.

Additional information

Die Daten sowie die vollständigen reproduzierbaren Codes, die für die Analysen in dieser Studie verwendet wurden, sind auf begründete Anfrage beim korrespondierenden Autor erhältlich. Die Verantwortung für den Inhalt dieser Veröffentlichung liegt bei der Autorin und den Autoren.

Supplementary Information

Onlinematerial 1 bis 3

Anhang

Tab. 9 Itemschwierigkeiten (p_i), Trennschärfen (r_it), Cronbach’s Alpha (α) und McDonald’s Omega (ω) beim ersten Pretest

Full size table

Tab. 10 Faktorladungen der explorativen Faktorenanalyse beim ersten Pretest

Full size table

Tab. 11 Fit-Statistiken der Lösungen der explorativen Faktorenanalyse

Full size table

Tab. 12 Faktorladungen der Lösung mit sechs Faktoren der explorativen Faktorenanalyse

Full size table

Tab. 13 Schätzungen der konfirmatorischen Faktorenanalysen für die drei Modelle

Full size table

Tab. 14 Informationskriterien des einheitlichen MIMIC-DIF-Testverfahrens für jedes der 18 Items des EPP‑L, Modellvergleiche und DIF-Effekte

Full size table

Rights and permissions

Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.

Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.

Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.

Reprints and permissions

About this article

Cite this article

Fütterer, T., Feder, L. & Cramer, C. Ein neues Instrument zur Erfassung der Einstellungen zu Portfolioarbeit in der Lehrerinnen- und Lehrerbildung (EPP-L). Unterrichtswiss 51, 361–393 (2023). https://doi.org/10.1007/s42010-022-00161-y

Download citation

Received: 06 November 2021
Revised: 09 November 2022
Accepted: 16 November 2022
Published: 16 December 2022
Issue Date: September 2023
DOI: https://doi.org/10.1007/s42010-022-00161-y

Schlüsselwörter

Keywords

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Ein neues Instrument zur Erfassung der Einstellungen zu Portfolioarbeit in der Lehrerinnen- und Lehrerbildung (EPP-L)

Zusammenfassung

Abstract

1 Theoretischer Hintergrund

1.1 Portfolioarbeit und deren Potenziale

1.2 Einstellungen zu Portfolioarbeit

1.3 Operationalisierung der Einstellungen zu Portfolioarbeit

1.4 Zielsetzungen und Annahmen

2 Methode

2.1 Konstruktion des Instrumentes

2.2 Validierung des EPP‑L

2.2.1 Stichproben

2.2.2 Instrumente zur Validierung

2.2.3 Statistische Analysen

2.2.4 Umgang mit fehlenden Werten

3 Ergebnisse

3.1 Mittelwerte und Reliabilitäten der Skalen sowie Schwierigkeiten der Items

3.2 Die Validität des EPP‑L

3.2.1 Konstruktvalidität

3.2.2 Konvergente und divergente Validität sowie Kriteriumsvalidität

3.3 Testfairness

4 Diskussion

4.1 Limitationen

4.2 Ausblick

Literatur

Förderung

Funding

Author information

Authors and Affiliations

Corresponding author

Ethics declarations

Interessenkonflikt

Additional information

Supplementary Information

Onlinematerial 1 bis 3

Anhang

Anhang

Rights and permissions

About this article

Cite this article

Share this article

Schlüsselwörter

Keywords

Search

Navigation