Einleitung

Ein angemessenes Wissenschaftsverständnis wird als Teil der Allgemeinbildung innerhalb von Naturwissenschaft und Technik geprägter Gesellschaftsformen und als wichtige Voraussetzung gesellschaftlicher Teilhabe verstanden (Menthe et al. 2013; Arndt et al. 2019). Am entsprechenden bildungswissenschaftlichen Diskurs beteiligen sich die Allgemeine Didaktik (z. B. Klafki 2007), die Pädagogische Psychologie (z. B. Bromme und Kienhues 2008) sowie die an einem pragmatischen (z. B. Shen 1975) wie klassischen (z. B. Hodson 2011) Begriff von scientific literacy orientierten naturwissenschaftsdidaktischen Konzeptionen (vgl. Fischler et al. 2018; Sjöstrom und Eilks 2018). Es wird deutlich, dass ein adäquates Wissenschaftsverständnis Teil einer naturwissenschaftlichen Grundbildung (scientific literacy) ist. Für die Formulierung von Bildungszielen für den Erwerb einer naturwissenschaftlichen Grundbildung, die damit auch das Wissenschaftsverständnis der Schülerinnen und Schüler als Zielebene beinhalten, stehen seit 15 Jahren die Bildungsstandards der Kultusministerkonferenz (KMK 2005a) oder in den USA seit längerem entsprechende National Science Education Standards (National Research Council 1996) und auf das Wissenschaftsverständnis zielende Benchmarks (NGSS 2013). Doch Zielsetzungen und Diskurse über ein angemessenes Wissenschaftsverständnis bleiben bezogen auf den Schulunterricht derzeit noch wirkungsschwach und werden in der Unterrichtspraxis häufig ignoriert (Bartos und Lederman 2014). Der Ansatzpunkt zum Erwerb eines adäquaten Wissenschaftsverständnisses wäre ein wirksames Angebot und die effektive Nutzung von Lerngelegenheiten (Helmke 2012; Seidel 2014; Wilhelm et al. im Druck). Eine Schlüsselrolle auf der Seite des Angebots scheint die Lehrkraft zu spielen (Lipowsky 2006), die einerseits selbst ein adäquates Wissenschaftsverständnis benötigt und andererseits zu dessen Vermittlung Professionswissen aufbauen muss, das alle naturwissenschaftlichen Disziplinen überspannt (Rehm et al. 2016). So wird in der Naturwissenschaftsdidaktik Professionswissen zum Wissenschaftsverständnis unter der Bezeichnung Nature of Science (NOS) naturwissenschaftsübergreifend diskutiert und gelehrt (z. B. Lederman 2007; Höttecke und Henke 2010; McComas 2014; Allchin 2017). Es beinhaltet ein reflektiertes Verständnis über die Rolle der Naturwissenschaften im gesellschaftlichen Kontext sowie über Eigenschaften naturwissenschaftlicher Erkenntnis. Für die Seite der Nutzung von Lerngelegenheiten stehen die oben angesprochenen Bildungsstandards.

In diesem Beitrag fokussieren wir den Bereich NOS auf der Seite des Angebots von Lerngelegenheiten und thematisieren ausgewählte berufliche Anforderungen an Lehrkräfte. Diese beruflichen Anforderungen an Lehrkräfte ergeben sich in unterschiedlichen NOS-Facetten, von denen wir drei in den engeren Fokus nehmen und deren Auswahl vor dem theoretischen Hintergrund des Konstrukts NOS explizit begründen. Diese Facetten nehmen die folgenden Aspekte des Konstrukt NOS in den Blick: die Bedeutung von Kreativität und Subjektivität für naturwissenschaftliche Erkenntnis, die Veränderung naturwissenschaftlicher Erkenntnisse im Laufe der Zeit sowie die Differenzierung zwischen Beobachtung und Schlussfolgerung im naturwissenschaftlichen Erkenntnisprozess. Ziel des Beitrags ist es, die Entwicklung eines Testformats darzustellen, das Professionswissen zu diesen NOS-Facetten bei angehenden Lehrkräften erheben kann.

Theoretischer Hintergrund

Nature of Science

Nature of Science (NOS) gilt fachdidaktisch als naturwissenschaftsübergreifendes Konstrukt (z. B. Schwarz und Lederman 2008). Frühe Unterrichtsbemühungen und Untersuchungen zu NOS konzentrierten sich in den USA der 50er und 60er Jahre auf Erkenntniswege wissenschaftlichen Wissens, also Scientific Inquiry (z. B. Welch und Pella 1967). Später traten Aspekte der Wissenschaftsphilosophie, -historie und -soziologie hinzu, z. B. im Sinne von Popper (1935) oder Kuhn (1962). Zunehmend bekommt das Wissen und Reflektieren über NOS als Teil naturwissenschaftlicher Bildung auch im deutschsprachigen Raum Gewicht (z. B. KMK 2005a, 2005b, 2005c; Höttecke 2001).

In aktuellen Ansätzen beinhaltet NOS ein reflektiertes Verständnis der Rolle der Naturwissenschaften im gesellschaftlichen, technischen, ökologischen und ansatzweise historischen Kontext sowie Eigenschaften naturwissenschaftlicher Erkenntnis (z. B. Gebhard et al. 2017; Allchin 2017). Mit der Reflexion über NOS nimmt naturwissenschaftlicher Unterricht eine grundlegende allgemeinbildende Funktion wahr: Schülerinnen und Schüler sollen über Kenntnisse naturwissenschaftlicher Inhalte und Methoden verfügen, damit sie Möglichkeiten und Grenzen naturwissenschaftlichen Wissens und Handelns reflektieren können. Dabei beinhaltet diese Reflexion nicht nur naturwissenschaftliches Fachwissen, sondern auch erkenntnis- und wissenschaftstheoretisches sowie wissenschaftshistorisches und -soziologisches Wissen (Hößle et al. 2004), für einen handelnden Umgang mit Naturwissenschaft im Sinne einer gesellschaftlichen Teilhabe und Meinungsbildung. Informierte Bürgerinnen und Bürger, die naturwissenschaftlichen Unterricht erhalten haben, sollten sich beispielsweise mit sogenannten socio-scientfic issues, kurz SSIs (Zeidler 2015) auseinandersetzen können, also gesellschaftlich bedeutsamen und naturwissenschaftlich relevanten Problemen, wie dem Klimawandel oder dem Klonen von Tieren (Gebhard et al. 2017).

Empirisch zeigt sich jedoch, dass die Unterrichtserfolge bei den Schülerinnen und Schülern in diesem Bereich hinter dem fachdidaktischen, bzw. gesellschaftlich-politischen Anspruch zurückbleiben (Deng et al. 2011). Es zeigt sich wenig Bewusstsein für eine soziale und in Institutionen verankerte Praxis, in der Experten miteinander aushandeln, was sie als gültiges Wissen erachten. Eine Praxis, die (auch) von gegenseitiger Kontrolle geprägt ist. In der anglo-amerikanischen Naturwissenschaftsdidaktik wurden auf Basis dieser Befundlage unterschiedliche Vorschläge gemacht, um das Lernen über NOS zu strukturieren, woraus sich bestimmte berufliche Anforderungen an das fachdidaktische Wissen und Können von Lehrkräften ergeben. Insbesondere wurde das Konstrukt NOS elementarisiert, um die Komplexität des Themas für Lernprozesse besser greifbar, und vor allem vermittelbar zu machen. Eine prominente Elementarisierungsmaßnahme stellen so genannte Aspektlisten dar.

NOS konzeptualisiert als Minimalkonsens in Aspektlisten

Seit etwa zwei Jahrzehnten werden in der Naturwissenschaftsdidaktik Listen diskutiert, welche NOS-Eigenschaften Lernende, aber auch Lehrkräfte kennen und reflektiert haben sollten (z. B. McComas 1998; Osborne et al. 2003; Lederman 2007; kritisch dazu z. B. Irzik und Nola 2011; Erduran und Dagher 2014; Allchin 2017). Die Strukturierung bzw. Elementarisierung von NOS ergibt sich aus einer fachlichen Analyse der Naturwissenschaften unter Berücksichtigung der Schülerperspektive. So untersuchten McComas und Olson (1998) in einer Textanalyse bildungspolitische Dokumente (Standards und Curricula) aus englischsprachigen Ländern auf Bildungsinhalte zu NOS. Außerdem befragten Osborne et al. (2003) in einer Delphi-Studie 23 Experten aus unterschiedlichen Fachgebieten von Fachdidaktikerinnen und Fachdidaktikern über Philosophinnen und Philosophen sowie Wissenschaftssoziologinnen und -soziologen bis hin zu Lehrkräften zu wünschenswerten Unterrichtsinhalten zu (1) naturwissenschaftlichen Methoden, (2) Eigenschaften naturwissenschaftlichen Wissens, (3) Organen und sozialen Aspekten der Naturwissenschaften. Als Ergebnis präsentierten sie zehn Aussagen, die als Konsens zwischen den Experten gewertet werden können. Lederman (2006) prüfte NOS-Aspekte im Blick auf die drei folgenden Fragestellungen:

  • Ist das Wissen zu dem NOS-Aspekt für Schülerinnen und Schüler zugänglich (können sie es lernen und verstehen)?

  • Besteht ein genereller Konsens über den NOS-Aspekt?

  • Ist das Verständnis des NOS-Aspekts für Bürgerinnen und Bürger nützlich?

Lederman et al. (2013, S. 140) kommen durch Prüfung der Fragen zu folgendem Minimalkonsens:

scientific knowledge is tentative (subject to change), empirically-based (based on and/or derived from observations of the natural world), subjective (theory-laden), necessarily involves human inference, imagination, and creativity (involves the invention of explanations), and is socially and culturally embedded. Two additional important aspects are the distinction between observations and inferences, and the functions of, and relationships between scientific theories and laws.

Synopsen der (Minimal‑)Konsenslisten haben z. B. Osborne et al. (2003, S. 713), Neumann (2011, S. 26), sowie Neumann und Kremer (2013, S. 215) zusammengestellt. Grundsätzlich versuchen diese (Minimal‑)Konsenslisten das Konstrukt NOS für die Schule angemessen zu explizieren und zugänglich zu machen. Gleichwohl wird in der Naturwissenschaftsdidaktik inzwischen deutliche Kritik an der Elementarisierung von NOS in Form dieser Konsenslisten geäußert, da sie (1) die aktuelle Praxis der Naturwissenschaften, (2) mögliche Erkenntnisfehler und (3) die kulturelle Dynamik naturwissenschaftlicher Erkenntnis unzureichend abbilden würden (z. B. Allchin 2018; Hodson und Wong 2017; Erduran und Dagher 2014). Allchin und Werth (2017) sehen im transportierten Wissenschaftsverständnis der Konsenslisten die Gefahr, implizit einen naiven Szientismus zu vermitteln. Wissenschaft werde als isoliertes Vorhaben dargestellt, das unabhängig von Fragen sozialer Gerechtigkeit und der Gesellschaft agiere. Bereits die Bezeichnung „Nature of Science“ lege die Fehlvorstellung von Naturwissenschaft als „natürliches“ (und damit von gesellschaftlichen Einflüssen und Abhängigkeiten isoliertes) Unterfangen nahe. Um die gesellschaftliche Eingebundenheit wissenschaftlicher Erkenntnis stärker ins Zentrum von NOS zu rücken, schlägt Allchin eine begriffliche und inhaltliche Erweiterung des NOS-Konzepts „[f]rom Nature of Science to Nature of Science in Society“ (Allchin 2018, S. 1) vor.

Mit der Alternativkonzeption „Nature of (whole) science“ hat Allchin (2011, S. 524) zudem auf die Gefahr hingewiesen, dass das Konstrukt NOS durch bisherige Elementarisierungen in einzelne Facetten zergliedert werde und damit der für die Entwicklung einer scientific literacy notwendige ganzheitliche Charakter wissenschaftlicher Erkenntnisprozesse verloren gehe:

Whole Science, like whole food, does not exclude essential ingredients. It supports healthier understanding. Metaphorically, educators must discourage a diet of highly processed, refined “school science.” Short lists of NOS features should be recognized as inherently incomplete and insufficient for functional scientific literacy

Matthews (2012) plädiert in Allchins Sinne dafür, in klassischen NOS-Elementarisierungen den Begriff „nature“ durch „features“ zu ersetzen, da das Konstrukt nicht die nature, sondern die features of science (= FOS) abbilde. Normativ erwarten auch die US-amerikanischen Bildungsstandards explizit ein ganzheitliches Wissenschaftsverständnis in Allchins Sinne: „students should develop an understanding of the enterprise of science as a whole – the wondering, investigating, questioning, data collecting and analyzing“ (NGSS Lead States 2013, S. 1). Allchin (2018, S. 2) kommt zu dem Schluss: „Ironically, the ‘consensus’ list no longer enjoys a very wide consensus“. Die Kritik weist damit auf wichtige Limitierungen traditioneller NOS-Konzeptualisierungen hin. Grundsätzlich bieten Konsenslisten von NOS-Facetten jedoch eine erste Orientierung, um den weiten Begriff von NOS greifbar zu machen. Sie bilden den Ausgangspunkt, um Unterrichts- und Testmaterialien zu entwickeln (Neumann und Kremer 2013). Die kritisierte Zergliederung von NOS in Einzelaspekte durch Konsenslisten lässt sich zudem bisher nicht empirisch belegen. Empirische Analysen deuten tendenziell eher in eine entgegengesetzte Richtung und zeigen keine Überlegenheit mehrdimensionaler Modelle von NOS-Facetten gegenüber einem eindimensionalen Modell (Neumann 2011; Neumann et al. 2011). Zunächst sollten traditionelle Konzeptualisierungen von NOS somit nicht ersetzt, sondern im Sinne aktueller Kritik erweitert werden. In diesem Sinne könnten bereits enthaltene Facetten wie die soziale und kulturelle Einbettung der Naturwissenschaften („is socially and culturally embedded“, Lederman et al. 2013, S. 140) stärker betont und ausdifferenziert werden.

Ein stärkerer Fokus auf soziale und kulturelle Aspekte naturwissenschaftlicher Erkenntnisprozesse erscheint auch vor dem Hintergrund aktuell diskutierter Neukonzeptualisierungen des Konstrukts NOS sinnvoll. Der Family Resemblance Approach (FRA) von Erduran und Dagher (2014) versucht das Konstrukt NOS nicht über eine Minimalkonsensliste zu explizieren, sondern in Anlehnung an Irzik und Nola (2011) sowie Wittgenstein (2003 [1953]) über Eigenschaften abzubilden, die nicht für alle naturwissenschaftlichen Disziplinen und Herangehensweisen vollkommen gleich sind, zwischen denen aber Ähnlichkeiten bestehen – so wie zwischen den Mitgliedern einer Familie. Für die Vielfalt naturwissenschaftlicher Praktiken, Methoden, Ziele und Werte definieren sie zwei Hauptdimensionen: Wissenschaft als kognitiv-epistemisches System und Wissenschaft als sozial-institutionelles System. Die beiden zentralen Systeme werden im FRA-Ansatz weiterausdifferenziert, gleichwohl werden die Dimensionen und ihre Subfacetten aber auch hier explizit als nicht voneinander trennbar, sondern als enges miteinander verflochtenes Netzwerk verstanden. Alle drei NOS-Ansätze – Minimalkonsens, Nature of (Whole) Science, FRA – verstehen ihre Konzeptualisierung von NOS somit als ganzheitlich. Für eine erste Version des Instruments erscheint gleichwohl eine Konzentration auf wesentliche Aspekte von NOS sinnvoll, die für das Gesamtkonstrukt NOS charakteristische Aspekte herausgreifen. Diese charakteristischen NOS-Aspekte konzentrieren sich in Erduran und Daghers Terminologie auf die kognitiv-epistemische NOS-Dimension und berücksichtigen insbesondere subjektive Einflüsse auf wissenschaftliches Wissen. Die soziale und kulturelle Einbettung (Lederman et al. 2013) bzw. Wissenschaft als sozial-institutionelles System (Erduran und Dagher 2014) soll in einem späteren Schritt der Instrumentenentwicklung angegangen werden. Zu den ersten Facetten im Einzelnen:

  1. a)

    Wissen über die Bedeutung von Kreativität und Subjektivität für wissenschaftliche Erkenntnis (KS)

Als von Menschen gestaltetes Vorhaben ist der Wissenschaftsprozess nicht nur objektiv, sondern beinhaltet auch subjektive und kreative Komponenten. Es steht außer Frage, dass Forschende logisches Denken beherrschen und über breites theoretisches Fachwissen verfügen müssen. Theorien und Erklärungen lassen sich jedoch nicht mechanistisch oder nur rational aus Beobachtungen oder Annahmen über die physische Welt ableiten. Es bedarf subjektiver Entscheidungen und der Vorstellungskraft und Kreativität der Forschenden, um Hypothesen, Fragestellungen und Versuchsdesigns zu entwickeln oder in Untersuchungen gewonnene Daten in (neue) Hypothesen, Theorien oder wissenschaftliche Gesetze zu überführen. Auch die Diskussion und Interpretation von (teils unerwarteten) Ergebnissen stellt einen kreativen Akt dar (McComas 2014; Lederman et al. 2013).

  1. b)

    Wissen über die Veränderung wissenschaftlicher Erkenntnisse im Laufe der Zeit (VZ)

Wissenschaftliches Wissen ist offen für Veränderungen und kann nicht abschließend bewiesen werden. Es stellt stets nur Annahmen über natürliche Phänomene dar. Eine wissenschaftliche Theorie kann in seiner Genese beispielsweise als subjektive Idee einer Forscherin oder einer Forschergruppe beginnen und sich in der scientific community durch theoretische Begründungen und empirische Evidenzen bewähren. Grundsätzlich kann wissenschaftlich gewonnenes Wissen widerlegt oder verändert werden (Popper 1935). Und auch Paradigmen entwickeln sich weiter oder werden gegebenenfalls ersetzt. Hinzu kommt, dass auch neue Erhebungsmethoden und neue oder verbesserte Instrumente zu neuen Erkenntnissen führen können (McComas 2014; Lederman et al. 2013).

  1. c)

    Wissen über die Differenzierung zwischen Beobachtung und Schlussfolgerung (BS)

Im wissenschaftlichen Erkenntnisprozess wird streng differenziert zwischen Beobachtungen einerseits sowie Erklärungen und Schlussfolgerungen andererseits. Beobachtungen stellen Beschreibungen natürlicher Phänomene dar, die durch menschliche Sinneswahrnehmung oder technische Möglichkeiten zugänglich und intersubjektiv nachvollziehbar sind, beispielsweise das Fallen von Gegenständen in Richtung Erde. Im Gegensatz dazu sind Schlussfolgerungen den menschlichen Sinnen nicht „direkt“ zugänglich. Dass Gegenstände aufgrund von Gravitation zu Boden fallen, beruht auf Annahmen, nicht auf sinnlich wahrnehmbarer Beobachtung (Lederman et al. 2013).

Unbestritten ist dagegen, dass auch Beobachtungen subjektive Anteile zugrunde liegen, bedingt z. B. durch das Vorwissen der beteiligten Forschenden oder durch die Konzeption des Beobachtungsdesigns. Eine weitere wichtige Rolle spielen Überzeugungen der Wahrnehmenden. Zu forderst sind dies die Überzeugungen über die Fragen nach dem zustande kommen naturwissenschaftlicher Erkenntnisse und welche Voraussetzungen hierfür eine Rolle spielen. Diese Überzeugungen werden von der psychologisch-ausgerichteten Lehr-Lernforschung mit dem Terminus epistemische Überzeugungen umschrieben (z. B. Schommer 1990; Hofer und Pintrich 1997; Bromme et al. 2016); in Bezug auf die Auswahl eines Konstrukts zu konvergierenden Validierung werden wir später darauf zurückkommen.

NOS als Facette des Professionswissens von Lehrkräften der Naturwissenschaften

Professionelle Kompetenz von Lehrkräften stellt eine wichtige Grundlage guten Unterrichtens dar (Baumert und Kunter 2011) und wird in unterschiedlichen Modellen konzeptualisiert (z. B. Baumert und Kunter 2011; Seidel und Stürmer 2014; Blömeke et al. 2015). Das innerhalb der COACTIV-Studie entwickelte Modell zur professionellen Kompetenz von Lehrkräften hat weitgehende Verbreitung gefunden (Krauss et al. 2017; Rutsch et al. 2017a). Nach Baumert und Kunter (2011) stellt das Professionswissen in diesem Rahmen eine zentrale Kompetenzfacette dar und wird im Kern mit den von Shulman (1986) beschriebenen Kategorien „CK“ (content knowledge = Fachwissen), „PCK“ (paedagogical content knowledge = fachdidaktisches Wissen) und „PK“ (pedagogical knowledge = pädagogisches Wissen) ausdifferenziert. Das in der Lehrerbildung erworbene Professionswissen zeigt – umgesetzt in prozedurale Routinen – einen Einfluss auf die Qualität des Unterrichtshandelns (Lipowsky 2006; Voss et al. 2011). Dieses zeigt sich wiederum als Prädiktor der Lernleistungen (z. B. Boyd et al. 2009; Kersting et al. 2012; Kunter et al. 2013; Tröger et al. 2014) und der Motivation der Lernenden (Krapp und Prenzel 2011).

Die Umsetzung des in der Lehrerbildung erworbenen Professionswissens in professionelles Unterrichtshandeln stellt allerdings einen komplexen Prozess dar. Es wird angenommen, dass prozedurale Routinen unter anderem auf dem handlungsnahen Professionswissen einer Lehrkraft beruhen (Stender 2014). Für Lehrkräfte naturwissenschaftlicher Fächer beinhaltet das Professionswissen u. a. auch Aspekte eines angemessenen Wissenschaftsverständnisses und einer angemessenen Wissenschaftsvermittlung (z. B. Bartos und Lederman 2014). Dieser Bereich ist mit jeweils eigenen Anteilen sowohl im CK als auch im PCK der Lehrkräfte naturwissenschaftlicher Fächer zu verorten: Professionswissen zu naturwissenschaftlichen Erkenntnisprozessen stellt zunächst einen Teil des CK dar. Shulman (1986, S. 9) geht mit seiner Konzeption des CK über ein bloßes Fachwissen von Fakten und Konzepten hinaus und erwartet auch ein angemessenes Wissenschaftsverständnis im Sinne der syntaktischen Struktur einer Disziplin:

The syntactic structure of a discipline is a set of ways in which truth or falsehood, validity or invalidity, are established. […] The teacher need not only to understand that something is so, the teacher must further understand why it is so, on what grounds its warrant can be asserted, and under what circumstances our belief in its justification can be weakened or even denied.

Diese Art des Fachwissens mediiert fachdidaktisches Wissen und Können (Baumert und Kunter 2011). Das fachdidaktische Wissen und Können verstanden als PCK beinhaltet (z. B. nach Kunter et al. 2013) im jeweiligen Fach unterrichtstypische Merkmale wie Aufgabenwissen, Erklärungswissen und Schülervorstellungen. Für den Bereich NOS bedeutet das: Lehrkräfte stehen im naturwissenschaftlichen Unterricht der berufsspezifischen Anforderung gegenüber, die Alltagsvorstellungen der Schülerinnen und Schüler zum Wissenschaftsverständnis aufzugreifen und im Verlauf des Unterrichtes sowie im Vorfeld, bei der Unterrichtsplanung adaptiv zu berücksichtigen (Feige et al. 2017). Bartos und Lederman (2014, S. 1151) sprechen von „teachers’subject matter knowledge structures for NOS […] communicated in their classroom practice“. Somit kann NOS im Professionswissen von Lehrkräften naturwissenschaftlicher Fächer verortet werden. Der Anforderungsbereich NOS stellt dabei eine besondere Herausforderung dar, denn er beinhaltet sowohl Teile des CKs (z. B. Wissen über die Struktur und Herangehensweise der Naturwissenschaften) als auch Teile des PCKs (z. B. Alltagsvorstellungen zu Naturwissenschaften; vgl. z. B. McComas 1998).

Professionswissen von Lehrkräften wird grundsätzlich als erlern- und veränderbar verstanden (Baumert und Kunter 2006). Das Konstrukt NOS in professionelles Unterrichtshandeln umzusetzen und Lernenden ein angemessenes Wissenschaftsverständnis zu vermitteln, stellt einen anspruchsvollen Schritt in Richtung Unterrichtswirksamkeit dar. Lehrkräfte sollten deshalb in diesem Bereich explizit ausgebildet werden und sowohl über CK und PCK zu NOS verfügen, da angenommen wird, dass die Wirksamkeit des Unterrichts durch die explizite Ausbildung von Lehrkräften in diesem Bereich gesteigert werden kann.

Stand der Forschung zu NOS: Wissen und Können von Lehrkräften

Auch wenn NOS in der englischsprachigen Naturwissenschaftsdidaktik seit mehr als 100 Jahren diskutiert wird (vgl. z. B. Central Association of Science and Mathematics Teachers 1907), fachdidaktisch seit langem als wichtiger Inhalt naturwissenschaftlichen Unterrichts gilt (z. B. Driver et al. 1996; Lederman 2007) und seit fast 30 Jahren Bestandteil von Standards und Benchmarks ist (AAAS 1993; National Research Council 1996), zeigt die internationale Forschungslage derzeit ein unzureichendes Professionswissen bei Lehrkräften in Bezug auf NOS. Fachdidaktische Konzeptualisierungen von NOS finden sich häufig nicht in Wissenschaftsvorstellungen von (angehenden) Lehrkräften wieder (z. B. Carey und Strauss 1970; Liang et al. 2006). Weitere Befunde zeigen, dass Lehrkräfte mit angemessenen Vorstellungen zu NOS diese nicht automatisch in ihre Unterrichtspraxis integrieren bzw. übertragen (z. B. Bartos und Lederman 2014). Zudem betrachten Lehrkräfte der Naturwissenschaften NOS im Vergleich zu „konkreten“ naturwissenschaftlichen Konzepten, wie beispielsweise „Bewegung“ oder „Evolution“, nicht als gleichwertiges Ziel naturwissenschaftlicher Bildung (Lederman und Lederman 2014). Insgesamt zeigt die Befundlage anhand weniger Studien ein mangelndes Wissen und Können bei Lehrkräften für den naturwissenschaftlichen Unterricht. Dies überrascht insbesondere in Anbetracht der langen englischsprachigen fachdidaktischen Diskussion mit entsprechender Verankerung in US-amerikanischen Bildungsstandards und Benchmarks. Die Herausforderung, Lernenden an Schule und Hochschule ein adäquates NOS-Verständnis zu vermitteln, scheint somit außergewöhnlich anspruchsvoll.

Die zitierten Evidenzen beruhen allerdings auf Untersuchungen in den USA, China und der Türkei. Dortige Lehramtsbiographien und Studieninhalte unterscheiden sich von Deutschland, Österreich und der Schweiz. Es stellt sich somit die Frage, ob das fachdidaktische Studium in deutschsprachigen Ländern zu besseren Ergebnissen führt, schließlich wird NOS auch in der deutschsprachigen Naturwissenschaftsdidaktik seit langem zentral diskutiert (z. B. Höttecke 2001; Sodian et al. 2002; Hößle et al. 2004; Neumann und Kremer 2013; Gebhard et al. 2017). Dies könnte sich in fachdidaktischen Lehrveranstaltungen niederschlagen. Andererseits offenbart die Befundlage auch Defizite bestehender Testinstrumentarien. Zur Erhebung des CK-Anteils von NOS bei Lehrkräften liegen zahlreiche Instrumente vor, z. B.: Wisconsin Inventory of Science Processes (WISP, Carey und Strauss 1968); Nature of Science Scale (NOSS, Kimball 1967); Views of Nature of Science (VNOS, Lederman et al. 2002; dt. Priemer 2003); Knowledge Structures for NOS and SI (KS4NS, Bartos und Lederman 2014; zusammenfassend vgl. Priemer 2006). Der PCK-Anteil von NOS wurde bisher qualitativ in Unterrichtsbeobachtungen mit kleinen Stichproben erhoben, z. B. von Lederman und Zeidler (1987), N = 18; Bell et al. (2000), N = 13; Bartos und Lederman (2014), N = 4. Die Forschungslage zeigt, dass es an quantitativen Instrumentarien fehlt, um Professionswissen zu NOS im Bereich des PCKs zu erheben, um die fachdidaktische Erwartungen an Lehrkräfte und ein angemessen im Unterricht kommuniziertes Wissenschaftsverständnis im Sinne von NOS mit empirischen Realitäten bzw. dem konditionalen Handlungswissen von Lehrkräften in Bezug auf NOS abzugleichen. Notwendig erscheinen Testformate, die eine situierte Messung des Wissens und Könnens von Lehrkräften erheben (vgl. König 2015).

Situierte Erhebungen zur Erfassung von Professionswissen

Um lernwirksames Professionswissen aus Fachdidaktiken, Schulpädagogik und pädagogischer Psychologie einer empirischen Prüfung zugänglich zu machen und keine handlungsfernen Artefakte zu erheben, legen aktuelle Forschungsansätze nahe, kontextualisierte und situationsspezifische Testaufgaben zu verwenden (z. B. König 2015). Hierfür bieten sich schriftliche Unterrichtsvignetten, d. h. kurze, authentische Beschreibungen von Unterrichtssituationen als Testaufgaben an, wodurch die Erfassung des Professionswissens in einem möglichst realitätsnahen Bezugsrahmen stattfindet (vgl. Shavelson 2013). Solche Testverfahren bieten die Möglichkeit Handlungsoptionen offen oder geschlossen zu erheben. Sofern vorgegebene Handlungsoptionen bewertet werden müssen, wird das Testverfahren von Oser et al. (2010) als „advokatorische Kompetenzmessung“ definiert.

Methode

Zielstellung

Aus dem oben skizzierten Desiderat quantitativ und zugleich situiert prüfender Instrumente zum Konstrukt NOS ergibt sich das folgende Ziel: Es soll ein quantitatives Instrument zur möglichst realitätsnahen und situierten Erhebung des Professionswissens von Lehrkräften zu NOS entwickelt werden. Es interessieren insbesondere die oben genannten und zentralen NOS-Facetten (a) Wissen über die Bedeutung von Kreativität und Subjektivität für wissenschaftliche Erkenntnis (KS), (b) Wissen über die Veränderung wissenschaftlicher Erkenntnisse im Laufe der Zeit (VZ) und (c) Wissen über die Differenzierung zwischen Beobachtung und Schlussfolgerung (BS). Die Modellstruktur soll in ihrer Dimensionalität geprüft und konvergent sowie diskriminant validiert werden. Dazu werden zwei Studien mit unterschiedlichen Testbatterien und Stichproben durchgeführt.

Testentwicklung mit Unterrichtsvignetten

Mit dem EKoL-NOS-Test des Kollegs Effektive Kompetenzdiagnose in der Lehrerbildung (EKoL; Rutsch et al. 2017a) soll Professionswissen zum Konstrukt NOS erhoben werden. Inhaltliche Basis stellen Nature of Science-Elementarisierungen dar. Ausgehend von existierenden Konsenslisten zu NOS – die sich trotz beschriebener Kritik für eine forschungspragmatische Operationalisierung eignen – wurden drei oben beschriebene und zentrale NOS-Facetten ausgewählt, die sich stets in klassischen NOS-Elementarisierungen finden. Das Instrument soll später durch weitere Facetten ergänzt werden. Ferner wird versucht, den Umgang mit dem Konstrukt NOS situationspezifisch angemessen und möglichst nahe an realen Unterrichtssituationen zu erheben. In Anlehnung an Rehm und Bölsterli (2014) wurde versucht, zu den Facetten möglichst authentische Unterrichtsbeispiele in schriftlicher Form (Vignetten) darzustellen, die bedeutsame Unterrichtssituationen (z. B. kritische Probleme oder fruchtbare Momente) beinhalten. Mit der Verwendung von Unterrichtsvignetten soll einer zentralen methodischen Herausforderung an die empirische Erfassung professioneller Kompetenz von Lehrkräften begegnet werden: der Berücksichtigung eines authentischen Bezugsrahmens für die Kompetenzerfassung (Shavelson 2013). Im Gegensatz zu Unterrichtsbeobachtungen lassen sich Vignettentests vergleichsweise zeitökonomisch einsetzen (Rehm und Bölsterli 2014; Rutsch et al. 2017b). Zudem bieten geschlossene Items den Vorteil einer schnellen Durchführung und Auswertung (Tepner und Dollny 2014). Gleichwohl wird mit einem solchen Verfahren die Tiefe einer real durchgeführten Unterrichtsbeobachtung nicht erreicht. Außerdem fordern geschlossene Items von den Testpersonen nur eine (Wieder-)erkennungsleistung, die gegenüber einer (Re-)produktionsleistung durch halboffene Antwortformate als weniger anspruchsvoll gilt (Döring und Bortz 2016).

Herausforderungen an NOS-Vignetten

Der Konstruktcharakter von NOS hat Konsequenzen für die Testentwicklung: NOS gilt als naturwissenschaftsübergreifendes Konstrukt (z. B. Schwarz und Lederman 2008); gleichwohl ist es zunächst nicht selbstverständlich, dass Vignetten zum Modellieren in der Biologie zu denselben Ergebnissen führen, wie Vignetten zum Modellieren in der Physik oder Chemie. So wurde bei jeder Vignette bereits im einführenden Vignettenstamm darauf geachtet, das disziplinspezifische Fachwissen für einen naturwissenschaftsübergreifend einsetzbaren NOS-Test möglichst gering zu halten, bzw. in Einzelfällen auch für Lehrkräfte anderer Naturwissenschaften verständlich aufzubereiten. Dies trifft ebenfalls auf den Anteil an pädagogischem Wissen (PK) in den Vignetten zu. Beides könnte sonst konstruktirrelevante Varianz erzeugen.

Grundsätzliches Problem des Einsatzes von Vignetten ist ferner die Gratwanderung zwischen möglichst authentischen und somit detailliert zu beschreibenden Unterrichtssequenzen einerseits und einer Fokussierung auf die zu erhebende Konstruktfacette andererseits (z. B. Friesen et al. 2018; Kuntze 2015).

Vignettenpool

Der Aufbau der Vignetten basiert auf folgendem Muster: Nach einer Überschrift und einer Zeichnung oder einem Photo zum Unterrichtsinhalt wird den Probandinnen und Probanden eine kurze Unterrichtssequenz präsentiert, in der ein Aspekt von NOS Teil des Unterrichtsgeschehens ist. Ein solches Beispiel zur NOS-Facette Wissen zur Bedeutung von Subjektivität und Kreativität zeigt Abb. 1.

Abb. 1
figure 1

Beispiel für eine Vignette zum Wissen über die Bedeutung von Subjektivität und Kreativität für wissenschaftliche Erkenntnis

Im Anschluss werden den Probandinnen und Probanden drei bis fünf Handlungsoptionen (Items) angeboten, deren situationsspezifische Angemessenheit auf einer Skala von 1 bis 6 zu bewerten ist. Damit erfolgt eine „advokatorische Kompetenzmessung“ (Oser et al. 2010). Ein solches Beispiel von Handlungsalternativen zu der Vignette aus Abb. 1 zeigt Abb. 2.

Abb. 2
figure 2

Beispiel für Handlungsalternativen zu einer Vignette zum Wissen über die Bedeutung von Subjektivität und Kreativität für wissenschaftliche Erkenntnis

Nach diesem Schema entstand ein Pool von 14 Vignetten aus dem für die vorliegende Studie neun Vignetten übernommen wurden. Die Beschränkung auf neun Vignetten stellt einen Kompromiss zwischen dem zeitlichen Aufwand einerseits, beispielsweise im Einsatz in umfangreicheren Testbatterien und andererseits einer ausreichenden Berücksichtigung der einzelnen NOS-Facetten mit jeweils drei Vignetten dar. Eine Inter-Rater-Übereinstimmung von drei Mitgliedern der Arbeitsgruppe in der Zuordnung der Vignetten zur jeweiligen NOS-Facette ergab ein Fleiss’ \(k\) = 0,77 (Fleiss 1971; R package irr, Gamer et al. 2012) und somit eine Gesamtübereinstimmung von 85,19 %. Landis und Koch (1977) bewerten ein \(k\) zwischen 0,61 und 0,80 als substanziell. Die Rater haben zuvor nicht an der Vignettenentwicklung teilgenommen. Erstellt wurde der Test als Paper-and-Pencil-Instrument. Für eine Teilstichprobe wurde das Instrument in eine Online-Version (oFb/SoSciSurvey; Leiner 2016) überführt.

Testwertberechnung durch Expertennorm

Innerhalb der Vignetten erfolgt zuerst eine Punktwertvergabe auf Itemebene (vgl. Meschede et al. 2015; Rutsch et al. 2018). Hierfür wurde eine Musterlösung für jedes Item entwickelt, an der sich Naturwissenschaftsdidaktikerinnen und -didaktiker (N = 8) beteiligten, die zu NOS an deutschsprachigen Hochschulen forschen. Auf Itemebene wird der Modalwert dieser Musterlösung mit den Antworten der Probandinnen und Probanden verglichen. Bei Übereinstimmung wird die volle Itempunktzahl (= 2) vergeben, liegt die Antwort eine Stelle auf der Antwortskala neben dem Modalwert, erhält die Probandin oder der Proband die halbe Punktzahl (= 1). Bei einzelnen Items ließ sich kein Modalwert als Musterlösung erzielen bzw. fielen die Experten-Bewertungen der Handlungsalternativen sehr unterschiedlich aus. In diesen Fällen wurde das Item nicht in die Testwertberechnung miteinbezogen. Einen Überblick zu Vignetten, ausgeschlossenen Items und Fachbezügen zeigt Tab. 1.

Tab. 1 Vignetten, zugeordnete Fächer und ausgeschlossene Items

Der Testwert einer Vignette aggregiert sich im Sinne eines polytomen (Super‑)Items aus den einzelnen Itemtestwerten der Vignette als Summenwert, der nochmals durch die Anzahl der eingeflossenen Items geteilt wird (vgl. Eckes 2015; Robitzsch und Lüdtke 2015; Rutsch et al. 2018). Die maximal erreichbaren Vignettentestwerte lagen somit pro Vignette bei 2 Punkten.

Nachteilig wirkt sich bei diesem Verfahren aus, dass bei einer sechsstufigen Skala nur jene Probanden Punkte erzielen, die auch den Modalwert treffen (bzw. ein Feld daneben). Individuelles Antwortverhalten, das tendenziell eher positiv oder negativ ausfallen könnte, wird somit nicht im Ergebnis berücksichtigt. Eine Punktevergabe duch Paarvergleiche (Artelt et al. 2009; Tepner und Dollny 2014) legt sich dagegen nicht auf einen bestimmten Referenzwert fest und toleriert Abweichungen eher (vgl. Rutsch et al. 2018). Für dies Auswertung dieses Tests haben wir uns dennoch für eine Punktevergabe auf Itemebene entschieden, da die zu bewertenden Handlungsoptionen in Theorie (und in der Punktevergabe der Experten) häufig keine eindeutige Reihenfolge der Beziehung zueinander erkennen lassen und jede Option für sich selbst beurteilt werden sollte.

Stichproben

An der Erhebung zu Studie 1 nahmen 289 Referendarinnen und Referendare des Lehramts für die Sekundarstufe 1 teil (204 weiblich). Einen detaillierten Überblick liefert Tab. 2. Die Erhebungen fanden im Rahmen des Forschungs- und Nachwuchskollegs EKoL an Studienseminaren in Baden-Württemberg im Februar 2017 direkt nach Beginn des Vorbereitungsdienstes der Lehrkräfte statt.

Tab. 2 Stichprobe 1

An der Studie 2 zur diskriminanten und konvergierenden Validierung nahmen 137 Referendarinnen und Referendare der naturwissenschaftliche Unterrichtsfächer Biologie und/oder Physik teil (82 weiblich). Einen detaillierten Überblick liefert Tab. 3. Die Erhebungen fanden von November 2017 bis Januar 2018 ebenfalls an Studienseminaren in Baden-Württemberg statt, allerdings gegen Ende des Referendariats kurz vor Beginn des Prüfungszeitraums.

Tab. 3 Stichprobe 2

Demographische Variablen

In Bezug auf demographische Variablen (kognitive Leistungsfähigkeit, Geschlecht) kann auf Basis bisheriger Studien zum PCK in den Naturwissenschaften (z. B. Krauss et al. 2017) davon ausgegangen werden, dass sich die kognitive Leistungsfähigkeit, auch in den Ergebnissen des EKoL-NOS-Tests widerspiegelt. In bisherigen naturwissenschaftsdidaktischen Tests (Riese 2009; Kirschner 2013; Schödl und Göhring 2017) lässt sich z. Zt. bei männlichen Lehrkräften noch ein Wissensvorsprung beobachten, der Ergebnis von Sozialisationseffekten sein könnte. Die entsprechenden Prozesse sollten Gegenstand weiterführender Untersuchungen sein. Ferner kann erwartet werden, dass angehende Lehrkräfte naturwissenschaftlicher Fächer in einem naturwissenschaftlichen PCK-Test bessere Leistungen erzielen, als ihre Mitreferendarinnen und -referendare ohne naturwissenschaftliches Fach; einschränkend ist jedoch zu erwarten, dass auch angehende Lehrkräfte nicht-naturwissenschaftlicher Fächer über wissenschaftstheoretische Kenntnisse aus ihren jeweiligen Fachdisziplinen verfügen, insbesondere die drei ausgewählten Facetten gelten grundsätzlich auch für nicht-naturwissenschaftliche Wissenschaftsdisziplinen (vgl. van Dijk 2011; Gebhard et al. 2017); beispielsweise versuchen die ästhetischen Wissenschaften bei der Analyse von Gemälden, Grafiken, Skulpturen, Fotografien oder Installationen zwischen Beobachtung und Interpretation zu differenzieren (vgl. Huber 2011). Auch in der Sportwissenschaft basiert ein Untersuchungsdesign auf dem subjektiven Vorverständnis der Forschenden; Interpretation, Modellierung und Auswertung der Daten sowie die Theoriebildung erfordern auch hier schlussfolgerndes Denken und Kreativität. Studierende der Religionswissenschaft bzw. Theologie lernen im ersten Semester die historisch-kritische Methode kennen und damit die tentative nature, dass „historische Erkenntnisse nicht endgültig, sondern prinzipiell revidierbar sind.“ (Heiligenthal et al. 1999, S. 30).

Konvergierende und diskriminante Konstrukte zu NOS: Epistemische Überzeugungen und berufsbezogene Motivation

Zur diskriminanten und konvergierenden Validierung des Instruments werden zwei Konstrukte herangezogen, die an dieser Stelle kurz skizziert werden. Im Modell zur professionellen Kompetenz von Lehrkräften des Forschungsprogramms COACTIV zeigen sich berufsbezogene Motivation der Lehrkräfte und ihre selbstregulativen Fähigkeiten nahezu unkorreliert mit dem Professionswissen (Kleickmann und Anders 2011), dies trifft insbesondere auf die Facette „Einfachheit des Studiums“ zu. Zur diskriminanten Validierung wurden somit aus dem Fragebogen FEMOLA (Pohlmann und Möller 2010) Items zur entsprechenden Facette der berufsbezogenen Motivation übernommen.

Als kovergierendes Konstrukt wurden epistemische Überzeugungen ausgewählt. Die Naturwissenschaftsdidaktik diskutiert Vorstellungen über wissenschaftliches Wissen im Konstrukt NOS. Die psychologisch ausgerichtete Lehr-Lern-Forschung untersucht Vorstellungen von Wissen unter dem Label epistemische Überzeugungen (z. B. Schommer 1990; Hofer und Pintrich 1997; Bromme et al. 2016). Zwischen den Konstrukten bestehen somit inhaltliche Zusammenhänge. Gleichwohl lassen sich beide Konstrukte theoretisch voneinander abgrenzen (vgl. Neumann und Kremer 2013) und unterschiedlich in Kompetenzmodellen verorten. Die epistemischen Überzeugungen der Lehrkraft lassen sich nach Baumert und Kunter (2006) den Überzeugungen und Werthaltungen zuordnen, da sie individuelle Überzeugungen repräsentieren. Neumann und Kremer sprechen in diesem Zusammenhang von einer Perspektive der 1. Person. Im Gegensatz dazu definieren Neumann und Kremer für NOS eine Perspektive der 3. Person, einer naturwissenschaftlichen Erkenntnistheorie, da traditionellen NOS-Elementarisierungen ein wissenschaftstheoretischer Minimalkonsens mit normativem Charakter zu Grunde liegt, der zu lehrende Eigenschaften wissenschaftlichen Wissens beschreibt und die in Bildungsstandards verankert sind (z. B. KMK 51,52,53,a–c; NGSS 2013). Für eine konvergierende Validierung scheint jedoch trotz dieser Differenzen eine ausreichende Nähe gegeben. Der Fragebogen CAEB (= Connotative Aspects of Epistemological Beliefs; Stahl und Bromme 2007) versucht epistemische Überzeugungen über ein semantisches Differenzial (vgl. Osgood et al. 1957) zu erheben. Der CAEB fragt nach Assoziationen zu Konzepten oder Fächern, beispielsweise zu „Wissen in der Biologie“ oder „Wissen in der Physik“. Diese Assoziationen werden über Adjektivpaare wie objektiv-subjektiv oder offen-abgeschlossen erhoben. Dazu wird in Fragebögen auf einer siebenstufigen Skala in Richtung des einen oder anderen Adjektivs gekreuzt. Faktorenanalytisch lassen sich zwei Dimensionen zur Struktur/Textur sowie Variabilität von Wissen abbilden, die in zahlreichen Studien repliziert werden konnten (z. B. von Porsch und Bromme 2011; Mason et al. 2014; Kramer 2017). Die Dimensionen erinnern an zwei der klassischen Dimensionen epistemischer Überzeugungen: „Simplicity“ und „Certainty“ (vgl. Schommer 1990; Hofer und Pintrich 1997).

Ergebnisse

Im Folgenden werden Ergebnisse zur Reliabilität und empirischen Validierung des Instruments vorgestellt. Die Auswertung erfolgte mit R (Version 3.5.0, R Core Team 2018) sowie dem Paket lavaan (Version 0.6.1 2018, Rosseel 2012). Dargestellt werden die Befunde mit der ersten Stichprobe (N = 289) anhand der Aspekte (1) Aufgabenschwierigkeiten und Trennschärfe, (2) Dimensionalitätsprüfung und (3) Validitätsprüfung in Hinblick auf demographische Variablen. Die Validitätsprüfung zu diskriminanten und konvergierenden Konstrukten wurde mit einer zweiten Stichprobe (N = 137) durchgeführt. Außerdem wurde mit dieser zweiten Stichprobe geprüft, inwiefern sich die Testergebnisse angehender Lehrkräfte der Fächer Biologie und Physik voneinander unterscheiden.

Aufgabenschwierigkeiten und Trennschärfe

Tab. 4 gibt einen Überblick zu den Aufgabenschwierigkeiten und Trennschärfe der einzelnen Vignetten. Die mittlere Aufgabenlösungshäufigkeit liegt zwischen 0,21 und 0,54. Damit kann mit den Testvignetten gut zwischen den Probandinnen und Probanden differenziert werden, wobei drei der Vignetten (KS1, KS2 und VZ1) mit Lösungshäufigkeiten von <0,3 als schwierig einzustufen sind. Grundsätzlich fallen den Referendarinnen und Referendaren Aufgaben zur NOS-Facette Beobachtung und Schlussfolgerung am leichtesten (Pi zwischen 0,46 und 0,54). Die größten Schwierigkeiten bereiten Vignetten zur NOS-Facette Kreativität und Subjektivität (Pi zwischen 0,21 und 0,44). Die Trennschärfen bewegen sich im mittelmäßigen (0,30 bis 0,50) bis hohen Bereich (größer als 0,50; nach Döring und Bortz 2016). Nur Vignette BS2 liegt unter 0,3; auch in der folgenden Modellprüfung ist Vignette BS2 zu hinterfragen.

Tab. 4 Aufgabenschwierigkeiten und Trennschärfe

Dimensionalitätsprüfung

Prüfung der Ein- bzw. Mehrdimensionalität

NOS stell auch in den Konzeptualisierungen von Lederman (2007) und McComas (1998) bestenfalls einen Minimalkonsens und kein kontingentes Konstrukt dar. Die Dimensionalität wurde mit einem ein- und einem dreidimensionalen Strukturgleichungsmodell geprüft (siehe Abb. 3).

Abb. 3
figure 3

Vergleich des dreidimensionalen Modells mit den Wissensfacetten zu (1) Kreativität und Subjektivität[KS], (2) Veränderung wissenschaftlichen Wissens im Laufe der Zeit [VZ] und (3) Unterscheidung zwischen Beobachtung und Schlussfolgerung [BS] und einem eindimensionalen Modell. Die schwachgedruckte Vignette BS2 wurde nach ersten Modellrechnungen entfernt

Grundlage stellen die neun Vignettentestwerte dar, wobei das dreidimensionale Modell zwischen den NOS-Facetten unterscheidet und das eindimensionale Modell NOS als gemeinsamen Faktor abbildet. Zunächst wies eine der Vignetten zur Facette Wissen über die Differenzierung zwischen Beobachtung und Schlussfolgerung in beiden Modellen inakzeptable Faktorladungen auf (λj = 0,037; λj = 0,019). Nach Entfernung der Vignette wurde mit Modellen weitergearbeitet, die auf acht Vignetten basieren. Tab. 5 zeigt, dass sowohl ein dreidimensionales Modell als auch ein eindimensionales Modell eine sehr gute Modellanpassungsgüte aufweist.

Tab. 5 Modellvergleich

Ein Vergleich zwischen beiden Modellen zeigt keinen signifikanten Unterschied: ∆χ2(3) = 1,67, p = 0,642. Damit passt ein sparsames Modell mit nur einer Dimension ebenso zu den Daten, wie ein dreidimensionales. In der Folge wird mit dem sparsameren eindimensionalen Modell weitergearbeitet; Cronbachs α liegt für dieses Modell bei 0,631.

Validierung über demographische Daten

Mit der ersten Stichprobe wird zunächst eine Validitätsprüfung mit Variablen zu demographischen Daten in Bezug auf die kognitive Leistungsfähigkeit (approximiert über die Note des Abiturs; Baron-Boldt et al. 1988; Schödl und Göring 2017), Geschlecht und das Studium eines naturwissenschaftlichen Faches berichtet. Da die Leistung über Textvignetten erhoben wurde, wird ferner das Personenmerkmal „Deutsch als Muttersprache“ kontrolliert. Ein Strukturgleichungsmodell mit diesen Variablen (Abb. 4) weist eine sehr gute Modellpassung auf (χ2 = 41,42, df = 60, n = 239, CFI = 1,00, RMSEA = 0,000, SRMR = 0,039; Cutoff-Werte siehe Tab. 5). Die Abiturnote wirkt prädiktiv auf die Testergebnisse des Instruments (β = −0,17, p = 0,025). Ferner erzielen männliche Lehrkräfte etwas bessere Testergebnisse (β = −0,16, p = 0,043), was Ergebnisse weiterer aktueller Untersuchungen zu fachdidaktischem Wissen naturwissenschaftlicher Fächer repliziert (z. B. Schödl und Göring 2017; Kirschner 2013; Riese 2009). Der Effekt, ob ein naturwissenschaftliches Unterrichtsfach studiert wurde, wird bei der untersuchten Stichprobengröße nicht signifikant (β = 0,15, p = 0,082). Der Effekt von „Deutsch als Muttersprache“ wird ebenfalls nicht signifikant (β = −0,07, p = 0,307).

Abb. 4
figure 4

Strukturgleichungsmodell zur Validierung mit den demographischen Variablen Muttersprache (deutsch = 1, andere = 2), kognitive Leistungsfähigkeit (Note Abitur), Geschlecht (m = 1, w = 2) und ob ein naturwissenschaftliches Fach studiert wurde (nein = 0, ja = 1). An den Pfeilen werden die standardisierten Regressionskoeffizienten dargestellt

Validierung über diskriminante und konvergierende Konstrukte

Mit einer zweiten Stichprobe aus Referendaren der Lehrämter Biologie und Physik wird versucht, das Instrument anhand konvergierender und diskriminanter Konstrukte zu validieren. Tab. 6 stellt zunächst die deskriptiven Testergebnisse aus Stichprobe 2 dar.

Tab. 6 Deskriptive Ergebnisse Stichprobe 2

Zur diskriminanten Validierung wird aus dem Fragebogen FEMOLA (zur Motivation der Wahl des Lehramtsstudiums; Pohlmann und Möller 2010) der Aspekt „Geringe Schwierigkeit des Studiums“ aufgenommen. Zur konvergierenden Validierung wird eine Kurzversion des CAEB (Stahl und Bromme 2007; Kurzversion aus: Kramer 2017) mit 13 Items eingesetzt. Die zweifaktorielle Struktur des CAEB mit den Faktoren „Struktur“ sowie „Variabilität“ von Wissen lässt sich replizieren. Drei der 13 CAEB-Items wurden aufgrund mangelnder Faktorladungen (<0,3) entfernt.

Weitere Konstrukte, Aspekte und Variablen wurden in diesem Modell nicht spezifiziert, um bei der Modellierug latenter Konstrukte und einer Stichprobe von deutlich unter 200 noch sinnvoll mit Struktukturgleichungsmodellen arbeiten zu können (vgl. dazu Bentler und Chou 1987) (Abb. 5).

Abb. 5
figure 5

Strukturgleichungsmodell zur Validierung über das als diskriminant angenommene Konstrukt Berufswahl „Geringe Schwierigkeit Studium“ und das als konvergierend angenommen Konstrukt Epistemische Überzeugungen. An den einseitigen Pfeilen werden die Regressionskoeffizienten dargestellt, an den beidseitigen Pfeilen die Korrelationskoeffizienten. * = Signifikanzniveau p = 0,05; ** = Signifikanzniveau p = 0,01. CAEB = Connotative aspects of epistemological beliefs. FEMOLA = Fragebogen zur Erfassung der Motivation des Lehramtsstudiums.

Das spezifizierte Modell weist eine gute Anpassungsgüte auf (χ2 = 238,52, df = 203, n = 137, CFI = 0,960, RMSEA = 0,035, SRMR = 0,071; Cutoff-Werte siehe Tab. 5). Erwartungskonform zeigt sich kein Zusammenhang zum Berufswahlmotiv „Geringe Schwierigkeit des Studiums“ (r = −0,08, p = 0,180). Der Effekt (r = 0,17) für die Korrelation mit dem CAEB-Faktor Variabilität wird signifikant (p = 0,036), die Korrelation mit dem CAEB-Faktor Struktur (p = 0,467) dagegen nicht. Untereinander korrelieren die zwei CAEB-Faktoren signifikant (p = 0,010).

Gruppenunterschiede zwischen den studierten Fächen Biologie und Physik

Für den NOS-Test wird zwar ein Einfluss des fachwissenschaftlichen Vorwissens angenommen, andererseits wurde versucht, durch die Vignetten- und Itemgestaltung Professionswissen zum Konstrukt NOS naturwissenschaftsübergreifend erheben zu können und das fachwissenschaftliche Vorwissens möglichst irrelevant zu halten. Um zu prüfen, inwiefern besondere fachwissenschaftliche Aspekte der Einzelvignetten die Ergebnisse beeinflussen könnten, wird mit Hilfe von t-Tests geprüft, inwiefern sich die Testwerte angehender Lehrkräfte der Fächer Biologie und Physik voneinander unterscheiden. Tab. 7 bildet die Ergebnisse ab. Keiner der p-Werte zeigt sich signifikant; der p-Wert für Vignette KS1 liegt allerdings bei 0,0501.

Tab. 7 Gruppenunterschiede in den Testwerten zwischen den studierten Fächen Biologie und Physik

Diskussion und Ausblick

Das in diesem Artikel vorgestellte Instrument EKoL-NOS ist ein Ansatz, Professionswissen zum Konstrukt Nature of Science handlungsnah mit Hilfe von Vignetten zu erfassen, um Informationen über interindividuelle Kompetenzunterschiede von Lehrkräften zu erhalten, bzw. fachdidaktische Erwartungen mit empirischen Realitäten abzugleichen. Basis für die Testentwicklung stellen Facetten aus klassischen Nature of Science-Konsenslisten mit einem Schwerpunkt auf dem kognitiv-epistemischen Charakter wissenschaftlichen Wissens dar. Die Testwertberechnung erfolgt auf Basis einer Expertennorm. Da weder McComas (1998) noch Lederman (2007) ein kontingentes NOS-Bild entworfen haben, sondern (bestenfalls) einen Minimalkonsens referieren, stellt sich eine Konstruktvalidierung per se als herausfordernd dar.

Die empirische Validierung des Instruments mit einem diskriminanten Konstrukt sowie demographischen Variablen (kognitive Leistungsfähigkeit, Geschlecht) liefert zumindest erste Hinweise, Professionswissen zu NOS über quantitativ prüfende Instrumente handlungsnah abbilden zu können. Erwartungskonform zeigt sich kein Effekt zum diskriminanten Konstrukt der Berufswahlmotivation „Einfachheit des Lehramtsstudiums“. Die als konvergierendes Konstrukt ausgewählten epistemischen Überzeugungen, abgebildet durch das semantische Differenzial CAEB, korrelieren mit dem NOS-Vignettentest zumindest in Bezug auf den Faktor Variabilität signifikant. Das ist für diesen Faktor naheliegend, als dass drei der Vignetten im NOS-Test versuchen, die Facette „Veränderbarkeit im Laufe der Zeit“ abzubilden und somit eine inhaltliche Nähe zum CAEB-Faktor aufweisen. Trotz der Signifikanz überrascht die geringe Korrelation von nur r = 0,14; allerdings korrelieren die beiden CAEB-Faktoren auch nur auf einem Niveau von r = 0,17 miteinander. Um von Konvergenz zu sprechen unterscheiden sich die Instrumente in den intendierten Ansprüchen und abzubildenden Konstrukten offenbar doch zu stark: Einerseits versucht der NOS-Test Professionswissen mit zum Unterricht kommunizierten Wissenschaftsverständnis zu bestimmten Facetten handlungsnah abzubilden und zu erheben; dazu gehören auch der Umgang mit Schülervorstellungen und angemessenen Aufgaben. Das semantische Differenzial CAEB ist nicht dazu konzipiert, ein differenziertes Wissenschaftsverständnis abzubilden, sondern versucht vielmehr spontane Assoziationen (CA = „connotative aspects“) zu wissenschaftlichen (Teil‑)Gebieten zu erheben. PCK-Anteile wie im Vignettentest sind nicht intendiert.

Eine zentrale Limitierung der vorliegenden Untersuchung liegt in der grundlegenden theoretischen Konzeption dieser ersten Version des Instruments: Die Vignetten wurden im Sinne von klassischen NOS-Elementarisierungen auf Basis der sogenannten „consensus view“ entwickelt und rekurrieren auf die Bedeutung subjektiver Anteile wissenschaftlichen Wissens. Aktuelle Ansätze (Allchin 2017, 2018; Erduran und Dagher 2014) fokussieren NOS stärker im Sinne von Ganzheitlichkeit und gesellschaftlicher Einbindung wissenschaftlicher Erkenntnis. Allchin nennt eine seiner Neukonzeptualisierungen „Nature of (whole) science“ (z. B. Allchin 2011, 2017), um mit der Bezeichnung whole science zu verdeutlichen, dass im Konstrukt NOS eben nicht voneinander isolierte „features of science“ (= FOS, Matthews 2012) elementarisiert werden sollten, sondern im Sinne einer scientific literacy der wissenschaftliche Erkenntnisprozess in seiner Ganzheit. Folgt man der Argumentation von Matthews und Allchin liegt mit dem vorliegenden und an klassischen NOS-Elementarisierungen orientierten Instrument ein FOS-Test und kein NOS-Test vor: Es wird versucht, Professionswissen zu ausgewählten Features (wie „subjektiver Anteile“) wissenschaftlicher Erkenntnis zu erheben und nicht die Ganzheitlichkeit des wissenschaftlichen Erkenntnisprozesses. Dass in der Dimensionalitätsprüfung ein dreidimensionales Modell mit Teilfacetten als eigenen Faktoren einem eindimensionalen Modell nicht überlegen ist, kann mit der Konzentration auf Facetten, die im Kern auf die Subjektivität bzw. das Wechselspiel zwischen Subjektivität und Objektivität naturwissenschaftlichen Wissens rekurrieren erklärt werden. Die nicht signifikante Modellprüfung bestätigt somit, dass zumindest für die drei Facetten keine unterschiedlichen Dimensionen vorliegen. Aussagen für die Dimensionalität des Gesamtkonstrukts NOS können aber nicht getroffen werden. Auch die Restunsicherheit, die sich in einem Fleiss’ \(k\) von „nur“ 0,77 bei neun „Superitems“ aus komplexen Vignettenstämmen und jeweils eigenen Items zeigt, kann als Hinweis interpretiert werden, dass die drei gewählten Facetten im Kern auf dieselbe Dimension rekurrieren, in deren Zentrum die Subjektivität bzw. das Wechselspiel zwischen Subjektivität und Objektivität naturwissenschaftlichen Wissens steht. Ein weitere Facetten prüfendes Instrument könnte an dieser Stelle zu differenzierteren Ergebnissen kommen. Erduran und Dagher (2014) elementarisieren NOS in zwei Hauptdimensionen: Naturwissenschaft als kognitiv-epistemisches System und Naturwissenschaft als sozial-institutionelles System, die sie aber ebenfalls explizit als nicht trennbar, sondern als zueinander in Beziehung stehend definieren. Die für diese erste Version des Instruments ausgewählten Facetten wissenschaftlichen Wissens konzentrieren sich primär auf Naturwissenschaft als kognitiv-epistemisches System. Für die geplante Weiterentwicklung des Instruments scheint somit eine Konzentration auf Facetten zu Naturwissenschaft als sozial-institutionellem System fruchtbar. Mit solchen Vignetten könnte geprüft werden, ob sich die von Erdugan und Dagher vorgeschlagene Dimensionalisierung über einen handlungsnahen Vignettentest abbilden lässt. Dies bietet sich ebenfalls für eine weitere Neukonzeptualisierung von NOS an: Auch Allchin (2018) hat inzwischen eine weitere NOS-Konzeptualisierung vorgelegt, in der er eine Weiterentwicklung von NOS zu „Nature of Science in Society“ (= NOSIS) forciert. Sowohl eine ganzheitliche Betrachtung des Wissenschaftsverständnisses, als auch die gesellschaftliche Verankerung wissenschaftlicher Erkenntnis zu erheben, war noch nicht Anspruch dieses NOS-Tests. Um auch diesen Aspekten eines angemessenen Naturwissenschaftsverständnisses gerecht zu werden, können künftige Vorhaben weitere Vignetten auf einer solchen theoretischen Grundlage ins Zentrum ihrer Forschungen stellen.

Ungeklärt bleibt, warum sich das Studium eines naturwissenschaftlichen Unterrichtsfaches gegen über der Vergleichsgruppe ohne naturwissenschaftliches Unterrichtsfach nicht in signifikant besseren Testergebnissen widerspiegelt: ob ein naturwissenschaftliches Fach studiert wurde, wird in der Modellierung mit einem p-Wert von 0,082 nicht signifikant. Interpretiert wird das Ergebnis in drei Richtungen:

Erstens: Sehr vorsichtig wird interpretiert, dass das Professionswissen zu NOS bei angehenden Lehrkräften naturwissenschaftlicher Fächer entsprechend der Testergebnisse tatsächlich nicht stärker ausgeprägt sein könnte, als bei angehenden Lehrkräften ohne naturwissenschaftliches Fach. Internationale Untersuchungen (z. B. Liang et al. 2006) liefern Hinweise, dass sich die wissenschaftstheoretische Konzeption von NOS häufig nicht im Wissenschaftsverständnis von angehenden Lehrkräften widerspiegelt; dies könnte auch im deutschsprachigen Raum der Fall sein. Die im Mittel recht geringen Testergebnisse (siehe Tab. 4 und 6) könnten (z. Zt. allerdings noch sehr vorsichtig) als Replikation internationaler Studien gedeutet werden und lassen erste Vermutungen auf eine nach wie vor geringe Bedeutung von NOS in der aktuellen Bildung naturwissenschaftlicher Lehrkräfte zu. Es müsste geprüft werden, ob der Stellenwert von NOS in der Lehrerbildung an den Hochschulen womöglich hinter anderen naturwissenschaftlichen und naturwissenschaftsdidaktischen Inhalten zurückbleibt. Die Rahmenverordnung für die Lehramtsausbildung in Baden-Württemberg, nach der die Hochschulen ihre Modulhandbücher gestalten und nach der das Gros der angehenden Lehrkräfte der Stichproben ausgebildet wurde, erwartet nur für den sogenannten naturwissenschaftlich-technischen Sachunterricht der Grundschule sowie das Fach Technik in der Sekundarstufe explizit Studieninhalte zu Nature of Science. Für die naturwissenschaftlichen Fächer der Sekundarstufe finden sich erkenntnistheoretische Inhalte dagegen eher implizit im Rahmen naturwissenschaftlicher Denk- und Arbeitsweisen.

Zweitens: Mit dem vorliegenden Instrument wurde versucht, Professionswissen im Bereich des CK und PCK zum Konstrukt NOS zu erfassen, also zu einem angemessenen Wissenschaftsverständnis. Sollte das Professionswissen zu CK und PCK im Bereich von NOS tatsächlich nur wenig ausgeprägt sein, da NOS im Lehramtsstudium bisher nur wenig reflektiert wurde, kann im Sinne des TIDE-Modells (Muis et al. 2006) interpretiert werden, dass die angehenden Lehrkräfte mangels differenzierter NOS-Kenntnisse (bzw. mangels angemessener fachspezifischer epistemischer Überzeugungen) ersatzweise mit generelleren epistemischen Überzeugungen antworten.

Drittens stellt sich die Frage, ob bisherige NOS-Elementarisierungen als Demarkationslinie geeignet sind, um ein angemessenes Naturwissenschaftsverständnis von einem angemessenen Verständnis anderer Wissenschaftsdisziplinen abzugrenzen. Nach van Dijk (2011) und Gebhard et al. (2017) können bisherige Konsens-Elementarisierungen der NOS-Facetten auch auf nicht-naturwissenschaftliche Wissenschaften angewandt werden. Angehende Lehrkräfte nicht-naturwissenschaftlicher Fächer haben Grundzüge pädagogischer Psychologie, der Erziehungswissenschaft sowie fachwissenschaftliche Anteile ihrer Unterrichtsfächer studiert und sollten mit den Grundlagen wissenschaftlicher Erkenntnis in ihren jeweiligen Disziplinen vertraut sein.

Eine weitere grundsätzliche Limitation erfährt das Instrument durch die Verwendung geschlossener Items und einem advokatorischen Ansatz. Zunächst wird dadurch eine zeitökonomische Durchführung und Auswertung ermöglicht. Durch ein solches Verfahren kann jedoch nicht die Tiefe einer real durchgeführten Unterrichtsbeobachtung erreicht werden. Durch geschlossene Items wird von den Testpersonen ferner nur eine (Wieder‑)Erkennungsleistung, jedoch keine (Re‑) Produktionsleistung gefordert (vgl. Döring und Bortz 2016), sodass anhand der Testergebnisse nur vorsichtig auf die Performanz im tatsächlichen Unterrichtsgeschehen geschlossen werden kann. Die interne Konsistenz des eindimensionalen Modells mit einem Cronbach’s α von 0,631 ist ebenfalls zu hinterfragen; für die erste Version eines neuentwickelten fachdidaktischen Instruments interpretieren wir den Wert als noch akzeptabel. Ferner ist in Bezug auf die Schwierigkeitsverteilung tendenziell ein Bodeneffekt zu erkennen. Offenbar gibt es in Hinblick auf die Zielgruppe keine leichten Items. Inzwischen wurde das Instrument in NOS-Interventionen eingesetzt; die Analyse der Ergebnisse wird Hinweise geben, ob die sich die Items auch nach Interventionen oder mit zunehmenden NOS-Kenntnissen als schwierig darstellen; daneben sollte bei der Überarbeitung des Instruments der Schwierigkeitsgrad der Items besondere Berücksichtigung finden.

Grundsätzlich lässt sich der Anspruch des Tests, NOS als ein die naturwissenschaftlichen Domänen überspannendes Konstrukt zu formulieren und dementsprechend die NOS-Vignetten möglichst frei von inhaltsbezogenem fachspezifischen content knowledge zu formulieren, durch die vorliegende Studie noch nicht belastbar abstützen. Die signifikante, jedoch geringe Korrelation mit dem zur kovergierenden Validitätsprüfung bemühten Instrument CAEB liefert dazu noch keine hinreichenden Belege. Um Professionswissen zum naturwissenschaftlichen Unterricht zu NOS handlungsnah und quantitativ mit Hilfe von Unterrichtsvignetten erheben zu können, bedarf es somit weiterer Prüfung.

Ein Nutzen, Professionswissen zu NOS gezielt und in Bezug auf bestimmte Aspekte zu erfassen, scheint dennoch gegeben, da die momentane Forschungslage trotz teils intensiver bildungspolitischer und fachdidaktischer Anstrengungen ein unzureichendes Professionswissen zu NOS bei zukünftigen Lehrkräften belegt. „Klassische“ NOS-Elementarisierungen haben diese Aspekte (momentan noch) sehr viel differenzierter herausgearbeitet als der Whole-Science- oder FRA-Ansatz und eigenen sich deshalb insbesondere für fachdidaktische Forschungszwecke und individuelle Rückmeldungen (z. B. in der Lehrerbildung), um etwa Lernbedarfe festzustellen oder spezifischere Informationen zu Zusammenhängen mit anderen Konstrukten zu untersuchen. Im neuentwickelten und handlungsnah erhebenden Instrument liegen somit zu nutzende Chancen. So ist neben zusätzlichen Schritten der Validierung die Weiterentwicklung mit Vignetten zu weiteren NOS-Aspekten geplant. Aber auch über das hier vorgestellte Instrument hinaus scheint weiterer Bedarf für entsprechende Forschungsarbeiten und fachdidaktische Lehrveranstaltungen (beispielsweise mit Vignetten) nötig.