1 Problemstellung und Forschungsstand

Der Qualitätspakt Lehre, durch den seit 2011 enorme staatliche Mittel zur Förderung der Qualität in Studium und Lehre und damit auch der hochschuldidaktischen Weiterbildung zur Verfügung gestellt wurden, hat zu einem Bedeutungszuwachs für Hochschullehre geführt. Um eine Verbesserung der Lehre zu erzielen, empfahlen u. a. Biggs und Tang (2011) institutionsweite Infrastrukturen für Maßnahmen guter Lehre, beispielsweise über hochschuldidaktische Weiterbildungsangebote. Solche Maßnahmen verfolgen als übergeordnetes Ziel die Steigerung der Lehrqualität durch Förderung der Lehrkompetenz der Dozierenden. Hochschullehrende fühlen sich primär ihrer Fachdisziplin zugehörig und eine didaktische Ausbildung für eine Lehrtätigkeit ist in der Regel nicht obligatorisch (Kultusministerkonferenz 2005; Trautwein und Merkt 2013). Hochschuldidaktische Weiterbildungsmaßnahmen sollten gemäß der Empfehlung des Wissenschaftsrates (2008) daher kontinuierlich im Rahmen der Lehrtätigkeit wahrgenommen werden. Bislang herrscht jedoch kein bundesweiter Standard für die Inhalte und den Aufbau hochschuldidaktischer Weiterbildungen. Die Formate reichen von einzelnen themengebundenen Workshops über Einführungswochen für Neuberufene bis hin zu Brown-Bag-Lunches, um kollegialen Austausch zu ermöglichen. Einige Hochschulen bieten umfassende systematische Weiterbildungsprogramme an, die verschiedene Kompetenzbereiche und -stufen ansprechen und mit einem Zertifikat abschließen. Die Deutsche Gesellschaft für Hochschuldidaktik (dghd) hat mit ihrer Akkreditierungskommission akko (2017) wünschenswerte Merkmale hochschuldidaktischer Aus- und Weiterbildungsangebote mit Anlehnung an spezifische didaktische Prinzipien und inhaltliche Standards solcher Programme formuliert: Die Vermittlung bloßer Methodik oder Technik soll hierbei überschritten werden, sodass die Komplexität der Lehraufgabe reflexiv thematisiert wird. Lehrende sollen ein Verständnis für den studentischen Lernprozess entwickeln, um die Lernenden beim aktiven und selbstverantwortlichen Lernen zu unterstützen. Gleichzeitig sollen Lehrende sich ihres individuellen Lehrstils bewusst werden, um authentisch zu agieren. Zudem sollen sie angeregt werden, ihre Lehre innovativ und experimentierfreudig unter Verwendung vielfältiger Methoden zu gestalten. Innerhalb der Intervention werden die Lehrenden außerdem motiviert und dabei unterstützt, ihre Lehre zu evaluieren, zu reflektieren sowie kontinuierlich weiterzuentwickeln. Feedbackprozesse sollen kultiviert sowie Forschung über eigenes Lehren im Sinne des Scholarship of Teaching and Learning implementiert werden (Huber 2014).

Der aktuelle Forschungsstand basiert überwiegend auf Untersuchungen zur Wirksamkeit hochschuldidaktischer Maßnahmen auf die wahrgenommenen Lehrkompetenzen der Lehrenden (Selbsteinschätzungen). In ihrem systematischen Review untersuchten bereits Steinert et al. (2006) die Effekte hochschuldidaktischer Interventionen auf die Einstellung zur Lehre, das Lehrverhalten sowie das Wissen bei Lehrenden an medizinischen Fakultäten. Ihr Review umfasst 53 Studien aus verschiedenen Ländern, wobei insgesamt positive Veränderungen in der Lehreinstellung sowie dem Lehrverhalten und ein erhöhtes Wissen festgestellt werden konnten. Stes et al. (2010) knüpften an diese Arbeit mit einem erweiterten Modell an und die große Mehrheit der untersuchten Studien verzeichnete ebenfalls positive Ergebnisse in diesen Bereichen. Da sich die Rahmenbedingungen von Hochschullehre und hochschuldidaktischer Qualifizierung, wie z. B. die Hochschulkultur, im internationalen Raum unterscheiden, können diese Ergebnisse nur bedingt auf den deutschen Hochschulkontext übertragen werden. Das vorliegende systematische Review untersucht ergänzend zu den beiden Arbeiten von Steinert et al. (2006) und Stes et al. (2010) die Studien der deutschen hochschuldidaktischen Wirksamkeitsforschung seit Einführung des Qualitätspakts Lehre im Jahr 2011. Die hierzu herangezogenen Studien werden in einem Modell zur Struktur akademischer Lehrkompetenz von Trautwein und Merkt (2013) verortet. Weiterhin werden zwei quantitative Meta-Analysen durchgeführt, um Effektstärken in den Wirkungsdimensionen Selbstwirksamkeitserwartungen der Lehrenden sowie Studierendenfokussierung in der Lehre ermitteln zu können. Ziel der hier dargestellten Studie ist es einen Überblick über die deutsche Wirksamkeitsforschung seit der Einführung des Qualitätspakts Lehre zu erstellen und – wo immer möglich – aggregierte Rückschlüsse auf die Wirkung hochschuldidaktischer Weiterbildungsmaßnahmen auf die akademische Lehrkompetenz in Form von metaanalytischen Betrachtungen zu ziehen. Dazu wird auf die folgenden Forschungsfragen rekurriert:

  1. 1.

    Wie wirksam waren die einzelnen hochschuldidaktischen Interventionen seit Einführung des Qualitätspakts Lehre im Jahr 2011 in Deutschland?

  2. 2.

    Welche aggregierten Effektstärken ergeben sich aus der Forschung in den Wirkungsdimensionen Selbstwirksamkeitserwartungen der Lehrenden und Studierendenfokussierung in der Lehre?

2 Theoretische Anknüpfungspunkte

Im Zuge des Bologna-Prozesses fand ein Wandel von einem lehrenden- zu einem studierendenzentrierten Lehransatz statt, wodurch sich die Rolle von Lehrpersonen veränderte: Studierende sollten zur aktiven Partizipation am Lernprozess angeregt werden. Lernen wurde dabei als individueller, aktiver und konstruktiver Vorgang konzipiert, welcher von Lehrenden nur bedingt gesteuert werden könne (Leutner 2010). Die reine Präsentation von Lehrinhalten werde der Komplexität des Lernprozesses nicht gerecht, vielmehr bedürfe es einer Partnerschaft zwischen Lehrenden und Lernenden und einer Wahrnehmung von Studierenden als eigenständigen Konstrukteuren ihres Wissens, ihrer Fähigkeiten und Fertigkeiten (Leutner 2010; Wissenschaftsrat 2008). Es erfolgte eine Verschiebung des Fokus von Wissen zu Können. Im Zentrum stand nunmehr der Erwerb spezifischer Kompetenzen im persönlichen Lernprozess der Studierenden, wobei die Lehrpersonen eine unterstützende und beratende Rolle einnehmen sollten. Dieser shift from teaching to learning, wie Brown und Atkins (1990) die Verschiebung bezeichnen, rückte die Lernenden mit ihren individuellen Voraussetzungen und Bedürfnissen in den Mittelpunkt der Lehre. Laut Wissenschaftsrat (2008) ist es Aufgabe der Lehrenden, die Konzeption der Lehrveranstaltungen auf eine effektive Unterstützung studentischer Lernprozesse auszurichten, um damit ihrer Mitverantwortung für den Lernerfolg gerecht zu werden. Voraussetzung dafür ist akademische Lehrkompetenz, deren Auf- und Ausbau wesentliches Ziel hochschuldidaktischer Weiterbildungsmaßnahmen ist (Kultusministerkonferenz 2005). Eine Möglichkeit der Definition von Lehrkompetenz bietet das Lehrkompetenzmodell von Baumert und Kunter (2011), welches im schulischen Kontext entwickelt wurde. Zwar überschneiden sich schulische und akademische Lehrkompetenz in vielen Bereichen, allerdings werden Lehrkräfte an Schulen innerhalb ihres Studiums pädagogisch ausgebildet und die Kompetenzfacetten des vorgenannten Modells sind darauf ausgelegt. Dagegen sind Lehrende an Hochschulen mit wenigen Ausnahmen vorrangig Fachexpert*innen ohne didaktische Qualifikationen. Entsprechend nehmen sie auch ihre Lehraufgaben zumeist als fachliche Expert*innen und hochschuldidaktische Laien wahr (Reinmann 2015). Dieser Umstand findet im Modell akademischer Lehrkompetenz von Trautwein und Merkt (2013) Berücksichtigung. Im Modell enthalten sind sechs Kompetenzfacetten, wobei der Fokus im Folgenden auf den vier Kompetenzfacetten liegt, die aktiv in hochschuldidaktischen Weiterbildungsmaßnahmen geschult werden. Dabei handelt es sich um das formale Lehr-Lern-Wissen, die metakognitiven Strategien, die Lehr-Lern-Philosophie und die Handlungsstrategien (Abb. 1).Footnote 1

Abb. 1
figure 1

Struktur akademischer Lehrkompetenz (Trautwein und Merkt 2013, S. 59)

Formales Lehr-Lern-Wissen beschreibt im Modell das theoretische Wissen über Lehren und Lernen, wie es über Fachliteratur expliziert wird. Es übt keinen unmittelbaren Einfluss auf die Lehrhandlungen aus und ist daher von dem in der Handlung wirksamen Wissen abzugrenzen (Trautwein und Merkt 2013). Um das eigene Handeln in der Lehre zu reflektieren, kritisch zu denken und vorhandenes Wissen zu hinterfragen, werden metakognitive Strategien angewandt. Diese sind ebenfalls ausschließlich in den Vorbereitungs- und Reflexionsprozessen der Lehrhandlung wirksam. Hierdurch sollen Prozesse evaluiert, überdacht und optimiert werden (Wegner und Nückles 2012). Diese Selbstreflexion ist zudem notwendig, um sich der Antinomien und der Handlungsoptionen des Lehrens bewusst zu sein, da die Lehrperson aus eigenen Entscheidungen heraus handelt, basierend auf persönlichen Überzeugungen sowie der eigenen Auffassung der Lehrsituation (Reinmann 2015; Wegner und Nückles 2012). Die nachfolgenden beiden Kompetenzfacetten sind dagegen in der Lehrhandlung selbst wirksam. Die Lehr-Lern-Philosophie umfasst alle Überzeugungen der Lehrperson, welche sich aus Annahmen, Vorstellungen und Konzepten über den Lehr-Lern-Prozess, der darin beteiligten Akteure sowie der Lehre selbst zusammensetzen. Die Lehr-Lern-Überzeugungen stellen zugleich eine Wertevorstellung der Lehrenden dar und werden für sie als wahr empfunden, weshalb sie als Orientierung für die spätere Lehrhandlung dienen und die individuelle Zielsetzung bedingen (Reusser et al. 2011). Die Lehr-Lern-Philosophie manifestiert sich in den hochschuldidaktischen Handlungsstrategien, die in der Lehre praktiziert werden. Diese beinhalten das Wissen über didaktische Modelle und Lehr-Lern-Methoden, Unterrichtsszenarien sowie Prüfungsformate und Beratungsmethoden. Aus diesem vorhandenen Wissen leiten Lehrpersonen Handlungsregeln für ihre Lehre ab (Trautwein und Merkt 2013). Die Anwendung der Handlungsstrategien dient der Erreichung der Ziele, die aus der Lehr-Lern-Philosophie heraus entstanden sind. Zwei Wirkungsdimensionen hochschuldidaktischer Interventionen, die im Systematic Review meta-analytisch betrachtet werden, sind die Selbstwirksamkeitserwartung der Lehrenden, welche in den metakognitiven Strategien wirksam werden, sowie die Studierendenfokussierung, welche den Lehr-Lern-Philosophien zugeordnet werden kann.

3 Methodisches Vorgehen

Um eine Übersicht über die hochschuldidaktische Wirksamkeitsforschung seit Einführung des Qualitätspakts Lehre im Jahr 2011 zu erhalten, wird auf ein systematisches Review und zwei quantitative Meta-Analysen zurückgegriffen. Dabei orientiert sich unsere Studie sowohl hinsichtlich des methodischen Vorgehens als auch hinsichtlich der Kriterien eines systematischen Reviews am PRISMA Statement (Liberati et al. 2009). Zunächst wurde im Frühjahr 2022 eine umfassende Literaturrecherche durchgeführt, für welche ein breit gefächerter Search String mit insgesamt dreizehn Suchbegriffen, die später miteinander kombiniert wurden, entwickelt wurde. Eine detaillierte Beschreibung des Search Strings sowie der hiermit erzielten Treffer pro Begriffskombination und Datenbanken ist in Anhang A ersichtlich. Der Search String wurde in Kooperation mit einem Übersetzer ins Englische übersetzt, um ebenfalls englischsprachige Datenbanken in die Suche miteinbeziehen zu können. Eine Herausforderung an dieser Stelle war der Terminus der Hochschuldidaktik, da hierfür keine direkte Übersetzung ins Englische existiert und daher mit einer Umschreibung des Hochschulkontextes gearbeitet werden musste. Ein Probelauf in den Datenbanken EBSCO und PsycInfo zeigte, dass die Schlagworte des englischen Search Strings überwiegend Publikationen aus dem schulischen anstelle des hochschulischen Kontextes lieferten. Ausnahmen erfüllten wiederum die übrigen Mindestanforderungen nicht, weshalb der englische Search String für dieses strategische Review explizit ausgeschlossen wurde. Weiter ist publizierte hochschuldidaktische Forschung an deutschen Universitäten und Hochschulen fast ausschließlich in deutscher Sprache verfasst. Dennoch wurde durch die manuelle Suche außerhalb der Datenbanken eine englischsprachige Studie gewonnen, die alle Anforderungen erfüllte und mit in das vorliegende Review aufgenommen wurde. Für die endgültige Suche wurden schließlich drei der größten Datenbanken im Bereich der Erziehungs- und Bildungswissenschaften sowie der Psychologie aufgenommen: Fachportal Pädagogik (FIS), PubPsych und Deutscher Bildungsserver, wobei letztere bei keiner Suchbegriffskombination zu Treffern führte. Innerhalb der Datenbanksuchen wurden alle Publikationstypen berücksichtigt, jedoch wurde eine Einschränkung des Publikationszeitraumes vorgenommen. Da 2011 der Qualitätspakt Lehre ins Leben gerufen wurde, sollte sich das vorliegende Review auf die Wirksamkeitsforschung ab dessen Beginn beziehen. Zudem erfolgte eine Eingrenzung auf deutsch- sowie englischsprachige Literatur. Es wurde kein Forschungsdesign explizit ausgeschlossen, jedoch sollte der Untersuchungsgegenstand einer jeden Studie die Effektivität von Interventionen für Lehrende an deutschen Universitäten und Hochschulen sein. Zudem erfolgte keine Einschränkung hinsichtlich des Weiterbildungsformats und des untersuchten Wirkungsbereichs, sodass ein breites Spektrum an Effekten basierend auf Fremd- und Selbsteinschätzung gewonnen werden konnte. Die Datenbankensuche lieferte über 4000 Treffer (inkl. Duplikaten). Nach Entfernen der Duplikate verblieben 3186 Studien. Im nächsten Schritt wurden die Datenbanktreffer mittels Titelanalyse auf Relevanz untersucht. Um zu überprüfen, ob eine Studie die Mindestanforderungen erfüllt, wurde sodann eine Abstract-Analyse durchgeführt. Lag kein Abstract vor, erfolgte ein Skimming der entsprechenden Abschnitte im Volltext. Hierdurch wurden die Treffer auf N = 42 reduziert, wobei drei weitere Studien nicht als Volltext verfügbar waren. Im Anschluss an eine erfolgreiche Abstract-Analyse sollten die Studien eine klare Beschreibung der Stichprobe, Methodik sowie der Datenauswertung aufweisen. Der exakte Selektionsprozess kann im Flow Diagram nachvollzogen werden (s. Anhang B). Schließlich verblieben N = 13 Studien, die allen Kriterien entsprachen. Im weiteren Prozess wurden die ausgewählten Studien auf die verzeichneten Auswirkungen der Teilnahme an einer hochschuldidaktischen Weiterbildung untersucht. Die in den Studien gemessenen Wirkungsbereiche wurden sodann entsprechend der dort aufgeführten Definitionen den Kompetenzfacetten des Modells nach Trautwein und Merkt (2013) zugeordnet. Hierfür wurde eine wissenschaftliche Hilfskraft als zweite Coder-Person hinzugezogen, wobei die Intercoder-Reliabilität mit einem Cohen’s Kappa von 0,62 ‚gut‘ ausfiel (Altman 1991).

Es wurden jene Studienresultate von der Analyse ausgeschlossen, die

  • irrelevant für die Beantwortung der Forschungsfragen sind (z. B. Zufriedenheit mit der Weiterbildungsmaßnahme)

  • Veränderungsbereiche untersuchen, die keinen Bestandteil der Weiterbildungsinhalte darstellen

  • aus Follow-Up-Erhebungen oder Messungen in der Programmmitte stammen, da fast alle Studien sich auf einen Vergleich der Messwerte zwischen vor und nach der Weiterbildung beziehen und vereinzelte Befunde aus längeren oder kürzen Betrachtungszeitpunkten nicht hiermit vergleichbar sind.

Ergebnisse, die relevant für die Beantwortung der Forschungsfragen zur Wirksamkeit der hochschuldidaktischen Interventionen sind, jedoch nicht direkt im Modell akademischer Lehrkompetenz verortet werden konnten, werden im Anschluss an die Präsentation der Ergebnisse vorgestellt. Um eine quantitative Aussage über die Veränderung von Bestandteilen akademischer Lehrkompetenz zu treffen, wurden alle einschlägigen Studien gesammelt. Ausgewählt wurden all jene Studien mit quantitativem Forschungsdesign und Prä-Post-Messung basierend auf der Selbsteinschätzung von Lehrenden, da hier ein Studienvergleich durch die ausreichend große Anzahl an Referenzstudien möglich erscheint. Diese wurden weiter auf Überschneidungen in den gemessenen Wirkungsbereichen untersucht. Zudem wurden ausschließlich jene Studien in die Berechnung einbezogen, die als Messinstrument einen Fragebogen nutzen, um auch hier die Studienauswahl möglichst groß zu halten. Aus Gründen der Konformität wurden unterschiedliche Skalenniveaus angepasst, wo erforderlich, wie von Maehler et al. (2020) vorgeschlagen. Als niedrigste Stichprobengröße für Meta-Betrachtungen in Bezug auf die einzelnen Kompetenzfacetten wurden N = 3 Studien festgelegt. Hierbei konnten nach Ausschluss der qualitativen Studien zwei Dimensionen identifiziert werden, für die diese Kriterien zutrafen: Die Selbstwirksamkeitserwartungen mit N = 6 (Beuße et al. 2016; Fabriz et al. 2020; Johannes und Seidel 2012; Ulrich mit zwei Teilstudien: Ulrich 2013.1 und Ulrich 2013.2; Wibbecke 2015) sowie die Studierendenfokussierung mit N = 6 (Beuße et al. 2016; Johannes und Seidel 2012; Leibenath et al. 2016; Ulrich 2013a, 2013b; Wibbecke 2015). Für die ausgewählten Studien wurden zunächst die betreffenden Mittelwerte M und Standardabweichungen SD sowie die Stichprobengröße N selektiert. Falls die Effektstärken nicht Teil der Ergebnisse oder nicht vollständig aufgeführt waren bzw. anderweitiger Klärungsbedarf bestand, wurde Kontakt mit den Studienautor*innen aufgenommen. In Einzelfällen führten diese Neuberechnungen durch, um die gewünschte Wirkungsdimension korrekt abbilden zu können. Schließlich wurden zwei quantitative Meta-Analysen mit der statistischen Software RStudio in der Version 2023.09.0+463 durchgeführt. Hierbei wurde das frei zugängliche Open-Source Add-On metafor mit dem darin enthaltenen escalc-Befehl genutzt (Viechtbauer 2010). Als Datengrundlage dienten die eingespeisten Datentabellen (s. Anhang C) mit entsprechendem Codebook für eine Definition der Tabellenspalten (s. Anhang D). Durch die Anwendung des Befehls wird die standardisierte Mittelwertdifferenz zwischen den in der Tabelle enthaltenen Werten vor Besuch der Intervention (mean_pre; sd_pre; n_pre) und denen nach Besuch der Intervention (mean_post; sd_post; n_post) berechnet. Dies ermöglicht eine Aussage über die Veränderung zwischen den beiden Messzeitpunkten über die Studien hinweg.

4 Ergebnisse

Nachfolgend werden die Ergebnisse dieses Reviews in Bezug auf das Modell akademischer Lehrkompetenz von Trautwein und Merkt (2013) vorgestellt.

4.1 Ergebnisse der systematischen Literaturübersicht

Als Ergebnis des systematischen Suchprozesses erfüllten dreizehn Studien die Anforderungskriterien und konnten in das Review aufgenommen werden. Eine Übersicht über die Studienauswahl findet sich in Tab. 1.

Tab. 1 Übersicht der Studienauswahl

Eine bündige Zusammenfassung der einzelnen Studien findet sich in Anhang E. Im Folgenden werden kurz das Forschungsdesign sowie die Ergebnisse der für das Review ausgewählten Studien beschrieben.

4.1.1 Formales Lehr-Lern-Wissen

In der Kompetenzfacette Formales Lehr-Lern-Wissen konnten Ergebnisse aus fünf Studien eingegliedert werden. Vier davon untersuchten die Wirkung von Interventionen in diesem Bereich quantitativ (Beuße et al. 2016; Fabriz et al. 2020; Fendler et al. 2013; Ulrich 2013) und eine Studie qualitativ (Schöler 2017). Schöler (2017) führte im Rahmen des Mixed-Methods-Designs unter anderem eine Interviewstudie durch, während die übrigen Autor*innen Fragebogenstudien wählten. Allen Studien liegt ein Prätest-Posttest-Design zugrunde mit Ausnahme der Studie von Fendler et al. (2013). Insgesamt basieren alle Ergebnisse auf der Selbsteinschätzung der Lehrenden, die eine hochschuldidaktische Weiterbildung besucht haben. Bis auf Fendler et al. (2013) konnten alle Studien in diesem Bereich eine signifikante Verbesserung feststellen. Fendler et al. (2013) befragten Weiterbildungsinteressierte, -teilnehmende sowie Lehrende, die keinerlei Berührungspunkte mit solchen Maßnahmen hatten, hinsichtlich ihres metakognitiven Lehrwissens. Hierbei konnten die Autor*innen keinerlei signifikante Unterschiede zwischen den drei Gruppen feststellen. In den Fragebogenstudien von Beuße et al. (2016) und Fabriz et al. (2020) wurde ein statistisch signifikanter Wissenszuwachs im Bereich der theoretischen Kenntnisse über Lehren und Lernen erfasst, welcher in der Studie von Fabriz et al. (2020) zusätzlich signifikant mit der Selbstwirksamkeitserwartung der Lehrenden korrelierte. Weiter verzeichneten hier Lehrende mit geringer Lehrerfahrung (0–4 Semester) die größte Erhöhung. Schölers (2017) Resultate aus den Interviews bestätigen diese Befunde, da die Autorin eine signifikante Verbesserung im pädagogisch-psychologischen Wissen von Lehrenden feststellte und dieses von den Befragten als zweithäufigster Veränderungsbereich angegeben wurde. Ulrich (2013) untersuchte eine interventionsbasierte Veränderung im Wissen über gute Lehre und führte eine Fragebogenstudie zu den Bestandteilen dieses Konstrukts durch. Der Autor identifizierte einen statistisch signifikant bedeutsamen Effekt, den er auf die Teilnahme an der Intervention zurückführte.

4.1.2 Metakognitive Strategien

Acht Fragebogenstudien (Beuße et al. 2016; Fabriz et al. 2020; Fendler et al. 2013; Johannes und Seidel 2012; Trautwein und Merkt 2013; Ulrich 2013; Vöing 2022; Wibbecke 2015) befassten sich mit der selbsteingeschätzten Veränderung der metakognitiven Strategien der Weiterbildungsteilnehmenden. Eine Studie (Schöler 2017) nutzte ein qualitatives Forschungsdesign, während die übrigen Studien quantitative Erhebungen durchführten. Alle Studien führten Prätest-Posttest-Messungen durch. Davon untersuchten fünf die Selbstwirksamkeitserwartungen von Lehrenden, wobei in vier Studien positive Effekte verzeichnet wurden. Bei Wibbecke (2015) zeigte sich kein signifikanter Unterschied zwischen Lehrenden, die die Weiterbildungsmaßnahme besuchten, und Nichtteilnehmenden. Beuße et al. (2016), Fabriz et al. (2020) sowie Johannes und Seidel (2012) stellten signifikante Erhöhungen im Bereich der Selbstwirksamkeitserwartungen von der Messung vor der Teilnahme zu der Messung im Anschluss an die Teilnahme fest. Diese Ergebnisse werden durch die Ergebnisse der Messungen durch Ulrich (2013) bestärkt. Auch er berichtet bei beiden Experimentalgruppen von signifikanten Unterschieden mit bedeutsamer Effektstärke, die damit ebenfalls auf einen förderlichen Einfluss der Weiterbildungsmaßnahme auf die Selbstwirksamkeitserwartungen der Lehrenden hinweisen (Ulrich 2013). Fabriz et al. (2020) und Ulrich (2013) untersuchten weiter die Effekte der Intervention auf das Fähigkeitsselbstkonzept der Lehrenden. Das Fähigkeitsselbstkonzept umfasst das Wissen über die eigenen kognitiven Fähigkeiten (Müller 2019), hier im Kontext der Lehre. Neben einer signifikanten Erhöhung zwischen den beiden Messzeitpunkten profitieren erneut Lehrende mit einer geringen Lehrerfahrung am meisten von der Weiterbildung, wie Fabriz et al. (2020) berichten. Ulrich (2013) stellt analog zu den Resultaten im Bereich der Selbstwirksamkeitserwartung ebenfalls signifikant bedeutsame Effekte in beiden Experimentalgruppen und damit eine interventionsbedingte Verbesserung des Fähigkeitsselbstkonzepts fest. Als Teil der metakognitiven Strategien haben sich Trautwein und Merkt (2013) mit dem Rollenverständnis von Lehrenden beschäftigt. In ihrer Interviewstudie im Anschluss an die Weiterbildungsteilnahme berichten die beiden Autorinnen von positiven persönlichen Entwicklungen der Lehrenden. Diese zeigen sich z. B. in einer Zunahme an Souveränität und Gelassenheit in der Rolle als Lehrende, aber auch in Form von verstärkter Durchsetzungs- und Abgrenzungsfähigkeit sowie an einer veränderten Selbstwahrnehmung. Fendler et al. (2013) untersuchten die wahrgenommenen Effekte in Bezug auf die Selbstregulation aus Sicht der Teilnehmenden im Anschluss an die Weiterbildung. Bestandteil der Befragung waren Items, die internes sowie externes Feedback und die Einstellung der Lehrenden zu kritischen Empfehlungen betreffen. Hierbei konnten die Autor*innen keine signifikanten Unterschiede zwischen den drei Befragungsgruppen feststellen, sodass keinerlei Effekte der Teilnahme an der Weiterbildung hinsichtlich der Selbstregulation verzeichnet wurden.

Mit Blick auf die (Selbst‑)Reflexion von Lehrenden liegen keine eindeutigen Ergebnisse aus den Studien von Schöler (2017), Trautwein und Merkt (2013) sowie Vöing (2022) vor. Mittels Fragebogenstudie im Anschluss an die Intervention erfasste Vöing (2022) die selbsteingeschätzte Veränderung in diesem Bereich, wobei 83 % zumindest teilweise von einer verstärkten Reflexion ihrer Lehrtätigkeit sprachen. In der Interviewstudie von Trautwein und Merkt (2013) fanden bei allen Teilnehmenden Veränderungen im metakognitiven Bereich statt. Unter allen identifizierten Veränderungsbereichen wurde am vierthäufigsten von Veränderungen im metakognitiven Bereich berichtet, z. B. dass die Lehrenden unter neuen Perspektiven über ihre Lehre reflektierten. Auch das Bewusstsein über Dilemmata in der Lehre, wie z. B. zwischen Freiheiten für die Lernenden und notwendigen Reglementierungen seitens der Lehrperson, seien gestiegen. Weiter berichteten die Teilnehmenden in der Studie von einer erhöhten Kontextsensibilität beim Einsatz von Methoden in der Lehre. Schölers (2017) Studie wiederum zeigt keinen signifikanten Unterschied in der (Selbst‑)Reflexion der Lehrenden zwischen den beiden Messzeitpunkten.

4.1.3 Lehr-Lern-Philosophien

In der Kompetenzfacette Lehr-Lern-Philosophie konnten zehn Studien verortet werden. Fünf Studien lag ein quantitatives Forschungsdesign zugrunde (Beuße et al. 2016; Fendler et al. 2013; Leibenath et al. 2016; Ulrich 2013; Vöing 2022), zwei Studien nutzten ein qualitatives Design (Trautwein und Merkt 2013; Wegner und Nückles 2011) und drei Studien nutzten Mixed-Methods (Johannes und Seidel 2012; Schöler 2017; Wibbecke 2015). Die Interviewstudie von Wegner und Nückles (2011) umfasste zum einen vier verschiedene Dilemmaszenarien, zu welchen die interviewten Lehrenden eine Perspektive einnahmen. In den Szenarien Freiheit versus Struktur und Individuelle Ausnahmen versus Gleichberechtigung wurden keine signifikanten Effekte gemessen. In den anderen beiden Szenarien Problemorientierung versus systematische Orientierung und Objektivität versus Validität konnten signifikant höhere Stufen für Teilnehmende der Weiterbildungsmaßnahme nachgewiesen werden. Lehrende, die eine Weiterbildung besuchten, hatten fortgeschrittenere Annahmen über die Anforderungen, die beim Lehren an sie gestellt wurden. Sie waren sich häufiger der Vielschichtigkeit von Problemen und der Antinomien des Lehrhandelns bewusst (Wegner und Nückles 2011). Zum anderen interviewten die beiden Autor*innen die Lehrenden hinsichtlich ihrer Vorstellungen über gute Lehre. Es zeigte sich, dass ein Drittel der Lehrenden nicht bereit war, eine pauschale Aussage hierzu zu treffen bzw. eine klare Definition bereitzustellen. Dies waren signifikant häufiger Lehrende, die an einer Weiterbildungsmaßnahme teilgenommen hatten. Daraus resultierte die Annahme, dass eine Teilnahme an Interventionen die Lehrenden möglicherweise für die Komplexität der Lehre und die darin bestehenden Optionen sensibilisiert (Wegner und Nückles 2011). Diese Annahme wurde durch die Ergebnisse aus der Prä-Post-Befragung der Lehrenden von Ulrich (2013) bestätigt. Die Wissensvermittlung als subjektiver Bestandteil guter Lehre nahm signifikant ab und tendierte zu einem studierendenzentrierten Lehransatz. Die Atmosphäre der Lehr-Lernumgebung und das Miteinander gewannen signifikant an Bedeutung für gute Lehre. Weitaus häufiger gaben die Lehrenden an, Transparenz als wichtigen Bestandteil guter Lehre zu erachten, was zu einem signifikanten Effekt in den Ergebnissen führte. Die Persönlichkeitsentwicklung und die Betreuung der Studierenden verlor relativ an Bedeutung und sank signifikant. Insgesamt konstatiert der Autor eine relativ starke Übereinstimmung der Ergebnisse mit den Workshopinhalten.

Die Studien von Beuße et al. (2016), Schöler (2017), Trautwein und Merkt (2013) sowie Ulrich (2013) analysierten die Effekte der Intervention auf den Lehrstil, die Konzepte und Einstellungen. Drei der vier Studien (Beuße et al. 2016; Schöler 2017; Ulrich 2013) konnten keine signifikanten Unterschiede feststellen. In der Studie von Beuße et al. (2016) konnten die Lehrenden zwischen fünf verschiedenen Rollen einer Lehrperson wählen. Die Prä-Post-Messung ergab zwar eine signifikante Abnahme der lehrendenorientierten Rollen, allerdings keine signifikante Zunahme der studierendenzentrierten Rollen. Auch Ulrichs (2013) Prä-Post-Befragung der Lehrenden zeigt lediglich kleine bedeutsame Effekte in den deskriptiven Ergebnissen, die jedoch insignifikant waren. Schöler (2017) erfasste die Veränderung im Lehrstil mittels Interviewstudie bei den Lehrenden sowie mittels Fragebogenstudie bei den Studierenden jeweils vor und nach der Weiterbildungsteilnahme. Die Ergebnisse sind deckungsgleich und es sind keinerlei signifikante Unterschiede erkennbar, sodass keine Verbesserung in Richtung eines studierendenzentrierten Lehrstils erfolgte. Kontrastierend zu diesen Befunden berichten Trautwein und Merkt (2013) von einer veränderten Konzeption der Lehrendenrolle. Unter anderem wurden ausgeprägtere Studierendenfokussierung, interaktive Lehre sowie selbstgesteuertes Lernen der Studierenden von den interviewten Teilnehmenden als wesentliche Merkmale der erfolgten Veränderungen genannt.

Fünf Studien untersuchten die Wirkung der Weiterbildung auf die Studierendenfokussierung in der Lehre, wobei mehrheitlich positive Auswirkungen verzeichnet wurden. Leibenath et al. (2016) erstellten einen Lehrstilfragebogen, welcher sowohl vor der Teilnahme an der Weiterbildung als auch im Anschluss daran von den Teilnehmenden ausgefüllt wurde. Bei nahezu allen Items des Fragebogens wurde eine deskriptive Verbesserung des Lehrstils festgestellt. Die größten Unterschiede zeigten sich bei den Aspekten aktivierender Lehre, der Förderung von Kommunikations- und Sozialkompetenz sowie der Feedbackkultur. In der Befragung von Vöing (2022) im Anschluss an die Teilnahme an einer Intervention stimmte die Hälfte der Lehrenden (eher) zu, ihre Lehre nun studierendenzentrierter zu gestalten. Zudem stimmten 83 % wenigstens teilweise zu, ihre Lehrkonzepte verändert zu haben. Auch Fendler et al. (2013) führten eine Anschlussbefragung an die Weiterbildung durch und gelangten zu dem Ergebnis, dass eine höhere Anzahl besuchter Workshops mit einer höheren Studierendenfokussierung einherging. Außerdem korrelierte eine höhere Lehrmotivation signifikant positiv mit der Studierendenfokussierung der Lehrenden. Die Autorinnen Johannes und Seidel (2012) korrelierten die handlungsbezogenen Vorstellungen der Lehrenden mit deren tatsächlicher Lehrhandlung mittels Videoanalyse und Fragebogenstudie. Die Selbsteinschätzung der Lehrenden wies im Mittel eine Tendenz zur Studierendenfokussierung auf. Die Videoanalyse bestätigte dies, da diese Selbsteinschätzung mit weniger beobachtetem Lehrhandeln und aktiverer Beteiligung der Studierenden einherging. Analog dazu beinhalteten die Lehrveranstaltungen weniger Wissensvermittlung und lehrendenzentrierte Arbeitsformen sowie mehr Elaborationsanteile. Der Prä-Post-Vergleich der Fragebogenstudie zeigte jedoch keinerlei signifikante Steigerung der Studierendenfokussierung. Wibbecke (2015) untersuchte mittels Fragebogenstudie und Beobachtungsstudie die Studierendenfokussierung sowie deren Umsetzung in den Lehrveranstaltungen. Es zeigten sich signifikante Unterschiede bei der Versuchsgruppe im Prä-Post-Vergleich mit moderaten Effekten und damit eine höhere interventionsbedingte Studierendenfokussierung. Zudem waren Lehrende nach Besuch der Weiterbildung zunehmend davon überzeugt, dass studierendenzentrierte Lehre auch in größeren Vorlesungen umgesetzt werden kann. Auch die selbsteingeschätzte Umsetzung der studierendenzentrierten Lehre wies höhere Ausprägungen bei kleinen Effektstärken nach der Intervention auf. Befragte, deren Weiterbildung mindestens ein Jahr zurücklag, unterschieden sich bei kleinen bis moderaten Effektstärken signifikant von Nichtteilnehmenden im Bereich der Lernziele. Diese Signifikanz konnte jedoch nicht bei Teilnehmenden nachgewiesen werden, die die Weiterbildung frisch absolviert hatten. Die Beobachtungsstudie durch Hochschuldidaktiker*innen zeigte hier, dass die Merkmale studierendenzentrierter Lehre mit Ausnahme der Lernziele signifikant häufiger bei Weiterbildungsteilnehmenden als bei Nichtteilnehmenden auftraten. Die Effektstärken lagen im kleinen bis großen Bereich.

4.1.4 Handlungsstrategien

Dem letzten Bestandteil Handlungsstrategien des Modells akademischer Lehrkompetenz konnten sechs quantitative Erhebungen (Beuße et al. 2016; Jörissen 2020; Leibenath et al. 2016; Stibane und Sitter 2018; Ulrich 2013; Wibbecke 2015), eine qualitative Erhebung (Trautwein und Merkt 2013) sowie eine Studie mit Mixed-Methods-Ansatz (Schöler 2017) zugeordnet werden. Sechs Studien befassten sich mit Effekten auf didaktisch-methodische Kompetenzen. Die Abschlussbefragung der Studie von Leibenath et al. (2016) zeigt, dass rund zwei Drittel der Teilnehmenden der Intervention den Zuwachs ihrer didaktischen Kompetenzen selbst als (sehr) hoch einschätzten. Alle Befragten gaben an, ihre Stärken in der Lehre ausgebaut zu haben und die große Mehrheit gab zudem an, ihre Schwächen darin verringert zu haben. Insgesamt verbesserten laut eigenen Angaben mehr als Dreiviertel der Teilnehmenden ihre didaktische Planung und Durchführung, womit ein Großteil Entwicklungen in den didaktischen Kompetenzen verzeichnen konnte. Als dritthäufigster Bereich wurde eine Veränderung in den Lehrmethoden von den Befragten der Interviewstudie von Trautwein und Merkt (2013) angegeben. Die Interviewten gaben an, häufiger praktische Elemente in die Lehre zu integrieren, Studierendenbeiträgen mehr Zeit in den Veranstaltungen einzuräumen und selbständiges Lernen mit erhöhten Erarbeitungsphasen zu ermöglichen. Dies wurde auch im Prä-Post-Vergleich der Fragebogenstudie von Beuße et al. (2016) ermittelt. Hier fand ein signifikanter Wissenszuwachs im Bereich der praktischen Fähigkeiten der Teilnehmenden statt. Schölers (2017) Ergebnisse sind hier zweigeteilt, wobei die Interviewstudie mit den Teilnehmenden auch hier eine signifikante Verbesserung im methodisch-didaktischen Können aufwies. Die Fragebogenstudie der Studierenden bestätigte die Selbsteinschätzung der Lehrenden jedoch nicht, denn es konnte kein signifikanter Unterschied zwischen der Messung vor und nach der Teilnahme an der Intervention festgestellt werden. Diese Einschätzung wird ebenfalls von den Ergebnissen aus Ulrichs (2013) Studierendenbefragung bestätigt, da auch hier kein Kompetenzzuwachs in der Methodik verzeichnet werden konnte. Jörissens (2020) Sekundäranalyse der Lehrveranstaltungsevaluationen von Weiterbildungsteilnehmenden gelangte zu ähnlichen Ergebnissen. Zwar wurden deskriptiv deutliche Entwicklungen festgestellt, diese erzeugen jedoch keine statistisch signifikanten Effekte.

Drei Studien untersuchten die Wirkung auf die Planung der Lehre. Ulrichs (2013) Studierendenbefragung lieferte gemischte Ergebnisse, da die beiden Experimentalgruppen unterschiedliche Effekte aufwiesen. Eine Gruppe von Weiterbildungsteilnehmenden zeigte einen erwarteten signifikanten Effekt in mittlerer Größe, während die andere Gruppe keinen bzw. tendenziell vielmehr einen negativen Effekt zeigte. Durch den signifikanten Unterschied der beiden Gruppen zwischen deren Teilnahme schließt Ulrich (2013) jedoch auf die Bedeutsamkeit der Ergebnisse und damit auf eine signifikante Verbesserung im Bereich der Planung und Darstellung von Lehre. In der Interviewstudie von Trautwein und Merkt (2013) wurde eine Veränderung der Planung der Lehrveranstaltung verzeichnet, welche 8,5 % aller identifizierten Veränderungsbereiche ausmacht. Stibane und Sitter (2018) untersuchten in ihrer Fragebogenstudie mit Lehrenden die Wirkung einer Schulung von Prüfenden im mündlich-praktischen Medizinerexamen. Obwohl etwa zwei Drittel der Teilnehmenden die Empfehlungen der Schulung als sinnvoll erachteten, gaben deutlich weniger Befragte an, diese auch tatsächlich umgesetzt zu haben. Die Ergebnisse zeigten, dass ein sehr großer Teil der Befragten die Absicht hatte, Empfehlungen umzusetzen. Die geringe Umsetzung hängt der Interpretation der Autor*innen zufolge mit der Entscheidungsmacht der Prüfungsvorsitzenden zusammen. In der Studie wurden weiter die Notendifferenzen zwischen mündlich-praktischer Prüfung und schriftlichem Examen vor der Schulung und nach der Schulung verglichen. Es zeigte sich eine relativ konstante Differenz auf lange Sicht mit relativ geringer Korrelation der beiden Noten, welche auch durch die Schulung nicht signifikant erhöht werden konnte.

In vier Studien wurde der Effekt auf die soziale Interaktion und den Umgang mit Studierenden untersucht. Die Ergebnisse bewegten sich hauptsächlich im negativen Bereich. Die Interviews von Trautwein und Merkt (2013) zeigten, dass Veränderungen in der Interaktion mit den Studierenden eine hintere Rangfolge in den Nennungen einnahmen und damit nicht zu den größeren Veränderungsbereichen der Weiterbildungsmaßnahme zählen. Schölers (2017) Ergebnisse der Interviewstudie im Prä-Post-Vergleich wiesen zwar eine signifikante Verbesserung in diesem Bereich auf, diese konnte jedoch von der Studierendenevaluation nicht bestätigt werden. Trotz der deskriptiven Steigerung war ebenfalls kein signifikanter Effekt in der sozialen Interaktion und Motivation der Studierenden in der Studie von Jörissen (2020) erkennbar, obwohl bereits in den ersten Lehrevaluationen hohe Werte in diesem Bereich vorlagen. Im Umgang mit Studierenden wies die Gruppe mit Teilnehmenden in Ulrichs (2013) Studierendenbefragung einen kleinen bedeutsamen Unterschied zur Gruppe vor der Teilnahme an der Weiterbildung auf. Letztere konnte sich durch die Teilnahme jedoch, kontrastierend zur anderen Experimentalgruppe, nicht signifikant verbessern.

4.2 Empirische Befunde der quantitativen Meta-Analysen

In diesem Abschnitt werden die Ergebnisse der Meta-Analysen zu den Dimensionen Selbstwirksamkeitserwartung von Lehrenden sowie Studierendenfokussierung präsentiert. Die in RStudio eingespeisten Datenblätter und das Codebook sind den Anhängen C und D zu entnehmen.

4.2.1 Wirkungsdimension Selbstwirksamkeitserwartungen

Mit Blick auf Tab. 2 ist festzustellen, dass alle Primärstudien eine deskriptive Verbesserung im Mittel von der Prä- zur Posttestmessung aufweisen. Weiter deuten alle Ergebnisse in die gleiche Richtung, da die kalkulierten Effektstärken im positiven Bereich liegen.

Tab. 2 Datengrundlage, Effektstärke (yi) und Varianz (vi) je Primärstudie zur Wirkungsdimension Selbstwirksamkeitserwartungen von Lehrenden

Aufgrund der geringen Anzahl einbezogener Studien (N = 6) und den recht kleinen Stichprobengrößen in einigen der Studien (Ulrich 2013.1, 2013.2) sind allerdings nicht alle primären Ergebnisse signifikant von Null verschieden, was sich in der Überschneidung der Kein-Effekt-Linie zeigt (Ulrich 2013.2; Wibbecke 2015). Das bedeutet, dass nicht alle Studien eine signifikante Steigerung der Selbstwirksamkeitserwartungen feststellen. Die Studien von Ulrich (2013) weisen entsprechend ein größeres Konfidenzintervall auf. Die mittlere Effektstärke von SMD = 0,61 erstreckt sich im Forest Plot (s. Abb. 2) über einen relativ großen Bereich.

Abb. 2
figure 2

Forest Plot zur Wirkungsdimension Selbstwirksamkeitserwartungen von Lehrenden

Bedingt durch diese systematischen Unterschiede herrscht eine beträchtliche Heterogenität zwischen den Studien (I2 = 69,26 %), was durch den signifikanten p‑Wert bestätigt wird (p = 0,0028). Dennoch ist die inverse varianzgewichtete mittlere Standardabweichung (SMD = 0,61) positiv und höchst signifikant (p = 0,0002) und deutet auf einen mittleren bis großen Effekt hin (Cohen 1988). Zusammenfassend ist festzustellen, dass die Selbstwirksamkeitserwartungen der Lehrenden durch die Intervention mittel bis stark erhöht wurden.

4.2.2 Wirkungsdimension Studierendenfokussierung

Mit Ausnahme der Studie von Leibenath et al. (2016) weisen alle Studien deskriptiv eine Verbesserung in diesem Bereich auf und deuten durch die kalkulierten positiven Effektstärken ebenfalls in die gleiche Richtung (s. Tab. 3). Allerdings sind aufgrund der geringen Anzahl einbezogener Studien (N = 6) und der recht kleinen Stichprobengrößen in den meisten Studien (Leibenath et al. 2016; Ulrich 2013.1, 2013.2) nahezu alle primären Ergebnisse nicht signifikant von Null verschieden, was sich in der Überschneidung der Kein-Effekt-Linie zeigt.

Tab. 3 Datengrundlage, Effektstärke (yi) und Varianz (vi) je Primärstudie zur Wirkungsdimension Studierendenfokussierung

Die Studie von Leibenath et al. (2016) verzeichnet einen negativen Effekt. Die Studie von Wibbecke (2015) weist einen signifikanten Effekt und damit eine Steigerung der Studierendenfokussierung auf. Die mittlere Effektstärke erstreckt sich im Forest Plot (s. Abb. 3) über einen größeren Bereich, was auf die kleinen Stichprobengrößen innerhalb der Studien sowie die geringe Anzahl einbezogener Studien zurückzuführen ist.

Abb. 3
figure 3

Forest Plot zur Wirkungsdimension Studierendenfokussierung

Bedingt durch diese systematischen Unterschiede herrscht eine beträchtliche Heterogenität zwischen den Studien (I2 = 67,73 %), was durch den signifikanten p‑Wert bestätigt wird (p = 0,0111). Die inverse varianzgewichtete mittlere Standardabweichung (SMD = 0,21) ist positiv und deutet auf einen schwachen Effekt hin, welcher jedoch mit p > 0,05 insignifikant ist (Cohen 1988). Zusammenfassend lässt sich sagen, dass die Studierendenfokussierung der Lehrenden durch die Intervention in den Einzelstudien zwar schwach erhöht wurde, dieser Effekt jedoch nicht signifikant ist und damit zweifelsfrei keine Verbesserung der Studierendenfokussierung durch die Weiterbildungsmaßnahme in dieser Meta-Analyse bestätigt werden kann.

5 Diskussion

Das vorliegende Review hatte zum Ziel, den Forschungsstand zur Wirkung hochschuldidaktischer Weiterbildungsmaßnahmen systematisch zusammenzufassen und zu beurteilen, welche Effekte diese auf die akademische Lehrkompetenz haben. Die identifizierten Studien messen die Effekte einer Teilnahme an hochschuldidaktischen Interventionen, variieren jedoch oftmals im Forschungsdesign sowie der Dauer bzw. dem Umfang der Weiterbildungsmaßnahmen. Die Synthese der Ergebnisse der Primärstudien im Rahmen des Systematic Reviews zeigte in den Facetten Formales Lehr-Lern-Wissen und Metakognitive Strategien akademischer Lehrkompetenz mehrheitlich positive Effekte. Dies bestätigt die Befunde des systematic reviews durch Steinert et al. (2006), das ebenso ein erhöhtes Bewusstsein über persönliche Stärken und Schwächen der Lehrenden nach einer Weiterbildungsteilnahme bestätigt. Widersprüchliche Befundlagen ergaben sich in unserem Review dagegen in den Bereichen Handlungsstrategien und Lehr-Lern-Philosophien. Steinert et al. (ebd.) und auch Stes et al. (2010) konnten dagegen klar positive Veränderungen in der Einstellung zur Lehre und ein gesteigertes Wissen über pädagogische Prinzipien und Lehrkonzepte sowie einen Zuwachs an diversen Fähigkeiten in der Lehrhandlung verzeichnen. Diese Abweichung der Ergebnisse der Reviews von Steinert et al. (2006) und Stes et al. (2010) könnte auf die unterschiedlichen einbezogenen Stichproben (nationale Befunde versus internationale Befunde) und entsprechend eine andere Lehr-Lernkultur bzw. auch andere Maßnahmen und Kursarten zurückzuführen sein.

Die in die quantitativen Meta-Analysen eingeflossenen empirischen Befunde der Primärstudien in der Wirkungsdimension Selbstwirksamkeitserwartungen von Lehrenden konnten zu einem mittleren, signifikanten Effekt aggregiert werden, sodass hier eine Wirksamkeit über die Studienlage hinweg klar belegt werden kann. Demnach haben die hochschuldidaktischen Interventionen nachweislich einen positiven Effekt auf die Selbstwirksamkeitserwartungen von teilnehmenden Lehrenden und damit auf die Kompetenzfacette der metakognitiven Strategien im Modell akademischer Lehrkompetenz von Trautwein und Merkt (2013). In der Wirkungsdimension Studierendenfokussierung war der aggregierte, positive Effekt dagegen – gegeben der kleinen Stichprobenumfänge in den Primärstudien – nicht groß genug, um inferenzstatistisch abgesichert zu werden. Hier kann eine Wirksamkeit nicht zweifelsfrei nachgewiesen werden. Die dargestellten Ergebnisse rechtfertigen die Schlussfolgerung, dass Lehrende durch hochschuldidaktische Interventionen in zumindest einem Bereich der akademischen Lehrkompetenz, den Lehr-Lern-Philosophien, statistisch nachweisbar profitieren.

Aufgrund der begrenzten Studienlage konnten keine weiteren Moderator-Analysen zur Klärung der Effektunterschiede der Studien durchgeführt werden. Auch Analysen eines plausiblen publication bias in diesem Bereich sind daher nicht durchführbar. Der Überblick des Forschungsstandes inkludierte zudem keine Verzerrungsrisiken innerhalb der jeweiligen Primärstudien. Diesen lagen unterschiedliche Forschungsdesigns zugrunde, wodurch die Vergleichbarkeit der Ergebnisse eingeschränkt wird. Zudem weisen die meisten Studien eine geringe Stichprobengröße auf. Diese Limitationen verdeutlichen die Notwendigkeit von mehr vergleichbarer Forschung in diesem Bereich. Es ist – nicht zuletzt durch die Gründung der bundesweit agierenden Stiftung für Innovation in der Hochschullehre im Jahr 2020 – zu erwarten, dass die Bedeutung von Hochschullehre weiterwächst, weshalb die Wirksamkeitsforschung in diesem Bereich vorangetrieben werden sollte. Wären mehr Studien zur Wirkung hochschuldidaktischer Maßnahmen verfügbar, ließen sich dann auch Gelingensbedingungen (z. B. Ziele der Maßnahmen, Dauer der Maßnahmen, Anzahl der Teilnehmenden, didaktisches Design der Maßnahmen) in Sub-Analysen identifizieren, anhand derer praktische Empfehlungen für die Gestaltung hochschuldidaktischer Maßnahmen abgeleitet werden könnten. Eine weitere durch das Review deutlich gewordene große Limitation stellt die Fokussierung des gesamten Forschungsstandes auf die Selbsteinschätzung der Lehrenden dar. Nur in seltenen Fällen wurde diese mit einer Fremdeinschätzung durch die Lernenden oder durch Expert*innen verglichen. Dadurch muss bei den meisten Ergebnissen, die in diesem Review berücksichtigt wurden, insbesondere die der quantitativen Meta-Analysen, von subjektiven Effekten gesprochen werden.

In breiteren Forschungsdesigns könnte eine Kombination aus multiperspektivischen Selbst- und Fremdeinschätzungen (Studierende, Lehrende sowie Beobachtungen durch hochschuldidaktische Expert*innen) genutzt werden. Hierbei sollte insbesondere stärker auf die Studierenden abgezielt werden, für die die Lehrkompetenz ihrer Dozierenden nur eine mittelbare Zielvariable für die letztlich anzustrebenden Qualitätsvorteile darstellt (höhere Lernzuwächse, Lernfreude, Lernmotivation). Neben Einschätzungsskalen liegen zudem an Hochschulen auch Studierendendaten zur Performanz der Lernenden in Form von Noten vor. Diese könnten perspektivisch als Proxys für Lernerfolg genutzt werden, um Einschätzungswerte mit objektiven Maßen zu kontrastieren, wobei hier selbstredend hohe Datenschutzanforderungen umzusetzen sind. Mittels Videoanalysen als qualitativem Bestandteil der Studien könnte zudem die tatsächliche Performanz der Lehrenden beobachtet sowie der Transfererfolg gemessen werden, wobei dabei den Lehrenden viel Offenheit und Vertrauen zur Analyse ihrer Lehrperformanz abverlangt wird, was wiederum ggf. zu Selektionseffekten bei der Stichprobenrekrutierung führt. Schließlich ist festzustellen, dass sich die meisten Studien auf die Evaluation kurzfristiger hochschuldidaktischer Maßnahmen beziehen (Trainings, Workshops). Mit höheren Effekten ist vermutlich bei regelmäßigen hochschuldidaktischen Weiterbildungsprogrammen zu rechnen (z. B. Zertifikate für Hochschuldidaktik) die eine kontinuierliche und umfassende Auseinandersetzung mit der eignen Lehre erfordern. Studien, die sich mit der Wirkung vollständiger Programme befassen, liegen bisher allerdings nicht vor, würden jedoch relevante Erkenntnisse zur Veränderung der Lehrenden über einen längeren Zeitraum hinweg liefern. Um der Problematik der über die Studien hinweg differierenden Terminologie entgegenzuwirken, könnte in Kollaboration von Hochschuldidaktiker*innen deutschlandweit auch ein konzeptueller Rahmen, der die konkreten Wirkungsbereiche hochschuldidaktischer Maßnahmen präzise definiert, entwickelt werden. Auf diese Weise ließen sich künftige Forschungsergebnisse einheitlich verorten und standardisierte Messkalen für die einzelnen Bereiche entwickeln, was für weitere systematische Betrachtungen sowie für die systematische Entwicklung und Steuerung von hochschuldidaktischen Maßnahmen von großem Vorteil wäre.