Forschungsstand: brüchige Erfolge schulischer Gesundheitsförderung

Der Settingansatz gilt auch in Schulen als aussichtsreicher Weg der Gesundheitsförderung, insbesondere für gesundheitlich Benachteiligte [10, 35, 36, 38]. Allerdings zeigt die Evidenz eine sehr heterogene Wirksamkeit dieses Ansatzes [22, 37]. Er bringt keineswegs sicher gute Gesundheitswirkungen, sondern hängt von komplex interagierenden Umsetzungsbedingungen ab. Spezifische Gesundheitsziele können in der Regel mit gezielten Programmen zuverlässiger (und ökonomischer) erreicht werden als mit einem (aufwendigen, mehrjährigen) gesundheitsgerechten Umbau der gesamten Organisation Schule. Deshalb finden sich bei genauerer Betrachtung nur wenige vollständig implementierte Settingprojekte in Schulen [24]. Zahlreiche Programme nutzen Schulen vielmehr als Plattform für „Gesundheitsförderung im Setting“, vernachlässigen Verhältnisprävention oder werden selektiv und mit geringer Ausstattung und Dosis umgesetzt [23, 39]. Zur Erreichung wichtiger Gesundheitsziele, z. B. Adipositasprävention oder Verbesserung des Organisationsklimas, ist jedoch ein systematisches multimodales Vorgehen effektiv [4, 5]. So empfiehlt sich z. B. zur Adipositasprävention ein kombiniertes Vorgehen für Ernährung, Bewegung und Fernsehverhalten über mindestens ein Schuljahr hinweg, das Aufstellen von Wasserspendern, die Aufnahme von Gesundheitsthemen (zuckerhaltige Getränke, Fernsehen) im Unterricht, verbesserter Sportunterricht sowie Bewegungsförderung im Schulalltag [5]. Gesundheitsförderung in Schulen kann nachhaltig wirken (z. B. zur Tabak- [25], Depressions- [6] oder Übergewichtsprävention [2, 27]), doch sind hochwertige Studien rar und viele Ergebnisse widersprüchlich. Die Evidenz für Sucht, sexuelles Risikoverhalten und psychische Gesundheit zeigt das gleiche Bild: Die Qualität der Interventionen und ihrer Umsetzung in Schulen variieren gleichermaßen, und aus beiden Gründen treten breit streuende Effekte auf [40].

In Deutschland wurden bislang v. a. einzelne spezifische Programme für Schulen mit belastbaren Forschungsplänen evaluiert [11, 26] und manualisiert [33], doch ist die Evidenz für zahlreiche Programme unsicher (z. B. im Feld der Gewaltprävention [20]). Für den Settingansatz in deutschen Schulen wurden bislang nur wenige, und zwar qualitative Beobachtungs-, retrospektive und Querschnittsstudien transparent publiziert [3, 21, 28, 30, 32]; weitere Einsichten sind von der Veröffentlichung der Anschubevaluationen zu erwarten. Kurz, schulische Gesundheitsförderung ist nach Forschungslage von vielen Bedingungen abhängig, nicht zuletzt von hochwertigen Interventionen und ihrer sauberen Umsetzung. Die Breitenwirksamkeit (effectiveness) vieler Einzelprogramme ist ebenso ungesichert wie die des Settingansatzes gesundheitsförderlicher Organisationsentwicklung für Schulen. Die Seltenheit dieses Ansatzes und veröffentlichter Evaluationen weisen zudem auf erhebliche Hürden für aussagefähige Begleitforschung hin.

Das Settingprojekt „gesund leben lernen“ und sein Vorgehen

Das Projekt „gesund leben lernen“ in Niedersachsen, Rheinland-Pfalz und Sachsen-Anhalt folgte seit 2003 dem Settingansatz [13, 42]. Beteiligt waren 62 Schulen und zwei Kitas – letztere, um auch alle Bildungsstufen einzubeziehen und damit auch Erfahrungen mit Gesundheitsförderung am Übergang zwischen Kita und Schule zu sammeln. Das Vorgehen war – dem Settingansatz entsprechend – teilstandardisiert (ähnliche Grundzüge, aber maßgeschneiderte Interventionen vor Ort mit unterschiedlicher Dosis, Zielsetzung und Durchführung). Zu den gemeinsamen Grundzügen zählten u. a. ein Beschluss der Schulkonferenz zur Projektteilnahme, die Einrichtung eines schulischen Ansprechpartners und Steuerkreises sowie die Suche nach lokalen und regionalen Kooperationspartnern. Zu den Durchführungsprinzipien gehörten:

  • Ganzheitlichkeit, die salutogenetische und ressourcenfördernde Umgestaltung aller Struktur- und Prozessebenen der Lebenswelt Schule,

  • Partizipation aller Gruppen in der Schule, etwa durch Befragungen, Fokusgruppen, Gesundheitszirkel und Beteiligung an wichtigen Teilschritten,

  • Integration von Gesundheit in Kernprozesse der Einrichtung durch Einführung eines systematischen Gesundheitsmanagements,

  • Empowerment, also Qualifizierung und Vorbereitung der Schulen auf die selbständige weitere Ausgestaltung gesundheitsgerechter Alltagsbedingungen, u. a. durch Hilfen zur Vernetzung, Fortbildungen, Projektmanagement, Gesundheitszirkelmoderation und fortlaufende Beratung,

  • ein Projektmanagement mit interner Qualifizierung der Schulen und externer Fachbegleitung durch die Landesvereinigungen für Gesundheit, Krankenkassen und eine Länderberatergruppe.

Zu Projektbeginn standen eine Bestandsaufnahme und Ursachenanalysen, dann wurden schulspezifisch geeignete Maßnahmen zur Gesundheitsförderung beschlossen und umgesetzt. Hinsichtlich der Art, Zahl, Abfolge, Dichte und Umsetzung dieser Maßnahmen konnte indes jede Schule ihren eigenen Weg suchen. Sie konnten also aus dem breiten Interventionsspektrum schulischer Gesundheitsförderung verhaltens- und verhältnispräventive Maßnahmen kombinieren oder entwickeln (Gesundheitstage/-wochen, Umgestaltung des Schulgeländes, Fortbildungen für das Kollegium, Durchführung von Programmen oder besonderen Angeboten zur Sucht oder Übergewichtsprävention oder Stressreduktion usw.; [10]).

Wichtige übergreifende Zielsetzungen bildeten die Verminderung sozial bedingter gesundheitlicher Ungleichheit sowie die Stärkung von Lehrergesundheit als wichtigem Pfeiler Betrieblicher Gesundheitsförderung in Schulen und zur Motivierung der Lehrkräfte als Schlüsselmultiplikator für eine Unterstützung des Projekts in den Schulen. Die drei Bundesländer wählten dabei unterschiedliche Implementationsschwerpunkte: (1) Multiplikatorenschulung und Aufbau eines landesweiten Experten- und Schulnetzwerks, (2) Projektmanagement sowie (3) Weiterentwicklung von Tools und Steuerungstechniken der Betrieblichen Gesundheitsförderung [1]. Diese Schwerpunkte dienten dazu, geeignete Verbreitungs- und Unterstützungsstrategien für Gesundheitsförderung in Schulen zu erproben; das Spektrum der einzelnen Interventionen in den Schulen blieb davon unberührt.

Aufgabenstellung, theoretischer Hintergrund und Zielgrößen

Die Begleitforschung hatte die Aufgaben,

  1. a)

    geeignete, knappe Evaluationsinstrumente für Settinginterventionen zu entwickeln,

  2. b)

    diese exemplarisch in einer Wirkungsabschätzung des Projekts „gesund leben lernen“ zu erproben [17], konzentriert auf gesundheitsbezogene Outcomes.

Zur Prozessevaluation der Implementationsschwerpunkte und der Umsetzung in den Schulen führten die Projekte interne Evaluationen durch, um die Durchführungserfahrungen zu sichten. Die Ergebnisevaluation konzentrierte sich dagegen auf die Gesundheitswirkungen. Aus der Evidenz ließ sich eine Programmtheorie schulischer Gesundheitsförderung gewinnen [19], um die Wirkungsebenen, erwarteten Effekte und wichtige Drittvariablen zu identifizieren (Abb. 1):

Abb. 1
figure 1

Programmtheorie „Schulische Gesundheitsförderung“

Prädiktoren für den Zustand zu Projektende und Zieldimensionen zugleich bilden die organisationalen und individuellen Ausgangslagen für die Interventionen: auf organisatorischer Ebene die Schulkultur (1.1+1.3), auf individueller Ebene gesundheitsrelevante Merkmale wie z. B. Prävalenzen und Soziodemographie (1.2+1.4). Manche Rahmenbedingungen (z. B. Halb-/Ganztagsschule) und Zielgruppenmerkmale sind vom Projekt unabhängige Konstanten, andere Variablen sind leichter veränderbar.

Der Interventionsverlauf ist – wie in der Betrieblichen Gesundheitsförderung – durch drei Teilbereiche bestimmt: Einbettung und Vorgehen des Gesamtprojekts (2.1), Arbeit des Steuerkreises (2.2) sowie Auswahl und Durchführung der präventiven Teilinterventionen (2.3).

Wirkungen der Interventionen treten in charakteristischer Abfolge ein: Am raschesten sind strukturelle und organisationskulturelle Effekte zu erzielen, z. B. im Schulprogramm oder der Gestaltung von Schulkonferenzen, Ruhe- und Arbeitsrhythmen (3.1). Sie unterstützen individuelle Verhaltensänderungen, weil sie gesundheitsbezogene Werte und Veränderungsmöglichkeiten vergegenwärtigen, etwa eine angenehme Schulumwelt zu gestalten (3.2). Individuelle Veränderungen für die Zielgruppen folgen den strukturellen und organisatorischen später nach (4.1ff). Auch die Zielgruppen werden gestaffelt erreicht – als erstes Lehrkräfte, dann Schüler und (selten) schließlich das familiäre Umfeld (4.1–4.4). Die zuerst erreichten Zielgruppen wirken als Multiplikator für die später angesprochenen. Dabei schwächt sich die Ausstrahlung der Intervention immer weiter ab.

Auf individueller Ebene reagieren die Wirkungsdimensionen ebenfalls in gestaffelter Folge: Zunächst lässt sich die Akzeptanz der Interventionen erreichen, dann Erweiterungen des gesundheitsbezogenen Wissens, andere Einstellungen und Motivationen, dann Gesundheitsverhalten, in der Folge ein verbesserter Gesundheitsstatus und (bei Generalisierung und Stabilisierung) ein gesundheitsgerechter Lebensstil.

Für Teilzielgruppen ist mit differenzieller Wirksamkeit zu rechnen; so zeigen Mädchen/Frauen häufig höhere Akzeptanz für Interventionen und profitieren besser von vielen Programmen. Die Interventionen können dabei jeweils spezifische Wirkungen hinsichtlich eingegrenzter Gesundheitsprobleme haben, aber auch allgemein das Gesundheitsbewusstsein unterstützen und Veränderungen initiieren. Viele haben auch nichtintendierte Nebenwirkungen.

Alle diese Teilfaktoren sind in Rückkopplungsschleifen verknüpft. Die Ausgangslage begrenzt Handlungsmöglichkeiten und Projektgestaltung der Schule (A, B), das Projekt hat direkte Wissens-, Einstellungs- und Gesundheitseffekte (C), aber auch Auswirkungen auf die Organisationsentwicklung (D), die ihrerseits Gesundheitswirkungen zeitigen (E) und durch externe Kooperation verstärkt werden können (H). Sowohl Veränderungen der Organisationsstruktur und -kultur als auch der Gesundheitsdimensionen bei den Zielgruppen wirken wiederum zurück auf die Rahmenbedingungen für die nächsten Teilschritte und Projekte (F, G).

Entsprechend der wirkungsbezogenen Evaluationsaufgabe wurde in dieser Studie nicht die Programmtheorie überprüft, sondern Interventionseffekte. Für das Projekt „gesund leben lernen“ waren vorab keine konkreten Zielindikatoren festgelegt. Projektziele und Endpunkte für die Outcomeevaluation wurden daher aus der Programmtheorie abgeleitet, nämlich Verbesserungen auf 3 Ebenen:

  1. 1.

    Organisation: Verankerung und Verbesserung gesundheitsbezogener Strukturen und Prozesse im Schulalltag und bei Schulentscheidungen, u. a. Partizipation, Planung und Steuerung, Ausstattung und Qualitätssicherung der Gesundheitsförderung in der Schule;

  2. 2.

    Lehrkräfte/Schulpersonal: Arbeitsbelastungen, Gesundheitsstatus und Wohlbefinden (Gesundheitsbezogene Lebensqualität, Beschwerden), Gesundheitsverhalten (Risikoverhalten) und Ressourcen (Selbstwirksamkeit).

  3. 3.

    Schüler: wie bei den Lehrkräften.

Auswirkungen auf Familien wurden nicht betrachtet, weil ihre Wirkungen erst später eintreten und mit vielen Moderatoren und Mediatoren verbunden sind. Auswirkungen auf das Umfeld wurden aus den gleichen Gründen nur indirekt durch die Zahl und Enge schulischer Kooperationen mit anderen Einrichtungen als Ziele aufgegriffen.

Studiendesign und Untersuchungsmethoden

Forschungsplan

Das wünschenswerte Design einer cluster-randomisierten Studie [8] war aus mehreren Gründen nicht durchführbar.

  • Alle Stakeholder lehnten eine Vollerhebung mit entsprechenden Kontrollgruppen ab (Fachkräfte der Projekte, Experte der Krankenkassen, Schulen, Landesbehörden); Gründe lagen in Kosten und Aufwand (Durchführungszeit).

  • Eine quotierte Vergleichsstichprobe von Schulen war nicht zu definieren, da wesentliche Einrichtungsmerkmale – u. a. Schulart und -größe, soziale Lage und Ausgangsbedingungen – nachweislich auf den Projektverlauf Einfluss nahmen. Diese hätten bei der Vergleichsgruppenbildung berücksichtigt werden müssen, ihre Bedeutung und Interaktion war und ist jedoch unbekannt.

  • Eine Eingangs- und Abschlussbefragung über Gesundheit bilden eine starke Intervention, die für sich bereits Aufmerksamkeit, Gesundheitsbewusstsein und -motivation schafft.

  • Als Kontrolleinrichtungen wären am ehesten Schulen zu gewinnen, die bereits Interesse für Schulgesundheit mitbringen; diese stellen indes eine besondere Vorauswahl dar und hätten sich zudem im Projektzeitraum aus Eigenantrieb gesundheitsbezogene Interventionen beschafft, so dass eine interventionsfreie Kontroll- oder Wartekontrollgruppe nicht realistisch war.

Statt eines Kontrollgruppendesigns wurde daher eine Beobachtungsstudie mit Verankerung an Referenzwerten der deutschen Bevölkerung durchgeführt, ein für Prävention und Gesundheitsförderung sinnvoller und oft alternativloser Forschungsplan [16], wo Kontrollgruppen oder -einrichtungen schwerlich valide und praktikabel bestimmbar sind [7, 18]. Zur Verankerung wurden die individuellen Werte der Schüler und Lehrer in normierten Standardinstrumenten erhoben und durch Differenzbildung an deren bundesweit repräsentativen Daten für Alters- und Geschlechtsgruppen justiert. Diese Justierung nutzt also die Gesamtbevölkerung als Vergleichsgruppe und ermöglicht zudem eine Kontrolle von Alters- und Genderverschiebungen zwischen Querschnitten. Das querschnittliche Design bestand aus einer Eingangserhebung zu Projektbeginn (T1), einer Abschlusserhebung zu Projektende etwa 2 Jahre später (T2) sowie einer Stabilitätserhebung etwa ein Jahr darauf (T3). Die Darstellung folgt daher der STROBE-Konvention [41], mit platzbedingten Einschränkungen.

Schüler und Lehrkräfte wurden mit einer quotierten Stichprobe aller Schularten und Bundesländer einbezogen, und zwar Lehrkräfte an 23, Schüler an 5 Schulen. Die Stichproben wurden aufgrund der laut Forschungslage heterogenen, oft geringen Wirkungen für schwache bis mittlere Effekte in varianzanalytischer Auswertung mit mindestens zwei Kovariaten zur Confounderkontrolle berechnet (für α=0,05), bei einem erwarteten Rücklauf von 60% der Grundgesamtheit bzw. der jeweils vorausgehenden Erhebungswelle und einer Testpower von 0,8 für eingesetzte Standardinstrumente. Hieraus ergaben sich erforderliche Zellenbesetzungen von etwa 200 Befragten. Diese mussten über verschiedene Schularten und Bundesländer variieren, um alle Umsetzungsbedingungen zu erfassen. Da die Zahl der Schulen und Schularten in den Ländern ungleich war, wurde eine Quota-Stichprobe mit den Parametern Bundesland, Schulart und – für die Schüler – Altersgruppe als Clusterauswahlmerkmalen definiert (Tab. 1). Da die Schularten nicht gleichmäßig in allen Bundesländern vertreten waren, blieben einige Cluster unbesetzt.

Die Auswahl der befragten Lehrkräfte erfolgte analog, wobei nach Größe der Kollegien quotiert wurde: je eine Förderschule pro Bundesland (n=3×40=120); je eine Berufsbildende Schule aus Sachsen-Anhalt und Rheinland-Pfalz (n=2×100=200); je eine Grundschule aus Niedersachsen und Rheinland-Pfalz sowie Vollbefragung Sachsen-Anhalt wg. extrem kleiner Kollegien (n=30 Sachsen-Anhalt, 25 Niedersachsen, ca. 50 Rheinland-Pfalz). Unter den nach Schulart, Land und Größe in Frage kommenden Schulen wurde nach Zufall gewählt, um eine Bevorzugung möglicherweise besonders aussichtsreicher Einrichtungen auszuschließen.

Tab. 1 Bestimmung der Schülerstichprobe (angestrebte Cluster-Besetzungen)

Befragt wurden alle Lehrkräfte sowie die Klassen der Sekundarstufe I an den einbezogenen Schulen, zu T2 also nur zu einem Teil die gleichen Personen wie zu T1. Der Umfang der Überlagerung ließ sich anhand der Variablen nicht zuverlässig prüfen, eine Pseudonymisierung war nicht Teil der Durchführungsgenehmigungen und wäre nach Einschätzung der Fachkräfte im Projekt von den Zielgruppen abgelehnt worden.

Die Messungen umfassten Schüler- und Lehrkräftegesundheit. Zur Interventionsbeschreibung wurde eine knappe Maßnahmendokumentation der Teilschritte an den Schulen eingesetzt, um Veränderungen mit dem Vorgehen in Beziehung zu setzen und Vergleiche zwischen Interventionsverläufen zu ermöglichen. Als Stabilitätsmessung wurden zur Verminderung des Aufwands und zur Sicherstellung der Akzeptanz der Erhebung nur Strukturveränderungen der Schulen erhoben und rückblickende Leitfadeninterviews zum Projektverlauf und -erfolg durchgeführt.

Die Deklaration von Helsinki wurde in allen Phasen der Studie eingehalten.

Datenerhebung und Stichproben

Die Befragung sollte klassenweise in der Unterrichtszeit durch Schulleitung und Lehrkräfte erfolgen. 2003 begannen 67 Schulen und zwei Kitas aus Niedersachsen, Rheinland-Pfalz und Sachsen-Anhalt das Projekt, 15 Schulen brachen es aber in den ersten beiden Jahren ab, u. a. infolge von Fusionen, Personal- und Leitungsfluktuation. T1 fand ab Ende 2004, T2 ab Ende 2006 und T3 ab Januar 2008 statt. Jede Erhebung dauerte durch Ferien-, Zeugnis- und Festtagsphasen etwa 4 Monate, forderte längere Nachfassaktionen und anfängliche Genehmigungsverfahren (in einem Bundesland rund 5 Monate).

Zu T1 trafen 56 Fragebögen von Schulen ein (einer davon nicht auswertbar), 523 Bögen von Schulpersonal und 1946 von Schülern (Tab. 2). Zu T2 beteiligten sich 44 Schulen, 386 Lehrkräfte und 1660 Schüler. Zu T3 stieg die Zahl durch Nachfassaktionen auf 55 Schulen mit 81 Interviews. Ein vollständiger Strukturfragebogen über alle drei Messzeitpunkte lag von 36 Einrichtungen vor.

Tab. 2 Befragte (Gesamtprojekt) und Rücklauf zu T1 und T2

Für „gesund leben lernen“ waren gezielt Schulen mit relativ großem Anteil gesundheitlich benachteiligter Herkunftsfamilien ausgewählt worden (d. h. Haupt-, Sonder-, Real-, Gesamt- und Berufsbildende Schulen sowie Grundschulen in entsprechenden Quartieren); nur jede 10. Schule war ein Gymnasium. Der größte Anteil von Einrichtungen kam aus Rheinland-Pfalz, vorrangig vertreten mit Grund- und Berufsschulen (Tab. 3). Die Sonderschulen standen überwiegend in Niedersachsen.

Tab. 3 Schulen im Projekt nach Bundesland und Schulart (T1)

Messinstrumente

Eingesetzt wurden 4 Bögen zur Wirkungsabschätzung:

  1. 1.

    Strukturbogen zur Erfassung gesundheitsförderlicher Strukturen und Prozesse: Er enthält Rahmendaten zur Schule (Größe, Fehlzeiten, Unfälle, aktuelle Projekte, genutzte Informationsquellen). Dann folgen 9 Dimensionen (45 Items) zur 4-stufigen Abschätzung (nicht eingeführt/geplant/teilweise/voll umgesetzt) von: Verankerung von Gesundheitsförderung (5 Items), Fortbildung (4 Items), Planung (6 Items), Steuerung (3 Items), Partizipation (3 Items), Vielfalt (5 Items), Vernetzung (5 Items), Qualitätssicherung (8 Items) und sozialer Verantwortung der Schule (6 Items). Ferner wurden 10 Ausstattungsmerkmale, z. B. Ruhezonen und Gemeinschaftsverpflegung, erhoben.

  2. 2.

    Fragebogen für Lehrkräfte: Er enthielt Alter, Geschlecht, Arbeitszufriedenheit (10 Items), tätigkeitsbezogene Belastung (13 Items), allgemeine Arbeitsplatzbelastungen (8 Items), berufsbezogene soziale Unterstützung (12 Items), Gesundheitsbezogene Lebensqualität (16 Items) in den Teildimensionen körperliche Rollenfunktion, Schmerz, Vitalität und psychisches Wohlbefinden des SF-36 [9], Tabak- und Alkoholkonsum (4 Items), ausgewählte arbeitsplatzbezogene Beschwerden (22 Items) und Allgemeine Selbstwirksamkeitserwartung (10 Items) [34].

  3. 3.

    Fragebogen für Schüler: Er erhob Alter, Geschlecht, Wohlbefinden und schulische Belastung (2 Items), Gesundheitsbezogene Lebensqualität (24 Items) in den Teildimensionen körperliches und psychisches Wohlbefinden, Selbstwerterleben, Familie, Freunde und Schule des KINDL [29], Beziehung zu Lehrkräften (2 Items) sowie in Klasse und Schule (4 Items), angelehnt an HBSC [14], eine nach Prävalenzdaten ausgewählte Liste von Beschwerden (8 Items), Bewegung, Ernähung, Nikotin- und Alkoholkonsum (je 1 Item), eine Beurteilung der Schulausstattung (10 Items) und ebenfalls Allgemeine Selbstwirksamkeitserwartung (10 Items; [33]).

  4. 4.

    Maßnahmendokumentation: Sie erfasste für jeden Teilschritt dessen Ziele (13 Items), Gesundheitsthemen (9 Items), Interventionsart (8 Items), Arbeitsaufwand (3 Items) und Zahl erreichter Personen aus den Zielgruppen Schüler, Schulpersonal und Externe (7 Items). Aus diesen Angaben konnten Merkmale des Vorgehens berechnet werden, darunter multimodales Vorgehen, Ansprechen mehrerer Zielebenen mit den Interventionen und Zeitaufwand der Schulen für das Projekt (ein Analogon zur individuellen Dosis). Dieses Instrument wurde von den Schulen unregelmäßig genutzt, wie die Leitfadeninterviews der Nachbefragung etwa ein Jahr nach Projektende zeigten.

Bei der Instrumentenentwicklung ergab sich teilweise die Notwendigkeit, Teilskalen auszuwählen (z. B. aus dem SF-36), um die Akzeptanz sicherzustellen. Dies entsprach auch dem Ziel der Entwicklung praktikabler, also kurzer Instrumente für Routine-Evaluationen.

Zur Stabilitätsmessung wurden zusätzlich zum Einsatz des Strukturbogens 81 retrospektive Leitfaden-Interviews mit 65 Einrichtungen durchgeführt. Interviewte waren hauptsächlich Schulleitungen (43%) und Gesundheitsmoderatoren (32%), der Rest Projektteilnehmende.

Auswertung

Für alle Erhebungsinstrumente und Teilschritte der Evaluation wurden die üblichen Prüfungen gemäß statistischer Konvention vorgenommen [18]. Verständlichkeit, Praktikabilität, Ökonomie und Akzeptanz wurden durch mehrere Methoden sichergestellt (Auswahl erprobter Standardinstrumente, Ausfallkontrolle durch Varianzanalyse bzw. χ2-Tests, Analyse fehlender Werte sowie Expertenvalidierung durch Fachkräfte der Landesvereinigungen für Gesundheit und der Krankenkassen und durch Probeläufe und Interviews bei Schul- und Kita-Leitungen). Die Verzerrungsfreiheit (Objektivität) und Zuverlässigkeit (Reliabilität) von Verfahren und Instrumenten ging aus Boden- und Deckeneffekten, Confounderanalysen (z. B. nach Altersgruppen) sowie Item- und Skalenanalysen (Trennschärfe, Schwierigkeit, Interne Konsistenz) hervor. Messungsschwächen zeigten v. a. Teilskalen des KINDL bei jüngeren Schülern aus Haupt-, Real- und Gesamtschulen [18]. Zur Sicherung der Faktoriellen Validität fanden explorative und konfirmatorische Faktorenanalysen statt, die Konvergente Validität wurde an Interskalenkorrelationen auf Individual- und Einrichtungsebene geprüft, die Diskriminante Validität an Mittelwertsunterschieden zwischen Extremgruppen der Befragten, die Kriteriumsvalidität u. a. an der Übereinstimmung mit Standardinstrumenten sowie im Vergleich mit bundesweit repräsentativen Referenzwerten.

Zur Confounderkontrolle von Einrichtungs- und Individualmerkmalen (nach Bundesland, Schulart und -größe, sozialem Umfeld der Schule, Gender und Altersgruppe der Befragten) wurden multiple Regressionen und Varianzanalysen herangezogen, wobei sich nur ein einzelner Hinweis auf Verzerrungen ergab (höherer Ausfall von Lehrkräften in sozial belasteten Einzugsgebieten).

Projektwirkungen wurden für 3 Zielbereiche analysiert: Schulstruktur, Gesundheit der Lehrkräfte und der Schüler. Alle Effektprüfungen wurden auf 4 Ebenen durchgeführt:

  1. 1.

    Veränderungen im Gesamtprojekt, d. h. im Mittel aller einbezogenen Schulen, Lehrkräfte und Schüler;

  2. 2.

    Veränderungen an den einzelnen Schulen;

  3. 3.

    Vergleich der Schulen verschiedener Schularten, um die Eignung des Vorgehens für sozial benachteiligte Zielgruppen abzuschätzen;

  4. 4.

    Extremgruppenvergleich der erfolgreichen Schulen gegenüber solchen mit geringen oder negativen Veränderungen (hier aus Platzgründen nicht dargestellt).

Dafür wurden in der Regel einfaktorielle Varianzanalysen berechnet, mit dem Messpunkt als unabhängiger Variable und mit Zufriedenheits-, Belastungs- und Gesundheitsindikatoren als abhängigen Variablen. Da die Verankerungsanalysen ungefähr die gleichen Ergebnisse wie die Rohwerte ergaben, sind hier aus Platzgründen nur die Rohwertanalysen dargestellt.

Um die Effektzuschreibungen abzusichern, wurden mehrfaktorielle Varianzanalysen mit den Endpunkten im Zeitverlauf als abhängigen und Projektmerkmalen und konfundierenden Faktoren als unabhängigen Variablen erstellt und die leitfadengestützten retrospektiven Interviews mit Projektbeteiligten herangezogen. Deren Auswertung folgte der entdeckenden Heuristik [15] in computergestützter Codierung (MAXQDA). Dieses Verfahren kann nach offener und axialer Codierung ökonomisch größere Datenmengen mit geschlossener Codierung verarbeiten und dabei Zusammenhänge und Unterschiede aufdecken und in Subgruppen von Befragten, Einrichtungen oder Rahmenbedingungen gezielt vergleichen und überprüfen. Die Ergebnisse dienten zur Ergebnistriangulation mit den quantitativen Befunden und zur Absicherung der Kausalität (internen Validität) gemessener Veränderungen.

Ergebnisse

Implementation und Einfluss des Vorgehens

Die Schulen investierten erhebliche Anstrengungen in das Projekt, im Mittel 160 h und 18 Maßnahmen in knapp 3 Jahren, jedoch bei extremer Streuung (0–711 h, 1–63 Maßnahmen). Den Leitfadeninterviews zufolge unterschätzten diese Angaben die reale Arbeitszeit, da viele Teilschritte ungenau protokolliert waren. Der Arbeitsaufwand der Gesundheitsmoderatoren an einer intensiv beteiligten Schule war auf 200–400 h im Jahr zu veranschlagen, also 1–2 Personalmonate.

Ein multimodales Vorgehen überwog: Im Mittel wurden je Teilintervention 1,8 Arbeitsformen genutzt (z. B. Arbeitsgruppe, Informationsveranstaltung, Arbeitsanalyse, Begehung) und 4,5 Ziele verfolgt, am häufigsten Arbeitsplatzgestaltung (48%), Verbesserung sozialer Beziehungen (39%), Bewegungsförderung (37%) und Stressbewältigung (34%).

Die zu Projektende noch teilnehmenden Schulen führten Prävention und Gesundheitsförderung oder das Projekt selbst weiter, auch wenn die externe Förderung zu Ende ging.

Hohe Dosis und Implementationsanstrengungen waren Bedingungen für Gesundheitseffekte. Schulen mit deutlichen Strukturverbesserungen und Gewinnen an Lehrergesundheit investierten im Mittel etwa doppelt so viel Zeit in das Projekt, führten weit mehr Einzelmaßnahmen durch und gestalteten diese häufiger entsprechend dem Settingansatz multimodal (mehrere Methoden, Ziele und Zielgruppen). Wo sich die Gesundheitsbezogene Lebensqualität der Lehrkräfte (SF-36) verbesserte, hatten Schulen mehr als doppelt so viel erfasste Personalzeit in das Projekt investiert, nämlich 276 h im Vergleich zu 137 h an Schulen, wo sich die Lehrergesundheit (SF-36) verschlechterte. Der Zeitaufwand je Schule korrelierte zudem schwach bis mittelstark mit einer Verbesserung der sozialen Unterstützung im Kollegium (r=0,34). Die Streuung war jedoch sehr groß, die Stichprobe (22 Schulen) klein und die Unterschiede dadurch nicht signifikant.

Auch die Leitfadeninterviews der Stabilitätserhebung bestätigten die Wichtigkeit von Intensität und Qualität der Umsetzung. Sie zeigten auch die Bedeutung einer qualifizierten, stetigen Begleitung durch externe Fachkräfte. Die Befragten stellten dar, dass diese Begleitung besonders in Phasen mit mangelnder Motivation oder Unsicherheit über die nächsten Schritte das Projekt stabilisiert.

Gesundheitsgewinne

Signifikante Verbesserungen auf der Ebene aller Schüler zeigten 7 der 10 Teilskalen, allerdings mit sehr kleiner Effektgröße (Tab. 4). Die Schulzufriedenheit stieg um etwa 5%, körperliches Wohlbefinden und Selbstwerterleben um etwa 3%, der Beschwerdenstand verminderte sich um etwa 1% des Ausgangswertes der jeweiligen Skala. Auch die Teildimensionen Gesundheitsbezogener Lebensqualität verbesserten sich (mit Ausnahme des Familienklimas, das ein Schulprojekt ohnedies nur mittelbar beeinflussen konnte).

Tab. 4 Mittlere Gesundheitsgewinne im Projektverlauf

Die Lehrkräfte berichteten über eine signifikante Zunahme ihrer erlebten Arbeitsbelastung um 12% im Projektzeitraum. Ihre Vitalität (SF-36) verbesserte sich im Projektverlauf dennoch signifikant, aber mit kleiner Effektgröße, um 4%. Weitere Indikatoren wie körperliche Rollenfunktion (SF-36), Beschwerdenstand und Belastung durch Schmerzen verbesserten sich ebenfalls um 4–5%, jedoch knapp unterhalb des Signifikanzniveaus (Tab. 4).

Strukturverbesserungen und Gesundheitsgewinne

Veränderungsmessungen auf mindestens 2 Ebenen lagen aus 22 Schulen vor, meist für Schulstrukturen und Lehrergesundheit (Abb. 1). Die 3 Wirkungsebenen entwickelten sich ungleichartig. Der Spielraum für Strukturverbesserungen war erheblich größer als der für Gesundheitsgewinne. Das Maximum für erstere lag bei etwa 35% des Skalenumfangs, für Gesundheitsgewinne der Lehrkräfte bei etwa 12%, für Schüler bei etwa 3%. Diese Abfolge entsprach den theoretischen Erwartungen einer „kaskadenartigen“ Wirkung von Settingprojekten [19].

Die Veränderungen waren indes nicht gleichgerichtet. Nur eine Schule erreichte Verbesserungen auf allen 3 Ebenen – etwa 3% Verbesserung der Schülergesundheit gegenüber dem Ausgangswert, 7% für Lehrergesundheit, 25% für gesundheitsbezogene Schulstrukturen. An 10 von 22 Schulen (45%) traten Erfolge auf mindestens 2 Ebenen ein, an ebenso vielen gingen Erfolge auf einer Ebene mit Rückgängen auf einer anderen einher. An 2 von 5 Schulen mit Schülerbefragungen standen Verschlechterungen der Lehrergesundheit leichten Verbesserungen der Schülergesundheit gegenüber. Eine Schule wies einen Rückgang gesundheitsbezogener Strukturqualität und Lehrergesundheit auf.

Stabilität der Verbesserungen

Vom mittleren Ausgangswert zu T1 (M=2,51) stieg die gesundheitsbezogene Strukturqualität zu T2 um knapp 11% an und verbesserte sich bis T3 in längsschnittlicher Analyse leicht weiter. Im Querschnitt auf Skalenebene betrachtet, zeigte sich in 4 von 10 Hauptskalen (Partizipation, Vielfalt gesundheitsfördernder Ansätze, Soziale Verantwortung und Ausstattung) ein positiver, bis zu T3 noch fortwirkender, aber kleiner Effekt (Tab. 5). In keiner Teilskala fielen die Werte auf den Ausgangswert zurück. Die Gewinne blieben im Mittel bei sehr schwacher Effektgröße, da die Schulen divergierende Verläufe aufwiesen (Abb. 2).

Tab. 5 Verbesserung gesundheitsbezogener Strukturen und Prozesse (Längsschnitt, n=34 Schulen)
Abb. 2
figure 2

Skalengewinne der Schulen in Strukturqualität, Lehrer-, Schülergesundheit (%)

Minderung gesundheitlicher Ungleichheit

Das Projektziel einer Verringerung sozial bedingter gesundheitlicher Ungleichheit wurde erreicht. Die Gesundheitsindikatoren der Lehrkräfte und Schüler lagen zu Projektbeginn deutlich unter denen ihrer bundesweiten Vergleichsgruppen, es waren also dem Projektziel entsprechend, relativ belastete Einrichtungen ausgewählt worden. Das Vorgehen erwies sich auch für sozial benachteiligte Einzugsbereiche geeignet: Schulen mit höheren Belastungen zu T1 erreichten höhere Struktur- und Gesundheitsgewinne der Kollegien. Zwar erzielten die beiden Gymnasien mit Schülerbefragung die höchsten Gesundheitsgewinne bei den Schülern, doch kamen zwei andere Schulen ihnen nahe. Für sozial schlechter gestellte Schülergruppen zeigten sich somit keine signifikant schlechteren Effekte. Das Vorgehen erreichte zwar keine „Umkehrung“ sozialer Benachteiligung, doch war diese von einem Einzelprojekt kaum zu erwarten; es eignete sich aber zur Stärkung von hoch belasteten Schulen ähnlich gut wie zur Gesundheitsförderung an Einrichtungen mit größerem kulturellen Kapital und besseren psychosozialen Ressourcen (in höheren Bildungsgängen). Da öffentliche Schulen für heterogene Einzugsgebiete offen sein müssen, macht dieses Leistungsprofil das Programm geeignet zur Umsetzung unter heterogenen Umfeldbedingungen, also an vielen Schulen.

Förderung der Organisationskultur

Die 81 retrospektiven Teilnehmerinterviews dokumentierten Verbesserungen in Organisationskultur und Schulklima an fast allen Schulen: Wissens- und Kompetenzerweiterungen (z. B. in Projektmanagement), interne und externe Vernetzung hin zu wachsender gegenseitiger Unterstützung, kollegialer Kooperation und einem partizipativen Führungsstil. Die meisten Schulen berichteten gewachsenes Gesundheitsbewusstsein, ablesbar an konkreten Alltagsregeln und -verhalten. Dort setzte das Projekt einen komplexen, teilweise selbstverstärkenden Prozess der Organisationsentwicklung in Gang, es erhöhte die Handlungs- und Problemlösungsfähigkeit der Organisation Schule und ihrer Mitglieder.

Diskussion

Interne Validität (Kausalität der Effekte)

Ausmaß und Verteilung der erzielten Struktur- und Gesundheitsgewinne konnten durch multivariate Confounderprüfungen kausal auf das Einwirken des Programms zurückgeführt werden. Signifikanten Einfluss auf Gesundheitsstatus, Beschwerden, Zufriedenheit und erfolgreichen Projektverlauf hatten erstens die Rahmenbedingungen: Schlechte Ausstattung der Schule zu Projektbeginn und Einrichtungsgröße (unüberschaubares Kollegium) schränkten die Wirksamkeit ein; Schulen der Sekundarstufe und solche mit niedrigeren Abschlüssen (Haupt-, Realschulen) profitierten etwas weniger vom Projekt. Zweitens war die Implementationsgüte bedeutsam, also eine intensive und vollständige Umsetzung: Hoher Zeiteinsatz und multimodales Vorgehen korrelierten mit Verbesserungen auf Schul-, Lehrkräfte- und Schülerebene. Daraus kann noch nicht abgeleitet werden, welche Teilschritte (z. B. Gesundheitswoche oder Einrichtung eines Ruheraums) und welche Einzelinstrumente (z. B. Gesundheitszirkel oder -moderator) die besten Ergebnisse bringen; doch sind daran ein breites und auf mehreren Ebenen ansetzendes Vorgehen und eine hohe Dosis als Voraussetzungen für Gesundheitsgewinne mit dem Settingansatz in Schulen erkennbar.

Externe Validität (Übertragbarkeit)

Ein Fünftel der Schulen (n=15) gab das Projekt kurz nach Beginn auf, nur etwa ein Drittel der verbleibenden profitierte klar, und davon etwa die Hälfte auf mehr als einer Ebene (Strukturen, Lehrer- oder Schülergesundheit). Das Programm bot also kein für alle Einrichtungen mit Sicherheit erfolgreiches Vorgehen. Seine Wirksamkeit war von Rahmenbedingungen und einer intensiven Durchführung abhängig (s. oben). Wo ungünstige Ausgangslagen bestanden (schlechte Ausstattung, geringes soziales Kapital im Schulumfeld, besonders hohe Eingangsbelastung), wo das Projekt mit geringem Einsatz durchgeführt wurde (punktuelle Maßnahmen relativ geringer Dosis) und wo die Veränderungen der Arbeitswelt Schule (erhöhte subjektive Arbeitsbelastung der Lehrkräfte) zusammentrafen, konnte das Projekt Gesundheitsverschlechterungen nicht aufhalten.

Dieses Gesamtbild entspricht der Forschungslage [12, 22, 23, 24, 31, 37, 38]. Da die Erfahrungen des Modellprojekts „gesund leben lernen“ aber für Verbesserungen genutzt werden, ist künftig ein optimiertes und dadurch wirkungsvolleres Vorgehen zu erwarten.

Methodische Einschränkungen

Die wichtigsten methodischen Schwächen liegen in folgenden Besonderheiten der Studie:

  1. 1.

    Querschnittliche Beobachtungsstudie: Ein Kontrollgruppendesign war aus mehreren Gründen nicht durchführbar. Die stattdessen gewählte Beobachtungsstudie mit Verankerung an bundesweiten Alters- und Genderreferenzwerten war zwar informativ und praktikabel. Die Referenzwerte wurden aber im Projektverlauf nicht aktualisiert. Künftig sind aktualisierte Vergleichswerte wünschenswert, etwa aus Telefonsurveys des RKI. Die Krankenkassen sollten aus ihren Evaluationsprojekten schulartspezifische Referenzwerte aufbauen.

  2. 2.

    Messungsschwächen: Die Fragebögen wiesen Defizite auf. Selbst Standardinstrumente der Bundesgesundheitsberichterstattung (KINDL) hatten bei niedrigen Klassenstufen, sozial benachteiligten Einzugsgebieten oder hohem Migrationsanteil unzulängliche Konsistenz. Die Evaluation unterschätzte also die Effekte, die bei höherer Messungsgenauigkeit nachweisbar wären.

  3. 3.

    Ungenaue Interventionserfassung: Statt individueller Dosis- und Teilnahmeeffekte wurden querschnittliche Mittelwerte nach Angaben für die gesamte Einrichtung angesetzt. Die Maßnahmendokumentation, auf der diese Werte fußten, wurde jedoch unregelmäßig genutzt. Infolge der mit dieser Berechnungsweise verbundenen Ungenauigkeit unterschätzten die Befunde die erzielten Outcomes. Künftig sind Längsschnitterhebungen wünschenswert; sie stoßen bislang auf Hürden der Praktikabilität und Akzeptanz bei Zielgruppen und Behörden. Außerdem sollten Interventionsbeschreibungen besser an den Schulen verbreitet oder ggf. von den Projektleitungen formalisierte Verlaufsprotokolle geführt werden.

  4. 4.

    Fließende Messpunkte: Die Erhebungen zogen sich über Monate hin. Genauere Messungen fordern jedoch erheblichen Aufwand und sind in Routineerhebungen kaum zu leisten. In einem Bundesland waren schon vor T1 erhebliche Teilschritte durchgeführt worden; sollten diese sofort Gesundheitseffekte gezeitigt haben, so wurden die Projektwirkungen dort unterschätzt.

  5. 5.

    Intransparentes Kosten-Nutzen-Verhältnis: Zwar können Standardinstrumente wie SF-36 potentiell in QALY umgerechnet werden, um den Projektnutzen gesundheitsökonomisch zu quantifizieren, doch fehlen in der schulischen Gesundheitsförderung Instrumente zur Aufwands- und Kostenerfassung; die hier dazu erhobenen Indikatoren, namentlich Arbeitsstunden in der Maßnahmendokumentation, wurden obendrein ungenau protokolliert. Künftigen Evaluationen ist der obligatorische Einsatz von Teilschrittdokumentationen und Einpreisungsschemata für alle Interventionen zu empfehlen; allerdings ist mit erheblicher Nichtkooperation wegen des Aufwands in den Schulen zu rechnen.

Das Gesamtbild wird von diesen Einschränkungen nicht in Frage gestellt, weil die Ergebnisse (a) an den einzelnen Schulen deutliche Kontraste aufwiesen, und zwar auch bei höherer Reliabilität einzelner Instrumente und höherem Rücklauf einzelner Einrichtungen, (b) die Befunde durch eine qualitative retrospektive Nachbefragung und die Mehrebenenmessung (Strukturen, Lehrkräfte, Schülerschaft) trianguliert wurden und (c) die Outcomevarianz teilweise auf Unterschiede in Dosis und Vorgehen einerseits, Ausgangsbedingungen (ursprüngliche Belastung, Ausstattung, Schulart und -größe) andererseits zurückgeführt werden konnte (s. oben). Überdies entspricht das Gesamtbild dem Forschungsstand. Die angeführten Messungsungenauigkeiten wirkten jedoch durch erhöhte Varianz auf eine Schmälerung der Effektgrößen und damit eine Unterschätzung der im Projektverlauf eingetretenen Veränderungen hin.

Schlussfolgerung

Settingprojekte in Schulen können gute Wirksamkeit erzielen. Am deutlichsten können sie gesundheitsbezogene Prozesse und Strukturen verbessern, gefolgt von der Gesundheit der Lehrkräfte und der der Schüler.

Der Settingansatz ist jedoch voraussetzungsreich, er führte daher nicht automatisch und überall zum Erfolg. Er fordert u. a. Einsatzbereitschaft der Kollegien für eine intensive Umsetzung. Settingprojekte sollten daher vorrangig an Schulen begonnen werden, wo eine hohe Motivation zum Engagement und Offenheit zur Organisationsentwicklung besteht. Sie sollten zudem von erfahrenen Fachkräften initiiert und begleitet und von gesundheitsbezogener Qualifizierung der Kollegien und von Qualitätsmonitoring unterstützt werden, um eine hochwertige Durchführung zu gewährleisten und bei erfolglosem Verlauf früh eingreifen zu können.

Fazit für die Praxis

Die dürftige Veröffentlichungslage zeigt: Viele gesundheitsbezogene Schulprogramme finden ohne belastbare Evaluation statt. Die Ergebnisse verdeutlichen die Gefahren dieser Praxis, wenn Umfeld und Ausgangslage der Schulen, ihre Handlungsfähigkeit und das Vorgehen nicht gut aufeinander zugeschnitten sind: Enttäuschung der Zielgruppen und Multiplikatoren (Schulleitungen, Kollegien), Zeit- und Ressourcenverluste, Überlastung der Einrichtungen und dadurch unbeabsichtigte Nebenwirkungen, Fehleinschätzungen von Verbesserungsansätzen, wenn gelungene und ungeeignete Interventionen „in einen Topf geworfen“ und zusammen beurteilt werden. Projektträgern und Behörden ist dringend zu raten, künftig Nachweise der Breitenwirksamkeit zur Grundlage ihrer Entscheidungen zu machen. Die Studie zeigt, dass solche Nachweise erbracht werden können und dass sie sachlich unabdingbar sind.

Das Evaluationssystem der Krankenkassen bietet aussagefähige, mehrdimensionale Veränderungsbeobachtungen auf 3 Ebenen (Strukturen, Lehrkräfte, Schüler). Die knappen Instrumente wurden zur Erhöhung von Akzeptanz und Praktikabilität nach der Erprobung in „gesund leben lernen“ gekürzt und in einem Handbuch zusammengefasst. Die Krankenkassen stellen dieses für Evaluationen zur Verfügung (http://www.gkv.info).