Advertisement

German Journal of Exercise and Sport Research

, Volume 48, Issue 3, pp 404–414 | Cite as

Stabilität der physischen Fitness im Kindesalter

Konstruktvalidität der Referenzkategorien für den Deutschen Motorik-Test 6–18 im Projekt „Berlin hat Talent“ über fünf Jahre
  • Till Utesch
  • Jochen Zinner
  • Dirk Büsch
Hauptbeitrag

Zusammenfassung

Kontinuierliches Monitoring physischer Fitness im Kindesalter ist aus gesellschaftlicher sowie individueller Perspektive bedeutsam, um eine gesunde kindliche Entwicklung zu unterstützen. Entsprechend wird von der Kultusministerkonferenz (KMK) und dem Deutschen Olympischen Sportbund (DOSB) in gemeinsamen Handlungsempfehlungen (2017, S. 9) der Einsatz motorischer Tests im Schulsport empfohlen, um aus verschiedenen Perspektiven bedarfsorientiert Interventionsmaßnahmen ableiten zu können. Motorische Testergebnisse werden in Leistungsklassen kategorisiert, um zu vermeiden, dass deskriptive, aber inhaltlich nicht bedeutsame Verbesserungen oder Verschlechterungen zwischen und innerhalb von Personen überinterpretiert werden. Veränderungen der durchschnittlichen Leistungsfähigkeit über mehrere Jahre hinweg können die Validität dieser Referenzkategorien beeinflussen. Ziele dieser Studie sind daher, (1) mittelfristige zeitliche Leistungsveränderungen der physischen Fitness im mittleren Kindesalter aufzuzeigen, (2) Auswirkungen von Leistungsveränderungen auf Referenzwerte und die Validität des Konstrukts physische Fitness zu prüfen und (3) valide Referenzwerte für Acht- und Neunjährige zur Verfügung zu stellen. Von 2011 bis 2016 nahmen in einem quasilängsschnittlichen Design über 20.000 DrittklässlerInnen im Projekt „Berlin hat Talent“ am Deutschen Motorik-Test 6–18 teil. Die zeitliche Stabilität sportmotorischer Leistungen wird mittels Regressionsmodellen und Kreuztabellen geprüft sowie Auswirkungen auf die Konstruktvalidität der bestehenden Berliner Referenzwerte mittels ordinaler Rasch-Modelle analysiert. Sieben der acht Testaufgaben zeigen zeitlich positive sowie negative Veränderungen. Die Konstruktvalidität des Deutschen Motorik-Tests kann für DrittklässlerInnen nach Ausschluss des Items „Balancieren rückwärts“ bestätigt werden (p > 0,90). Die aufgabenspezifischen Veränderungen der motorischen Leistungsfähigkeit von Kindern in einem relativ kurzen Zeitraum unterstützen zum einen die Forderung eines flächendeckenden und kontinuierlichen Monitorings, um frühzeitig Interventionsmaßnahmen einleiten zu können, und bedingen zum anderen eine kontinuierliche Prüfung bzw. Testnormierung von Referenzwerten im DMT mit ausreichend großen und repräsentativen Stichproben.

Schlüsselwörter

Motorische Tests Motorische Entwicklung Item-Response-Theorie Deutscher Motorik-Test Zeitliche Trends 

Stability of physical fitness in childhood

Construct validity of the reference categories for the German Motor Test 6–18 in the project “Berlin has talent” over 5 years

Abstract

Monitoring of physical fitness (PF) in childhood is important from a societal as well as individual perspective to ensure and support healthy child development. Hence, the German Standing Conference of the Ministers of Education and Cultural Affairs together with the German Olympic Federation recommend the usage of motor tests, for instance in schools, to implement targeted interventions. Results of motor assessments are interpreted using reference categories to prevent overinterpretation of small but meaningless intra- and inter individual differences. Furthermore, temporal trends can influence the validity of these reference categories. The aims of the study are (1) to examine short- and medium-term changes in PF in middle childhood (2) to evaluate implications for reference values and the validity of the construct PF, (3) to provide valid reference values for eight- to nine-year-old children. In the school years 2011–2016, over 20,000 third-graders completed the German Motor Test (GMT) in the project “Berlin has Talent”. Possible temporal trends are examined using regressions and cross-tables. Implications of these changes on the construct PF are analyzed using Rasch measurement. Four out of seven tasks showed temporal changes. However, the validity and unidimensionality of the GMT are confirmed (p > 0.90), if balancing backwards is excluded from the model. On the one hand, task-related changes of children’s motor performance within five years support the requirement of a comprehensive continuous monitoring to enable early interventions. On the other hand, they call for continuous evaluation of reference values of the GMT, which should rely on representative and sufficiently large samples.

Keywords

Motor tests Motor development Item response theory German motor test Temporal trends 

Ein Monitoring der physischen Fitness im Kindesalter erscheint aus einer individuellen, aber auch aus einer gesellschaftlichen Perspektive immer aktuell, da ein Zusammenhang zwischen einer gesunden motorischen Entwicklung und einer positiven körperlichen, psychischen, persönlichen und teilweise auch kognitiven Entwicklung angenommen wird (Kastner & Petermann, 2009; Kriemler et al., 2011; van der Fels et al., 2015; Robinson et al., 2015). Für ein kontinuierliches Monitoring der physischen Fitness wird von der Kultusministerkonferenz (KMK) und dem Deutschen Olympischen Sportbund (DOSB) in gemeinsamen Handlungsempfehlungen (2017, S. 9) unter anderem der Einsatz sportmotorischer Tests im Schulsport empfohlen, um daraus bedarfsorientierte Interventionsmaßnahmen ableiten zu können, mit denen eine positive körperliche Entwicklung im Kindes- und Jugendalter unterstützt werden kann (Bardid, Lenoir et al., 2017; Cattuzzo et al., 2016; Robinson et al., 2015; Stodden & Brooks, 2013). Zur Erfassung und Bewertung der physischen Fitness können unterschiedliche Testbatterien eingesetzt werden, bei denen die Messwerte alters- und geschlechtsnormiert in Kategorien überführt werden. Diese Kategorisierungen sollen u. a. vermeiden, dass deskriptive, aber inhaltlich respektive praktisch nicht bedeutsame Verbesserungen oder Verschlechterungen einzelner Personen überinterpretiert werden. Holzweg, Ketelhut und Brandt (2012) zeigen in diesem Zusammenhang, dass die gewählte Kategorisierung sowohl die Testauswertung als auch -interpretation substanziell beeinflussen kann (siehe auch Utesch et al., 2015). Darüber hinaus sind bei langjährigen Testdurchführungen für valide Testnormierungen säkulare Veränderungen zu berücksichtigen, die zu einer Verzerrung bei der Testauswertung und -interpretation, insbesondere bei (Quasi‑)Längsschnittstudien führen können. Tomkinson und Olds (2007) konnten beispielsweise mittels globaler Stichproben von über 20 Mio. Personen zeigen, dass es seit 1958 positive und negative, d. h. inkonsistente Entwicklungen in unterschiedlichen physischen Fitnessparametern von Kindern und Jugendlichen im Alter von sechs bis 19 Jahren gibt. Albrecht et al. (2016) bestätigen diese globale Einschätzung für Deutschland. Im Rahmen des Motorik-Moduls (MoMo) der repräsentativen deutschen KIGGS-Studie zeigen sie für den Zeitraum 2003–2012 für vier bis 17-Jährige in zwei Untersuchungszeiträumen (N2003–2006 = 4528; N2009–2012 = 2820) ebenfalls Leistungsverbesserungen sowie -verschlechterungen in verschiedenen Testaufgaben.

Messung physischer Fitness mit dem Deutschen Motorik-Test 6–18

Das in Deutschland am weitesten verbreitete Modell motorischer Dimensionen stellt das Strukturmodell motorischer Fähigkeiten von Bös (1987) bzw. Bös und Mechling (1983) dar. Auf der obersten Ebene werden informatorisch determinierte (koordinative) und energetisch determinierte (konditionelle) Fähigkeiten differenziert. Eine weitere Unterscheidung in die Grundeigenschaften Ausdauer, Kraft, Schnelligkeit und Koordination wird wiederum in die Haupterscheinungsformen aerobe Ausdauer, anaerobe Ausdauer, Kraftausdauer, Maximalkraft, Schnellkraft, Aktionsschnelligkeit, Reaktionsschnelligkeit, Koordination unter Zeitdruck und Koordination bei Präzisionsanforderungen untergliedert. Andere (internationale) etablierte Strukturmodelle zur physischen Fitness, beispielsweise von Caspersen, Powell und Christenson (1985), differenzieren in gesundheits- sowie fertigkeitsbezogene Fitnessdimensionen. Die Granularität derartiger Strukturmodelle kann als Grundlage für eine vollständige Erfassung der physischen Fitness im Kindesalter hilfreich sein und bedingt theoretisch multidimensionale Testbatterien, die aus zahlreichen Einzeltests bestehen. Allerdings hat sich praktisch gezeigt, dass sparsame respektive eindimensionale Modelle ausreichend sein können, um die physische Fitness vom Kleinkind- bis zum späten Schulkindalter valide beschreiben und kategorial bewerten zu können (u. a. Utesch, Dreiskämper, Strauss, & Naul, 2018).

Der Deutsche Motorik-Test 6–18 (DMT 6–18) ist eine von der Deutschen Vereinigung für Sportwissenschaft (dvs) empfohlene motorische Testbatterie, die zur Erfassung der physischen Fitness von Kindern und Jugendlichen in Schul- und Vereinssettings entwickelt wurde (Bös et al., 2009; Bös, Schlenker, Albrecht, Büsch et al. 2016). Der DMT 6–18 besteht aus acht Testaufgaben: 6-Minuten-Lauf (aerobe Ausdauer), Standweitsprung (Schnellkraft), Liegestütz (Kraftausdauer), Sit-ups (Kraftausdauer), 20-m-Sprint (Reaktions- und Frequenzschnelligkeit), seitliches Hin- und Herspringen (Koordination unter Zeitdruck), Balancieren rückwärts (Koordination bei Präzisionsanforderungen) sowie Rumpfbeugen (Beweglichkeit) und orientiert sich am Strukturmodell sportmotorischer Fähigkeiten von Bös (1987) sowie Bös und Mechling (1983). Zusätzlich werden Alter, Geschlecht und der Body-Mass-Index (BMI) erhoben.

Im Jahr 2009 wurden für den DMT 6–18 Normwerte bzw. Leistungsklassen publiziert, denen aufgrund unterschiedlicher und teilweise geringer Stichprobengrößen sowie fehlender Itemhomogenität keine hinreichende Validität zugeschrieben werden kann (Utesch et al., 2015). Demgegenüber konnten Utesch et al. (2015) sowie Zinner, Büsch, Poller und Bartko (2015) für Kinder im Alter von neun bis zehn Jahren zeigen, dass unter Ausschluss der beiden Testaufgaben Balancieren rückwärts und Rumpfbeuge für empirisch abgeleitete Kategorien Konstruktvalidität innerhalb eines Fitnessfaktors angenommen werden kann (Cattuzzo et al., 2016). Für jüngere Kinder im Alter von sechs bis acht Jahren stellt Balancieren rückwärts hingegen ein valides Item im eindimensionalen Fitnesskonstrukt dar (Utesch et al., 2018). Die altersabhängige Differenzierung dieses Items wird auf die unzureichende Aufgabenschwierigkeit für ältere Kinder und Jugendliche zurückgeführt.

Der DMT 6–18 soll entsprechend der Zielsetzung der Sportministerkonferenz (SMK) flächendeckend eingesetzt werden (Herrmann, Bartz, Lischka, & Spahl, 2016). Auch im Projekt Berlin hat Talent wird der DMT 6–18 seit dem Schuljahr 2011/12 jährlich an repräsentativ ausgewählten Schulen und künftig flächendeckend in den dritten Klassen aller Berliner Grundschulen durchgeführt. Auf Grundlage der jährlichen Untersuchungsergebnisse werden besonders leistungsauffällige und leistungsbenachteiligte Kinder entweder in Talentförder- oder in Bewegungsfördergruppen zielgerichtet unterstützt (Zinner, Büsch et al., 2015). Auf der Grundlage der repräsentativen jährlichen Untersuchungen wurden im Laufe des Projekts vorläufige „Berliner Referenzkategorien für den DMT 6–18“ für den Altersbereich von sieben bis zehn Jahren erstellt, um eine valide Einschätzung der physischen Fitness in Berlin sicherzustellen (Zinner & Büsch, 2014, 2016; Zinner, Büsch et al., 2015; Zinner, Werner, Mehler, & Abraldes-Rois, 2015).

Im Rahmen dieser Studie soll die Validität der vorläufigen Berliner Referenzkategorien für Acht- und Neunjährige, die auf der Grundlage von vier Erhebungsjahren erstellt wurden, im Sinne ihrer zeitlichen Stabilität geprüft werden. Damit verbunden ist die Prüfung potenzieller kurz- und mittelfristiger Leistungsveränderungen, z. B. säkularer Trends, da sich positive und negative Leistungsveränderungen gleichermaßen auf die Validität der Referenzkategorien auswirken können, weshalb in regelmäßigen Zeitabschnitten, z. B. jeweils nach fünf Jahren, systematisch evaluiert werden sollte (Moosbrugger & Kelava, 2012).

Methode

Daten und Durchführung

Im Schuljahr 2015/16 wurde in Berlin im fünften Jahr in Folge die physische Fitness von Drittklässlern mithilfe des Deutschen Motorik-Tests 6–18 (Bös et al., 2009) untersucht. In jedem Schuljahr erhielten die öffentlichen Grundschulen aus vier bis sechs der 12 Berliner Stadtbezirke (insgesamt 368 Grundschulen mit rund 27.500 Drittklässlern im Alter von sieben bis zehn Jahren1) von der Berliner Schulverwaltung ein schriftliches Angebot für die Teilnahme. Jährlich nahmen zwischen 80 und 120 Grundschulen das Angebot an. Die Auswahl der zu untersuchenden Drittklässlerinnen und Drittklässler erfolgte schulweise durch eine vom Landessportbund Berlin (LSB) und Berliner Schulverwaltung beauftragte Projektgruppe, wobei der Umfang dieser Stichprobe sukzessive ausgebaut wird. Zwischen 2000 und 7000 Berliner Drittklässler und -klässlerinnen eines Schuljahres absolvierten schließlich – mit schriftlicher Einverständniserklärung der Eltern – die sportmotorischen Tests. Die Erhebung der sportmotorischen Leistungen hat die Berliner Schulverwaltung einer auf die Erhebung von Sportdaten spezialisierten Firma übertragen, die diese mit nahezu unverändertem Personal über die Jahre realisiert hat und fortführen wird.

In der vorliegenden Untersuchung wurden zum einen 12.431 Kinder berücksichtigt, die den DMT 6–18 im Sinne eines quasi-längsschnittlichen Panel-Designs im Zeitraum 2011/12 bis 2014/15 absolvierten und die als Basis für die Erstellung der vorläufigen Berliner Referenzkategorien dienten (Zinner, Büsch et al., 2015)2. Weiterhin nahmen im Schuljahr 2015/16 weitere 6653 Drittklässler und -klässlerinnen im Alter von acht und neun Jahren am Projekt teil (n8 Jahre = 4705; 50,6% weiblich; n9 Jahre = 1948; 46,3% weiblich). Insgesamt wurden 19.084 acht- und neunjährige Schülerinnen (n = 12.460) und Schüler (n = 6624) in diesem Studiendesign berücksichtigt. Wegen zu geringer Zellenbesetzungen wurden die Alterskategorien sechs, sieben, zehn und elf Jahre, die in den dritten Klassen in Berlin vertreten sind, nicht in die vorliegende Datenanalyse einbezogen.

Design und Erwartungen

Ein relativ stabiles Leistungsniveau der absolut gemessenen (also noch nicht in Kategorien überführte) Leistungen bildet die Voraussetzung für verzerrungsfreie und valide Referenzkategorien. Bei zeitlich stabilen Leistungen bedürfen ausreichend große Referenzstichproben keiner Anpassung. Empirische Forschungsergebnisse zeigen jedoch, dass sportmotorische Leistungen von Schülerinnen und Schülern in mittleren und größeren Zeitintervallen unsystematischen und systematischen Leistungsveränderungen unterliegen können (Tomkinson & Olds, 2007; Albrecht et al., 2016). Leistungsveränderungen inkludieren per se das Risiko, dass sie existierende Referenzkategorien verzerren können. Marginale, unsystematische Leistungsveränderungen (kleine, aber praktisch unbedeutsame Effekte) können hierbei durch große, repräsentative Stichproben (also Zusammenlegung von Stichproben) und eine resultierende Anpassung bzw. Neubestimmung der Referenzkategorien ausgeglichen werden, während systematische, substanzielle Leistungsveränderungen (mittlere und große Effekte) dazu führen, dass diese Stichproben nicht mehr zusammengelegt werden sollten (Moosbrugger & Kelava, 2012). Um die Validität der vorläufigen Berliner Referenzkategorien im Sinne ihrer Stabilität zu überprüfen, wird daher ein dreistufiges Studiendesign gewählt.

Zunächst wird die Erwartung geprüft, dass innerhalb eines Zeitraums von fünf Jahren von einem stabilen Leistungsniveau der involvierten 19.084 Schülerinnen und Schüler auf der Ebene der Messwerte bzw. der Leistungsmaße auszugehen ist (Studie I).

Anschließend ist die zweite Voraussetzung für verzerrungsfreie Referenzkategorien, zu prüfen, also ob die empirische Häufigkeitsverteilung (kodiert nach den Grenzwerten der vorläufigen Berliner Referenzkategorien) aus dem Schuljahr 2015/16 mit der Häufigkeitsverteilung der Referenzkategorien (2011/12–2014/15) übereinstimmt, sodass eine konsistente Einteilung der Kinder über den gesamten Beobachtungszeitraum gegeben ist (Studie II). Konsistente Häufigkeitsverteilungen würden die vorläufigen Referenzkategorien bestätigen. Dagegen müssten die Stichproben von 2011/12 bis 2015/16 im Sinne einer Umfangserhöhung zusammengelegt werden, wenn Unterschiede in den Häufigkeitsverteilungen nicht auszuschließen, aber auch nicht als systematisch und substantiell bezeichnet werden können (Moosbrugger & Kelava, 2012).

Abschließend wird in Studie III geprüft, (a) ob die aufgrund der vorläufigen Berliner Referenzkategorien postulierte Konstruktvalidität auch für die empirische Stichprobe aus dem Schuljahr 2015/16 bestätigt werden kann und (b) ob das Item Balancieren rückwärts, wie in vorherigen Studien gezeigt, nicht in den Summenwert bzw. den Fitnessfaktor mit einbezogen werden sollte (Utesch et al., 2015; Utesch et al., 2018; Zinner, Büsch et al., 2015).

Die Datenanalyse in den Studien I und II erfolgt mit den Programmen R (R Core Team, 2017) und JASP (JASP Team, 2017). In Studie III wird die Konstruktvalidität im Sinne der Itemhomogenität mit dem Programm Winmira geprüft (von Davier, 2001).

Studie I: Zeitliche Stabilität sportmotorischer Leistungen

Datenauswertung (I)

Innerhalb des dreistufigen Studiendesigns wird im ersten Schritt die Annahme stabiler sportmotorischer Leistungen in einem Zeitraum von fünf Jahren geprüft. Die Analyse wird für die acht Testaufgaben des DMT 6–18 mittels regressionsanalytischer OLS-Modelle auf Rohwert- und Itemebene separat für die Acht- und Neunjährigen durchgeführt. Innerhalb der Modellierung werden die Messzeitpunkte als Prädiktor zentriert, sodass der Achsenabschnitt als korrigierter Mittelwert interpretiert werden kann. Es wird von mangelnder Stabilität ausgegangen, wenn das 90 %-Vertrauensintervall (Bühner & Ziegler, 2017) um das standardisierte β-Gewicht in der linearen Regression den Nullpunkt nicht beinhaltet. Jedoch sind substantielle Leistungsveränderungen erst mit mittleren Effekten assoziiert. Ergänzend werden bayesianisch-korrelative Analysen durchgeführt, die durch den sogenannten Bayes-Faktor (BF01) einen Wert für die Wahrscheinlichkeit angeben, dass die Leistungen als stabil zu betrachten sind. Ein Wert BF01 > 1 kann als Evidenz für Stabilität und ein Wert BF01 < 1 invers interpretiert werden (Jeffreys, 1961).

Ergebnis (I)

Die Analyse der Stabilität der motorischen Leistungen in der Zeit von 2011 bis 2016 in den acht Testaufgaben zeigt anstelle stabiler Leistungen positive sowie negative Veränderungen mit marginalen bis kleinen Effekten, wobei sich die Effekte zwischen den Acht- und Neunjährigen insgesamt statistisch nicht bedeutsam unterscheiden (siehe Tab. 1). In den fünf Jahren von 2011/12 bis 2015/16 können deskriptiv folgende Veränderungen konstatiert werden (Tab. 1): Nach fünf Jahren laufen die Kinder im 6-Minuten-Lauf im Schnitt ca. 50–60 m mehr, was für Acht- und Neunjährige einer Verbesserung von 5–7% oder 0,11 Standardabweichungen (SD) entspricht (siehe standardisiertes Regressionsgewicht β). Des Weiteren schaffen die Kinder nach fünf Jahren etwa einen Liegestütz (10–12 %) mehr, etwa einen Sit-up weniger (0,8–0,9 Sit-ups = 4,4–5,0 %), springen beim Standweitsprung ca. 2,4–2,8 Zentimeter weiter (1,9–2,3%), laufen beim 20-m-Sprint ca. 0,1 Sekunden langsamer (2,25 %), verbessern sich um 2–3 Sprünge beim seitlichen Hin- und Herspringen (2,5–2,9 Sprünge = 10–11,18 %), schaffen etwa einen Schritt weniger beim Balancieren rückwärts (0,5–1,15 Schritte = 1,5–3,4 %) und verlieren etwa 0,9–1,6 Zentimeter Beweglichkeit bei der Rumpfbeuge vorwärts.
Tab. 1

Deskriptive Stichprobenbeschreibung und Ergebnisse zur Leistungsveränderung in den acht Testaufgaben des Deutschen Motorik-Test 6–18 von 2011/2012 bis 2015/2016

Testaufgabe

MW

SD

Achsenabschnitt

KI90

b

KI90

β

KI90

p-Wert

8 Jahre

6-Minuten-Lauf (m)

888,77

139,08

844,71

838,67–850,75

11,88

10,35–13,48

0,11

−1,42–1,64

<0,001

Liegestütz (Anzahl)

12,27

3,85

11,41

11,24–11,57

0,23

0,19–0,27

0,08

0,04–0,12

<0,001

Sit-ups (Anzahl)

17,51

5,17

18,16

17,93–18,39

−0,18

−0,23 bis −0,12

−0,05

−0,10–0,01

<0,001

Standweitsprung (cm)

126,34

18,63

124,26

123,44–125,07

0,56

0,36–0,77

0,04

−0,17–0,24

<0,001

20-m-Sprint (s)

4,51

0,38

4,45

4,43–4,47

0,02

0,01–0,02

0,05

0,05–0,06

<0,001

Seitliches Hin- und Herspringen (Anzahl)

27,12

6,22

25,04

24,77–25,31

0,56

0,49–0,63

0,12

0,05–0,19

<0,001

Balancieren rückwärts (Schritte)

33,6

8,91

33,99

33,60–34,38

−0,10

−0,20 bis −0,01

−0,02

−0,11–0,08

<0,001

Rumpfbeuge (cm)

0,91

6,75

−0,27

−0,56–0,03

0,32

0,24–0,39

0,06

−0,01–0,14

<0,001

9 Jahre

6-Minuten-Lauf (m)

874,13

146,19

841,77

834,18–849,35

9,58

7,5–11,65

0,09

−1,90–2,10

<0,001

Liegestütz (Anzahl)

12,05

3,97

11,14

10,93–11,34

0,27

0,21–0,33

0,09

0,04–0,15

<0,001

Sit-ups (Anzahl)

17,65

5,42

18,19

17,91–18,47

−0,16

−0,24 bis −0,08

−0,04

−0,11–0,03

<0,001

Standweitsprung (cm)

125,62

19,98

124,01

122,97–125,05

0,48

0,19–0,75

0,03

−0,24–0,31

<0,001

20-m-Sprint (s)

4,49

0,40

4,41

4,38–4,42

0,02

0,02–0,03

0,09

0,08–0,09

<0,001

Seitliches Hin- und Herspringen (Anzahl)

27,28

6,52

25,55

25,21–25,89

0,51

0,42–0,61

0,11

0,02–0,20

<0,001

Balancieren rückwärts

(Schritte)

33,36

9,22

34,13

33,65–34,61

−0,23

−0,36 bis −0,1

−0,03

−0,16–0,90

<0,001

Rumpfbeuge (cm)

−0,37

6,91

−0,96

−1,32 bis −0,60

0,18

0,08–0,27

0,03

−0,06–0,13

<0,001

Unterschiede zwischen den Acht- und Neunjährigen: pSechsmin = 0,18; pLiegestütz = 0,28; pSit-ups = 0,85; pStandweitsprung= 0,68; pSeitlichesHH = 0,03; p20m Sprint = 0,59; pBalancieren = 0,19; pRumpfbeuge = 0,09

KI Konfidenzintervall

Jedoch implizieren die 90-%-Vertrauensintervalle (Tab. 1) für die Testaufgaben 6-Minuten-Lauf, Sit-ups, Standweitsprung und Balancieren rückwärts praktisch nicht bedeutsame Leistungsveränderungen, da sie den Nullpunkt überdecken. Die Vertrauensintervalle der Testaufgaben Liegestütz, 20-m-Sprint sowie seitliches Hin- und Herspringen deuten hingegen sowohl für Acht- als auch für Neunjährige darauf hin, dass Leistungsverbesserungen mit marginalen bis kleinen Effekten nicht auszuschließen sind, da die Vertrauensintervalle den Nullpunkt nicht beinhalten (Büsch & Strauß, 2016).

Ergänzend zeigt die bayesianische Äquivalenzstatistik, dass mit Ausnahme der Testaufgabe Balancieren rückwärts (BF01 = 1,96) die sportmotorischen Leistungen nicht als stabil betrachtet werden können, da der Bayes-Faktor (BF01) extrem nah bei null liegt (alle BF01 < 0,001; Tab. S1 im elektronischen Zusatzmaterial). Für Balancieren rückwärts kann konstatiert werden, dass Stabilität der Balancierleistung 1,96 Mal wahrscheinlicher als Nichtstabilität (BF01 = 1,96; Jeffreys, 1961). Darüber hinaus zeigen die Analysen zur Robustheit sowie die sequenziellen Analysemuster, dass die bayesianischen Ergebnisse, also nicht stabile Leistungen, als sehr robust zu bewerten sind. Eine ausführliche, umfangreiche Ergebnisdarstellung dieser bayesianischen Analysen inklusive einer Robustheitsanalyse ist aus Platzgründen im Supplement zu diesem Beitrag hinterlegt.

Zwischenfazit (I)

Im ersten Schritt wurde überprüft, ob auf der Ebene der Rohwerte (absolute Werte) von stabilen sportmotorischen Leistungen über fünf Jahre ausgegangen werden kann. Sowohl die herkömmlichen frequentistischen Analysen mit Hilfe der Vertrauensintervalle als auch die bayesianischen Analysen zeigen, dass eine stabile, d. h. unveränderte sportmotorische Leistungsfähigkeit auf der Ebene individueller Testaufgaben über fünf Jahre unwahrscheinlich ist. Stattdessen zeigen die Ergebnisse, dass unsystematisch sowohl positive als auch negative Leistungsveränderungen mit marginalen bis kleinen Effekten zu beobachten sind. Da ein stabiles Leistungsniveau der absoluten Werte die Voraussetzung für verzerrungsfreie Referenzkategorien der Schülerinnen und Schülern bildet, muss daher in Schritt zwei überprüft werden, ob eine konsistente Einteilung der Kinder über den gesamten Beobachtungszeitraum sichergestellt ist oder ob die mangelnde Stabilität der motorischen Leistungen die Häufigkeitsverteilungen der Referenzkategorien beeinflusst.

Studie II: Zeitliche Stabilität der Referenzkategorien

Datenanalyse (II)

Im zweiten Schritt wird die Stabilität der Häufigkeitsverteilungen, auf der die Berliner Referenzkategorien aus den Schuljahren 2011/12 bis 2014/15 beruhen, geprüft, um eine konsistente Einteilung von Personen in die Referenzkategorien zu gewährleisten. Hierfür werden die prozentualen Häufigkeitsverteilungen der Berliner Referenzkategorien von 2011/12 bis 2015/16 mit den empirischen prozentualen Häufigkeitsverteilungen in der Stichprobe aus 2015/16 verglichen. Da bei einer Stichprobengröße von mehreren tausend Kindern auch bei minimalen Unterschieden statistisch signifikante Ergebnisse zu erwarten sind, wird in Anlehnung an Minimum-Effekt-Hypothesen die Äquivalenz der Häufigkeitsverteilungen zwischen den Berliner Referenzkategorien und den Daten aus dem Schuljahr 2015/16 überprüft, indem sogenannte Null-Intervalle berechnet werden (siehe „Null-Counternull Intervall for \(\upvarphi \,\)“, Grissom & Kim, 2005). Ein Null-Intervall demonstriert ein Vertrauensintervall, in welchem der wahre Effekt mit einer a priori festgelegten Sicherheit bzw. Wahrscheinlichkeit, in diesem Fall 90%, in der empirischen Stichprobe enthalten ist. Das Vertrauensintervall wird so interpretiert, dass keine hinreichende Stabilität in den Häufigkeitsverteilungen gewährleistet ist und eine Überarbeitung der Referenzkategorien angezeigt wäre, wenn das Intervall mindestens einen Wert \(\upvarphi \,\)≥ 0,1 beinhaltet, d. h. die untere Grenze zu einem kleinen Effekt. Mittlere Effekte (\(\upvarphi \,\)≥ 0,3) zeigen zudem an, dass eine Überarbeitung der Referenzwerte durch eine einfache Zusammenlegung der Stichproben nicht ausreichen würde.

Ergebnis (II)

Die empirischen Häufigkeitsverteilungen befinden sich aus Platzgründen im Supplement. Die Analyse zeigt beim 6-Minuten-Lauf einen kleinen Effekt (\(\varphi\)= 0,13; Tab. 2). Darüber hinaus ist bei den drei Testaufgaben Sit-ups, 20-m-Sprint und seitliches Hin- und Herspringen die Schwelle \(\upvarphi \,\)≥ 0,1 zu einem kleinen Effekt im Vertrauensintervall eingeschlossen (Tab. 2). Bei den vier Testaufgaben Liegestütz, Standweitsprung, Balancieren rückwärts sowie Rumpfbeuge ist dieser Effekt nicht im Vertrauensintervall enthalten, sodass in diesen Testaufgaben eine ausreichende Stabilität vorliegt. Zusammengefasst bedeuten die Ergebnisse jedoch, dass die vorläufigen Berliner Referenzkategorien bei vier von acht Testaufgaben als nicht hinreichend stabil betrachtet werden müssen, da kleine Effekte nicht ausgeschlossen werden können.
Tab. 2

Effektgrößen für den Test der Stabilität der Häufigkeitsverteilungen vorläufige Berliner Referenzwerte * Empirische Stichprobe 2015/16 für Acht- und Neunjährige

Testaufgabe

Effektgröße (Cramer-V/Phi)

Null-Intervall

6-Minuten-Lauf

0,13

0–0,25

Liegestütz

0,02

0–0,04

Sit-ups

0,07

0–0,14

Standweitsprung

0,03

0–0,06

20-m-Sprint

0,08

0–0,16

Seitliches Hin- und Herspringen

0,08

0–0,16

Rückwärts Balancieren

0,01

0–0,02

Rumpfbeuge

0,04

0–0,09

Zwischenfazit (II)

Die Analysen zur prozentualen empirischen Verteilung zeigen, dass die ursprüngliche prozentuale Häufigkeitsverteilung der Berliner Referenzkategorien in der empirischen Stichprobe teilweise verzerrt wird. Dies bedeutet, dass nicht ausgeschlossen werden kann, dass die empirischen Häufigkeitsverteilungen für die Testaufgaben 6-Minuten-Lauf, Sit-ups, 20-m-Sprint und seitliches Hin- und Herspringen von der ursprünglichen Häufigkeitsverteilung abweichen, was durch eine die unzureichende Stabilität in den gezeigten Leistungen auf Messwerteebene erklärt werden kann. Aufgrund der marginalen, unsystematischen positiven und negativen Leistungsveränderungen empfiehlt sich eine Zusammenlegung der beiden Stichproben, um die unzureichende Stabilität in einem Zeitraum von fünf Jahren zu kompensieren.

Aus der Verzerrung bzw. Instabilität, die in Konsequenz mit zu großen oder zu geringen Zellbesetzungen in den Randbereichen einhergeht, folgt ein erhöhtes Risiko bzgl. einer Verletzung der Konstruktvalidität im Sinne der Itemhomogenität einer Testbatterie. Über- oder unterrepräsentierte Randbereiche gefährden insbesondere dann die zuverlässige und valide Einordnung von Kindern mit Defiziten und Kindern mit Begabungen, wenn die Zuordnung in die theoretisch geordneten Randkategorien aus messtheoretischer Sicht zufällig erfolgt. Daher ist in Studie III zu prüfen, ob die vorliegenden Verzerrungen die Validität der Referenzkategorien speziell in den Extremkategorien beeinflussen oder ob diese robust gegenüber zeitlicher Instabilität sind.

Studie III: Zeitliche Stabilität der Konstruktvalidität

Datenanalyse (III)

In Studie III wird die Stabilität des latenten Konstrukts physische Fitness geprüft. Hierfür wird die Itemhomogenität der vorläufigen Berliner Referenzkategorien mittels der unabhängigen Stichprobe aus dem Schuljahr 2015/16 geprüft. Dafür wurden die Testergebnisse aus dem Schuljahr 2015/16 in die publizierten Berliner Referenzkategorien überführt. Bei der konfirmatorischen Modellierung wird die für den DMT 6–18 bereits gezeigte Eindimensionalität physischer Fitness zugrunde gelegt (Utesch et al., 2015; Zinner, Büsch et al., 2015). Dabei wird die Rumpfbeuge analog zum Strukturmodell motorischer Fähigkeiten nach Bös (1987) nicht in das eindimensionale Konstrukt physische Fitness integriert. Die Testaufgabe Balancieren rückwärts wird aufgrund divergierender altersabhängiger Aufgabenschwierigkeit für Acht- und Neunjährige separat auf Zugehörigkeit zum latenten Konstrukt geprüft, um bisherige Ergebnisse zu validieren (Utesch et al., 2015; Utesch et al., 2018; Zinner, Büsch et al., 2015). Angelehnt an das methodische Vorgehen von Büsch et al. (2009) und Utesch et al. (2015) zur Überprüfung der Konstruktvalidität motorischer Tests wird das Partial-Credit-Modell (PCM; Masters, 1982) eingesetzt. Das PCM gehört zu den auf Schwellenparametern basierenden probabilistischen Testmodellen, sogenannte IRT-Modelle („item response theory models“), und wird auch als ordinales oder polytomes Rasch-Modell bezeichnet. Um die globale Modellanpassungsgüte zu prüfen, wird ein Bootstrapping Verfahren mit 100 Stichproben angewendet (Rost, 2004; von Davier, 2001). Globale Modellgeltung liegt nach von Davier (2001) vor, wenn die statistischen Parameter Cressie-Read (CR) und Pearson-χ2 (P-χ2) im Bereich p ≥ 0,05 liegen. Anschließend wird die Robustheit der intendierten ordinalen Struktur der Referenzkategorien durch die Prüfung lokaler Modellverletzungen im Sinne geordneter Schwellenparameter analysiert.

Ergebnisse (III)

Die Ergebnisse des Partial-Credit-Modells zeigen sowohl für die Acht- als auch für die Neun-Jährigen auf globaler Modellebene eine gute Modellanpassungsgüte für die sieben untersuchten Testaufgaben des DMT 6–18 (alle p > 0,05; theoriekonform unter Ausschluss von Rumpfbeuge; Tab. 3), sodass auf globaler Ebene von Itemhomogenität bzw. Konstruktvalidität der eindimensionalen Fitness ausgegangen werden kann. Für das Modell mit allen sieben Testaufgaben zeigt sich jedoch eine lokale Modellverletzung aufgrund ungeordneter Schwellenparameter für Balancieren rückwärts (Tab. 4). Dies bedeutet, dass das Erreichen der Kategorie 4 oder 5 beim Balancieren rückwärts nicht mit einer höheren physischen Fitness eines Kindes korrespondiert. Die Auswirkungen eines Deckeneffekts beim Balancieren rückwärts ab dem Alter von etwa acht Jahren auf das Konstrukt physische Fitness und somit auf die Art der Auswertung von Balancieren rückwärts wurde bereits in früheren Studien gezeigt (Utesch et al., 2015; Utesch et al., 2018; Zinner, Büsch et al., 2015). Nachdem Balancieren rückwärts aus dem Modell ausgeschlossen wurde, zeigt sich ein guter globaler sowie lokaler Modellfit (Tab. 3 und 4), sodass insgesamt von einem homogenen und validen Konstrukt der physischen Fitness im Kindesalter ausgegangen wird. Die resultierende deskriptive Verteilung der Referenzwerte wird in Tab. 5 dargestellt.
Tab. 3

Globaler Modellfit und Reliabilität im Partial-Credit-Modell

Alter

Test

Cressie Read (CR)

pCR

Pearson-χ2 (P-χ2)

pP-χ2

Andrich’s Reliabilitäta

8 Jahre

7 Aufgaben

−1,27

0,95

−0,57

0,83

0,72

6 Aufgaben

−0,52

0,96

−0,19

0,87

0,71

9 Jahre

7 Aufgaben

−1,44

0,92

−0,21

0,88

0,75

6 Aufgaben

−0,85

0,99

−0,53

0,89

0,74

aAus Andrich (1988)

Tab. 4

Schwierigkeiten und Schwellenparameter für den DMT 6–18 für Acht- und Neunjährige im Partial-Credit-Modell

  

Schwellenparameter

Testaufgaben

Schwierigkeit

1

2

3

4

8 Jahre: Sieben Testaufgaben

6-Minuten-Lauf

−0,90

−2,97

−2,16

1,92

2,84

Liegestütz

0,30

−3,00

−1,91

2,17

2,85

Sit-ups

0,10

−3,03

−1,84

2,47

2,81

Standweitsprung

0,06

−2,93

−1,939

2,07

3,03

20-m-Sprint

0,14

−2,88

−1,80

2,33

2,90

Seitliches Hin- und Herspringen

0,00

−2,94

−2,00

2,00

2,92

Rückwärts Balancierena

−0,24

−3,08

−1,95

2,34

1,75*

8 Jahre: Sechs Testaufgaben

6-Minuten-Lauf

−0,13

−3,14

−2,29

1,91

2,97

Liegestütz

−0,01

−3,16

−2,03

2,16

2,99

Sit-ups

0,69

−3,19

−1,96

2,47

2,95

Standweitsprung

0,02

−3,09

−2,06

2,06

3,17

20-m-Sprint

0,10

−3,04

−1,91

2,32

3,04

Seitliches Hin- und Herspringen

−0,04

−3,10

−2,12

1,99

3,05

9 Jahre: Sieben Testaufgaben

6-Minuten-Lauf

−0,08

−3,22

−2,05

2,11

2,85

Liegestütz

0,01

−3,05

−1,74

2,00

2,83

Sit-ups

0,15

−3,10

−1,79

2,28

3,21

Standweitsprung

0,02

−3,30

−1,84

2,13

3,08

20-m-Sprint

0,18

−2,98

−1,78

2,38

3,09

Seitliches Hin- und Herspringen

−0,10

−3,16

−1,97

2,01

2,73

Rückwärts Balancierena

−0,18

−2,99

−1,90

2,56

1,60*

9 Jahre: Sechs Testaufgaben

6-Minuten-Lauf

−0,11

−0,11

−3,40

−2,215

2,97

Liegestütz

−0,02

−0,02

−3,22

−1,74

2,95

Sit-ups

0,13

0,13

−3,27

−1,89

3,35

Standweitsprung

−0,01

−0,01

−3,46

−1,94

3,21

20-m-Sprint

0,15

0,15

−3,16

2,41

3,22

Seitliches Hin- und Herspringen

−0,13

−0,13

−3,34

2,03

2,85

aRückwärts Balancieren zeigt ungeordnete Schwellenparameter

Tab. 5

Deskriptive Statistik zur Verteilung der Summenwerte auf der Basis der neuen Berliner Referenzwerte

N

19.084

Mittelwert

3,01

Median

3,00

Modus

3,00

Standardabweichung

0,43

Minimum

1

Maximum

4,83

25. Perzentil

2,83

50. Perzentil

3,00

75. Perzentil

3,33

Diskussion

Die motorische Leistungsfähigkeit von Kindern und Jugendlichen kann sich im Querschnittsvergleich über mehrere Jahre aufgabenspezifisch unterschiedlich verändern (Albrecht et al., 2016; Tomkinson & Olds, 2007). In gemeinsamen Handlungsempfehlungen werben KMK und DOSB für ein regelmäßiges Monitoring der physischen Fitness im Schulkontext, da diese für eine gesunde körperliche, aber auch psychosoziale Entwicklung von Kindern und Jugendlichen eine wichtige Rolle spielt (KMK & DOSB, 2017). Im Zuge eines regelmäßigen Screenings werden zur objektiven Erfassung des Status quo motorische Testbatterien eingesetzt, um bei Bedarf evidenzbasierte Interventionsmaßnahmen einleiten zu können. Die Ergebnisse sollen den Verantwortlichen helfen, zielgruppenspezifische Sportprogramme zu entwickeln und zu evaluieren.

In Deutschland wird vermehrt sowohl in der Praxis als auch in (sport)wissenschaftlichen Studien der Deutsche Motorik-Test 6–18 eingesetzt. Dieser erfasst die physische Fitness von Kindern und Jugendlichen auf ökonomische Art und Weise in Schul- und Vereinssettings. Es hat sich etabliert, die Ergebnisse von motorischen Testbatterien im Rahmen von Referenz- oder Normkategorien zu interpretieren, um das Alter und das Geschlecht der getesteten Kinder und Jugendlichen zu berücksichtigen. Dabei müssen tendenzielle Leistungsveränderungen über mehrere Jahre bei der Normierung eines Tests wie dem DMT 6–18 berücksichtigt werden, um fehlende Leistungsstabilität bzw. einen zeitbedingten Verzerrungsfehler (Bias) bei der Interpretation der Testwerte zu vermeiden. Dementsprechend würden positive Leistungsentwicklungen zu einer erhöhten bzw. negative Leistungsentwicklungen zu einer reduzierten physischen Standardfitness führen, sofern keine validen Cut-off-Kriterien vorliegen und keine Interventionsprogramme durchgeführt werden.

Zeitliche Stabilität motorischer Leistungen

In Studie I dieses Beitrages wurde die Stabilität des Leistungsniveaus in einzelnen Parametern der physischen Fitness überprüft. Für die Testaufgaben des DMT 6–18 zeigt sich, dass das Leistungsniveau zwischen Jahrgängen bereits in einem relativ kurzen Zeitraum von nur fünf Jahren instabil ist. Die größten positiven Veränderungen konnten beim seitlichen Hin- und Herspringen (10–11%) und bei Liegestützen (10–12%) beobachtet werden. Da das Projekt Berlin hat Talent bereits seit mehr als fünf Jahren läuft und bekannt ist, welche Testaufgaben eingesetzt werden, könnte dieses Ergebnis darauf hindeuten, dass die einzelnen Klassen in den teilnehmenden Schulen und Bezirken für den Test explizit trainiert haben („teaching to the test“). Dagegen spricht allerdings, dass in anderen Testaufgaben rückläufige Leistungen zu konstatieren sind. Beispielsweise zeigen die Kinder im 20-m-Sprint nach fünf Jahren ca. 0,1 Sekunden langsamere Laufleistungen und schaffen etwa einen Sit-up weniger. Die Befunde unterstützen vorhergehende Erkenntnisse zu aufgabenspezifischen Veränderungen der motorischen Leistungsfähigkeit (Albrecht et al., 2016; Tomkinson & Olds, 2007). Eindeutige Trends zu einzelnen Testaufgaben konnten in der vorliegenden Querschnittsuntersuchung jedoch nicht in substanzieller Form bestätigt werden. Beispielsweise zeigen Albrecht et al. (2016) in ihrer quasi-längsschnittlichen Untersuchung kongruent zu dieser Studie Verbesserungen in der Testaufgabe seitliches Hin- und Herspringen, wohingegen die positiven Entwicklungen im Balancieren rückwärts und in der Beweglichkeit in dieser Studie nicht bestätigt wurden. Zusammengefasst können daher über die verschiedenen Studien keine einheitlichen Veränderungsmuster bzw. Tendenzen konstatiert werden. Ob die vorliegenden Ergebnisse auf einen systematischen säkularen Trend zurückzuführen sind, wird daher in der Zukunft in weiteren, langfristig angelegten Untersuchungsreihen zu prüfen sein. Insgesamt impliziert die empirische, jedoch inhaltlich als nicht substanziell einzuschätzende Instabilität der sportmotorischen Leistungen über einen relativ kurzen Zeitraum, dass die Daten aus den Schuljahren 2011/12 bis 2015/16 für Bestimmung der Referenzkategorien zusammengefasst werden sollten.

Stabilität des Konstrukts der physischen Fitness

Der vorliegende Beitrag zeigt den möglichen Einfluss von kurz- bzw. mittelfristigen Leistungsveränderungen auf die Normierung von Testbatterien. In fünf Jahren bedingt die unzureichende Stabilität der motorischen Leistungen auf der Messebene auch verzerrte Häufigkeitsverteilungen der Referenzkategorien. Dies führt dazu, dass sich die prozentualen Verteilungen der Randkategorien disproportional stärker verändern als die der mittleren Kategorien, was bei Benutzung nicht angepasster Referenzkategorien zu Fehlinterpretationen der Standardfitness führen kann (Studie II).

Um das latente Konstrukt physische Fitness umfassend zu erheben, werden Testbatterien wie der DTM 6–18 auf der Grundlage von Strukturmodellen physischer Fitness oder motorischer Dimensionen entwickelt. Für die physische Fitness (ebenso wie für das Konstrukt motorische Kompetenz, welches anderen motorischen Tests zugrunde liegt) wurde im Rahmen der probabilistischen Testtheorie gezeigt, dass ein sparsames eindimensionales Modell motorischer Leistung im Sinne der „General Motor Ability Hypothesis“ vom Kleinkind- bis zum Ende des Grundschulalters empirisch valide ist (Bardid, Utesch, & Lenoir, 2017; Hands & Larkin, 2001; Utesch et al., 2015, 2016; Yan & Bond, 2011; Zhu & Cole, 1996; Zhu et al., 2011; Zinner, Büsch et al., 2015; Utesch et al., 2018). Entsprechend konnte in Studie III gezeigt werden, dass sich das eindimensionale Konstrukt auch unter der Berücksichtigung von kurzfristigen Leistungsveränderungen als stabil erweist. Das latente Konstrukt erweist sich insbesondere in den Randbereichen gegenüber den gezeigten empirischen Verteilungsverzerrungen als robust.

Um auch perspektivisch Verzerrungsfehler bei der Leistungsbewertung zu vermeiden, erscheint eine regelmäßige Evaluation der Grenzwerte für die Referenzkategorien, nach fünf Jahren inhaltlich sinnvoll. Dringend angezeigt erscheinen in Zukunft zudem Längsschnittuntersuchungen mit systematischer Validierung der Referenz- bzw. Normkategorien sowie des latenten Konstrukts (Wicks, Telford, Cunningham, Semple, & Telford, 2015).

Testinterpretation durch Summenwerte statt durch Testprofile?

Das Ziel sportmotorischer Testungen ist vermehrt die Identifikation von Talenten und Kindern mit motorischen Defiziten. Ein stabiles homogenes Konstrukt der physischen Fitness gestattet die Interpretation von Testergebnissen des DMT 6–18 auf der Basis eines Summenwertes: Mit den Testaufgaben 6‑Minuten-Lauf, Liegestütz, Sit-ups, Standweitsprung, 20-m-Sprint und seitliches Hin- und Herspringen ist es unter statistisch-methodischen Gesichtspunkten angemessen, einen Summenwert physische Fitness anstelle von Testprofilen zu verwenden, sofern ein valides Kategorisierungssystem eingesetzt wird. Für die in diesem Beitrag validierten Referenzkategorien (Zinner, Utesch, & Büsch, 2017) wurde eine Verteilung gewählt, die durch schmale äußere Kategorien den höchsten Testinformationsgehalt an den Rändern aufweist, um auf diese Weise Talente und Kinder mit motorischen Unterstützungsbedarf so reliabel und valide wie möglich zu diagnostizieren (Holzweg et al., 2012; Utesch et al., 2015).

Die vorgestellte Testinterpretation auf der Grundlage eines sparsamen Modells ist insbesondere in groß angelegten Multicenterstudien oder im flächendeckenden Screening nützlich und suffizient, um Leistungsentwicklungen und/oder langfristige Veränderungen aufzeigen, Theorien prüfen und Testmodelle aktualisieren zu können. Auf individueller Ebene, wenn im Klassenverband an spezifischen Schwächen von Individuen gearbeitet werden soll, ist die Interpretation von Testprofilen weiterhin möglich, auch wenn die empirisch-statistischen Ergebnisse (u. a. auch aus den weiteren Studien zum eindimensionalen Konstrukt motorischer Leistung im Kindesalter) andeuten, dass eine spezifische Intervention einem globalen Intervenieren im Sinne einer Verbesserung der allgemeinen Leistungsfähigkeit nicht überlegen ist.

Spezifische Empfehlungen bei der Diagnostik von Talenten

Während die Referenzkategorien und ein eindimensionaler Faktor physische Fitness insbesondere für Screenings, Interventionsevaluationen oder wissenschaftliche Studien wertvoll sein können, sind diese für individuelle Fragestellungen wie in der spezifischen Talentdiagnostik ggf. zu ungenau. Im Zuge spezifischer Talentdiagnostik ist das Ziel nicht die Kategorisierung in durchschnittlich, gut oder sehr gut. Vielmehr müssen hier Unterschiede zuverlässig zwischen den als sehr gut eingestuften Kindern identifiziert werden. Für eine holistische individuelle Einschätzung der Leistungsfähigkeit von Kindern sind daher weitere Parameter zu berücksichtigen, die im Rahmen von Fitnessuntersuchungen modelliert werden können bzw. sollten. Eigenschaften wie Körperkoordination oder Objektmanipulation (Golle, Muehlbauer, Wick, & Granacher, 2015; Rudd et al., 2016), aber auch BMI, Körpergröße etc. (Zinner, Büsch, & Ester, 2017) sowie Umfeldbedingungen (Wirszing, 2015) müssen für eine ganzheitliche Betrachtung berücksichtigt werden. Neben dem präsentierten Fitnessfaktor werden im Projekt Berlin hat Talent daher weitere individuelle Parameter herangezogen. Mit Hilfe von sog. Fuzzy-Modellen können aus Größen wie z. B. Körperhöhe, Körpermasse, Monatsalter, Daten aus der Körperkoordination bzw. der Objektmanipulation Rangfolgen von Kindern berechnet werden (Zinner, 1996, 1997; Zinner & Büsch, 2016). Diese Modelle erlauben es, anders als ein einfacher Summenwert, die spezifischen Anforderungen bestimmter Sportarten an Sportler in die Modellierung der Gesamtmotorik einzubeziehen. Darüber hinaus wird in Berlin ab 2017 auch das biologische Alter der Kinder erhoben (Freitas et al., 2015).

Aktualisierte Berliner Referenzwerte für den DMT 6–18

Um Problemen vorzubeugen, die sich aus einer Verzerrung der Referenzkategorien ergeben können, wurden mit der Gesamtstichprobe aus dem Projekt Berlin hat Talent aktualisierte und valide Referenzkategorien für acht- bis neunjährige Kinder im DMT 6–18 zur Verfügung gestellt (z. B. www.berlin-hat-talent.de oder www.trainer-offensive.de; Zinner, Utesch, & Büsch, 2017). Diese Referenzkategorien gelten zuvorderst für Berlin. Für die darüberhinausgehende Verwendung müssen im Einzelfall die mangelnde Repräsentativität der Berliner Referenzkategorien für ganz Deutschland (z. B. ländliche Gebiete) gegenüber den kleineren Stichproben der 2009 publizierten Normwerte für den Deutschen Motorik-Test 6–18 abgewogen werden. Perspektivisch wäre es zu begrüßen, wenn deutschlandweit Normwerte für mehr Altersklassen erstellt würden, die hinreichend große Stichproben, moderne testtheoretische Ansätze und Repräsentativität, beispielsweise durch die Sammlung in großen Datenbanken vereinen (siehe hierzu z. B. die Datenbank MO|RE data; Bös, Schlenker, & Albrecht, 2016).

Fazit

Um systematische Leistungsveränderungen innerhalb der physischen Fitness frühzeitig zu erkennen, bedarf es eines regelmäßigen und flächendeckenden Screenings. In diesem Beitrag wird gezeigt, wie sich die physische Fitness von Kindern in einem 5‑Jahres-Zeitraum aufgabenspezifisch verändern kann. Die beobachteten Leistungsveränderungen scheinen jedoch keinem einheitlichen Muster, z. B. einem säkularen Trend zu folgen. Sie wirken sich nicht verzerrend auf die Validität des eindimensionalen Konstrukts der physischen Fitness aus und gestatten die Berechnung eines Summenwertes, um die physische Fitness bewerten zu können. Für die Bewertung der sportmotorischen Einzelleistungen von acht- und neunjährigen Schülerinnen und Schülern im DMT 6–18 können wir zusammenfassend die aktualisierten und validen Berliner Referenzkategorien (www.berlin-hat-talent.de oder www.trainer-offensive.de; Zinner, Utesch, & Büsch, 2017) empfehlen, die im 5‑Jahres-Turnus regelmäßig evaluiert und validiert werden sollen.

Fußnoten

  1. 1.

    Die aktuellen Zahlen zu den Berliner Grundschulen können unter https://www.berlin.de/sen/bildung/schule/bildungsstatistik/ abgerufen werden (Blickpunkt Schule – Schuljahr 2016/17).

  2. 2.

    Die Daten aus den vier Schuljahren 2011/12 bis 2014/15 wurden bereits mit dem Ziel von Referenzdaten publiziert (Zinner et al., 2015). Sie gehen in diese Untersuchung mit ein, um die kurz- bis mittelfristigen Leistungsveränderungen analysieren zu können und um auf Grundlage einer adäquaten Stichprobe für fünf Jahre gültige Referenzkategorien für Acht- und Neunjährige zur Verfügung zu stellen.

Notes

Einhaltung ethischer Richtlinien

Interessenkonflikt

T. Utesch, J. Zinner und D. Büsch geben an, dass kein Interessenkonflikt besteht.

Dieser Beitrag beinhaltet keine von den Autoren durchgeführten Studien an Tieren. T. Utesch, J. Zinner und D. Büsch geben an, dass die Studie den ethischen Richtlinien entspricht.

Supplementary material

12662_2018_500_MOESM1_ESM.docx (591 kb)
A Bayesianische Analyse der zeitlichen Stabilität auf Rohwertebene, B Kreuztabellen zur Stabilität der Referenzwerte

Literatur

  1. Albrecht, C., Hanssen-Doose, A., Bös, K., Schlenker, L., Schmidt, S., Wagner, M., Worth, A., et al. (2016). Motorische Leistungsfähigkeit von Kindern und Jugendlichen in Deutschland. Sportwissenschaft, 46(4), 294–304.CrossRefGoogle Scholar
  2. Andrich, D. (1988). Rasch models for measurement. London: SAGE.CrossRefGoogle Scholar
  3. Bardid, F., Lenoir, M., Huyben, F., De Martelaer, K., Seghers, J., Goodway, J. D., & Deconinck, F. J. (2017). The effectiveness of a community-based fundamental motor skill intervention in children aged 3–8 years: results of the “Multimove for Kids” project. Journal of Science and Medicine in Sport, 20(2), 184–189.CrossRefPubMedGoogle Scholar
  4. Bardid, F., Utesch, T., & Lenoir, M. (2017). Investigating the construct of motor competence in middle childhood. In 2017 North American Society for the Psychology of Sport and Physical Activity (NASPSPA) conference (Vol. 39, No. suppl., pp. S47–S48).Google Scholar
  5. Bös, K. (1987). Handbuch sportmotorischer Tests. Göttingen: Hogrefe.Google Scholar
  6. Bös, K., & Mechling, H. (1983). Dimensionen sportmotorischer Leistungen. Schorndorf: Hofmann.Google Scholar
  7. Bös, K., Schlenker, L., Büsch, D., Lämmle, L., Müller, H., Oberger, J., & Tittlbach, S. (2009). Deutscher Motorik-Test 6–18:(DMT 6–18). Hamburg: Czwalina.Google Scholar
  8. Bös, K., Schlenker, L., & Albrecht, C. (2016). Berlin hat Talent: Der Deutsche Motorik-Tests, Exkurs: eResearch Infrastruktur für sportwissenschaftliche Motorikforschungsdaten. In J. Zinner & T. Poller (Hrsg.), BERLIN HAT TALENT – Neue Ansätze der Talent- und Bewegungsförderung (S. 25–34). Berlin: Hochschule für Gesundheit & Sport, Technik &amp; Kunst.Google Scholar
  9. Bös, K., Schlenker, L., Albrecht, C., Büsch, D., Lämmle, L., Müller, H., Tittlbach, S., et al. (2016). Deutscher Motorik-Test (DMT 6–18) (2. Aufl.). Schriftenreihe der Deutschen Vereinigung für Sportwissenschaft. Hamburg: Czwalina.Google Scholar
  10. Bühner, M., & Ziegler, M. (2017). Statistik für Psychologen und Sozialwissenschaftler (2. Aufl.). München: Pearson.Google Scholar
  11. Büsch, D., & Strauß, B. (2016). Wider die „Sternchenkunde“! Sportwissenschaft, 46(2), 53–59.  https://doi.org/10.1007/s12662-015-0376-x.CrossRefGoogle Scholar
  12. Büsch, D., Strauß, B., Seidel, I., Pabst, J., Tietjens, M., Müller, L., Kretschmer, J., & Wirszing, D. (2009). Die Konstruktvalidität des Allgemeinen Sportmotorischen Tests für Kinder. Sportwissenschaft, 39, 95–103.CrossRefGoogle Scholar
  13. Casprsen, C. J., Powell, K. E., & Christenson, G. M. (1985). Physical activity, exercise, and physical fitness: definitions and distinctions for health-related research. Public Health Reports, 100(2), 126–131.Google Scholar
  14. Cattuzzo, M. T., dos Santos Henrique, R., Ré, A. H. N., de Oliveira, I. S., Melo, B. M., de Sousa Moura, M., & Stodden, D. (2016). Motor competence and health related physical fitness in youth: A systematic review. Journal of Science and Medicine in Sport, 19(2), 123–129.CrossRefPubMedGoogle Scholar
  15. von Davier, M. (2001). Winmira 2001. Computer software. St. Paul: Assessment Systems Corporation.Google Scholar
  16. van der Fels, I. M., te Wierike, S. C., Hartman, E., Elferink-Gemser, M. T., Smith, J., & Visscher, C. (2015). The relationship between motor skills and cognitive skills in 4–16 year old typically developing children: a systematic review. Journal of Science and Medicine in Sport, 18(6), 697–703.CrossRefPubMedGoogle Scholar
  17. Freitas, D. L., Lausen, B., Maia, J. A., Lefevre, J., Gouveia, É. R., Thomis, M., Malina, R. M., et al. (2015). Skeletal maturation, fundamental motor skills and motor coordination in children 7–10 years. Journal of Sports Sciences, 33(9), 924–934.CrossRefPubMedGoogle Scholar
  18. Golle, K., Muehlbauer, T., Wick, D., & Granacher, U. (2015). Physical fitness percentiles of german children aged 9–12 years: findings from a longitudinal study. PloS One, 10(11), e142393.CrossRefPubMedPubMedCentralGoogle Scholar
  19. Grissom, R. J., & Kim, J. J. (2005). Effect sizes for research: a broad practical approach. Mahwah: Lawrence Erlbaum.Google Scholar
  20. Hands, B., & Larkin, D. (2001). Using the Rasch measurement model to investigate the construct of motor abilities in young children. Journal of Applied Measurement, 2(2), 101–120.PubMedGoogle Scholar
  21. Herrmann, S., Bartz, E., Lischka, B., & Spahl, O. (2016). Bewegungs-Checks in Deutschlands Grundschulen. Leistungssport, 46(3), 52–55.Google Scholar
  22. Holzweg, M., Ketelhut, K., & Brandt, S. (2012). Der Einfluss des gewählten Bewertungsverfahrens auf die Interpretation der Ergebnisse des Deutschen Motorik Tests (DMT 6–18). Sportunterricht, 61(8), 239–243.Google Scholar
  23. JASP Team (2017). JASP (Version 0.8.4) [Computer software].Google Scholar
  24. Jeffreys, H. (1961). Theory of probability (3. Aufl.). New York: Oxford University Press.Google Scholar
  25. Kastner, J., & Petermann, F. (2009). Entwicklungsbedingte Koordinationsstörung. Psychologische Rundschau, 60(2), 73–81.CrossRefGoogle Scholar
  26. KMK & DOSB (2017). Gemeinsame Handlungsempfehlungen der Kultusministerkonferenz und des Deutschen Olympischen Sportbundes zur Weiterentwicklung des Schulsports 2017 bis 2022 Retrieved from https://www.kmk.org/fileadmin/Dateien/pdf/PresseUndAktuelles/Beschluesse_Veroef fentlichungen/2017-02-17_KMK-DOSB-Handlungsempfehlungen-Schulsport-2017.pdf.Google Scholar
  27. Kriemler, S., Meyer, U., Martin, E., van Sluijs, E. M. F., Andersen, L. B., & Martin, B. W. (2011). Effect of school-based interventions on physical activity and fitness in children and adolescents: a review of reviews and systematic update. British Journal of Sports Medicine, 45(11), 923–930.CrossRefPubMedGoogle Scholar
  28. Masters, G. N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47(2), 149–174.CrossRefGoogle Scholar
  29. Moosbrugger, H., & Kelava, A. (2012). Testtheorie und Fragebogenkonstruktion. Heidelberg: Springer.CrossRefGoogle Scholar
  30. R Core Team (2017). R: A language and environment for statistical computing. Vienna: R Foundation for Statistical Computing.Google Scholar
  31. Robinson, L. E., Stodden, D. F., Barnett, L. M., Lopes, V. P., Logan, S. W., Rodrigues, L. P., & D’Hondt, E. (2015). Motor competence and its effect on positive developmental trajectories of health. Sports Medicine, 45(9), 1273–1284.CrossRefPubMedGoogle Scholar
  32. Rost, J. (2004). Lehrbuch Testtheorie-Testkonstruktion (2. Aufl.). Bern: Huber.Google Scholar
  33. Rudd, J., Butson, M. L., Barnett, L., Farrow, D., Berry, J., Borkoles, E., & Polman, R. (2016). A holistic measurement model of movement competency in children. Journal of Sports Sciences, 34(5), 477–485.CrossRefPubMedGoogle Scholar
  34. Stodden, D., & Brooks, T. (2013). Promoting musculoskeletal fitness in youth: Performance and health implications from a developmental perspective. Strength & Conditioning Journal, 35(3), 54–62.CrossRefGoogle Scholar
  35. Tomkinson, G. R., & Olds, T. S. (2007). Secular changes in pediatric aerobic fitness test performance: the global picture. Pediatric Fitness, 50, 46–66.CrossRefGoogle Scholar
  36. Utesch, T., Strauß, B., Tietjens, M., Büsch, D., Ghanbari, M.-C., & Seidel, I. (2015). Die Überprüfung der Konstruktvalidität des Deutschen Motorik-Tests 6–18 für 9‑ bis 10-Jährige. Zeitschrift für Sportpsychologie, 22(2), 77–90.CrossRefGoogle Scholar
  37. Utesch, T., Bardid, F., Huyben, F., Strauss, B., Tietjens, M., De Martelaer, K., Lenoir, M., et al. (2016). Using Rasch modeling to investigate the construct of motor competence in early childhood. Psychology of Sport and Exercise, 24, 179–187.CrossRefGoogle Scholar
  38. Utesch, T., Dreiskämper, D., Strauss, B., & Naul, R. (2018). The development of the physical fitness construct across childhood. Scandinavian Journal of Medicine and Science in Sports,, 28(1), 212–219.  https://doi.org/10.1111/sms.12889.CrossRefGoogle Scholar
  39. Wicks, L. J., Telford, R. M., Cunningham, R. B., Semple, S. J., & Telford, R. D. (2015). Longitudinal patterns of change in eye–hand coordination in children aged 8–16 years. Human Movement Science, 43, 61–66.CrossRefPubMedGoogle Scholar
  40. Wirszing, D. (2015). Die motorische Entwicklung von Grundschulkindern. 28. Band Forum Sportwissenschaft. Hamburg: Feldhaus Edition Czwalina.Google Scholar
  41. Yan, Z., & Bond, T. G. (2011). Developing a Rasch measurement physical fitness scale for Hong Kong primary school-aged students. Measurement in Physical Education and Exercise Science, 15(3), 182–203.CrossRefGoogle Scholar
  42. Zhu, W., & Cole, E. L. (1996). Many-faceted Rasch calibration of a gross motor instrument. Research Quarterly for Exercise and Sport, 67(1), 24–34.CrossRefPubMedGoogle Scholar
  43. Zhu, W., Rink, J., Placek, J. H., Graber, K. C., Fox, C., Fisette, J. L., Raynes, D., et al. (2011). PE metrics: background, testing theory, and methods. Measurement in Physical Education and Exercise Science, 15(2), 87–99.CrossRefGoogle Scholar
  44. Zinner, J. (1996). Fuzzy in der Datenanalyse. In Bundesinstitut für Sportwissenschaft (Hrsg.), Anwendungen der Fuzzy-Logik und neuronaler Netze (S. 41–60). Köln: Strauß.Google Scholar
  45. Zinner, J. (1997). Multiattributive und unscharfe (FUZZY-)Bewertungsmethoden zur Datenanalyse im Sport. Berlin: Olympiastützpunkt Berlin.Google Scholar
  46. Zinner, J., & Büsch, D. (2014). Zwischenbericht für das Projekt „Berlin hat Talent“ (Datenbasis 2012/2013). Fakultät Sport. Berlin: H:G Hochschule für Gesundheit & Sport, Technik & Kunst.Google Scholar
  47. Zinner, J., & Büsch, D. (2016). BERLIN HAT TALENT – Ausgewählte Ergebnisse der Untersuchungen 2014/15. In J. Zinner & T. Poller (Hrsg.), Berlin hat Talent (S. 110–124). Berlin: Hochschule für Gesundheit & Sport, Technik & Kunst GmbH.Google Scholar
  48. Zinner, J., Büsch, D., Poller, T., & Bartko, R. (2015). Berlin hat Talent – ein Zwischenbericht für die Jahre 2012 und 2013. Leistungssport, 45(5), 12–18.Google Scholar
  49. Zinner, J., Werner, C., Mehler, S., & Rois, A. L. M. (2015). Berlin hat Talent. Ergebnisse der Untersuchungen in mehreren Bezirken von Berlin 2014. Zeitschrift für Gesundheit und Sport, 1, 59–65.Google Scholar
  50. Zinner, J., Büsch, D., & Ester, J. (2017). Individuelle Leistungseinschätzung im Deutschen Motorik-Test. Zur Individualisierung von DMT-Auswertungen mit Hilfe von muoltiattributiven FUZZY-Analysen. Leistungssport, 47, im Druck.Google Scholar
  51. Zinner, J., Utesch, T., & Büsch, D. (2017). Berliner Referenzwerte für den Deutschen Motorik-Test (7 bis 10 Jahre). http://www.berlin-hat-talent.de/wp-content/uploads/2014/12/Zinner_Utesch_Buesch_2017_Berliner-Referenzwerte.pdf

Copyright information

© Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2018

Authors and Affiliations

  1. 1.Institut für SportwissenschaftWestfälische Wilhelms-Universität MünsterMünsterDeutschland
  2. 2.H:G Hochschule für Gesundheit & Sport, Technik & KunstBerlinDeutschland
  3. 3.Fakultät IV – Human- und GesellschaftswissenschaftenCarl von Ossietzky Universität OldenburgOldenburgDeutschland

Personalised recommendations