Unter dem Begriff „internal load“ werden im Rahmen eines Monitorings der Beanspruchung in Training und Wettkampf sowohl objektive Parameter, z. B. die Herzfrequenz, als auch subjektive Parameter, z. B. die Selbsteinschätzung der wahrgenommenen Anstrengung verstanden. Bei der Messung dieser Selbsteinschätzung werden psychische und physische Beanspruchungen in einer subjektiven Bewertung zusammengefasst (Borg, 1982; Chen, Fan, & Moe, 2002; Enoka & Duchateau, 2016; Impellizzeri, Marcora, & Coutts, 2019; Morgan, 1994). Die Selbsteinschätzung kann auf dieser theoretischen Grundlage alters- und geschlechtsunabhängig, zuverlässig und valide bestimmt werden (Garcin, Fleury, Mille-Hamard, & Billat, 2005; Lamb, Parfitt, & Eston, 2017; Robertson et al., 2000). Als Erhebungsinstrumente existieren einerseits differenzierte Skalen mit mehreren Items (Hitzschke et al., 2016; Hitzschke et al., 2015; Kellmann, Kölling, & Hitzschke, 2016; Kölling et al., 2015; Kölling & Kellmann, 2020) und andererseits Ein-Item-Skalen, z. B. die sogenannte Borg- oder RPE-Skala (Rating of Perceived Exertion Scale, Borg, 1998). Aufgrund ihrer Einfachheit und Nutzerfreundlichkeit wird für die Erfassung der subjektiven Beanspruchungswahrnehmung in Training und Wettkampf bevorzugt die Category Ratio Scale (CR10-Skala) oder eine daran angelehnte Single-Item-Skala eingesetzt (Borg, 1998; Foster et al., 2021; Gaudino et al., 2015; Haddad, Stylianides, Djaoui, Dellal, & Chamari, 2017), die ursprünglich aus der an der Herzfrequenz orientierten RPE-Skala abgeleitet und validiert wurde (Tab. 1, Borg, 1998; Löllgen, 2004). Die CR10-Skala stellt eine nicht lineare, leicht positiv beschleunigte Funktion bezogen auf die Beanspruchung dar (Eston & Parfitt, 2006; Faulkner & Eston, 2008), die in der von Borg autorisierten deutschen Fassung mit „Anstrengungsempfinden“ übersetzt wird (Borg, 2004; Löllgen, 2004). Pageaux (2016) und Fisher und Smith (2012) sowie Fisher, Steele, Bruce-Low und Smith (2011) haben aus unterschiedlichen Perspektiven darauf hingewiesen, dass die Begriffe „exertion“ und „intensity“ synonym zu „effort“ (Anstrengung) zu verstehen sind. Die Beanspruchungsintensität kann daher über den Anstrengungsgrad erfasst werden (Carton & Rhodes, 1985; Lamb et al., 2008/2013; Noble & Robertson, 1996). Darüber hinaus kann der effektive Workload, d. h. das Produkt aus Anstrengungsgrad und Dauer einer Trainingseinheit als Session-RPE für ein systematisches Monitoring eingesetzt werden (Foster et al., 2021; Foster et al., 2001; Foster, Rodriguez-Marroyo, & de Koning, 2017; Gabbett, 2020; Gomes et al., 2020; Haddad, Padulo, & Chamari, 2014; Haddad et al., 2017; Robertson et al., 2000; Scott, Duthie, Thornton, & Dascombe, 2016).

Tab. 1 Stufenbezeichnungen der Children’s Effort Rating Table (CERT, Original und deutsche Übersetzung) und der Anstrengungsskala Sport (ASS) sowie die Zuordnungswahrscheinlichkeiten, Mittelwerte und Standardabweichungen bei der digitalen Sortieraufgabe für die einzelnen Stufen

Die CR10-Skala von Borg (1982), die im Original keine zehn-, sondern eine dreizehnstufige Skala mit Zwischenschritten darstellt, wurde mit der Intention entwickelt, dass „…numbers should be anchored by verbal expressions that are simple and understandable by most people. The expressions should in turn be placed in the correct position on a ratio scale, where the expressions belong according to their quantitative meaning“ (S. 380). Des Weiteren wies Borg darauf hin, dass unabhängig von der Belastungsart die anstrengendste Übung mit „very, very strong/heavy“ und das Gegenteil mit „very, very weak/light“ bezeichnet werden könnte. Es erscheint daher entgegen der ursprünglichen Zielstellung nicht verwunderlich, dass zahlreiche Versionen der CR10-Skala mit unterschiedlichen und überwiegend unvollständigen Stufenbezeichnungen existieren (Halperin & Emanuel, 2020). Auch wenn semantische Unterschiede bei den verwendeten unterschiedlichen Stufenbezeichnungen, z. B. „hard, heavy, strong“ anzunehmen sind, erscheint eine exakte Übersetzung und Diskussion der Stufenbezeichnungen nicht zielführend, da die Einschätzung der Anstrengung maßgeblich über den Kontext, d. h. über die konkrete Fragestellung und damit den situativen Bedeutungsgehalt bestimmt wird (Äquivalenzkriterium, Behr, Braun, & Dorer, 2015). Dennoch ist sprachliche bzw. begriffliche Klarheit notwendig, um Überschneidungen mit verwandten Konstrukten, z. B. Schmerz („pain“), Unbehagen („discomfort“), Kraft („force“) oder Ermüdung („fatigue“) zu vermeiden (Abbiss, Peiffer, Meeusen, & Skorski, 2015; Pageaux, 2016). Auch wenn der Bedeutungsgehalt maßgeblich über den Kontext bestimmt wird und die unterschiedlichen CR10-Skalen im Monitoring bereits eingesetzt werden (können), erscheint die Entwicklung einer deutschsprachigen Skala mit vollständigen Stufenbezeichnungen sowie semantischer Klarheit unter Berücksichtigung der Zielsetzung von Borg (1982) dringend geboten, um Anstrengung zuverlässig und valide messen zu können.

Entwicklung einer Anstrengungsskala

In Anlehnung an die inhaltlichen Überlegungen von Borg (1982) sowie das paradigmatische, methodologische Vorgehen von Jonkisz, Moosbrugger, und Brandt (2012) soll das Konstrukt Anstrengung, d. h. die individuell wahrgenommene Beanspruchung bei einer sportlichen Belastung erhoben bzw. gemessen werden. Dafür wurde eine unipolare diskret gestufte Ein-Item-Ratingskala in Anlehnung an die CR10-Skala für Sportlerinnen und Sportler entwickelt. Im ersten Schritt wurde von den Autoren eine rationale Konstruktionsstrategie in Anlehnung an Borg (1982) und Williams et al. (1994) gewählt. Der Aufgabenstamm lautet: „Wie anstrengend ist die Aufgabe (resp. Trainingseinheit) gewesen?“. Das Adjektiv anstrengend wird komparativ von überhaupt nicht bis so anstrengend, dass ich abbrechen muss durchdekliniert (Borg, 2004). Für die vorläufige verbale Ratingskala sowie die numerische Ratingskala von eins bis zehn wurde eine exhaustive Zuordnungsaufgabe erstellt, um die Eindeutigkeit der Item-Inhalte bzw. Bezeichnungen der Skalenstufen empirisch prüfen zu können. Im Rahmen einer Pilotstudie mit fünf Sportwissenschaftlerinnen und 15 Sportwissenschaftlern (Alter: 25–55 Jahre) sowie zehn jugendlichen Kaderathletinnen und 15 Kaderathleten (Alter: 16–18 Jahre) wurde die Zuordnungsaufgabe mit einer analogen Sortieraufgabe in einem individuellen Setting geprüft (Flick, 2002). Die Aufgabe bestand darin, zehn ungeordnet und gleichzeitig präsentierte Karteikarten (DIN A7, weiße Karten mit schwarzer Schrift) mit den Abstufungsbezeichnungen von überhaupt nicht anstrengend bis so anstrengend, dass ich abbrechen muss in Relation zu einer ansteigenden Beanspruchung anzuordnen. Zur Orientierung für eine ansteigende Beanspruchung bzw. aufsteigende Skala wurde die Stufenbezeichnung Ruhe als Ausgangsreferenz vorgegeben (Comyns & Flanagan, 2013). Die Ergebnisse verdeutlichen, dass sowohl die Sportwissenschaftlerinnen und -wissenschaftler als auch die jugendlichen Kaderathletinnen und -athleten bei der Sortieraufgabe eine fast perfekt übereinstimmende Reihenfolge der verbalen und numerischen Ratingskala erreichten (Kaderathlet*innen ICC[2,1] = 0,99; 95 % KI 0,97–0,99; Sportwissenschaftler*innen ICC[2,1] = 99, 95 % KI 0,98–0,99), was zunächst als systematisch differenzierende, altersunabhängige und interindividuell vergleichbare Anstrengungseinschätzung interpretiert werden kann.

Evaluation

Für die Evaluation bzw. Item-Analyse wurde die vorläufige Testversion der Anstrengungsskala (ASS, Abb. 1) sowie die Children’s Effort Rating TableFootnote 1 (CERT, Williams et al., 1994), die sich als eine der wenigen kontextbezogenen Skalen ebenfalls durch vollständige Stufenbezeichnungen auszeichnet, in einer anonymen Online-Umfrage mit sporttreibenden Erwachsenen im Alter von 19–40 Jahren (M = 24,2, SD = 4,1) geprüft. An der Studie nahmen N = 244 Personen teil, von denen n = 203 (w = 109, m = 94) vollständige Datensätze berücksichtigt werden konnten. Die digitale Sortieraufgabe bestand darin, die gleichzeitig, aber ungeordnet und randomisiert präsentierten verbalen Stufenbezeichnungen einer aufsteigenden Skala von 1–10 mit der Funktion Drag-and-Drop einzeln zu zuordnen. Beide Skalen wurden in randomisierter und ausbalancierter Reihenfolge präsentiert und von den Personen nacheinander bearbeitet.

Abb. 1
figure 1

Anstrengungsskala Sport (ASS)

Für die Bestimmung des Schwierigkeitsindex ergab eine korrekte Zuordnung den Wert 0 und eine fehlerhafte Zuordnung den Wert 1. Die Zuordnungswahrscheinlichkeit bzw. Item-Schwierigkeit für die einzelnen Stufen liegt für die ASS im Wertebereich zwischen 82,8 ≤ P ≤ 93,1 und für die CERT im Wertebereich zwischen 47,8 ≤ P ≤ 99,5 (Tab. 1). Während bei der ASS die höchste Zuordnungswahrscheinlichkeit bei der Stufenbezeichnung „so anstrengend, dass ich abbrechen musste“ (P = 93,1) und die geringste bei der Stufe „mäßig anstrengend“ (P = 82,8) zu konstatieren ist, erweist sich bei der CERT die höchste Zuordnungswahrscheinlichkeit bei der Stufe „so hart, dass ich aufhören musste“ (P = 99,5) und die geringste bei der Stufe „hart“ (P = 47,8). Zusammenfassend erweisen sich die Zuordnungswahrscheinlichkeiten bzw. Item-Schwierigkeiten für die ASS konsistenter bzw. einfacher als bei der CERT.

CR10-Skalen sind jedoch als Verhältnisskalen konzipiert, sodass neben einem definierten Nullpunkt Äquidistanz zwischen den Skalenpunkten bzw. Stufenbezeichnungen gefordert sind. Die Forderung der Äquidistanzannahme wurde in Anlehnung an die Modelle der Item-Response-Theorie (IRT) geprüft. Hierfür wurden die Zuordnungen angelehnt an „item characteristic curves“ zum einen in Wahrscheinlichkeitsfunktionen für jede Stufe überführt und zum anderen die Schwellenabstände über die Mittelwertsdifferenzen zwischen den einzelnen Stufen berechnet. Zusammenfassend kann die Äquidistanz für die ASS aufgrund der gleichmäßigen und geordneten Wahrscheinlichkeitsverteilungen (Abb. 2) der regelmäßigen Schwellenabstände (0,85–1,15; Tab. 1) angenommen werden, wohingegen eine Äquidistanz für die CERT aufgrund der nicht durchgehend geordneten und ungleichmäßigen Wahrscheinlichkeitsverteilungen sowie der deutlich divergierenden Schwellenabstände (−0,10–1,87) nicht gegeben scheint.

Abb. 2
figure 2

Wahrscheinlichkeitsfunktionen für die einzelnen Stufen der Children’s Effort Rating Table (CERT, a) sowie der Anstrengungsskala Sport (ASS, b)

Forschungsstand und weiterführende Überlegungen

Single-Item-Skalen erlauben eine ökonomische und effiziente Messung von Merkmalen, bei denen Item-Rohwerte mit den Skalenwerten identisch sind, sodass die Objektivität als gegeben angesehen werden kann (Lienert & Raatz, 1994). Die Anstrengungsskala Sport (ASS) stellt zum jetzigen Zeitpunkt lege artis eine Single-Item-Skala zur subjektiven Anstrengungseinschätzung dar, die durch die systematische Verwendung des Adjektivs „anstrengend“ auf jeder Stufe zum einen Überschneidungen mit ähnlichen Skalen, z. B. Ermüdung, Unwohlsein, Schmerz usw. (Halperin & Emanuel, 2020; Micklewright, St Clair Gibson, Gladwell, & Al Salman, 2017; Pageaux, 2016) vermeidet und zum anderen neben interindividuellen Unterschieden auch intraindividuelle Veränderungen und Effekte zuverlässig abbilden kann (Pageaux, 2016).

Der Einsatz der ASS erscheint bei sporttreibenden Erwachsenen, aber auch bei Sportanfängerinnen und -anfängern aufgrund der bisherigen Datenlage gerechtfertigt, da wesentliche Erwartungen an empirisch geprüfte, qualitativ hochwertige, standardisierte Kurzskalen erfüllt sind (https://www.gesis.org/kurzskalen-psychologischer-merkmale). Bisher nicht geprüfte Aspekte, z. B. zur divergenten Validität, sowie die Relevanz der ASS im Sinne eines Monitorings für das Erkennen von Übertrainingsmerkmalen und Verletzungsrisiken sind in weiteren Studien zu prüfen (Foster et al., 2021; Gabbett, 2016). Ebenso erscheinen Studien angezeigt, in denen bspw. der Einsatz bei Kindern und Jugendlichen (Eston, Lamb, Bain, Williams, & Williams, 1994; Eston & Parfitt, 2006; Kasai, Parfitt, Tarca, Eston, & Tsiros, 2021; Lamb et al., 2017) geprüft und objektive Beanspruchungsgrößen für weitergehende Vergleiche herangezogen werden können (Borg, 2004; Egan, Winchester, Foster, & McGuigan, 2006; Gomes et al., 2020; Hiscock, Dawson, Donnelly, & Peeling, 2016; Hiscock, Dawson, & Peeling, 2015; Mayo, Iglesias-Soler, & Fernández-Del-Olmo, 2014; Robertson et al., 2003). Des Weiteren wäre zu prüfen, inwieweit eine Farbzuordnung über gleichmäßige Abstufungen der Spektralfarben und der Farbintensität von Weiß (HSL: Farbton: 0, Sättigung: 255, Intensität: 128) über schwach hellblau, moderat hellgrün zu intensiv Rot (HSL: Farbton: 170, Sättigung: 0, Intensität: 255) als kongruent und unterstützend wahrgenommen wird („mode congruence“, Buckley & Eston, 2000; Serafim et al., 2014).

Unter der Voraussetzung, dass (1) eine eindeutige Instruktion – z. B. „Wie anstrengend ist die Aufgabe (resp. Trainingseinheit) gewesen?“ – verwendet wird, dass (2) eine Abstimmungs- bzw. Übungsphase für die Verwendung der Skala berücksichtigt wird und dass (3) unmittelbar nach einer Belastung, d. h. innerhalb von maximal 30 min nach dem Training oder des Wettkampfs, die Beanspruchung bspw. über eine App erfasst werden kann (Foster et al., 2021), stellt die Anstrengungsskala Sport (ASS) eine zuverlässige und sprachlich eindeutige Single-Item-Skala dar, die mehr Systematik in diesen wichtigen Bereich der Leistungssteuerung und des Monitorings bringen kann. Die Entwicklung aufgaben- bzw. kontextspezifischer Ankerbeispiele, insbesondere für den mittleren Anstrengungsbereich, sollte perspektivisch alters- und geschlechtsspezifisch erfolgen, um u. a. Orientierungen für spezifische Trainingseffekte geben zu können (Borg, 2004; Lamb et al., 2017).