Die standardisierte Erhebung der Mobilität ist ein Kernelement geriatrischen Assessments. In Kliniken und Pflegeheimen ist der Anteil an Personen, die den Timed-up-and-go(TUG)-Test [11] nicht bewältigen, so hoch, dass ein alternativer Performance-Test zur Verfügung stehen sollte. Die Lübecker Skala der Basis-Mobilität (LSBM) fokussiert auf diese Personengruppe. Ziel der Studie war die Überprüfung der Validität, Reliabilität und Änderungssensitivität.

Im geriatrischen Assessment ist die Notwendigkeit, unterschiedliche Schweregrade abzubilden, ein Grund dafür, über mehrere Instrumente pro Dimension zu verfügen. Einige weisen in leistungsschwachen Zielgruppen hohe Bodeneffekte oder eine geringe Differenzierung auf bzw. führen dort gehäuft zum Testabbruch.

Für die Basis-Mobilität behauptet sich der TUG-Test trotz Zweifeln an der Prädiktion des Sturzrisikos [1]. Jedoch bewältigt bei Aufnahme etwa die Hälfte stationärer geriatrischer Patienten die Aufgabenkombination nicht [5]. Hier wird ein anderer Test benötigt, um sowohl kleine Fortschritte als auch Verschlechterungen der Basis-Mobilität standardisiert abzubilden.

Die S1-Leitlinie „Geriatrisches Assessment der Stufe 2, Living Guideline“ [6] führt als Performance-Tests, die keine Gehfähigkeit voraussetzen, die Esslinger Transfer Skala (ETS) [12] und den De Morton Mobility Index (DEMMI) [2, 10] auf.

Die ETS differenziert nicht im Leistungsbereich oberhalb personellen Hilfebedarfs. Eine klare Unterscheidung der Stufen H2 und H3 ist stationär kaum möglich, eine ausreichende wissenschaftliche Evaluation nicht zu erwarten.

Der De Morton Mobility Index (DEMMI) weist in manchen Studien kaum einen Bodeneffekt auf, jedoch hängt dieser von der Studienpopulation ab. Die Validierungsstudie erfolgte an 106 Krankenhauspatienten ab 65 Jahren (47,3 % Frauen, 1,9 % aus Pflegeheimen, 44,6 % vor Aufnahme ohne Gehhilfsmittel) mit mittlerem Barthel-Index von 82,5. Trøstrup et al. [14] fanden nur bei 2 von 155 stationären Patienten ab 65 Jahren den Wert 0, Hulsbæk et al. [4] dagegen bei 31 % der 222 geriatrischen Patienten 9 Tage nach operativer Versorgung einer Hüftfraktur, woraus die Autoren den Schluss ziehen, der DEMMI eigne sich eher für Patienten mit besser erhaltener Funktionsfähigkeit („higher functional levels“). In der Validierungsstudie der deutschen Übersetzung durch Braun et al. [2] bewältigten am 2. Tag akutstationärer Versorgung 9 von 62 geriatrischen Patienten (14,5 %) keine der Aufgaben. Angaben zu Ausschlusskriterien, der Geschlechtsverteilung und dem Barthel-Index fehlen hier. 11 der 15 Items werden 2‑stufig bewertet, bei diesen gibt es keine Differenzierung zwischen Patienten, die die Aufgabe unter Hilfsmitteleinsatz bewältigen, ungeschulte oder geschulte Hilfe benötigen oder auch dann nicht schaffen. De Morton et al. [9] berechneten die Änderungssensitivität durch Vergleich mit einer 5‑stufigen klinischen Einschätzung an 57 stationären Patienten. Signifikante Unterschiede zwischen dem DEMMI-Score bei Aufnahme und bei Entlassung fanden sich nur in der Subgruppe (n = 35), die sich laut Therapeutenurteil klinisch stark verbessert hatte („much better“). Søndergaard et al. [13] fanden eine moderate Änderungssensitivität des DEMMI, allerdings untersuchten sie 250 Rehabilitanden nach ihrer Krankenhausentlassung, keine akutgeriatrischen stationären Patienten.

Methodik

Für die monozentrische longitudinale Studie wurden nach positivem Votum der Ethikkommission der Universität zu Lübeck (Aktenzeichen 20-356) stationäre Patienten des Krankenhaus Rotes Kreuz Lübeck Geriatriezentrum rekrutiert. Der die Datenerhebung durchführende Physiotherapeut fragte seine behandelnden Kollegen stationsweise an etwa 2 Tagen wöchentlich, welche der innerhalb der letzten 4 Tage aufgenommenen Patienten den TUG-Test nicht bewältigt hatten und die weiteren Einschlusskriterien erfüllen (nichtinfektiöse Patienten ohne Ruhedyspnoe mit ausreichender Fähigkeit zur verbalen Kommunikation). Danach informierte er die prospektiv Teilnehmenden und bat sie um ihre schriftliche Einwilligung.

Lübecker Skala der Basis-Mobilität

Es sollte ein Test für schwer in ihrer Mobilität beeinträchtigte Patienten entwickelt werden, dessen Ergebnisse für Therapie und Pflege unmittelbar relevant sind. Dazu gehört die Überprüfung, inwieweit eine Person in der Lage ist, sich im Bett zu drehen, es zu verlassen und im Zimmer zu gehen. Der Test sollte eine an die Internationale Klassifikation der Funktionsfähigkeit, Behinderung und Gesundheit (ICF) [15] angelehnte Skalierung verwenden, nicht mehr als 10 min und kaum Material erfordern sowie einfach erlernbar sein.

Die in Tab. 1 genannte Skalierung wurde in Abstimmung mit Physiotherapeuten und Pflegefachkräften festgelegt. Zur Visualisierung von Schweregrad (S) 2 wird empfohlen sich vorzustellen, eine gesunde 70-jährige Frau werde vom Patienten spontan um Hilfe gebeten – die Unterstützung sollte ohne Vorinformationen, besondere Körperkräfte oder Techniken möglich sein.

Tab. 1 Skalierung der ICF und korrespondierende Schweregrade der LSBM

Für das Erkennen von Therapiebedarf und Monitoring des Verlaufs ist die Item-Ebene entscheidend. Dem Wunsch nach Übermittlung eines Gesamtwertes für die Basis-Mobilität wird dadurch Rechnung getragen, dass für jedes der 7 Items dem vorliegenden Schweregrad der entsprechende Punktwert zugeordnet wird (S0–S4 entspricht 0 bis 4 Punkten) und die Punktwerte addiert werden (LSBM-Score 0–28, Angabe z. B. 19/28 = Einschränkung der Basis-Mobilität 68%).

Tab. 2 zeigt die Aufgabenstellung und Bewertung anhand eines konkreten Fallbeispiels. Die Liegefläche sollte eben sein; ein Kopfkissen ist erlaubt. Gelingt das selbstständige Drehen dem Patienten nur unter Festhalten z. B. am Bettgitter, so stellt dies eine Kompensation dar (S1). Obwohl der physiologische Zeitbedarf für die 5 Transfers unterschiedlich ist, wurde das Limit für alle Aufgaben auf 60 s festgelegt, um den Lernaufwand zu minimieren. Das Halten der freien Sitzposition entsprechend S0 (Aufgabe C) kann am einfachsten bewertet werden, wenn der Patient die Arme verschränkt.

Tab. 2 Fallbeispiel für die Aufgaben und Bewertung gemäß LSBM

Die Inhaltsvalidität ist bereits durch die Verwendung von Komponenten des TUG-Tests und DEMMI gegeben, sowie dadurch, dass die Items „einen Ausschnitt aus dem Verhaltensbereich darstellen, über den eine Aussage getroffen werden soll“ [8]. Es kann eine beliebige Reihenfolge gewählt werden, bei im Bett befindlichen Patienten bietet sich aber die alphabetische Abfolge an. Ein gesunder Mensch könnte die gesamte Performance in 3 min durchlaufen, in der Zielgruppe ist mit etwa 7 min sowie 3 für die Vorbereitung und Dokumentation zu rechnen. Die Praktikabilität bestätigte sich im Einsatz der LSBM in den Präventionsprojekten POLKA [7] und PfleBeO in Pflegeeinrichtungen, inzwischen auch in der Akutgeriatrie. In den Literaturangaben ist ein Hinweis auf online verfügbare Schulungsvideos enthalten [3].

Datenerhebung und Statistik

Daten zu Alter, Geschlecht, Barthel-Index, die Mobilität beeinflussenden Erkrankungen und dem kognitiven Status wurden der elektronischen Patientenakte entnommen. Die Kognition wurde für Berechnungen, basierend auf den im Arztbrief aufgeführten Diagnosen und Befunden (Testergebnisse, klinische Beobachtungen), von einem für die LSBM verblindeten Arzt festgelegt auf „kein Hinweis auf Störung der Kognition“: 0, „(Verdacht auf) mindestens leichte kognitive Störung“: 1 und „deutliche Störung der Kognition“: 2. Für die konvergente Validität der LSBM wurde der DEMMI durchgeführt. In mindestens einwöchigem Abstand wurde eine 2. Erhebung der LSBM vorgenommen, am gleichen Tag der aktuell behandelnde verblindete Physiotherapeut gebeten, eine Bewertung der Veränderung der Mobilität unter Therapie vorzunehmen, wobei dem Urteil für Berechnungen die Werte „viel schlechter“: −2, „etwas schlechter“: −1, „unverändert“: 0, „etwas besser“: 1 und „viel besser“: 2 zugeordnet wurden.

Die Datenanalyse erfolgte mit SPSS Version 29 (IBM SPSS Statistics for Windows, Armonk, NY, USA). Die Stichproben wurden mit Mittelwert, Standardabweichung und Streuung beschrieben. Das Signifikanzniveau wurde auf α = 0,05 festgelegt. Mittelwerte wurden bei nicht normal verteilten rangskalierten Daten mittels Mann-Whitney-U-Test verglichen, bei normal verteilten Daten mittels t-Test. Korrelationen (z. B. für den Einfluss von Geschlecht, Alter und Kognition auf das Ergebnis der LSBM) wurden nach Spearman berechnet. Für die prädiktive Validität wurden Mittelwertvergleiche mittels t-Test vorgenommen und Korrelationen zwischen LSBM bzw. DEMMI zu t0 und dem Bewältigen des TUG-Tests bei Klinikentlassung berechnet. Für die Änderungssensitivität wurde neben der Effektstärke gemäß Cohens d die Änderung des LSBM-Scores mit dem Urteil der Physiotherapeuten über den klinischen Verlauf verglichen. Eine Faktorenanalyse (Varimax) erfolgte unter Überprüfung des Kaiser-Meyer-Olkin-Kriteriums, der Sphärizität mittels Bartlett-Test sowie des Kaiser-Guttman-Kriteriums zur Analyse der Dimensionalität und Verteilung der Faktorenladungen auf die Items der LSBM.

Ergebnisse

Die Untersuchungen erfolgten zwischen dem 03.09.2020 und dem 03.08.2021. Tragischerweise sind sämtliche Daten der Personen, die noch vor der 2. Untersuchung entlassen worden waren oder aus anderen Gründen nicht daran teilnahmen, verloren gegangen. Tab. 3 beschreibt die Gruppe aller an den korrespondierenden Tagen aufgenommenen Patienten, der Subgruppe von Personen, die den TUG-Test nicht bewältigten (48,0 %), und der Probanden, die für beide Untersuchungszeitpunkte zur Verfügung standen. Der Mittelwertvergleich zwischen den letztgenannten Gruppen zeigt keinen signifikanten Unterschied für die Geschlechtsverteilung und das Alter, jedoch für den Barthel-Index (p = 0,001). Dieser lag bei den Probanden 5,1 Punkte über dem der ganzen Gruppe der Patienten, die den TUG-Test nicht bewältigten, aber 4,6 Punkte unter dem aller aufgenommenen Patienten.

Tab. 3 Deskription des Gesamtkollektivs, der Subgruppe, die den TUG-Test nicht bewältigte, und der Stichprobe

Als die Mobilität limitierende Erkrankungen lagen u. a. 28-mal Frakturen vor, 28-mal zentralnervös bedingte Bewegungsstörungen, 9‑mal Implantationen einer Endoprothese im Bereich unterer Extremitäten (ohne Fraktur), 5‑mal Herzinsuffizienz und 5‑mal Sarkopenie. 29 Probanden (37,7 %) waren kognitiv unauffällig, bei 20 (26,0 %) bestand der Verdacht auf eine mindestens leichte kognitive Störung, und bei 28 (36,4 %) fanden sich deutliche kognitive Defizite.

Ergebnisse der LSBM

Ein Patient (1,3 %) wies bereits bei der ersten Untersuchung (t0) in allen 7 Items den Schweregrad 0 auf, zum Kontrollzeitpunkt (t1) nach im Mittel 9 (7 bis 18) Tagen 2 Patienten (2,6 %). Ein Bodeneffekt wurde bei der LSBM nicht beobachtet, beim DEMMI bei 5 Patienten (6,5 %).

Geschlecht (p = 0,324), Alter (p = 0,214) und Kognition (p = 0,415) korrelierten nicht signifikant mit dem Ergebnis der LSBM.

Tab. 4 weist die Häufigkeitsverteilung der Schweregrade auf die Items, bezogen auf beide Messzeitpunkte, aus.

Tab. 4 Häufigkeitsverteilung der Schweregrade auf Item-Ebene (Anzahl der Patienten) zu t0 und t1

Die Interrater-Reliabilität, überprüft durch simultane Bewertung der Durchführung bei 62 Patienten durch 2 für die Ergebnisse des jeweils anderen verblindete Untersucher, erreichte einen hohen Wert (r = 0,983, p < 0,001). Die Korrelation der LSBM-Scores zu t0 und t1, berechnet auf der Basis der Untersuchungen an 77 Patienten, betrug 0,836 (p < 0,001) – wegen des im Mittel 9‑tägigen Intervalls ist davon auszugehen, dass die wahre Retest-Reliabilität oberhalb dieses Wertes liegt. Die interne Konsistenz lag mit Cronbachs α 0,876 ebenfalls hoch.

In der Hauptkomponenten-Analyse fanden sich 2 Faktoren mit Eigenwert über 1, die kumulativ 73,7 % der Varianz erklärten (Summen der quadrierten Ladungen), der Hauptfaktor 57,9 %, der zweite weitere 15,7 %. Der erste Faktor erreichte in der Komponentenmatrix den höchsten Wert beim Transfer vom Sitz in den Stand und könnte Extension repräsentieren, der zweite überwiegt ausschließlich bei der Drehung von der Rücken- in die Seitenlage und könnte der Rumpfrotation entsprechen.

Für die Korrelation des LSBM-Scores mit der Bewertung der Items „Aufsetzen und Umsetzen“ (−0,547, p < 0,001) und „Aufstehen und Gehen“ (−0,537, p < 0,001) des Barthel-Index sowie des Summenscores (−0,535, p < 0,001) fanden sich moderate bis hohe Werte. Mit −0,880 (p < 0,001) bestand eine hohe Korrelation des LSBM-Scores mit dem DEMMI-Score und Rohwert. Tab. 5 weist für jeden der 77 Patienten den Summenscore der LSBM im Vergleich zu dem des DEMMI aus, wobei die Anzahl des Auftretens der Kombinationen angegeben ist. Zum Beispiel fand sich bei drei Patienten mit Summenscore 0 im DEMMI ein Summenscore von 25 in der LSBM (Einschränkung der Basis-Mobilität 25/28 = 89 %).

Tab. 5 Häufigkeitsverteilung des Auftretens bestimmter Kombinationen von Summenscores für DEMMI (X‑Achse) und LSBM (Y‑Achse) bei insgesamt 77 Patienten

Verlauf der Werte und Änderungssensitivität

Den Verlauf der Werte der LSBM gibt Tab. 6 wieder. Die 25., 50. und 75. Perzentile des LSBM-Scores lagen zu t0 bei 6, 12 und 17, zu t1 bei 3, 8 und 14 Punkten, die Streubreite zu t0 bei 0 bis 25, zu t1 bei 0 bis 22 Punkten. Der LSBM-Score stieg individuell um bis zu 12 Punkte (Verschlechterung) bzw. fiel um bis zu 16 Punkte ab (Verbesserung). Die Mittelwertdifferenz zwischen t0 und t1 war signifikant (p = 0,001, t-Test bei abhängigen Stichproben). Die Effektstärke als Maß für die Änderungssensitivität lag bei einem Cohen’s d von 0,711 (Konfidenzintervall 0,459–0,959). Für die Änderungssensitivität beurteilten außerdem bezüglich der LSBM verblindete Physiotherapeuten die Veränderung der Mobilität von t0 zu t1 bei 77 Patienten. Die Korrelation dieses Urteils mit der Änderung des LSBM-Scores war moderat bis hoch (0,482, p < 0,001). Tab. 7 zeigt die zum Therapeutenurteil korrespondierenden Änderungen des LSBM-Scores. 43 der 45 Patienten, die sich im LSBM-Score um mindestens 2 Punkte verbessert hatten, wurden auch von den sie behandelnden Physiotherapeuten als verbessert eingestuft. Laut Therapeutenurteil hatten sich 3 Patienten verschlechtert und 60 verbessert, gemäß LSBM 6 Patienten (7,8 %) verschlechtert und 54 (70,1 %) verbessert. 31 (40,3 %) konnten den TUG-Test bei Krankenhaus-Entlassung weiterhin nicht bewältigen.

Tab. 6 Verlauf der Werte der LSBM
Tab. 7 Physiotherapeutisches Urteil und korrespondierende Änderung des LSBM-Scores von t0 zu t1

Prädiktive Validität

Für die prädiktive Validität der LSBM und des DEMMI wurden Mittelwertvergleiche der Gruppe, die den TUG-Test bei Entlassung bewältigte (n = 46), und der Gruppe, die dies weiterhin nicht konnte (n = 25), vorgenommen (t-Test). In der Gruppe, die den TUG-Test zuletzt schaffte, lag der Summenscore der LSBM zu t0 bei 9,02 ± 5,19, der des DEMMI bei 6,41 ± 3,47. Der Summenscore der weiterhin „nicht-TUG-Test-fähigen“ Patienten hatte zu t0 gemäß LSBM bei 16,84 ± 5,45 gelegen, gemäß DEMMI bei 2,48 ± 2,37 (p < 0,001 für beide Mittelwertunterschiede und beide Tests). Die Korrelation (Spearman) zwischen Bewältigung des TUG-Test bei Entlassung und Summenscore zu t0 und betrug für die LSBM −0,577 (p = 0,001), für den DEMMI 0,542 (p = 0,001).

Diskussion

Die Studie zeigte eine hohe Korrelation der Ergebnisse von LSBM und DEMMI. Kein Patient erreichte das schlechteste Ergebnis der LSBM (Score 28). Somit konnten Verschlechterungen – anders als beim TUG-Test und DEMMI – stets abgebildet werden. Etwa 40 % der Patienten, die den TUG-Test bei Aufnahme nicht bewältigten, erwarben diese Fähigkeit auch nicht. Dagegen konnte die LSBM bei etwa 70 % eine Verbesserung dokumentieren.

Die Berechnung von Summenscores ist bei rangskalierten Tests angreifbar, jedoch üblich (z. B. DEMMI, Barthel-Index). Mit der ICF vertrauten Nutzern kann das arithmetische Mittel der Schweregrade über alle 7 Items der LSBM einen Gesamteindruck von der Schwere der Einschränkung der Basis-Mobilität des Patienten vermitteln. Für die Therapie entscheidend ist jedoch die Betrachtung der Items.

Praktikabilität und Akzeptanz der Erhebung der Basis-Mobilität mittels LSBM haben sich im Rahmen dieser Studie, in der Aufnahme-Routine des akutgeriatrischen Krankenhauses sowie in den Präventionsprojekten POLKA [7] und PfleBeO in Pflegeeinrichtungen erwiesen, in denen geschultes Personal die Erhebung durchführt. Die Notwendigkeit, sich bei der Bewertung der Mobilität eines Krankenhauspatienten oder Pflegeheimbewohners zwischen den Schweregraden 2 und 3 (ungeschulte/geschulte Hilfe erforderlich) zu entscheiden, richtet das Augenmerk auf die Frage, ob Kontaktpersonen der Anleitung zur Unterstützung der Mobilität bedürfen. Solange ein Patient nur eine Funktionsfähigkeit gemäß S3 erlangt hat, ist er zu instruieren, sich durch Personal bei der Ausübung unterstützen zu lassen, bis ggf. An- und Zugehörige, die diese Hilfe ebenfalls leisten möchten, geschult sind. Der Schweregrad 1 erfasst Defizite im Stadium der Kompensation und zeigt Interventionsbedarf zur Prävention eines Verlusts der Selbstständigkeit auf.

Bei kognitiv stark eingeschränkten Patienten ist der TUG-Test oft nicht valide einsetzbar [6], weil der mehrteilige Ablauf nicht verstanden wird. Die LSBM bietet hier den Vorteil einzeln zu bewertender Teilaufgaben, die oft auch durch bloße Beobachtung bewertet werden können.

Die LSBM wurde primär für den Einsatz bei Personen entwickelt, die die im TUG-Test gestellte Aufgabenkombination nicht bewältigen, in der „TUG-Test-fähigen“ Subpopulation geriatrischer Patienten ist mit einem inakzeptablen Deckeneffekt zu rechnen. Durch Berücksichtigung der Dauer der einzelnen Transfers ließe sich dieser Nachteil bereinigen: Eine Studie zur Timed Luebeck Scale of Basic Mobility (t-LSBM) wird derzeit durchgeführt.

Limitationen

Der Verlust der Daten jener Patienten, die der Studienteilnahme zugestimmt hatten, dann aber nicht für die komplette Datenaufnahme zur Verfügung standen, stellt die bedeutendste Limitation dieser Studie dar. Auch wurde keine Zufallsstichprobe aus sämtlichen Patienten gezogen, sondern der Untersucher vertraute an den ihm möglichen Rekrutierungstagen für das Vorliegen der Einschlusskriterien auf das Urteil der aufnehmenden Physiotherapeuten. Die beschriebene Stichprobe weist jedoch gemäß den in Tab. 1 demonstrierten Daten hinsichtlich Geschlechts- und Altersdurchschnitt keine signifikanten Unterschiede zur Zielgruppe auf; der Barthel-Index liegt, wie zu erwarten, zwischen dem Mittelwert für alle stationären geriatrischen Patienten (einschließlich derer, die den TUG-Test bewältigten) und dem der Gruppe, die die Aufgabenstellung des TUG-Test nicht absolvieren konnte (einschließlich derer, bei denen Ausschlusskriterien wie Ruhedyspnoe vorlagen).

Im Hinblick auf die Retest-Reliabilität wäre ein kürzeres, für die Änderungssensitivität ein längeres Intervall zwischen den beiden Untersuchungszeitpunkten wünschenswert gewesen, eine 3malige Erhebung konnte jedoch nicht realisiert werden. Es muss davon ausgegangen werden, dass die Korrelation für die Retest-Reliabilität bei kleinerem Mess-Intervall noch höher gewesen wäre, die Effektstärke für die Änderungssensitivität bei größerem Intervall.

Eine ungenauere physiotherapeutische Einschätzung des Verlaufs der Basis-Mobilität muss angenommen werden, wenn zwischenzeitlich ein Behandlerwechsel stattgefunden hatte, sowie in Fällen, in denen außerhalb des Bereichs der Basis-Mobilität ein Funktionsgewinn erzielt wurde (z. B. bei der Gehstrecke).

Fazit für die Praxis

  • Die LSBM ist ein valider Performance-Test mit hoher Interrater- und Retest-Reliabilität, interner Konsistenz und Änderungssensitivität.

  • Die LSBM korreliert hoch mit dem DEMMI, beschränkt sich jedoch auf 7 Parameter der Basis-Mobilität und stellt den Schweregrad von Funktionseinschränkungen für diese differenzierter dar.

  • Durch Einsatz der LSBM lassen sich bei Patienten, die den TUG-Test nicht bewältigen, schon kleine Verbesserungen und Verschlechterungen erfassen und standardisiert dokumentieren.

  • Die LSBM ist sowohl für Klinikpatienten als auch in Pflegeeinrichtungen durch geschultes Personal einsetzbar und in 10 min zu erheben.