Verschleißleiden des Kniegelenks — gesundheitsökonomische Bedeutung

Nach Schätzungen der Weltgesundheitsorganisation leiden in den Industrienationen 14,1% aller Männer und 22,8% aller Frauen über 45 Jahren an einer symptomatischen Gonarthrose [19]. Allein in Frankreich führten diese Leiden im Jahr 2003 zu 5 Mio. Arbeitsunfähigkeitstagen und Kosten von 820 Mio. EUR [11].

Die Prävalenz und ökonomische Belastung können in der Bundesrepublik Deutschland derzeit lediglich geschätzt werden. In einer Telefonbefragung des Robert-Koch-Instituts gaben 1557 von 8318 Befragten (18,7%, 95%-Konfidenzintervall=17,9–19,6%) an, unter einer (nicht weiter spezifizierten) Arthrose zu leiden [6]. Präzisere Informationen soll langfristig die derzeit noch rekrutierende Herner Arthrose-Studie (HER-AS) liefern (http://www.versorgungsforschung.nrw.de/content/e67/e106/e334/e331/referenzbox373/object375/ThiemHER-ASPost070605.pdf).

Therapeutische Standards

Nach heutigem biologischem Verständnis verlaufen Verschleißleiden schicksalhaft unidirektional. Ziel der konzertierten Bemühungen von Molekularbiologie und Unfallchirurgie sind die Umkehr oder die Reparatur der erheblichen strukturellen Veränderungen in Knochen, Knorpel und Gelenkinnenhaut durch Tissue Engineering und Gentherapie. Trotz des exponentiellen Zuwachses an Wissen um die molekularen Grundlagen der Arthroseprogression ist regenerative Medizin [2, 13] aber derzeit noch Zukunftsmusik.

Definitive Referenztherapie bleibt die Kniegelenktotalendoprothese (Knie-TEP). Der BQS-Qualitätsreport erfasste im Jahr 2004 110.349 Erstimplantationen in 1016 Kliniken (http://www.bqs-qualitaetsreport.de). International gelten die skandinavischen Endoprothesenregister als wichtigste Informationsquelle über Komplikationen und Standzeiten. Laut norwegischen Überlebenszeitanalysen sind nach 10 Jahren noch 90% aller Primärimplantate intakt (http://www.haukeland.no/nrl/).

Versorgungsrelevante Probleme

Die Arthrose stellt derzeit noch eine Erkrankung dar, die erst im symptomatischen Stadium einer Therapie zugänglich ist — zwischen radiologischer Ausprägung und klinischem Befund klaffen häufig Welten. Neben einer adäquaten medikamentösen Schmerz- und antiinflammatorischen Therapie stellen physikalische Maßnahmen etablierte Behandlungskonzepte dar. Nach der spektakulären Rücknahme der Coxibe bleiben nichtsteroidale Antiphlogistika (NSAI), intraartikuläre Glukokortikoide und Hyaluronsäureformulierungen die wichtigsten, wissenschaftlich gesicherten pharmakologischen Prinzipien, um Beschwerden zu dämpfen und das Intervall bis zum Gelenkersatz zu verlängern [1].

Viele Betroffene verlangen unter hohem Leidensdruck von Anbietern und Kostenträgern auch nicht schulmedizinische oder unkonventionelle Behandlungsmaßnahmen. Das Spektrum angeblich biologisch wirksamer Mittel reicht von Vitaminen und Spurenelementen, Ölen und Salben hin zu dubiosen, teuren Eigenblutformulierungen [15, 20]. Sie gelten als Rezepturarzneimittel und unterliegen nicht den strengen internationalen Auflagen, wie sie an pharmakologisch definierte Substanzen gestellt werden. Vielen dieser komplementären Methoden ist gemein, dass sie sich den geltenden wissenschaftlichen Standards zum Nachweis ihrer Effektivität nicht oder nur eingeschränkt gestellt haben.

Die Prämisse „wer heilt, hat recht“ ist weithin akzeptiert. Tatsächlich sollte jedoch derjenige, der den Eindruck hat, zu heilen, dies auch durch transparente, harte, nachprüfbare Daten belegen können. Ein gutes Beispiel stellt die kürzlich publizierte ART-Studie dar, die einen günstigen, wenn auch nur kurzzeitigen Effekt einer definierten Akupunktur auf alle Dimensionen des Western Ontario and McMasters Universities Osteoarthritis Index (WOMAC) im Vergleich zu einer Scheinakupunktur bei Gonarthrose nachweisen konnte [18].

Die Messlatte für alternative Konzepte hat sich dramatisch erhöht, da

  • in einer aktuellen quantitativen Analyse gezeigt werden konnte, dass ein weit verbreitetes Prinzip wie die Homöopathie nicht besser als Plazebo wirkt [14],

  • eine randomisierte Studie hinsichtlich patientenzentrierter Endpunkte die Gleichwertigkeit eines arthroskopischen Débridements zu einem Scheineingriff (!) nahe legt [8],

  • derzeit selbst die klinische Bedeutung eines Plazeboeffekts angezweifelt wird [5].

Bewertungsmaßstäbe

Anbieter, Konsumenten und Kostenträger von Gesundheitsleistungen sollten schulmedizinische und nicht schulmedizinische Behandlungen den folgenden Prüfungen unterziehen:

  1. 1.

    Ist die Maßnahme spezifisch? Wurde sie für die Erkennung oder Behandlung eines engen Spektrums von Erkrankungen oder Verletzungen entwickelt oder wird ein unglaubwürdig großer Katalog von mit der Intervention zu beeinflussenden Gesundheitsstörungen vorgeschlagen („magic bullet“)?

  2. 2.

    Ist das vorgeschlagene Prinzip biologisch plausibel? Existieren physiologische und pathophysiologische Kreisläufe oder Mechanismen (z. B. molekulare oder zelluläre Vorgänge, Expressionsprofile, Rezeptorvermittlungen), die einer Intervention zugänglich sind und lässt der postulierte Wirkmechanismus dies überhaupt zu?

  3. 3.

    Existieren labor- oder tierexperimentell erhobene Daten, die die Theorie untermauern?

  4. 4.

    Wurde die klinische Effektivität in einer vergleichenden (im Idealfall randomisierten) Studie gesichert? Entspricht die Vergleichsbehandlung gängigen Therapiestandards?

Dieser Fragekatalog ist chronologisch abzuarbeiten (Deduktionsprinzip — von der Hypothese zur Beobachtung). Es ist irreführend, aus einer klinisch beobachteten Wirksamkeit eine Hypothese über mögliche biologische Grundlagen zu entwickeln (Induktion).

Das klinische Beispiel: Pulsierende SignalTherapie

Elektromagnetische Felder sind ein seit langem propagiertes Behandlungsprinzip für Beschwerden und Erkrankungen des Bewegungsapparats. Experimentell (in vitro: bovine und humane Zellkulturen, in vivo: Meerschweinchen und Hasen) wurden unter Exposition gegenüber pulsierenden elektromagnetischen Feldern (PEMF) verschiedener Frequenzen, Feldstärken und Pulsdauern z. T. inkonsistente Effekte auf Knorpelproliferation, Glykosaminoglykansynthese, Genexpression von Varianten der TGF-β-Familie und Adenosin-A2α-Rezeptoren nachgewiesen[3].

Eine besondere Spielart der PEMF wird von ihrem Entwickler und Protagonisten als „pulsierende Signaltherapie“ (PST) bezeichnet [7]. In ihrer Übersichtsarbeit führten Markoll et al. [7] aus:

„PST is an extension of PEMF therapy, modified to correspond to the body’s own stimulatory energy parameters and designed to stimulate growth and repair of connective tissue ... By delivering modulating pulsed electromagnetic signals in an alternating fashion, PST mimics the signals generated in the body to stimulate chondrocyte activity, without subjecting the affected tissues to any load ... The physiologically optimal ranges epitomize both effectiveness and safety in treatment with PST.“

Außerhalb dieser eher vagen Beschreibung wurden keine Wirkungsmechanismen postuliert. Zudem wurde behauptet:

„Double-blind and other open-label randomized clinical trials conducted in over 100,000 patients globally, including the United States, Canada, France, Italy, and Germany, have confirmed the long-term efficacy and safety of PST.“

Auf der Hersteller-Homepage (http://www.sigmed.de) werden diese Angaben in folgenden Kontext gebracht:

„Die PST-Behandlung ist aufgrund der derzeitigen finanziellen Lage der gesetzlichen Krankenversicherungen im Leistungskatalog der GKV nicht aufgenommen ... Die Behandlung kostet je Therapiestunde zu 60 Minuten 73,72 EUR (nach GOÄ-Ziffer 383a). Je nach Behandlungsregion haben sich 9 (z. B. Knie) oder 12 (z. B. Wirbelsäule) Behandlungen medizinisch bewährt.“ (Anmerkung: hieraus ergeben sich für die Betroffenen Kosten von 663,48 bzw. 884,64 EUR).

Als Indikationsgebiete werden Arthrosen und sonstige Knorpelschäden unterschiedlicher Gelenke, Rückenschmerzen, Pseudarthrosen, Tennis- und Golferellenbogen, Impingementsyndrome, aber auch Weichteilrheumatismus sowie Tinnitus genannt.

Alle diese Aussagen stehen im offensichtlichen Gegensatz zu den Ergebnissen des zusammenfassenden Berichts des Bundesausschusses der Ärzte und Krankenkassen [4]. Hierin heißt es:

„Die aktuelle Analyse und Bewertung ... ergab, dass die Wirksamkeit und medizinische Notwendigkeit der Pulsierenden Signaltherapie bei den angegebenen Indikationen nicht hinreichend belegt ist ... Die zur Pulsierenden Signaltherapie vorliegenden Unterlagen waren so wenig tragfähig, dass auch eine teilweise Anerkennung zumindest bei einigen der benannten Indikationen nicht hätte begründet werden können.“

Qualitative und quantitative Analyse der Literatur

Um die Ursachen für die Diskrepanz zwischen den Aussagen des Herstellers und des Gesundheitstechnologieberichts zu beleuchten und eine faire Bewertung zu erreichen, wurden die vom Hersteller zitierten Originalarbeiten herangezogen. Zudem wurden in PubMed Medline, dem Cochrane Central Register of Controlled Trials, den Datenbanken des Deutschen Instituts für Medizinische Dokumentation und Information (DIMDI) und über Google potenziell relevante weitere Studien identifiziert.

Hierbei stellte sich heraus, dass die in der Übersicht von 2003 als „submitted for publication“ bezeichneten Arbeiten bisher nicht in der Fachpresse veröffentlicht wurden [7]. Als einziger Hinweis zu den Ergebnissen angeblich prospektiver, multizentrischer Studien findet sich lediglich „high statistical significance“, ohne Designaspekte, Ein- und Ausschlusskriterien, Endpunktdefinitionen und analytische Verfahren zu nennen. Daten zu einer Intervention, die nichtinvasiv und angeblich nebenwirkungsfrei zu einer Besserung der Kniegelenkfunktion führt, sollten auch internationale Aufmerksamkeit erregen, wenn sie den harten Kriterien eines verblindeten Peer-Reviews standhalten.

Die angeführte Stichprobengröße von 100.000 Patienten bildet sich in der verfügbaren Literatur nicht ab.

Tatsächlich lassen sich zur Behandlung der Gonarthrose mit dem PST-Verfahren nur 2 RCT (randomisierte Studien) finden, die insgesamt 126 Patienten einschlossen [10, 17]. Rechnet man 3 weitere RCT zur PEMF hinzu, wurden der wissenschaftlichen Gemeinschaft bisher klinisch-experimentelle Daten von 310 Patienten aus einem Zeitraum von über 10 Jahren vorgelegt [9, 11, 16].

Am häufigsten zitiert wird die von Trock et al. [17] 1994 veröffentlichte randomisierte Studie, in der die Wirksamkeit von PST auf patientenzentrierte Endpunkte [Schmerz, „activities of daily living“ (ADL)] bei nicht klassifizierter Gonarthrose (n=86) und symptomatischer Osteochondrose der HWS (n=81) im Vergleich zu einer Scheinbehandlung (nicht eingeschaltetes Gerät) untersucht wurde. Die Angaben im Methodenteil lassen jedoch an der Maskierung (und damit Aufrechterhaltung) der Randomisierung zweifeln:

„One research associate kept the list of 1,000 random numbers, divided into pairs, the higher of which was to receive treatment and the lower placebo.“

Dies lässt auf eine alternierende Zuteilung schließen, die leicht durchbrochen werden kann. Diese Vermutung wird durch die für eine RCT ungewöhnlichen Differenzen in den Ausgangswerten gestützt: Unter beiden Indikationsstellungen waren die mittleren Schmerzangaben in der Plazebogruppe niedriger als in der Verumgruppe (Knie: −7,2, 95%-Konfidenzintervall=−16,5–2,2, HWS: −9,7, 95%-Konfidenzintervall=−19,2–−0,3). So genannte Bodeneffekte machen es schwieriger, eine messbare Änderung in der Plazebogruppe nachzuweisen. Abbildung 1 zeigt die auf der Basis der publizierten Ergebnisse berechneten Mittelwertdifferenzen zwischen Verum- und Plazeboarm. Nicht publiziert und aus den berichteten Daten auch nicht ableitbar sind die gemessenen Mittelwerte. Tatsächlich findet sich lediglich bei Therapieende und nur in der Gonarthrosepopulation ein marginaler Vorteil für PST gegenüber Plazebo in den Endpunkten Ruheschmerz und Patientenzufriedenheit; 1 Monat nach Behandlungsende ist keine Differenz mehr nachweisbar.

Abb. 1
figure 1

Ergebnisse der Studie von Trock et al. [17] zur Wirksamkeit der PST bei Gonarthrose und zervikaler Spondylarthrose, Mittelwertdifferenzen zwischen aktiver und Scheintherapie; Forest-Plots: Quadrate Punktschätzer, Querbalken zugehörige 95%-Konfidenzintervalle (KI), größere Quadrate Messungen mit geringer Varianz. Schneidet das 95%-Konfidenzintervall den 0-Wert, kann bei einem Fehler 1. Art von 5% nicht ausgeschlossen werden, dass die Ergebnisse lediglich auf Zufall beruhen („Die Differenzen zwischen aktiver und Scheinbehandlung sind nicht statistisch signifikant“), t0 unter Therapie, t1 bei Therapieende, t2 Follow-up (1 Monat nach Therapieabschluss), ADL „activities of daily living „

Der Gutachter des Bundesausschusses der Ärzte und Krankenkassen fällte ein härteres Urteil:

„Allein die Angabe von mehr als 100 (!) einzelnen p-Werten deutet auf erhebliche Defizite der biometrischen Planung und Auswertung der Studien hin. Mit jeder einzelnen Testung steigt die Irrtumswahrscheinlichkeit erheblich an, so dass die ‚statistischen Signifikanzen‘ ohne Erkenntniswert sind. Der bloße Vergleich von p-Werten ist biometrisch unsinnig, da insbesondere die klinische Relevanz der Unterschiede völlig unberücksichtigt bleibt. Sind sog. multiple Testungen trotzdem erforderlich, sind entweder Korrekturprozeduren oder multivariate statistische Methoden anzuwenden. Angesichts dieser unangemessenen Planung, Analyse und Darstellung der Studie kann keine valide Schlussfolgerung hinsichtlich der Wirksamkeit der PST gezogen werden.“

Interessant ist schließlich auch die offensichtliche Diskrepanz zwischen den Behauptungen im Manuskript und den Patienteninformationen, die die Aufrechterhaltung der Verblindung in Frage stellen. Im Artikel von Trock et al. [17] steht:

„The M-T System does not generate any noise, and there is no thermal effect or other sensation while treatment is being received; it thus aids in the maintenance of the double blind nature of the trial.“

Demgegenüber heißt es auf der Homepage:

„Während der Behandlung spüren manche Patienten ein leichtes Kribbeln oder Wärmegefühl. Gelegentlich kann in der Anfangsphase eine Änderung oder Verstärkung der Schmerzsymptomatik auftreten. Dies ist nur vorübergehend und wird als positive Reaktion des Gewebes auf die PST gewertet.“

Das größte RCT zur PST ist so starken Verzerrungen ausgesetzt, dass selbst die vereinzelten, marginalen Vorteile nicht kausal der experimentellen Intervention zugeordnet werden können.

Abbildung 2 zeigt den Patientenfluss in einem weiteren, sehr kleinen RCT zur Wirksamkeit der PST im Vergleich zu Plazebo bei ebenfalls nicht näher klassifizierten Gonarthrosen [10]. Gründe für den Ausschluss von Patienten aus der Nachuntersuchung wurden nicht angegeben. Als Therapieerfolg wurde eine Verbesserung der VAS-Skalen und des Lequesne-Index um 30% gegenüber dem Ausgangswert definiert. Im Gegensatz zur Arbeit von Trock et al. [17] war lediglich 1 Monat nach Therapieende ein Vorteil von PST gegenüber Plazebo festzustellen (Risikodifferenz 36,7%, 95%-Konfidenzintervall=8,8–64,5%).

Abb. 2
figure 2

Nachgestellter Patientenfluss (CONSORT-Flussdiagramm) in der PST-Studie von Perrot et al. [10]; unklar bleibt, wie viele Patienten behandelt, gescreent, eingeschlossen und über die Studie aufgeklärt (!) wurden; Angaben zur Vorlage des Protokolls bei einer Ethikkommission fehlen, Gründe für ein Ausscheiden aus der Studie sind nicht spezifiziert

Ein jüngeres RCT zur PEMF bei erneut nicht klassifizierten Gonarthrosen [11] lässt sich ebenfalls nur schwer interpretieren, da die Autoren auf eine Publikation der wesentlichen Ergebnisse ihrer Studie schlichtweg verzichteten:

„Similarly, the two patients groups did not differ in any of the variables measured in our study to evaluate outcome with treatment (data not shown).“

Die aus den verfügbaren Daten berechneten Resultate sind in Abb. 3 dargestellt; 6 Wochen nach Studienende war kein Unterschied zwischen aktiver und Plazebotherapie nachweisbar. Die Art der grafischen Präsentation lässt die Unterschiede in der globalen WOMAC-Skala allerdings größer erscheinen als bei wissenschaftlich korrekter Darstellungsweise (Abb. 4).

Abb. 3
figure 3

Nachberechnete Ergebnisse der PEMF-Studie von Pipitone u. Scott [11], kein Nachweis von Unterschieden zwischen aktiver und Scheinbehandlung

Abb. 4
figure 4

Durch grafische Abbildung im Originalmanuskript [11] suggerierte größere Differenz zwischen aktiver und Scheinbehandlung, Fehlerbalken von Autoren nicht definiert, rechts korrekte Achsenskalierung

Ein durch alle PST-/PEMF-Studien zu beobachtender Trend im Umgang mit Messergebnissen findet sich auch bei Nicolakis et al. [9]: Im Ergebnisteil wurden zwar durchweg die mittleren Änderungen in den WOMAC-Subskalen und sonstigen Endpunkten dargestellt, nicht aber die zum Zeitpunkt der Erhebung tatsächlich gemessenen Werte. Diese Informationen wurden in dieser Arbeit zumindest teilweise im Abstract mitgeteilt. Der Vergleich hinkt, wenn, wie auch hier, der Ausgangswert im WOMAC-Gesamtscore in der Scheintherapiegruppe niedriger als in der PEMF-Gruppe ist (Abb. 5). In den klinisch relevanten Endpunkten fand sich auch dann kein Unterschied zwischen aktiver und Scheintherapie.

Abb. 5
figure 5

Ergebnisse der PEMF-Studie von Nicolakis et al. [9], signifikanter Effekt in der Änderung des WOMAC-Scores aufgrund des höheren Ausgangswerts im aktiven Therapiearm, Vergleich der tatsächlichen Mittelwerte: kein Vorteil mehr für PEMF im Vergleich zu Plazebo

Es verwundert nicht, dass das valideste RCT zur PEMF bei nach Kellgren-Lawrence klassifizierten Gonarthrosen keinen Vorteil der PEMF gegenüber einer Scheinbehandlung zeigte (Abb. 6) [16].

Abb. 6
figure 6

Ergebnisse der PEMF-Studie von Thamsborg et al. [16], laut valider Daten kein Unterschied zwischen aktiver und Scheinbehandlung

Klinisch-epidemiologisches Fazit

Weder PEMF noch PST zeigten in randomisierten Studien einen konsistenten, längerfristigen, klinisch relevanten oder statistisch signifikanten Vorteil gegenüber einer Scheintherapie.

Es mag dahingestellt sein, ob physikalisch wesentliche Unterschiede zwischen PEMF und PST vorliegen, die zu in vitro messbaren Veränderungen in Surrogatmarkern führen — die klinischen Ergebnisse sind unmissverständlich. Die Methodenbewertung des BÄK [4] ist in jedem Punkt formal und inhaltlich korrekt und wird durch jüngere Studienergebnisse noch gestützt — Patienten mit symptomatischer Gonarthrose profitieren von einer Behandlung mit elektromagnetischen Feldern nicht mehr als scheinbehandelte Kontrollen.

Es existiert somit nicht nur keine Evidenz für die Effektivität der PEMF oder PST — die verfügbaren Daten liefern vielmehr Evidenz gegen die Effektivität der PST. In dieser Situation sind aus ethischer Sicht keine weiteren randomisierten Studien gerechtfertigt, da das Prinzip der therapeutischen Unsicherheit (Equipoise) verletzt wird.

Finanzielle Ressourcen aus öffentlicher Hand sollten eher den Bestrebungen zugute kommen, durch Tissue Engineering und verwandte Verfahren eine Reparation bzw. Regeneration arthrotisch veränderter Gelenke zu erreichen. Im Idealfall sollten die Gelder jedoch in die primäre Prävention (Gewichtsreduktion, körperliche Aktivität, Unfallvermeidung) von Gonarthrosen investiert werden.

Interessenkonflikt

Die Autoren versichern, dass keine Verbindungen mit einer Firma, deren Produkt in dem Artikel genannt ist, oder einer Firma, die ein Konkurrenzprodukt vertreibt, bestehen.