Durch die stetigen Verbesserungen in der frühen Erkennung und in der Behandlung von Krebserkrankungen hat sich die Gesamtüberlebenszeit in den letzten Jahrzehnten deutlich verlängert [14]. Abhängig von der Diagnose und dem Stadium der Erkrankung haben Patienten mit einer Krebserkrankung inzwischen eine deutlich höhere Lebenserwartung als vor wenigen Jahrzehnten. Somit wird auch immer relevanter, wie Menschen mit der Krankheit leben und welche Spätfolgen sie aufgrund der Krankheit oder der Behandlung erleiden. Zum Beispiel konnte eine Studie des Deutschen Krebsforschungszentrums zeigen, dass (Darm‑)Krebspatienten auch 10 Jahre nach der Erstdiagnose noch mindestens ein tumor- oder therapieassoziiertes Symptom berichten [13]. Informationen zur zu erwartenden Lebensqualität während der Behandlung sind von Patientenseite oft erwünscht, aber werden auch oft zu wenig kommuniziert und in den Konsultationen besprochen [16]. Dabei können genau solche Informationen dabei helfen, Unsicherheit bei den Patienten zu reduzieren und die Bewältigung (Coping) der Krankheit sowie wünschenswertes Gesundheitsverhalten zu fördern [12]. Gerade wenn es um Behandlungsentscheidungen oder die Nachsorge geht, sollten also Informationen zur Lebensqualität in die Abwägungen einbezogen werden, um zur individuell bestmöglichen Entscheidung zu kommen.
Der Goldstandard zur Erfassung der Lebensqualität sind „Patient-Reported Outcomes“
Der Goldstandard zur Erfassung der (gesundheitsbezogenen) Lebensqualität sind sogenannte „Patient-Reported Outcomes“ (PRO). Als PRO werden alle Aussagen zum Gesundheitszustand oder zur Behandlung betrachtet, welche direkt vom Patienten selbst kommen und nicht durch Dritte (beispielsweise Ärzte) interpretiert werden [27]. PRO sind eine von mehreren Möglichkeiten, klinische Ergebnisse oder Veränderungen zu messen (sogenannte „Clinical Outcome Assessments“ [COA]). Sie finden Anwendung in der klinischen Praxis, in klinischen Studien, in der Registerforschung oder können für Health Technology Assessments oder zur Qualitätssicherung verwendet werden.
Üblicherweise werden PRO in Form von standardisierten Fragebögen erhoben, um die Erhebung zu vereinheitlichen und so Vergleiche zwischen Patienten zu ermöglichen. In dieser Form sind PRO eine Datenquelle, die sich für Machine-Learning-Algorithmen eignet: Jede Skala eines Fragebogens, jede Frage oder auch jede einzelne Antwortmöglichkeit kann als individuelle Variable mit potenzieller Vorhersagegüte betrachtet werden. Für traditionelle Prognosemodelle stellt die Vielzahl an möglichen Prädiktoren, die aus PRO gewonnen werden können, an möglichen Kombinations- und (nichtlinearen) Interaktionsmöglichkeiten ein Problem dar. Für Machine-Learning-Modelle wiederum ist diese Datenvielfalt ein potenzieller Vorteil. In solchen Szenarien ermöglicht Machine Learning, speziell auch Deep Learning, Prognosemodelle, die im Vergleich zu traditioneller Statistik eine deutlich erhöhte Vorhersagegüte und Genauigkeit besitzen [6, 28].
Die Informationen, die PRO über den Gesundheitszustand der Patienten liefern, können eine wichtige Ergänzung zu „harten“ klinischen Daten sein. Der naheliegende Anwendungsbereich von PRO ist zunächst die Nutzung von PRO zur Vorhersage des Gesamtüberlebens von Patienten. Es gibt durchaus Studien die zeigen, dass PRO, zusätzlich zu medizinischen Parametern, inkrementelle Varianz zur Vorhersage vom Gesamtüberleben aufklären (für einen Überblick siehe Efficace et al. [9]). Allerdings liegen noch keine vergleichbaren Studien mit Machine-Learning-Verfahren vor. Der zweite wichtige potenzielle Anwendungsbereich von Machine-Learning-Verfahren liegt in der Prognose von zu erwartender Lebensqualität. Individuelle Prognosen der Lebensqualität während und nach der Behandlung können eine wichtige Komponente der gemeinsamen Entscheidungsfindung und Patientenkompetenz sein.
PRO und Machine Learning: bislang nur wenig Forschung
Entgegen der zuvor genannten Vorteile finden sich in der onkologischen Literatur bisher kaum Studien, welche PRO in Machine-Learning-Modelle integrieren. Exemplarisch seien zwei Studien genannt, die das Potenzial von PRO und Machine Learning in der Onkologie aufzeigen: In einer Studie von Arkin et al. [2] wurde mittels neuronaler Netze das Gesamtüberleben von palliativ behandelten onkologischen Patienten vorhergesagt. Als Prädiktoren für das Überleben verwendeten die Autoren neben klinischen Variablen auch ein PRO-Instrument, die Edmonton Symptom Assessment Scale (ESAS). In ihrer Studie konnten sie nicht nur zeigen, dass das neuronale Netz eine höhere Vorhersagegüte aufwies als eine vergleichbare logistische Regression, sondern auch, dass die ESAS die am dritthöchsten korrelierte Variable (r = 0,32) mit dem Überleben der Patienten war.
Eine andere Herangehensweise wurde in der Studie von Santos et al. [22] gewählt. In ihrer Studie untersuchten die Autoren, wie Machine Learning genutzt werden kann, um komplexe Entscheidungen in der Intensivmedizin zu unterstützen. Sie erhoben Lebensqualitätsdaten von n = 777 onkologischen Patienten, bei denen zur Aufnahme zusätzlich 37 klinische Variablen ausgehoben wurden. Mithilfe von unterschiedlichen Machine-Learning-Algorithmen wurde das sogenannte lebensqualitätskorrigierte Überleben (sogenannte Quality-Adjusted Life Years, d. h., die Überlebenszeit wird in Bezug zur zu erwartenden Lebensqualität gesetzt) über einen Zeitraum von 30 Tagen vorhergesagt. Die von den Autoren entwickelten Modelle treffen also nicht nur eine Aussage darüber, wie lange die Patienten überleben, sondern beziehen auch ein, wie es ihnen nach der Intensivbehandlung geht und wie vorteilhaft oder unvorteilhaft Patienten die Lebensqualität bewerten.
Die beiden Studien zeigen, dass PROs sowohl als Prädiktor (PROs zur Vorhersage von anderen Variablen), aber auch als Kriterium (PROs werden durch andere Variablen vorhergesagt) im Kontext des Machine Learning verwendet werden können. Allerdings finden sich in der Literatur nur vereinzelt Studien, welche Machine-Learning-Verfahren mit PRO-Daten kombinieren. Auch in einem systematischen Review zu Machine-Learning-Ansätzen in der palliativen Behandlung von Patienten, einem Feld, in welchem PRO eigentlich eine bedeutende Rolle spielen sollten, wurden keine Studien gefunden, die PRO einbeziehen [24].
Warum werden PRO so selten in Machine-Learning-Ansätze integriert?
Sowohl Machine Learning als auch PRO sind noch vergleichsweise neue Forschungsfelder, deren Schnittmenge noch nicht allzu groß ist. Um die Frage zu beantworten, warum PRO noch selten in Machine-Learning-Ansätze integriert werden, ist ein Blick auf die Natur der Daten und Datensätze hilfreich. Ein erstes Problem ist, dass die strukturierte Erhebung von PRO-Daten nur selten in der klinischen Routine erfolgt. Im Vergleich zu anderen klinischen Daten, beispielsweise CT-Bildern, werden PRO kaum oder nur an verhältnismäßig wenigen Zentren im Verlauf der Behandlung erhoben. Während also Studien mit CT-Bildern aus der Routineversorgung heraus möglich sind, müssen PRO-Daten meist erst zusätzlich erhoben werden – zum Beispiel in klinischen Studien. Daraus resultiert, dass PRO-Datensätze oft vergleichsweise klein sind, was die Anwendungsmöglichkeiten und die Vorteile von Machine Learning drastisch reduziert.
Der Flaschenhals für die Nutzung von PRO-Daten sind die Menge der Daten und ihre Qualität
Ein weiteres Problem ist, dass es viele unterschiedliche PRO-Instrumente gibt, was die Harmonisierung der Daten erschwert. Lebensqualitätsdaten von Patienten, die mit unterschiedlichen Fragebögen erhoben wurden, sind nur sehr begrenzt vergleichbar, da die Fragebögen Lebensqualität unterschiedlich konzeptualisieren und operationalisieren. Der Flaschenhals zur Anwendung von Machine Learning für PRO-Daten in der Onkologie sind also die Menge der Daten und ihre Qualität bzw. ihre Harmonisierung.
Welche Entwicklungen sind nötig, damit Machine Learning für die PRO-Forschung genutzt werden kann?
Um Machine-Learning-Verfahren im Kontext der PRO-Forschung zu nutzen, ist die umfassende und standardisierte Erhebung von PRO-Daten nötig. Entsprechende Projekte, welche PRO in der breiten onkologischen Praxis implementieren, existieren beispielsweise in Kanada (Ontario Cancer Registry [4, 5]). Dort füllen Patienten bei jedem Besuch in mehreren teilnehmenden onkologischen Zentren einen kurzen Symptomscreeningfragebogen aus, welcher auch zu Forschungszwecken verwendet werden darf. So können Analysen mit 100.000 bis 200.000 Patienten mit PRO und klinischen Daten gerechnet werden [3, 4]. Bislang sind jedoch noch keine Machine-Learning-Algorithmen in diesem oder vergleichbaren PRO-Datensätzen angewendet worden.
Analysen in dieser oder noch größerer Größenordnung sind vielversprechender, da mit steigender Datenmenge auch die Vorhersagegüte der Machine-Learning-Modelle steigt. Allerdings geht auch ein erheblicher Arbeitsaufwand mit der Sammlung und Harmonisierung von PRO-Daten einher. Die Datensammlung wird erschwert, wenn PRO-Daten unstrukturiert sind, viele Datenpunkte fehlen oder PRO aus unterschiedlichen Klinikinformationssystemen extrahiert werden müssen. Im Hinblick darauf sind Initiativen zu begrüßen, welche die Erfassung von PRO-Daten als klinische Endpunkte oder ihre Erfassung in der klinischen Praxis harmonisieren.