Hinführung zum Thema

Die rapide ansteigenden Datenmengen in der Onkologie bieten viel Potenzial, das Verständnis von Krebs zu vertiefen, stellen aber gleichzeitig neue Herausforderungen an die Datenverarbeitung und Analyse. Machine Learning, ein Bereich der künstlichen Intelligenz, kann dabei helfen, aus großen Datenmengen sinnvolle Informationen zu gewinnen. Aufgrund der steigenden Bedeutung und der zunehmenden Verwendung von Machine Learning in der Onkologie wird das grundlegende Verständnis der Technologie in Zukunft auch für praktizierende Onkologen relevant werden.

Hintergrund

In den letzten zwei Jahrzehnten sind die Datenmengen in der Onkologie rapide angestiegen. Pro Patient werden immer mehr Daten generiert und gespeichert. Im europäischen Innovative-Medicine-Initiative-Projekt OncoTrack wird beispielsweise pro Patient annähernd 1 Terabyte (1000 Gigabyte) an Daten produziert, was in etwa 250.000 Fotos oder 6,5 Mio. Dokumentenseiten entspricht [29]. Die rapide Zunahme gespeicherter Informationen ist eine Entwicklung, welche durch die zunehmende Digitalisierung der Medizin und technologische Fortschritte, speziell auch genetische Analysen wie Next Generation Sequencing, hervorgerufen und verstärkt wurde.

Diese Datenmengen bieten ein hohes Potenzial, um das Wissen über Krebserkrankungen zu vertiefen, stellen aber gleichzeitig neue Anforderungen an die Methoden der Datenverarbeitung und -auswertung. Klassische (inferenz-)statistische Methoden, wie sie traditionell in der Medizin verwendet werden, stoßen mit steigender Daten- und Variablenanzahl schnell an ihre Grenzen. Ein Ansatz, um solche großen Datenmengen zu verarbeiten und darin relevante Variablen und Zusammenhänge zu identifizieren, ist Machine Learning [7], ein Teilbereich der künstlichen Intelligenz. Es gibt unterschiedliche Anwendungsfelder für Machine Learning in der Onkologie. Machine Learning kann beispielsweise eingesetzt werden, um Tumoren auf Bildern (z. B. CT- oder fMRT-Bildern) zu erkennen oder um das Risiko einer Progredienz ausgehend von klinischen Variablen zu beurteilen.

Dieser Artikel soll eine Übersicht zum Thema Machine Learning in der Onkologie bieten. Dazu wird zunächst erklärt, was Machine Learning ist und welche Vorteile es gegenüber anderen statistischen Methoden bietet. Dann werden die unterschiedlichen Anwendungsfelder von Machine Learning in der Onkologie dargestellt und der aktuelle Stand der Forschung diskutiert. Zuletzt wird noch ein Ausblick gegeben, wie Machine Learning im Bereich der Lebensqualitätsforschung in der Onkologie eingesetzt werden kann und welche Schritte und Entwicklungen notwendig sind, um dies zu ermöglichen.

Was sind künstliche Intelligenz, Machine Learning und Deep Learning?

Unter Machine Learning werden Verfahren zusammengefasst, die es einem Computersystem erlauben, Rückschlüsse aus Daten zu ziehen, um so ihre Fähigkeiten in einer spezifischen Aufgabe langfristig zu verbessern. Machine Learning stellt dabei nur einen Teilbereich der künstlichen Intelligenz dar, welche zusätzlich noch Bereiche wie Planung, Problemlösung und logisches Schließen umfasst. Aus den gegebenen Fällen „lernen“ die Verfahren ein Vorhersagemodell für noch nicht bekannte Fälle und versuchen damit, die Problemstellung generell zu „verstehen“. Die Beschaffenheit der Daten ist dabei von besonderer Bedeutung. Allgemein wird beim Lernen zwischen Supervised, Unsupervised und Reinforcement Learning differenziert. Beim Supervised Learning wird jeder Datenpunkt mit einem konkreten erwarteten Vorhersageergebnis assoziiert (z. B. „gutartiger Tumor“). Ziel ist es, im Verlauf des Lernvorgangs eine Funktion zu approximieren, die die Daten auf diese erwarteten Ausgaben abbildet. Im Gegensatz dazu hat das Unsupervised Learning zum Ziel, Muster in den zur Verfügung stehenden Daten zu erkennen, ohne dabei auf eine Rückmeldung oder Zielvorhersage angewiesen zu sein. Beispielsweise können Bilder nach Ähnlichkeit gruppiert werden, wobei hier aber die Bedeutung der einzelnen Gruppen nicht vom Verfahren selbst mitgeliefert wird. Beim Reinforcement Learning wird während des Lernprozesses die Leistung des Algorithmus kontinuierlich durch Belohnungen und Bestrafungen bewertet, um den Lernprozess in die Richtung des erstrebten Verhaltens zu lenken [20].

Aufgrund der bei Machine Learning üblicherweise auftretenden großen Datenmengen werden häufig auch künstliche neuronale Netze eingesetzt, welche sich aus einer hohen Anzahl an Schichten von recht einfachen Neuronen zusammensetzen. Ähnlich wie beim menschlichen Gehirn „feuern“ diese aufgrund ihrer Vernetzung und geben ihr Ergebnis an die verknüpften Neuronen weiter. Dies ermöglicht es den Netzen, komplizierte Zusammenhänge zu erkennen und abzubilden. Verfahren, die auf solchen Netzen basieren, werden generell als Deep Learning bezeichnet und sind somit eine Unterkategorie des Machine Learning [23]. Abb. 1 gibt einen Überblick über die eingeführten Begriffe.

Abb. 1
figure 1

Künstliche Intelligenz, Machine Learning und Deep Learning

Machine Learning kann sowohl zur Inferenz als auch zur Prognose verwendet werden, was dadurch gewisse Überschneidungen mit klassischer Statistik aufweist. Auch einige der in der Statistik verwendeten Verfahren, wie lineare und logistische Regressionen finden in Machine Learning Anwendung. Allerdings unterscheiden sich die beiden Ansätze meist in ihrem Fokus. Statistische Verfahren haben meist zum Ziel, Eigenschaften einer Stichprobe mit einer gewissen Konfidenz auf eine Population zu übertragen. Der Fokus des Machine Learning liegt hingegen auf der Vorhersage und dem Erkennen von Mustern und in Daten. In der Regel werden dabei große Datenmengen verarbeitet, ohne spezielle Annahmen über die Beschaffenheit der Daten zu treffen. Gerade im Deep Learning können aufgrund der hohen Datenmengen und der teils hohen Anzahl an Parametern in den verwendeten Modellen auch komplexe, nicht lineare Zusammenhänge abgebildet werden. Allerdings gehen solche Modelle auch mit einer deutlich geringeren Interpretierbarkeit der gefundenen Ergebnisse einher [7].

Anwendungsbereiche von Machine Learning in der Onkologie

Machine Learning findet bereits in unterschiedlichen Bereichen der Onkologie Anwendung. Gemäß der Prämisse, dass mehr Daten in der Regel auch zu besseren Modellen führen, wird Machine Learning vor allem in Bereichen eingesetzt, die eine große Menge an möglichst standardisierten Daten produzieren. Im Folgenden werden die häufigsten Anwendungsbereiche für Machine Learning in der Onkologie vorgestellt.

Machine Learning zur Diagnosestellung und zum Screening

Die Anwendung von Machine Learning zur Diagnosestellung und zum onkologischen Screening wird klassischerweise vor allem in der Radiologie und Pathologie genutzt. Der Großteil der bisherigen Machine-Learning-Forschung in der Onkologie findet in diesem Bereich statt [8, 21]. Machine Learning wird hier vor allem dazu genutzt, malignes Gewebe über bildgebende Verfahren zu erkennen. Beispielsweise konnten Forscher sogenannte Convolutional Neural Networks (auf Bildverarbeitung spezialisierte neuronale Netze) erfolgreich einsetzen, um Oropharynxkarzinome auf Endoskopieaufnahmen zu erkennen [25]. Die Studie zeigt nicht nur, wie akkurat ein solcher Algorithmus arbeiten kann (alle Karzinome im Validierungsdatensatz wurden korrekt erkannt), sondern auch, wie schnell die Algorithmen arbeiten können. Alle 1912 Bilder individueller Patienten wurden in weniger als 30 s korrekt klassifiziert.

In einer weiteren Studie von Forschern von Google Health wurden neuronale Netze verwendet, um Krebs auf Mammographiebildern zu erkennen – ein Bereich, in welchem es noch immer eine hohe Rate an falsch-positiven Erstdiagnosen gibt [15]. Der Algorithmus zeigte nicht nur eine bessere Erkennungsrate von malignem Gewebe als 6 Radiologen, mit denen er verglichen wurde, sondern auch eine niedrigere Rate an falsch-positiv diagnostizierten Patientinnen.

Insgesamt zeigte sich in einem rezenten systematischen Review, dass Algorithmen im Vergleich zu menschlichen Experten eine ähnlich gute oder sogar bessere Erkennung von Krebs auf Bildern erreichen können [17]. Im Review zeigte sich jedoch auch, dass oft die externale Validierung der Algorithmen fehlt (d. h. Validierung der Daten an einem unabhängigen Datensatz), was die Verallgemeinerbarkeit der Modelle einschränkt.

Machine Learning zur Prognoseerstellung und Risikoeinschätzung

Die klassischerweise in der Onkologie verwendeten prognostischen Indizes verwenden oft nur eine Handvoll medizinischer Faktoren, um eine Prognose zu stellen. Wenn jedoch umfangreichere Daten vorliegen, können diese genutzt werden, um die Vorhersagekraft dieser Indizes zu verbessern. Dazu werden in der Regel möglichst viele klinische Parameter aggregiert und in das Modell einbezogen. Je nach Datenqualität und -menge eignen sich dann unterschiedliche Machine-Learning-Algorithmen.

Elfiky et al. [10] entwickelten ein Machine-Learning-Modell zur Vorhersage des Gesamtüberlebens zum Start der Chemotherapie aus einer Stichprobe von N = 26.946 Patienten, die 51.774 unterschiedliche Chemotherapien begannen. Mithilfe von Entscheidungsbäumen identifizierten sie erfolgreich jene Patienten, die ein besonders hohes Risiko hatten, innerhalb der nächsten 30 Tage zu sterben. So konnten die Autoren jene Patienten identifizieren, die trotz einer sehr schlechten Prognose noch eine (kurative) Chemotherapie erhielten. Die Autoren schlussfolgern, dass Machine-Learning-Algorithmen in der Zukunft verwendet werden könnten, um bei Patienten mit schlechter Prognose eine palliative Behandlung zu empfehlen, um eine unnötige Belastung dieser Patienten zu vermeiden.

In einer anderen Studie konnten Forscher die Überlebenszeit von N = 221 Patienten mit nichtresezierbaren Pankreaskarzinomen mittels Machine-Learning-Algorithmen vorhersagen [26]. Sie verwendeten die Daten von 168 Patienten, um das Modell zu trainieren und validierten es anschließend an Daten von 53 weiteren Patienten. Durch den Vergleich unterschiedlicher Vorhersagemodelle konnten die Autoren zeigen, dass Machine Learning im Vergleich zu traditionellen Verfahren wie der logistischen Regression eine höhere Vorhersagegüte aufwies.

Solche und ähnliche Studien zeigen einerseits die eindrucksvollen Fortschritte, welche sich mit Machine Learning erzielen lassen. Andererseits verdeutlichen sie auch ein generelles Problem: Die meisten entwickelten Modelle sind sehr spezifisch, da sie auf Daten von speziellen Krankheitsbildern oder Patientengruppen beruhen.

Machine Learning zur Vorhersage des Ansprechens auf die Behandlung und zur Unterstützung bei Behandlungsentscheidungen

Obwohl die personalisierte Krebsbehandlung zunehmend an Bedeutung gewinnt, sind die jeweiligen Therapieansätze oft noch nicht individuell auf die Patienten abgestimmt. Mittels Machine Learning können personalisierte Ansätze in der Auswahl oder Anpassung der Therapie verfolgt werden. Agius et al. [1] beschreiben die Entwicklung eines kombinierten Machine-Learning-Modells (das Modell kombiniert 28 separate Algorithmen), mit dem neu diagnostizierte Patienten mit chronischer lymphatischer Leukämie identifiziert werden konnten, welche ein besonders hohes Infektionsrisiko hatten. Bei diesem Krankheitsbild stellen Infektionen die häufigste Todesursache dar. Mit Daten von N = 4149 Patienten erstellten die Forscher ein Modell, welches klinische Parameter und individuelle Risikofaktoren berücksichtigt. Durch die Prognose des individuellen Risikos könnte bei besonders infektionsgefährdeten Patienten die Behandlung früher angesetzt werden. Das Modell kann online eingesehen werden (www.CLL-TIM.org).

Hou et al. entwickelten auf Basis retrospektiver Daten ein Modell, mit welchem sie das Ansprechen der Krebserkrankung auf kombinierte Chemotherapie und Bestrahlung mit sehr hoher Genauigkeit vorhersagen konnten [11]. In anderen Studien wurde Machine Learning auch dazu genutzt, die Dosis der Behandlung zu individualisieren oder unerwünschte Therapieereignisse („adverse events“) zu prognostizieren und diese Informationen in den Behandlungsverlauf einzubeziehen [18, 19].

Das Potenzial von Machine Learning im Kontext der PRO-Forschung

Durch die stetigen Verbesserungen in der frühen Erkennung und in der Behandlung von Krebserkrankungen hat sich die Gesamtüberlebenszeit in den letzten Jahrzehnten deutlich verlängert [14]. Abhängig von der Diagnose und dem Stadium der Erkrankung haben Patienten mit einer Krebserkrankung inzwischen eine deutlich höhere Lebenserwartung als vor wenigen Jahrzehnten. Somit wird auch immer relevanter, wie Menschen mit der Krankheit leben und welche Spätfolgen sie aufgrund der Krankheit oder der Behandlung erleiden. Zum Beispiel konnte eine Studie des Deutschen Krebsforschungszentrums zeigen, dass (Darm‑)Krebspatienten auch 10 Jahre nach der Erstdiagnose noch mindestens ein tumor- oder therapieassoziiertes Symptom berichten [13]. Informationen zur zu erwartenden Lebensqualität während der Behandlung sind von Patientenseite oft erwünscht, aber werden auch oft zu wenig kommuniziert und in den Konsultationen besprochen [16]. Dabei können genau solche Informationen dabei helfen, Unsicherheit bei den Patienten zu reduzieren und die Bewältigung (Coping) der Krankheit sowie wünschenswertes Gesundheitsverhalten zu fördern [12]. Gerade wenn es um Behandlungsentscheidungen oder die Nachsorge geht, sollten also Informationen zur Lebensqualität in die Abwägungen einbezogen werden, um zur individuell bestmöglichen Entscheidung zu kommen.

Der Goldstandard zur Erfassung der Lebensqualität sind „Patient-Reported Outcomes“

Der Goldstandard zur Erfassung der (gesundheitsbezogenen) Lebensqualität sind sogenannte „Patient-Reported Outcomes“ (PRO). Als PRO werden alle Aussagen zum Gesundheitszustand oder zur Behandlung betrachtet, welche direkt vom Patienten selbst kommen und nicht durch Dritte (beispielsweise Ärzte) interpretiert werden [27]. PRO sind eine von mehreren Möglichkeiten, klinische Ergebnisse oder Veränderungen zu messen (sogenannte „Clinical Outcome Assessments“ [COA]). Sie finden Anwendung in der klinischen Praxis, in klinischen Studien, in der Registerforschung oder können für Health Technology Assessments oder zur Qualitätssicherung verwendet werden.

Üblicherweise werden PRO in Form von standardisierten Fragebögen erhoben, um die Erhebung zu vereinheitlichen und so Vergleiche zwischen Patienten zu ermöglichen. In dieser Form sind PRO eine Datenquelle, die sich für Machine-Learning-Algorithmen eignet: Jede Skala eines Fragebogens, jede Frage oder auch jede einzelne Antwortmöglichkeit kann als individuelle Variable mit potenzieller Vorhersagegüte betrachtet werden. Für traditionelle Prognosemodelle stellt die Vielzahl an möglichen Prädiktoren, die aus PRO gewonnen werden können, an möglichen Kombinations- und (nichtlinearen) Interaktionsmöglichkeiten ein Problem dar. Für Machine-Learning-Modelle wiederum ist diese Datenvielfalt ein potenzieller Vorteil. In solchen Szenarien ermöglicht Machine Learning, speziell auch Deep Learning, Prognosemodelle, die im Vergleich zu traditioneller Statistik eine deutlich erhöhte Vorhersagegüte und Genauigkeit besitzen [6, 28].

Die Informationen, die PRO über den Gesundheitszustand der Patienten liefern, können eine wichtige Ergänzung zu „harten“ klinischen Daten sein. Der naheliegende Anwendungsbereich von PRO ist zunächst die Nutzung von PRO zur Vorhersage des Gesamtüberlebens von Patienten. Es gibt durchaus Studien die zeigen, dass PRO, zusätzlich zu medizinischen Parametern, inkrementelle Varianz zur Vorhersage vom Gesamtüberleben aufklären (für einen Überblick siehe Efficace et al. [9]). Allerdings liegen noch keine vergleichbaren Studien mit Machine-Learning-Verfahren vor. Der zweite wichtige potenzielle Anwendungsbereich von Machine-Learning-Verfahren liegt in der Prognose von zu erwartender Lebensqualität. Individuelle Prognosen der Lebensqualität während und nach der Behandlung können eine wichtige Komponente der gemeinsamen Entscheidungsfindung und Patientenkompetenz sein.

PRO und Machine Learning: bislang nur wenig Forschung

Entgegen der zuvor genannten Vorteile finden sich in der onkologischen Literatur bisher kaum Studien, welche PRO in Machine-Learning-Modelle integrieren. Exemplarisch seien zwei Studien genannt, die das Potenzial von PRO und Machine Learning in der Onkologie aufzeigen: In einer Studie von Arkin et al. [2] wurde mittels neuronaler Netze das Gesamtüberleben von palliativ behandelten onkologischen Patienten vorhergesagt. Als Prädiktoren für das Überleben verwendeten die Autoren neben klinischen Variablen auch ein PRO-Instrument, die Edmonton Symptom Assessment Scale (ESAS). In ihrer Studie konnten sie nicht nur zeigen, dass das neuronale Netz eine höhere Vorhersagegüte aufwies als eine vergleichbare logistische Regression, sondern auch, dass die ESAS die am dritthöchsten korrelierte Variable (r = 0,32) mit dem Überleben der Patienten war.

Eine andere Herangehensweise wurde in der Studie von Santos et al. [22] gewählt. In ihrer Studie untersuchten die Autoren, wie Machine Learning genutzt werden kann, um komplexe Entscheidungen in der Intensivmedizin zu unterstützen. Sie erhoben Lebensqualitätsdaten von n = 777 onkologischen Patienten, bei denen zur Aufnahme zusätzlich 37 klinische Variablen ausgehoben wurden. Mithilfe von unterschiedlichen Machine-Learning-Algorithmen wurde das sogenannte lebensqualitätskorrigierte Überleben (sogenannte Quality-Adjusted Life Years, d. h., die Überlebenszeit wird in Bezug zur zu erwartenden Lebensqualität gesetzt) über einen Zeitraum von 30 Tagen vorhergesagt. Die von den Autoren entwickelten Modelle treffen also nicht nur eine Aussage darüber, wie lange die Patienten überleben, sondern beziehen auch ein, wie es ihnen nach der Intensivbehandlung geht und wie vorteilhaft oder unvorteilhaft Patienten die Lebensqualität bewerten.

Die beiden Studien zeigen, dass PROs sowohl als Prädiktor (PROs zur Vorhersage von anderen Variablen), aber auch als Kriterium (PROs werden durch andere Variablen vorhergesagt) im Kontext des Machine Learning verwendet werden können. Allerdings finden sich in der Literatur nur vereinzelt Studien, welche Machine-Learning-Verfahren mit PRO-Daten kombinieren. Auch in einem systematischen Review zu Machine-Learning-Ansätzen in der palliativen Behandlung von Patienten, einem Feld, in welchem PRO eigentlich eine bedeutende Rolle spielen sollten, wurden keine Studien gefunden, die PRO einbeziehen [24].

Warum werden PRO so selten in Machine-Learning-Ansätze integriert?

Sowohl Machine Learning als auch PRO sind noch vergleichsweise neue Forschungsfelder, deren Schnittmenge noch nicht allzu groß ist. Um die Frage zu beantworten, warum PRO noch selten in Machine-Learning-Ansätze integriert werden, ist ein Blick auf die Natur der Daten und Datensätze hilfreich. Ein erstes Problem ist, dass die strukturierte Erhebung von PRO-Daten nur selten in der klinischen Routine erfolgt. Im Vergleich zu anderen klinischen Daten, beispielsweise CT-Bildern, werden PRO kaum oder nur an verhältnismäßig wenigen Zentren im Verlauf der Behandlung erhoben. Während also Studien mit CT-Bildern aus der Routineversorgung heraus möglich sind, müssen PRO-Daten meist erst zusätzlich erhoben werden – zum Beispiel in klinischen Studien. Daraus resultiert, dass PRO-Datensätze oft vergleichsweise klein sind, was die Anwendungsmöglichkeiten und die Vorteile von Machine Learning drastisch reduziert.

Der Flaschenhals für die Nutzung von PRO-Daten sind die Menge der Daten und ihre Qualität

Ein weiteres Problem ist, dass es viele unterschiedliche PRO-Instrumente gibt, was die Harmonisierung der Daten erschwert. Lebensqualitätsdaten von Patienten, die mit unterschiedlichen Fragebögen erhoben wurden, sind nur sehr begrenzt vergleichbar, da die Fragebögen Lebensqualität unterschiedlich konzeptualisieren und operationalisieren. Der Flaschenhals zur Anwendung von Machine Learning für PRO-Daten in der Onkologie sind also die Menge der Daten und ihre Qualität bzw. ihre Harmonisierung.

Welche Entwicklungen sind nötig, damit Machine Learning für die PRO-Forschung genutzt werden kann?

Um Machine-Learning-Verfahren im Kontext der PRO-Forschung zu nutzen, ist die umfassende und standardisierte Erhebung von PRO-Daten nötig. Entsprechende Projekte, welche PRO in der breiten onkologischen Praxis implementieren, existieren beispielsweise in Kanada (Ontario Cancer Registry [4, 5]). Dort füllen Patienten bei jedem Besuch in mehreren teilnehmenden onkologischen Zentren einen kurzen Symptomscreeningfragebogen aus, welcher auch zu Forschungszwecken verwendet werden darf. So können Analysen mit 100.000 bis 200.000 Patienten mit PRO und klinischen Daten gerechnet werden [3, 4]. Bislang sind jedoch noch keine Machine-Learning-Algorithmen in diesem oder vergleichbaren PRO-Datensätzen angewendet worden.

Analysen in dieser oder noch größerer Größenordnung sind vielversprechender, da mit steigender Datenmenge auch die Vorhersagegüte der Machine-Learning-Modelle steigt. Allerdings geht auch ein erheblicher Arbeitsaufwand mit der Sammlung und Harmonisierung von PRO-Daten einher. Die Datensammlung wird erschwert, wenn PRO-Daten unstrukturiert sind, viele Datenpunkte fehlen oder PRO aus unterschiedlichen Klinikinformationssystemen extrahiert werden müssen. Im Hinblick darauf sind Initiativen zu begrüßen, welche die Erfassung von PRO-Daten als klinische Endpunkte oder ihre Erfassung in der klinischen Praxis harmonisieren.

Fazit für die Praxis

Machine Learning kann dabei helfen, die steigenden Datenmengen in der Onkologie zu analysieren und neue Erkenntnisse zu gewinnen. Gut entwickelte und validierte Algorithmen können in Zukunft die klinische Arbeit unterstützen, beispielsweise in der Diagnosestellung oder bei der Behandlungsentscheidung. Aktuelle Machine-Learning-Modelle sind jedoch oft noch zu spezialisiert und oft nicht hinreichend validiert, um breit einsatzfähig zu sein.

Für die PRO-Forschung stellen Machine-Learning-Analysen einen vielversprechenden und weitgehend unerforschten Ansatz dar. Mit steigender Qualität und zunehmender Harmonisierung größerer Datensätze ist zu erwarten, dass PRO im Zusammenspiel mit klinischen Daten die Vorhersagegüte von Machine-Learning-Algorithmen verbessern. Die individuelle Vorhersage der Lebensqualitätserwartung, ausgehend von klinischen Parametern und PRO, könnte die klinische Praxis entscheidend bereichern.