Zusammenfassung
Hintergrund
Steigende Datenmengen in der Onkologie stellen neue Herausforderungen an die Analyse. Machine Learning ist ein Teilbereich der künstlichen Intelligenz und kann auch in sehr großen und weniger strukturierten Datensätzen Zusammenhänge erkennen.
Ziel der Arbeit
Der Artikel vermittelt einen Überblick zu den Einsatzbereichen von Machine Learning in der Onkologie. Weiterhin wird das Potenzial von Machine Learning für die Patient-Reported-Outcome (PRO) Forschung diskutiert.
Material und Methoden
Selektive Literaturrecherche (PubMed, MEDLINE, IEEE Xplore) und Diskussion des aktuellen Stands der Forschung.
Ergebnisse
In der Onkologie ergeben sich drei primäre Einsatzbereiche für Machine Learning: (1) zur Krebserkennung oder Klassifikation bei bildgebenden Verfahren, (2) zur Prognose von Gesamtüberleben oder zur Risikoeinschätzung, (3) zur Unterstützung bei Behandlungsentscheidungen und zur Vorhersage von Therapieansprechen. In der onkologischen PRO-Forschung und Praxis werden bisher kaum Machine-Learning-Ansätze verfolgt und es gibt nur wenige Studien, welche PRO-Daten in Machine-Learning-Modelle integrieren.
Diskussion
Machine Learning zeigt in einigen Bereichen der Onkologie vielversprechende Anwendungsmöglichkeiten, jedoch schaffen wenige Modelle den Sprung in die klinische Praxis. Die Versprechen von einer personalisierten Krebstherapie und von Unterstützung bei der Behandlungsentscheidung durch Machine Learning haben sich noch nicht erfüllt. Als ein Bereich, der in der Onkologie stetig an Bedeutung gewinnt, sollten PRO auch in Machine-Learning-Ansätze aufgenommen werden. Dazu sind jedoch die breite, standardisierte Erfassung von PRO sowie die umfassende Harmonisierung bestehender Datensätze nötig.
Abstract
Background
Increasing data volumes in oncology pose new challenges for data analysis. Machine learning, a branch of artificial intelligence, can identify patterns even in very large and less structured datasets.
Objective
This article provides an overview of the possible applications for machine learning in oncology. Furthermore, the potential of machine learning in patient-reported outcome (PRO) research is discussed.
Materials and methods
We conducted a selective literature search (PubMed, MEDLINE, IEEE Xplore) and discuss current research.
Results
There are three primary applications for machine learning in oncology: (1) cancer detection or classification; (2) overall survival prediction or risk assessment; and (3) supporting therapy decision-making and prediction of treatment response. Generally, machine learning approaches in oncology PRO research are scarce and few studies integrate PRO data into machine learning models.
Discussion
Machine learning is a promising area of oncology, but few models have been transferred into clinical practice. The promise of personalized cancer therapy and shared decision-making through machine learning has yet to be realized. As an equally important emerging research area in oncology, PROs should also be incorporated into machine learning approaches. To gather the data necessary for this, broad implementation of PRO assessments in clinical practice, as well as the harmonization of existing datasets, is suggested.
Hinführung zum Thema
Die rapide ansteigenden Datenmengen in der Onkologie bieten viel Potenzial, das Verständnis von Krebs zu vertiefen, stellen aber gleichzeitig neue Herausforderungen an die Datenverarbeitung und Analyse. Machine Learning, ein Bereich der künstlichen Intelligenz, kann dabei helfen, aus großen Datenmengen sinnvolle Informationen zu gewinnen. Aufgrund der steigenden Bedeutung und der zunehmenden Verwendung von Machine Learning in der Onkologie wird das grundlegende Verständnis der Technologie in Zukunft auch für praktizierende Onkologen relevant werden.
Hintergrund
In den letzten zwei Jahrzehnten sind die Datenmengen in der Onkologie rapide angestiegen. Pro Patient werden immer mehr Daten generiert und gespeichert. Im europäischen Innovative-Medicine-Initiative-Projekt OncoTrack wird beispielsweise pro Patient annähernd 1 Terabyte (1000 Gigabyte) an Daten produziert, was in etwa 250.000 Fotos oder 6,5 Mio. Dokumentenseiten entspricht [29]. Die rapide Zunahme gespeicherter Informationen ist eine Entwicklung, welche durch die zunehmende Digitalisierung der Medizin und technologische Fortschritte, speziell auch genetische Analysen wie Next Generation Sequencing, hervorgerufen und verstärkt wurde.
Diese Datenmengen bieten ein hohes Potenzial, um das Wissen über Krebserkrankungen zu vertiefen, stellen aber gleichzeitig neue Anforderungen an die Methoden der Datenverarbeitung und -auswertung. Klassische (inferenz-)statistische Methoden, wie sie traditionell in der Medizin verwendet werden, stoßen mit steigender Daten- und Variablenanzahl schnell an ihre Grenzen. Ein Ansatz, um solche großen Datenmengen zu verarbeiten und darin relevante Variablen und Zusammenhänge zu identifizieren, ist Machine Learning [7], ein Teilbereich der künstlichen Intelligenz. Es gibt unterschiedliche Anwendungsfelder für Machine Learning in der Onkologie. Machine Learning kann beispielsweise eingesetzt werden, um Tumoren auf Bildern (z. B. CT- oder fMRT-Bildern) zu erkennen oder um das Risiko einer Progredienz ausgehend von klinischen Variablen zu beurteilen.
Dieser Artikel soll eine Übersicht zum Thema Machine Learning in der Onkologie bieten. Dazu wird zunächst erklärt, was Machine Learning ist und welche Vorteile es gegenüber anderen statistischen Methoden bietet. Dann werden die unterschiedlichen Anwendungsfelder von Machine Learning in der Onkologie dargestellt und der aktuelle Stand der Forschung diskutiert. Zuletzt wird noch ein Ausblick gegeben, wie Machine Learning im Bereich der Lebensqualitätsforschung in der Onkologie eingesetzt werden kann und welche Schritte und Entwicklungen notwendig sind, um dies zu ermöglichen.
Was sind künstliche Intelligenz, Machine Learning und Deep Learning?
Unter Machine Learning werden Verfahren zusammengefasst, die es einem Computersystem erlauben, Rückschlüsse aus Daten zu ziehen, um so ihre Fähigkeiten in einer spezifischen Aufgabe langfristig zu verbessern. Machine Learning stellt dabei nur einen Teilbereich der künstlichen Intelligenz dar, welche zusätzlich noch Bereiche wie Planung, Problemlösung und logisches Schließen umfasst. Aus den gegebenen Fällen „lernen“ die Verfahren ein Vorhersagemodell für noch nicht bekannte Fälle und versuchen damit, die Problemstellung generell zu „verstehen“. Die Beschaffenheit der Daten ist dabei von besonderer Bedeutung. Allgemein wird beim Lernen zwischen Supervised, Unsupervised und Reinforcement Learning differenziert. Beim Supervised Learning wird jeder Datenpunkt mit einem konkreten erwarteten Vorhersageergebnis assoziiert (z. B. „gutartiger Tumor“). Ziel ist es, im Verlauf des Lernvorgangs eine Funktion zu approximieren, die die Daten auf diese erwarteten Ausgaben abbildet. Im Gegensatz dazu hat das Unsupervised Learning zum Ziel, Muster in den zur Verfügung stehenden Daten zu erkennen, ohne dabei auf eine Rückmeldung oder Zielvorhersage angewiesen zu sein. Beispielsweise können Bilder nach Ähnlichkeit gruppiert werden, wobei hier aber die Bedeutung der einzelnen Gruppen nicht vom Verfahren selbst mitgeliefert wird. Beim Reinforcement Learning wird während des Lernprozesses die Leistung des Algorithmus kontinuierlich durch Belohnungen und Bestrafungen bewertet, um den Lernprozess in die Richtung des erstrebten Verhaltens zu lenken [20].
Aufgrund der bei Machine Learning üblicherweise auftretenden großen Datenmengen werden häufig auch künstliche neuronale Netze eingesetzt, welche sich aus einer hohen Anzahl an Schichten von recht einfachen Neuronen zusammensetzen. Ähnlich wie beim menschlichen Gehirn „feuern“ diese aufgrund ihrer Vernetzung und geben ihr Ergebnis an die verknüpften Neuronen weiter. Dies ermöglicht es den Netzen, komplizierte Zusammenhänge zu erkennen und abzubilden. Verfahren, die auf solchen Netzen basieren, werden generell als Deep Learning bezeichnet und sind somit eine Unterkategorie des Machine Learning [23]. Abb. 1 gibt einen Überblick über die eingeführten Begriffe.
Machine Learning kann sowohl zur Inferenz als auch zur Prognose verwendet werden, was dadurch gewisse Überschneidungen mit klassischer Statistik aufweist. Auch einige der in der Statistik verwendeten Verfahren, wie lineare und logistische Regressionen finden in Machine Learning Anwendung. Allerdings unterscheiden sich die beiden Ansätze meist in ihrem Fokus. Statistische Verfahren haben meist zum Ziel, Eigenschaften einer Stichprobe mit einer gewissen Konfidenz auf eine Population zu übertragen. Der Fokus des Machine Learning liegt hingegen auf der Vorhersage und dem Erkennen von Mustern und in Daten. In der Regel werden dabei große Datenmengen verarbeitet, ohne spezielle Annahmen über die Beschaffenheit der Daten zu treffen. Gerade im Deep Learning können aufgrund der hohen Datenmengen und der teils hohen Anzahl an Parametern in den verwendeten Modellen auch komplexe, nicht lineare Zusammenhänge abgebildet werden. Allerdings gehen solche Modelle auch mit einer deutlich geringeren Interpretierbarkeit der gefundenen Ergebnisse einher [7].
Anwendungsbereiche von Machine Learning in der Onkologie
Machine Learning findet bereits in unterschiedlichen Bereichen der Onkologie Anwendung. Gemäß der Prämisse, dass mehr Daten in der Regel auch zu besseren Modellen führen, wird Machine Learning vor allem in Bereichen eingesetzt, die eine große Menge an möglichst standardisierten Daten produzieren. Im Folgenden werden die häufigsten Anwendungsbereiche für Machine Learning in der Onkologie vorgestellt.
Machine Learning zur Diagnosestellung und zum Screening
Die Anwendung von Machine Learning zur Diagnosestellung und zum onkologischen Screening wird klassischerweise vor allem in der Radiologie und Pathologie genutzt. Der Großteil der bisherigen Machine-Learning-Forschung in der Onkologie findet in diesem Bereich statt [8, 21]. Machine Learning wird hier vor allem dazu genutzt, malignes Gewebe über bildgebende Verfahren zu erkennen. Beispielsweise konnten Forscher sogenannte Convolutional Neural Networks (auf Bildverarbeitung spezialisierte neuronale Netze) erfolgreich einsetzen, um Oropharynxkarzinome auf Endoskopieaufnahmen zu erkennen [25]. Die Studie zeigt nicht nur, wie akkurat ein solcher Algorithmus arbeiten kann (alle Karzinome im Validierungsdatensatz wurden korrekt erkannt), sondern auch, wie schnell die Algorithmen arbeiten können. Alle 1912 Bilder individueller Patienten wurden in weniger als 30 s korrekt klassifiziert.
In einer weiteren Studie von Forschern von Google Health wurden neuronale Netze verwendet, um Krebs auf Mammographiebildern zu erkennen – ein Bereich, in welchem es noch immer eine hohe Rate an falsch-positiven Erstdiagnosen gibt [15]. Der Algorithmus zeigte nicht nur eine bessere Erkennungsrate von malignem Gewebe als 6 Radiologen, mit denen er verglichen wurde, sondern auch eine niedrigere Rate an falsch-positiv diagnostizierten Patientinnen.
Insgesamt zeigte sich in einem rezenten systematischen Review, dass Algorithmen im Vergleich zu menschlichen Experten eine ähnlich gute oder sogar bessere Erkennung von Krebs auf Bildern erreichen können [17]. Im Review zeigte sich jedoch auch, dass oft die externale Validierung der Algorithmen fehlt (d. h. Validierung der Daten an einem unabhängigen Datensatz), was die Verallgemeinerbarkeit der Modelle einschränkt.
Machine Learning zur Prognoseerstellung und Risikoeinschätzung
Die klassischerweise in der Onkologie verwendeten prognostischen Indizes verwenden oft nur eine Handvoll medizinischer Faktoren, um eine Prognose zu stellen. Wenn jedoch umfangreichere Daten vorliegen, können diese genutzt werden, um die Vorhersagekraft dieser Indizes zu verbessern. Dazu werden in der Regel möglichst viele klinische Parameter aggregiert und in das Modell einbezogen. Je nach Datenqualität und -menge eignen sich dann unterschiedliche Machine-Learning-Algorithmen.
Elfiky et al. [10] entwickelten ein Machine-Learning-Modell zur Vorhersage des Gesamtüberlebens zum Start der Chemotherapie aus einer Stichprobe von N = 26.946 Patienten, die 51.774 unterschiedliche Chemotherapien begannen. Mithilfe von Entscheidungsbäumen identifizierten sie erfolgreich jene Patienten, die ein besonders hohes Risiko hatten, innerhalb der nächsten 30 Tage zu sterben. So konnten die Autoren jene Patienten identifizieren, die trotz einer sehr schlechten Prognose noch eine (kurative) Chemotherapie erhielten. Die Autoren schlussfolgern, dass Machine-Learning-Algorithmen in der Zukunft verwendet werden könnten, um bei Patienten mit schlechter Prognose eine palliative Behandlung zu empfehlen, um eine unnötige Belastung dieser Patienten zu vermeiden.
In einer anderen Studie konnten Forscher die Überlebenszeit von N = 221 Patienten mit nichtresezierbaren Pankreaskarzinomen mittels Machine-Learning-Algorithmen vorhersagen [26]. Sie verwendeten die Daten von 168 Patienten, um das Modell zu trainieren und validierten es anschließend an Daten von 53 weiteren Patienten. Durch den Vergleich unterschiedlicher Vorhersagemodelle konnten die Autoren zeigen, dass Machine Learning im Vergleich zu traditionellen Verfahren wie der logistischen Regression eine höhere Vorhersagegüte aufwies.
Solche und ähnliche Studien zeigen einerseits die eindrucksvollen Fortschritte, welche sich mit Machine Learning erzielen lassen. Andererseits verdeutlichen sie auch ein generelles Problem: Die meisten entwickelten Modelle sind sehr spezifisch, da sie auf Daten von speziellen Krankheitsbildern oder Patientengruppen beruhen.
Machine Learning zur Vorhersage des Ansprechens auf die Behandlung und zur Unterstützung bei Behandlungsentscheidungen
Obwohl die personalisierte Krebsbehandlung zunehmend an Bedeutung gewinnt, sind die jeweiligen Therapieansätze oft noch nicht individuell auf die Patienten abgestimmt. Mittels Machine Learning können personalisierte Ansätze in der Auswahl oder Anpassung der Therapie verfolgt werden. Agius et al. [1] beschreiben die Entwicklung eines kombinierten Machine-Learning-Modells (das Modell kombiniert 28 separate Algorithmen), mit dem neu diagnostizierte Patienten mit chronischer lymphatischer Leukämie identifiziert werden konnten, welche ein besonders hohes Infektionsrisiko hatten. Bei diesem Krankheitsbild stellen Infektionen die häufigste Todesursache dar. Mit Daten von N = 4149 Patienten erstellten die Forscher ein Modell, welches klinische Parameter und individuelle Risikofaktoren berücksichtigt. Durch die Prognose des individuellen Risikos könnte bei besonders infektionsgefährdeten Patienten die Behandlung früher angesetzt werden. Das Modell kann online eingesehen werden (www.CLL-TIM.org).
Hou et al. entwickelten auf Basis retrospektiver Daten ein Modell, mit welchem sie das Ansprechen der Krebserkrankung auf kombinierte Chemotherapie und Bestrahlung mit sehr hoher Genauigkeit vorhersagen konnten [11]. In anderen Studien wurde Machine Learning auch dazu genutzt, die Dosis der Behandlung zu individualisieren oder unerwünschte Therapieereignisse („adverse events“) zu prognostizieren und diese Informationen in den Behandlungsverlauf einzubeziehen [18, 19].
Das Potenzial von Machine Learning im Kontext der PRO-Forschung
Durch die stetigen Verbesserungen in der frühen Erkennung und in der Behandlung von Krebserkrankungen hat sich die Gesamtüberlebenszeit in den letzten Jahrzehnten deutlich verlängert [14]. Abhängig von der Diagnose und dem Stadium der Erkrankung haben Patienten mit einer Krebserkrankung inzwischen eine deutlich höhere Lebenserwartung als vor wenigen Jahrzehnten. Somit wird auch immer relevanter, wie Menschen mit der Krankheit leben und welche Spätfolgen sie aufgrund der Krankheit oder der Behandlung erleiden. Zum Beispiel konnte eine Studie des Deutschen Krebsforschungszentrums zeigen, dass (Darm‑)Krebspatienten auch 10 Jahre nach der Erstdiagnose noch mindestens ein tumor- oder therapieassoziiertes Symptom berichten [13]. Informationen zur zu erwartenden Lebensqualität während der Behandlung sind von Patientenseite oft erwünscht, aber werden auch oft zu wenig kommuniziert und in den Konsultationen besprochen [16]. Dabei können genau solche Informationen dabei helfen, Unsicherheit bei den Patienten zu reduzieren und die Bewältigung (Coping) der Krankheit sowie wünschenswertes Gesundheitsverhalten zu fördern [12]. Gerade wenn es um Behandlungsentscheidungen oder die Nachsorge geht, sollten also Informationen zur Lebensqualität in die Abwägungen einbezogen werden, um zur individuell bestmöglichen Entscheidung zu kommen.
Der Goldstandard zur Erfassung der Lebensqualität sind „Patient-Reported Outcomes“
Der Goldstandard zur Erfassung der (gesundheitsbezogenen) Lebensqualität sind sogenannte „Patient-Reported Outcomes“ (PRO). Als PRO werden alle Aussagen zum Gesundheitszustand oder zur Behandlung betrachtet, welche direkt vom Patienten selbst kommen und nicht durch Dritte (beispielsweise Ärzte) interpretiert werden [27]. PRO sind eine von mehreren Möglichkeiten, klinische Ergebnisse oder Veränderungen zu messen (sogenannte „Clinical Outcome Assessments“ [COA]). Sie finden Anwendung in der klinischen Praxis, in klinischen Studien, in der Registerforschung oder können für Health Technology Assessments oder zur Qualitätssicherung verwendet werden.
Üblicherweise werden PRO in Form von standardisierten Fragebögen erhoben, um die Erhebung zu vereinheitlichen und so Vergleiche zwischen Patienten zu ermöglichen. In dieser Form sind PRO eine Datenquelle, die sich für Machine-Learning-Algorithmen eignet: Jede Skala eines Fragebogens, jede Frage oder auch jede einzelne Antwortmöglichkeit kann als individuelle Variable mit potenzieller Vorhersagegüte betrachtet werden. Für traditionelle Prognosemodelle stellt die Vielzahl an möglichen Prädiktoren, die aus PRO gewonnen werden können, an möglichen Kombinations- und (nichtlinearen) Interaktionsmöglichkeiten ein Problem dar. Für Machine-Learning-Modelle wiederum ist diese Datenvielfalt ein potenzieller Vorteil. In solchen Szenarien ermöglicht Machine Learning, speziell auch Deep Learning, Prognosemodelle, die im Vergleich zu traditioneller Statistik eine deutlich erhöhte Vorhersagegüte und Genauigkeit besitzen [6, 28].
Die Informationen, die PRO über den Gesundheitszustand der Patienten liefern, können eine wichtige Ergänzung zu „harten“ klinischen Daten sein. Der naheliegende Anwendungsbereich von PRO ist zunächst die Nutzung von PRO zur Vorhersage des Gesamtüberlebens von Patienten. Es gibt durchaus Studien die zeigen, dass PRO, zusätzlich zu medizinischen Parametern, inkrementelle Varianz zur Vorhersage vom Gesamtüberleben aufklären (für einen Überblick siehe Efficace et al. [9]). Allerdings liegen noch keine vergleichbaren Studien mit Machine-Learning-Verfahren vor. Der zweite wichtige potenzielle Anwendungsbereich von Machine-Learning-Verfahren liegt in der Prognose von zu erwartender Lebensqualität. Individuelle Prognosen der Lebensqualität während und nach der Behandlung können eine wichtige Komponente der gemeinsamen Entscheidungsfindung und Patientenkompetenz sein.
PRO und Machine Learning: bislang nur wenig Forschung
Entgegen der zuvor genannten Vorteile finden sich in der onkologischen Literatur bisher kaum Studien, welche PRO in Machine-Learning-Modelle integrieren. Exemplarisch seien zwei Studien genannt, die das Potenzial von PRO und Machine Learning in der Onkologie aufzeigen: In einer Studie von Arkin et al. [2] wurde mittels neuronaler Netze das Gesamtüberleben von palliativ behandelten onkologischen Patienten vorhergesagt. Als Prädiktoren für das Überleben verwendeten die Autoren neben klinischen Variablen auch ein PRO-Instrument, die Edmonton Symptom Assessment Scale (ESAS). In ihrer Studie konnten sie nicht nur zeigen, dass das neuronale Netz eine höhere Vorhersagegüte aufwies als eine vergleichbare logistische Regression, sondern auch, dass die ESAS die am dritthöchsten korrelierte Variable (r = 0,32) mit dem Überleben der Patienten war.
Eine andere Herangehensweise wurde in der Studie von Santos et al. [22] gewählt. In ihrer Studie untersuchten die Autoren, wie Machine Learning genutzt werden kann, um komplexe Entscheidungen in der Intensivmedizin zu unterstützen. Sie erhoben Lebensqualitätsdaten von n = 777 onkologischen Patienten, bei denen zur Aufnahme zusätzlich 37 klinische Variablen ausgehoben wurden. Mithilfe von unterschiedlichen Machine-Learning-Algorithmen wurde das sogenannte lebensqualitätskorrigierte Überleben (sogenannte Quality-Adjusted Life Years, d. h., die Überlebenszeit wird in Bezug zur zu erwartenden Lebensqualität gesetzt) über einen Zeitraum von 30 Tagen vorhergesagt. Die von den Autoren entwickelten Modelle treffen also nicht nur eine Aussage darüber, wie lange die Patienten überleben, sondern beziehen auch ein, wie es ihnen nach der Intensivbehandlung geht und wie vorteilhaft oder unvorteilhaft Patienten die Lebensqualität bewerten.
Die beiden Studien zeigen, dass PROs sowohl als Prädiktor (PROs zur Vorhersage von anderen Variablen), aber auch als Kriterium (PROs werden durch andere Variablen vorhergesagt) im Kontext des Machine Learning verwendet werden können. Allerdings finden sich in der Literatur nur vereinzelt Studien, welche Machine-Learning-Verfahren mit PRO-Daten kombinieren. Auch in einem systematischen Review zu Machine-Learning-Ansätzen in der palliativen Behandlung von Patienten, einem Feld, in welchem PRO eigentlich eine bedeutende Rolle spielen sollten, wurden keine Studien gefunden, die PRO einbeziehen [24].
Warum werden PRO so selten in Machine-Learning-Ansätze integriert?
Sowohl Machine Learning als auch PRO sind noch vergleichsweise neue Forschungsfelder, deren Schnittmenge noch nicht allzu groß ist. Um die Frage zu beantworten, warum PRO noch selten in Machine-Learning-Ansätze integriert werden, ist ein Blick auf die Natur der Daten und Datensätze hilfreich. Ein erstes Problem ist, dass die strukturierte Erhebung von PRO-Daten nur selten in der klinischen Routine erfolgt. Im Vergleich zu anderen klinischen Daten, beispielsweise CT-Bildern, werden PRO kaum oder nur an verhältnismäßig wenigen Zentren im Verlauf der Behandlung erhoben. Während also Studien mit CT-Bildern aus der Routineversorgung heraus möglich sind, müssen PRO-Daten meist erst zusätzlich erhoben werden – zum Beispiel in klinischen Studien. Daraus resultiert, dass PRO-Datensätze oft vergleichsweise klein sind, was die Anwendungsmöglichkeiten und die Vorteile von Machine Learning drastisch reduziert.
Der Flaschenhals für die Nutzung von PRO-Daten sind die Menge der Daten und ihre Qualität
Ein weiteres Problem ist, dass es viele unterschiedliche PRO-Instrumente gibt, was die Harmonisierung der Daten erschwert. Lebensqualitätsdaten von Patienten, die mit unterschiedlichen Fragebögen erhoben wurden, sind nur sehr begrenzt vergleichbar, da die Fragebögen Lebensqualität unterschiedlich konzeptualisieren und operationalisieren. Der Flaschenhals zur Anwendung von Machine Learning für PRO-Daten in der Onkologie sind also die Menge der Daten und ihre Qualität bzw. ihre Harmonisierung.
Welche Entwicklungen sind nötig, damit Machine Learning für die PRO-Forschung genutzt werden kann?
Um Machine-Learning-Verfahren im Kontext der PRO-Forschung zu nutzen, ist die umfassende und standardisierte Erhebung von PRO-Daten nötig. Entsprechende Projekte, welche PRO in der breiten onkologischen Praxis implementieren, existieren beispielsweise in Kanada (Ontario Cancer Registry [4, 5]). Dort füllen Patienten bei jedem Besuch in mehreren teilnehmenden onkologischen Zentren einen kurzen Symptomscreeningfragebogen aus, welcher auch zu Forschungszwecken verwendet werden darf. So können Analysen mit 100.000 bis 200.000 Patienten mit PRO und klinischen Daten gerechnet werden [3, 4]. Bislang sind jedoch noch keine Machine-Learning-Algorithmen in diesem oder vergleichbaren PRO-Datensätzen angewendet worden.
Analysen in dieser oder noch größerer Größenordnung sind vielversprechender, da mit steigender Datenmenge auch die Vorhersagegüte der Machine-Learning-Modelle steigt. Allerdings geht auch ein erheblicher Arbeitsaufwand mit der Sammlung und Harmonisierung von PRO-Daten einher. Die Datensammlung wird erschwert, wenn PRO-Daten unstrukturiert sind, viele Datenpunkte fehlen oder PRO aus unterschiedlichen Klinikinformationssystemen extrahiert werden müssen. Im Hinblick darauf sind Initiativen zu begrüßen, welche die Erfassung von PRO-Daten als klinische Endpunkte oder ihre Erfassung in der klinischen Praxis harmonisieren.
Fazit für die Praxis
Machine Learning kann dabei helfen, die steigenden Datenmengen in der Onkologie zu analysieren und neue Erkenntnisse zu gewinnen. Gut entwickelte und validierte Algorithmen können in Zukunft die klinische Arbeit unterstützen, beispielsweise in der Diagnosestellung oder bei der Behandlungsentscheidung. Aktuelle Machine-Learning-Modelle sind jedoch oft noch zu spezialisiert und oft nicht hinreichend validiert, um breit einsatzfähig zu sein.
Für die PRO-Forschung stellen Machine-Learning-Analysen einen vielversprechenden und weitgehend unerforschten Ansatz dar. Mit steigender Qualität und zunehmender Harmonisierung größerer Datensätze ist zu erwarten, dass PRO im Zusammenspiel mit klinischen Daten die Vorhersagegüte von Machine-Learning-Algorithmen verbessern. Die individuelle Vorhersage der Lebensqualitätserwartung, ausgehend von klinischen Parametern und PRO, könnte die klinische Praxis entscheidend bereichern.
Literatur
Agius R, Brieghel C, Andersen MA et al (2020) Machine learning can identify newly diagnosed patients with CLL at high risk of infection. Nat Commun 11:363. https://doi.org/10.1038/s41467-019-14225-8
Arkin FS, Aras G, Dogu E (2020) Comparison of artificial neural networks and logistic regression for 30-days survival prediction of cancer patients. Acta Inform Med 28:108–113. https://doi.org/10.5455/aim.2020.28.108-113
Barbera L, Sutradhar R, Earle CC et al (2020) The impact of routine Edmonton symptom assessment system use on receiving palliative care services: results of a population-based retrospective-matched cohort analysis. BMJ Support Palliat Care. https://doi.org/10.1136/bmjspcare-2020-002220
Barbera L, Sutradhar R, Seow H et al (2020) Impact of standardized Edmonton symptom assessment system use on emergency department visits and hospitalization: results of a population-based retrospective matched cohort analysis. JCO Oncol Pract. https://doi.org/10.1200/JOP.19.00660
Basch E, Barbera L, Kerrigan CL, Velikova G (2018) Implementation of patient-reported outcomes in routine medical care. Am Soc Clin Oncol Educ Book 38:122–134. https://doi.org/10.1200/EDBK_200383
Bice N, Kirby N, Bahr T et al (2020) Deep learning-based survival analysis for brain metastasis patients with the national cancer database. J Appl Clin Med Phys 21:187–192. https://doi.org/10.1002/acm2.12995
Bzdok D, Altman N, Krzywinski M (2018) Statistics versus machine learning. Nat Methods 15:233–234. https://doi.org/10.1038/nmeth.4642
Echle A, Rindtorff NT, Brinker TJ et al (2020) Deep learning in cancer pathology: a new generation of clinical biomarkers. Br J Cancer. https://doi.org/10.1038/s41416-020-01122-x
Efficace F, Collins GS, Cottone F et al (2021) Patient-reported outcomes as independent prognostic factors for survival in oncology: systematic review and meta-analysis. Value Health 24(2):250–267. https://doi.org/10.1016/j.jval.2020.10.017
Elfiky AA, Pany MJ, Parikh RB, Obermeyer Z (2018) Development and application of a machine learning approach to assess short-term mortality risk among patients with cancer starting chemotherapy. JAMA Netw Open 1:e180926. https://doi.org/10.1001/jamanetworkopen.2018.0926
Hou Z, Ren W, Li S et al (2017) Radiomic analysis in contrast-enhanced CT: predict treatment response to chemoradiotherapy in esophageal carcinoma. Oncotarget 8:104444–104454. https://doi.org/10.18632/oncotarget.22304
Husson O, Mols F, van de Poll-Franse LV (2011) The relation between information provision and health-related quality of life, anxiety and depression among cancer survivors: a systematic review. Ann Oncol 22:761–772. https://doi.org/10.1093/annonc/mdq413
Jansen L, Herrmann A, Stegmaier C et al (2011) Health-related quality of life during the 10 years after diagnosis of colorectal cancer: a population-based study. J Clin Oncol 29:3263–3269. https://doi.org/10.1200/JCO.2010.31.4013
Jemal A, Ward EM, Johnson CJ et al (2017) Annual report to the nation on the status of cancer, 1975–2014, featuring survival. J Natl Cancer Inst. https://doi.org/10.1093/jnci/djx030
McKinney SM, Sieniek M, Godbole V et al (2020) International evaluation of an AI system for breast cancer screening. Nature 577:89–94. https://doi.org/10.1038/s41586-019-1799-6
McRoy S, Rastegar-Mojarad M, Wang Y et al (2018) Assessing unmet information needs of breast cancer survivors: exploratory study of online health forums using text classification and retrieval. JMIR Cancer 4:e10. https://doi.org/10.2196/cancer.9050
Nagendran M, Chen Y, Lovejoy CA et al (2020) Artificial intelligence versus clinicians: systematic review of design, reporting standards, and claims of deep learning studies. BMJ. https://doi.org/10.1136/bmj.m689
Nguyen D, Jia X, Sher D et al (2019) 3D radiotherapy dose prediction on head and neck cancer patients with a hierarchically densely connected U‑net deep learning architecture. Phys Med Biol 64:65020. https://doi.org/10.1088/1361-6560/ab039b
Nguyen D, Long T, Jia X et al (2019) A feasibility study for predicting optimal radiation therapy dose distributions of prostate cancer patients from patient anatomy using deep learning. Sci Rep 9:1076. https://doi.org/10.1038/s41598-018-37741-x
Russell SJ, Norvig P, Davis E, Edwards D (2016) Artificial intelligence: a modern approach, 3. Aufl. Pearson, London
Saba L, Biswas M, Kuppili V et al (2019) The present and future of deep learning in radiology. Eur J Radiol 114:14–24. https://doi.org/10.1016/j.ejrad.2019.02.038
Santos HGD, Zampieri FG, Normilio-Silva K et al (2020) Machine learning to predict 30-day quality-adjusted survival in critically ill patients with cancer. J Crit Care 55:73–78. https://doi.org/10.1016/j.jcrc.2019.10.015
Schmidhuber J (2015) Deep learning in neural networks: an overview. Neural Netw 61:85–117. https://doi.org/10.1016/j.neunet.2014.09.003
Storick V, O’Herlihy A, Abdelhafeez S et al (2019) Improving palliative and end-of-life care with machine learning and routine data: a rapid review. HRB Open Res 2:13. https://doi.org/10.12688/hrbopenres.12923.2
Tamashiro A, Yoshio T, Ishiyama A et al (2020) Artificial intelligence-based detection of pharyngeal cancer using convolutional neural networks. Dig Endosc 32:1057–1065. https://doi.org/10.1111/den.13653
Tong Z, Liu Y, Ma H et al (2020) Development, validation and comparison of artificial neural network models and logistic regression models predicting survival of unresectable pancreatic cancer. Front Bioeng Biotechnol 8:196. https://doi.org/10.3389/fbioe.2020.00196
Food and Drug Administration (2009) Patient-reported outcome measures: use in medical product development to support labeling claims. https://www.fda.gov/regulatory-information/search-fda-guidance-documents/patient-reported-outcome-measures-use-medical-product-development-support-labeling-claims. Zugegriffen: 5. Aug. 2020
Wong NC, Lam C, Patterson L, Shayegan B (2019) Use of machine learning to predict early biochemical recurrence after robot-assisted prostatectomy. BJU Int 123:51–57. https://doi.org/10.1111/bju.14477
Innovative Medicines Initiative (2021) Onco Track. Methods for systematic next generation oncology biomarker development. https://www.imi.europa.eu/projects-results/project-factsheets/onco-track. Zugegriffen: 13. Jan. 2021
Funding
Open access funding provided by University of Innsbruck and Medical University of Innsbruck.
Author information
Authors and Affiliations
Corresponding author
Ethics declarations
Interessenkonflikt
J. Lehmann, T. Cofala, M. Tschuggnall, J.M. Giesinger, G. Rumpold und B. Holzner geben an, dass kein Interessenkonflikt besteht.
Für diesen Beitrag wurden von den Autoren keine Studien an Menschen oder Tieren durchgeführt. Für die aufgeführten Studien gelten die jeweils dort angegebenen ethischen Richtlinien.
Rights and permissions
Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.
Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.
Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/licenses/by/4.0/deed.de.
About this article
Cite this article
Lehmann, J., Cofala, T., Tschuggnall, M. et al. Machine Learning in der Onkologie – Perspektiven in der Patient-Reported-Outcome-Forschung. Onkologe 27, 587–594 (2021). https://doi.org/10.1007/s00761-021-00917-8
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s00761-021-00917-8