FormalPara Originalpublikation

Huang CM, Huang MY, Huang CW et al (2020) Machine learning for predicting pathological complete response in patients with locally advanced rectal cancer after neoadjuvant chemoradiotherapy. Sci Rep 10:12555. https://doi.org/10.1038/s41598-020-69345-9

FormalPara Hintergrund.

Durch den Einsatz einer neoadjuvanten Radiochemotherapie (RCHT) beim lokal fortgeschrittenen Rektumkarzinom konnte die Lokalrezidivrate gesenkt und die Rate an schließmuskelerhaltenden Eingriffen erhöht werden [1]. Ein weiterer Vorteil besteht in der Möglichkeit, eine komplette pathologische Remission (pCR) zu erzielen. Ein derartiges Outcome ist allerdings nur bei 10–30 % der betroffenen Patientinnen und Patienten zu finden, ermöglicht aber eine Watch-and-Wait-Strategie und damit eine potenzielle Vermeidung einer chirurgischen Resektion. Prädiktive Faktoren, um das komplette Ansprechen nach einer RCHT vorauszusagen, sind nur limitiert verfügbar; außerdem existieren unterschiedliche statistische Rechenmodelle mit variierender interner Validität: zum Beispiel das künstliche neuronale Netzwerk (ANN), der k‑Nearest-Neighbor-Algorithmus (KNN, deutsch: „k-nächste Nachbarn-Algorithmus“), die Support Vector Machine (SVM), naïve Bayes Classifier (NBC) oder die klassische logistische Regression (MLR). Das Ziel dieser Studie war es, die Genauigkeit des ANN-Modells zur Vorhersage einer pathologischen kompletten Remission beim Rektumkarzinom nach neoadjuvanter RCHT zu beurteilen. Zusätzlich wurden verschiedene prädiktive Modelle evaluiert und untereinander verglichen [2].

FormalPara Methode.

Es wurden am Kaohsiung Medical University Hospital 236 konsekutive Personen mit einem bioptisch verifizierten Rektumkarzinom (Stadium T3/4 oder N+) und neoadjuvanter RCHT eingeschlossen und analysiert. Alle Patientinnen und Patienten wurden mittels totaler mesorektaler Exzision und kolorektaler Anastomose (n = 207) oder Exstirpation (n = 29) operiert.

Fanden sich in den Operationspräparten keine Tumorzellen, wurde sie als pCR bezeichnet.

Für die statistische Berechnung wurde primär eine univariate Analyse durchgeführt, um signifikante Parameter für die Vorhersage einer pCR zu ermitteln. Danach wurden für die weiteren Berechnungsmodelle zwei Datensets geschaffen: ein Trainings-Datenset für die Lernphase und ein Trainings-Datenset für die anschließend durchgeführten Performance-Analysen der Prognosemodelle. Abschließend wurde der Einfluss einzelner Variablen auf die Prognosefähigkeit der Modelle untersucht; hierbei wurde eine Variable-Sensitivität-Ratio (VSR) von ≤ 1 mit einer schlechten Prognosefähigkeit assoziiert.

FormalPara Ergebnisse.

Die Trainingsgruppe enthielt 236 Patienten, die Testgruppe 34 Patienten. Das mediane post-CRT-CEA-Level war 2,2 ng/ml (Range: 0,48–197,5). Eine komplette pathologische Remission erreichten in der Lerngruppe 23,7 % und in der Testgruppe 20,6 % (p = 0,162) der Patienten.

Alle Variablen, welche in der univariaten Analyse einen signifikanten Einfluss auf das Outcome pCR zeigten, wurden in die Prognosemodelle integriert. Die Neuronen des künstlichen neuronalen Netzwerks wurden in 3 Schichten angeordnet. Das ANN 16-4-1-Modell beinhaltete 16 Input-Neuronen, vier versteckte Neuronen, ein Bias-Neuron und ein Output-Neuron. Die Ergebnisse zeigten, dass das ANN-Modell andere Modelle wie KNN, SVM, NBC und MLR in Hinblick auf Sensitivität, 1‑Spezifität und Genauigkeit übertraf.

Die sensitivste Variable, um eine pathologische komplette Remission vorauszusagen, war der CEA-Tumormarker (VSR = 1,57), welcher nach abgeschlossener RCHT gemessen wurde. Andere Parameter waren das Intervall zwischen Bestrahlung und Operation (VSR = 1,50), die Art der Chemotherapie (VSR = 1,45), der Lymphknotenstatus (VSR = 1,37) und das Tumorstadium (VSR = 1,32).

FormalPara Diskussion.

Die Studie konnte eine deutliche Überlegenheit des ANN-Modells feststellen gegenüber anderen Prognosemodellen wie KNN, SVM, NBC, oder MLR.

Es gibt zum jetzigen Zeitpunkt mehrere Untersuchungen, die den Einsatz von maschinellem Lernen zur Vorhersage der Prognose nach einer Krebstherapie evaluiert haben. Zum Beispiel fanden Bibault et al., dass tiefes Lernen (Deep Learning) verglichen mit der linearen Regression die Voraussage einer pathologischen kompletten Remission genauer treffen kann [3]. Ähnliche Ergebnisse zeigten auch andere onkologische Studien bei Tumoren des Halses, der Brust, der Lunge oder der Prostata.

Der nach abgeschlossener RCHT erfasste Tumormarker CEA war hoch signifikant in der Vorhersage einer kompletten Remission. Der Stellenwert des CEA wurde allerdings bereits mehrfach analysiert und bestätigt. Der exakte Mechanismus für dessen Signifikanz ist nicht eindeutig geklärt, die Korrelation mit der Tumorregression scheint eine Rolle zu spielen.

Ein weiterer signifikanter Faktor in dieser Studie für eine pCR war das verlängerte Beobachtungsintervall von > 8 Wochen zwischen RCHT und der Operation. Daten in der Literatur über den Effekt der Wartezeit zwischen dem Ende der Bestrahlung und der Resektion sind kontrovers. Es gibt zwar einzelne randomisiert-kontrollierte Studien, eine eindeutige Empfehlung für eine bestimmte Dauer kann derzeit dennoch nicht gegeben werden.

Ähnlich wie bei anderen Studien, waren positive Lymphknoten mit einer schlechteren Prognose nach RCHT vergesellschaftet.

Kommentar

Die Arbeit ist äußerst interessant, da sie einerseits ein klinisch spannendes und relevantes onkologisches Thema untersucht hat und auf der anderen Seite den Stellenwert einer zukunftsweisenden Methode evaluiert hat. Der Einsatz von künstlicher Intelligenz in der Medizin nimmt an Bedeutung rasch zu und scheint vor allem in der Analyse von großen Datenmengen herkömmlichen Methoden deutlich überlegen zu sein [4]. Maschinelles Lernen wird in vielen Bereichen in Zukunft breitere Anwendung finden und die Genauigkeit analytischer Auswertungen vorantreiben. Das betrifft unter anderem die Interpretation von radiologischen und pathologischen Befunden als auch verschiedenste Prognosemodelle. Die exaktere Charakterisierung von prognostischen Parametern wird verstärkt helfen, klinische Entscheidungen zu treffen und individualisierte Behandlungsstrategien zu entwerfen. Die aktuelle Arbeit mit ihrer überschaubaren Fallzahl bringt zwar keine neuen klinischen Erkenntnisse, zeigt aber die Überlegenheit des maschinellen Lernens erneut auf. Anzumerken ist, dass zwar eine hohe Anzahl an Variablen zur Berechnung inkludiert wurde, die Magnetresonanzuntersuchung, als wesentlicher Bestandteil der Therapieentscheidung, aber nicht berücksichtigt wurde.