Wird Künstliche Intelligenz (KI) Menschen in der Auswertung von digitalen Mammogrammen (DMG) ersetzen? Im Moment zumindest (noch) nicht, könnte man auf Basis der Ergebnisse eines aktuellen Reviews antworten. Britische Forschende haben zwölf Studien ausgewertet, in denen die Genauigkeit von KI und Radiolog*innen in der Brustbefundung miteinander verglichen worden waren [Freeman K et al. BMJ. 2021; https://doi.org/gtqv]. In drei großen retrospektiven Studien schnitten 94 % (34 von 36) der untersuchten KI-Systeme schlechter ab als ein*e einzelne*r Radiolog*in - und 100 % schlechter, wenn sie mit der Leistung von zwei menschlichen Beurteilenden verglichen wurden. Zwar gab es auch fünf Studien, in denen die KI jeweils ein*e einzelne*r Radiolog*in in puncto Genauigkeit schlug - allerdings seien diese fünf kleinen Untersuchungen mit einem besonders hohen Risiko für Verzerrungen assoziiert gewesen, so die Forschenden. In den übrigen drei Studien war die KI als Vortest eingesetzt worden, um zu entscheiden, welche DMG eine vertiefte menschliche Analyse verdienen. Korrekt von der KI aussortiert wurden Befunde von Frauen mit niedrigem Risiko in 53 %, 45 % und 50 % der Fälle - allerdings auch DMG mit tatsächlichen Tumoren in 10 %, 4 % und 0 %. Referenzkriterium war jeweils die Biopsie bzw. der Follow-up (für negativ Gescreente).