1 Einleitung

Jeder Besuch beim Haus- oder Facharzt und jeder Klinikaufenthalt ist mit der Erzeugung von Daten verbunden. Laborergebnisse, Medikationspläne, Diagnosen und vieles mehr werden in zunehmendem Maße digital verarbeitet und gespeichert, und dienen Dokumentations-, Behandlungs- und Abrechnungszwecken. Zudem bergen Daten aus der Krankenversorgung auch Potenziale für den wissenschaftlichen Fortschritt im biomedizinischen Bereich und können damit zu einer Verbesserung der Patientenversorgung beitragen. Diese Potenziale lassen Stimmen laut werden, Daten aus der klinischen Versorgung systematisch datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten für eine Sekundärnutzung zuzuführen. In den letzten Jahren haben sich unter anderem in den USA und in Großbritannien mehrere Initiativen mit dem Ziel einer Sekundärnutzung von Daten aus der Krankenversorgung für die Forschung formiert (Warren-Gash 2017; Committee on the Learning Health Care System in America 2013; Schilsky et al. 2014). Auch in Deutschland besteht ein reges Interesse an der Sekundärnutzung von Daten aus der Krankenversorgung. Dies zeigt sich z. B. in der vom Bundesministerium für Bildung und Forschung geförderten Medizininformatikinitiative (Bundesministerium für Bildung und Forschung 2015, siehe hierzu auch den Beitrag von Wiebke Lesch in diesem Band), aber auch in Vorstößen des Bundesministeriums für Gesundheit, Versorgungsdaten der Krankenkassen standardmäßig für die Forschung nutzbar zu machen (Digitale-Versorgung-Gesetz – DVG (Fn.: BT-Drs. 19/13438)).

Trotz der offensichtlichen Relevanz des Themas wurden begriffliche Fragen der Sekundärnutzung von Daten aus der Krankenversorgung – im Folgenden als „klinische Daten“ bezeichnet – bisher in der Literatur wenig erörtert. Mit dem vorliegenden Artikel soll ein Beitrag zur Schließung dieser Forschungslücke geleistet werden. So besteht zum einen das Desiderat einer begrifflichen Klärung dessen, was unter Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten zu verstehen ist. Dieser Aufgabe widmet sich der erste Abschnitt des vorliegenden Artikels sowohl in Bezug auf den Begriffsinhalt als auch seinen Umfang. Es werden im Anschluss drei Anwendungsfelder für die Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten aufgezeigt. Im nächsten Abschnitt analysieren wir neben möglichen Nutzenpotenzialen auch die Herausforderungen für die Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten. Für eine verantwortungsvolle Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten ist zudem eine Abschätzung möglicher negativer Folgen für PatientenFootnote 1 wie auch für Ärzte, Pflegepersonal und Kliniken unabdingbar. Aus diesem Grund zeigen wir wichtige Risiken und ethische Implikationen auf. Im Anschluss geben wir einen Ausblick auf mögliche Maßnahmen der Risikoreduzierung.

2 Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten

Die vorliegende Analyse stellt eine Präzisierung eines Konzepts dar, welches an anderer Stelle veröffentlicht wurde (Jungkunz et al. 2021). Im vorliegenden Artikel bauen wir auf den wichtigsten Ideen dieser Publikation auf und erweitern sie um einige wichtige Aspekte.

Die American Medical Informatics Association (AMIA) definiert die Sekundärnutzung von klinischen Daten als “non-direct care use of [personal health information (PHI)] including but not limited to analysis, research, quality/safety measurement, public health, payment, provider certification or accreditation, and marketing and other business including strictly commercial activities” (Safran et al. 2007). Ähnlich allgemein äußern sich weitere Publikationen. So identifiziert ein systematisches Literaturreview von Robertson et al. die Bereiche „Forschung“, „Qualitätssicherung und Sicherheit in der Versorgung“, „Finanzverwaltung“ und „Bildung“ als Anwendungsfelder der Sekundärnutzung klinischer Daten (Robertson et al. 2016). Andere Autoren benennen ähnliche allgemeine Kategorien (Heatherly et al. 2013; Ienca et al. 2018; American Medical Informatics Association 2007). Eine detaillierte begriffliche Definition und Beschreibung der mit Sekundärdatennutzung durchführbaren Forschungs- oder Lernaktivitäten fehlt bisher. Diese Lücke füllen wir im nächsten Abschnitt durch Beschäftigung mit dem Begriff, dem Umfang und den Anwendungsfeldern der „Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten“. Zuerst analysieren wir den Inhalt (Sinn) des Begriffs „Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten“ und zeigen im Anschluss daran auf, welche Arten von Studien unter dem Begriff subsumiert werden können (Umfang). Im weiteren Verlauf des Artikels nehmen wir auf den Begriff mit dem Akronym „SeConts“ Bezug, das auf den englischen Begriff „Secondary use of clinical data in data-gathering, non-interventional research or learning activities“ zurückgeht (Jungkunz et al. 2021).

2.1 Sinn des Begriffs SeConts

Wenn wir von Sekundärnutzung klinischer Daten in datensammelnden, nicht interventionellen Forschungs- oder Lernaktivitäten (SeConts) sprechen, so stellt sich zuallererst die Frage, was mit dem Begriff der klinischen Daten gemeint ist. Klinische Daten sind nach unserer Begriffsdeutung ausschließlich Daten, die im Kontext der Krankenversorgung in Krankenhäusern und Arztpraxen erhoben werden. Dies können zum einen Daten sein, die direkt mit der Behandlung zusammenhängen, wie z. B. Diagnosen, Befunde, Verlaufsdokumentation, Medikationspläne oder Laborwerte. Zum anderen geht es bei klinischen Daten auch um Daten aus dem Abrechnungswesen von Versorgungsleistungen, die z. B. Alter, Beschäftigungsstatus und andere soziodemographische Informationen beinhalten. Bei allen genannten Formen von Daten ist es nach unserem Verständnis des Begriffs „klinische Daten“ unerheblich, ob die Daten aus der Administration der Kliniken selbst bezogen werden, zukünftig über eine selbstverwaltete elektronische Patientenakte oder von den Krankenkassen. In allen Fällen sprechen wir von klinischen Daten. Als Überkategorie zum Begriff der klinischen Daten steht derjenige der GesundheitsdatenFootnote 2, welcher zwar auch klinische Daten beinhaltet, jedoch in seinem Umfang über diese hinausgeht. So werden z. B. auch Daten als Gesundheitsdaten angesehen, die mit sogenannten Wearables (tragbare Geräte wie Fitness-Armbänder) und Gesundheitsapps etc. gewonnen werden und einen (expliziten) Gesundheitsbezug haben, jedoch nicht im klinischen Kontext erhoben werden. Verschiedene Arten von Gesundheitsdaten inklusive der für diesen Artikel relevanten klinischen Daten werden in Abb. 1 dargestellt.

Abb. 1.
figure 1

Klinische Daten und andere Gesundheitsdaten

Der Begriff der Sekundärnutzung klinischer Daten impliziert die Existenz einer vorhergehenden PrimärnutzungFootnote 3. Die Primärnutzung wurde bereits mit der Erläuterung der Herkunft klinischer Daten angedeutet. Klinische Daten dienen in ihrer ursprünglichen (primären) Verwendung der Patientenversorgung bzw. – im Falle von Abrechnungs- und Verwaltungsdaten – der Organisation und Durchführung jener Versorgung. Im Rahmen von SeConts werden keinerlei neue Daten erhoben. Vielmehr werden bereits aus der Versorgung vorhandene Daten gesammelt und zu einem anderen Zweck als dem der Versorgung verwendet. Dies bedeutet, dass die sekundäre Nutzung keinerlei zusätzliche Intervention am Patienten voraussetzt oder mit sich bringt, welche dem Zweck der Erhebung von Daten zu Forschungszwecken dienen würde. Dieses Verständnis von Sekundärnutzung schließt nicht aus, dass die zu nutzenden Daten im Zuge von Interventionen erzeugt wurden, welche zu Diagnose- oder Therapiezwecken am Patienten vorgenommen wurden.

Wenn wir von der Sekundärnutzung klinischer Daten im Rahmen von Forschungs- oder Lernaktivitäten sprechen, so sind die Begrifflichkeiten Forschung und Lernen – im technischen Sinne eines Erkenntnisgewinns durch die Auswertung klinischer Daten – schwer trennbar und die Grenzen zwischen ihnen fließend. In beiden Fällen geht es um die Generierung verallgemeinerbaren Wissens unter alleinigem Rückgriff auf die Sammlung und Nutzung klinischer Daten. Im Bereich der Forschung liegt der primäre Fokus zunächst auf dem Erkenntnisgewinn und eher indirekt und in der Folge der wissenschaftlichen Veröffentlichung der Ergebnisse auf der Verbesserung der medizinischen Versorgung.

Unter Lernaktivitäten verstehen wir Aktivitäten, die sich von Forschung dahingehend unterscheiden, dass das primäre Interesse in der unmittelbaren Sicherung oder Verbesserung einer konkreten Versorgungssituation besteht. Lernaktivitäten können auf eine bestimmte Klinik oder Station bezogen sein, wie z. B. bei der Infektionskontrolle einer bestimmten Abteilung. Ebenso können sich Lernaktivitäten auf ganze Gesellschaften beziehen, wie dies z. B. das Robert Koch-Institut für Deutschland in Hinblick auf die Infektionskontrolle zur Aufgabe hat. Selbstverständlich können auch Lernaktivitäten zu Erkenntnissen führen, die Gegenstand einer wissenschaftlichen Publikation werden. Ebenso ist im Falle von Erkenntnissen, welche über Lernaktivitäten einzelner Kliniken gewonnen werden, eine Weitergabe des Wissens auch in anderer als wissenschaftlicher Form möglich. Eine solche Weitergabe kann etwa in Klinikverbünden geschehen, wenn z. B. Erkenntnisse zur Verbesserung des Infektionsmanagements einer einzelnen Klinik an den restlichen Verbund weitergegeben werden. Das primäre Ziel von Lernaktivitäten bleibt jedoch die zeitnahe Kontrolle und Verbesserung einer konkreten Versorgungssituation. Dieser Fokus bedeutet nicht, dass Lerntätigkeiten direkt denjenigen Patienten zugutekommen, deren Daten verwendet werden. Ein derartiger direkter Nutzen für den Patienten ist eher unwahrscheinlich, da auch Qualitätssicherungs- und Verbesserungsprozesse innerhalb einzelner Kliniken eine gewisse Implementierungszeit beanspruchen.

Fassen wir die vorangehende begrifflichen Erläuterungen zusammen, lässt sich Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten (SeConts) beschreiben als Nutzung von Daten aus der medizinischen Versorgung für Forschungs- oder Lernaktivitäten, ohne körperliche Eingriffe oder zusätzliche Maßnahmen zur Datengenerierung, zum Zweck der Verbesserung des biomedizinischen Wissens und der medizinischen Versorgung, jedoch nicht zum Eigennutzen des Patienten.

2.2 Umfang des Begriffs SeConts: Studientypen

Es gibt ein weites Spektrum an Forschungs- oder Lernaktivitäten, welche unter SeConts subsumiert werden können. Beispiele wären hier die Modellierung von klinischen Studien in-silico (Weiner et al. 2008), vergleichende Wirksamkeitsstudien (comparative effectiveness studies) (Bronsert et al. 2013; Institute of Medicine 2009), Studien zur Arzneimittelsicherheit und -wirksamkeit (Kuter et al. 2013) oder auch Studien zu Risikofaktoren verschiedener Krankheiten (Mathews et al. 2013; Conway et al. 2007). Ebenso ist es möglich, individuelle Heilversuche (z. B. durch einen Off-Label Use von Medikamenten) retrospektiv zu analysieren (Oshikoya et al. 2019). Weiterhin kann SeConts der Infektionskontrolle in Kliniken (Samore et al. 1997; Evans et al. 1992) oder der Früherkennung z. B. von multiresistenten Keimen (Pittet et al. 1996) dienen. Auf gesamtgesellschaftlicher Ebene sind gesellschaftliche Infektionskontrolle (Smith et al. 2007) und epidemiologische Studien unterschiedlicher Art (Robinson et al. 2001; Mitchell et al. 2014) sowie Outcome-Forschung (Been et al. 2015) oder Versorgungsforschung (Hay und Hay 1992) mit klinischen Daten durchführbar. Ebenso können hier die bereits gut etablierten sogenannten Registerstudien (Stattin et al. 2010), die eher eine Methode als einen Studientyp beschreiben, genannt werden.

Betrachtet man den jeweiligen Forschungsgegenstand der unterschiedlichen genannten Arten von SeConts, so ist eine Kategorisierung in drei übergeordnete Bereiche möglich. Der Forschungsgegenstand kann entweder der individuelle Patient (Mikroebene), die klinische Versorgungseinheit (Mesoebene) oder die Gesellschaft (Makroebene) sein. Entsprechend dieser Ebenen ergibt sich eine Einteilung von SeConts in nicht-interventionelle klinische Forschung (Mikroebene), Aktivitäten zur Kontrolle, Verbesserung und Erforschung der Versorgung (oder bestimmter Versorgungssituationen) (Mesoebene) und Public Health Forschung (Makroebene). Darüber hinaus ist in allen drei Bereichen eine explorative Verwendung der Daten möglich. Hierunter fällt insbesondere die Hypothesengenerierung – für welche manche Autoren (Braun und Dabrock 2016; Lee et al. 2015) ein großes Potenzial in der Datenanalyse durch Künstliche Intelligenz (KI) bzw. Maschinellem Lernen (ML) sehen. Über die hypothesengenerierende Verwendung (ob mit oder ohne KI bzw. ML) hinaus ermöglicht die Sekundärnutzung klinischer Daten die Durchführung von MachbarkeitsstudienFootnote 4 im Vorfeld geplanter Studien und ggf. sogar der Identifizierung möglicher Teilnehmer für geplante bzw. laufende klinische StudienFootnote 5 (Kopcke et al. 2013). Neben den genannten Beispielen gibt es weitere Studientypen, welche mehreren Anwendungsfeldern zugeordnet werden können, wie z. B. Forschung in der Medizininformatik, welche u. a. an Diagnostiksoftware zur Unterstützung von Ärzten oder an einer Verbesserung der Datensicherheit in Kliniken arbeitet und somit in die Anwendungsfelder „nicht-interventionelle klinische Forschung“ und „Aktivitäten zur Kontrolle, Verbesserung und Erforschung der Versorgung (oder bestimmter Versorgungssituationen)“ fallen kann (Xu et al. 2010; Yeniterzi et al. 2010). Die genannten Anwendungsfelder von SeConts inklusive möglicher Studientypen sind in Tab. 1 zusammengefasst.

Tab. 1. Anwendungsfelder von SeConts und Studientypen

Was hingegen nicht zum Umfang unseres Begriffs von SeConts gezählt werden kann, ist Forschung, welche klinische Daten mit Forschungsdaten kombiniert oder Daten aus anderen Quellen (z. B. von Wearables oder Fitness Apps) auswertet. Ein Beispiel hierfür wären Genomweite Assoziationsstudien (GWAS), welche aktuell häufig eine Kombination aus klinischen Daten (Phänotypen) und Forschungsdaten (Genotypen) darstellenFootnote 6. Ebenso kann Biobankforschung nicht unter SeConts gefasst werden. Zwar ist es möglich, dass Biomaterial im Zuge der Behandlung und somit ohne zusätzliche Eingriffe entnommen werden kann (Kaye et al. 2012). Jedoch sind Entnahme und Sammlung des Materials ein ethisch und rechtlich relevanter Extraschritt, der nicht zu Behandlungs-, sondern zu Forschungszwecken unternommen wird. Dies gilt besonders auch für die eventuell aus dem Biomaterial zu erzeugenden Daten, mit denen später Forschung betrieben wird, da diese Daten eben nicht bereits aus dem Versorgungskontext vorliegen, sondern aus dem Biomaterial nur zu Forschungszwecken gewonnen werden.Footnote 7

3 Nutzenpotenziale der Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten

Darüber, dass SeConts große Nutzenpotenziale beinhaltet, sind sich zahlreiche Autoren einig. Diese Nutzenpotenziale liegen in sehr unterschiedlichen Aspekten begründet (siehe hierzu auch den Beitrag von Anja Köngeter in diesem Band). Aus forschungsökonomischer Sicht ist die Sekundärnutzung klinischer Daten insofern äußerst interessant, als sie Studien ermöglicht, welche ohne bzw. mit nur minimalem Erhebungsaufwand durchführbar sind (Meystre et al. 2017). Im Rahmen dieser Studien können – durch eine mögliche Aggregation von Daten aus unterschiedlichen Kliniken – große Stichproben untersucht werden. Ebenso ist es möglich, Patienten, z. B. bei chronischen Erkrankungen, über einen langen Zeitraum hinweg anhand ihrer in der Versorgung erzeugten Daten zu betrachten und somit große Langzeitstudien (z. B. die Erforschung von Langzeiteffekten bestimmter Interventionen) durchzuführen (Martin-Sanchez et al. 2017).

Aus forschungsmethodischer Sicht zeichnet sich SeConts durch ein hohes Maß an externer Validität aus. Daten aus traditionellen Studiendesigns werden häufig in einer mehr oder weniger artifiziellen Umgebung erzeugt, was sinnvoll ist, um äußere Störfaktoren zu kontrollieren, jedoch auch gewisse Probleme mit sich bringen kann. So spricht man in diesem Zusammenhang vom sogenannten Hawthorne Effekt. Dieser beschreibt das Phänomen, dass Probanden sich aufgrund des Wissens, dass sie sich in einer Studie befinden, anders verhalten, als sie dies normalerweise tun würden (Adair 1984; Benedetti et al. 2016). Ein derartiger Effekt ist bei SeConts nicht zu erwarten, da die (retrospektiv genutzten) Daten einer „natürlichen“ Umgebung entspringen und somit die Patienten zwar eventuell unvollständig (hierzu mehr im nächsten Abschnitt), aber dennoch in einer alltäglichen (Klinik-)Wirklichkeit abbilden (Martin-Sanchez et al. 2017). Ebenso unterliegt SeConts dadurch, dass die Daten direkt aus der Versorgung stammen, einer geringeren Wahrscheinlichkeit, bestimmten Formen von Verzerrungen (Bias) zu unterliegen (Lucero et al. 2015; Brakewood und Poldrack 2013), z. B. derart, dass im Fall von klinischen Studien bestimmte Gruppen über- bzw. unterrepräsentiert sind. So sind z. B. Frauen in Studien zu nicht-geschlechtsspezifischen Krebsformen häufig unterrepräsentiert (Jagsi et al. 2009). Ähnliches gilt für Ältere und ethnische Minderheiten in anderen Bereichen der klinischen Forschung (Sardar et al. 2014; Vitale et al. 2017). Eine Über- oder Unterrepräsentation kann sehr unterschiedliche Gründe haben, wie z. B. eine unterschiedliche Bereitschaft zur Studienteilnahme in bestimmten Gruppen von Patienten, aber auch die Verwendung von Ein- und Ausschlusskriterien, welche bestimmte Patientengruppen aus methodischen Gründen ausschließt. Dass SeConts allerdings nicht nur derartige Verzerrungen vermeidet, sondern andererseits auch anfällig für andere Arten von Verzerrungen sein kann, werden wir im nächsten Abschnitt zeigen.

Aus forschungsethischer Sicht besteht ein grundsätzlicher Vorteil, wie bereits angedeutet, darin, dass SeConts aufgrund ihrer Nicht-Interventionalität keinerlei direkte physische Risiken für Probanden mit sich bringt. Dies ist auch deshalb relevant, da die Nicht-Interventionalität die Möglichkeit eröffnet, Fragestellungen nachzugehen, deren Erforschung durch gezielte Interventionen in interventionellen Studien ethisch problematisch wäre (Lee 2017). Ein Beispiel hierfür ist die Erforschung bestimmter medizinischer Interventionen bei vulnerablen Gruppen wie z. B. Kindern oder Schwangeren. Eine Forschungslücke und damit ein Wissensdefizit in Bezug auf vulnerable Gruppen äußert sich in einem Fehlen von Behandlungsmethoden und Medikamenten, die speziell für diese Gruppen entwickelt und getestet wurden. Wissen aus bereits erfolgter Behandlung, vermittelt über die SeConts, könnte hier helfen, die Evidenzlage und somit auch die zukünftige Behandlung dieser Gruppen zu verbessern.

Auf die gleiche Weise können systematische Analysen von Heilversuchen ermöglicht werden. Bei Heilversuchen handelt es sich um ärztliche Heilbehandlungen, die vom medizinischen Standard abweichen, etwa mit einem noch nicht etablierten Medikament oder einer noch nicht etablierten Methode, z. B. bei Off-Label-Use von Medikamenten. Im Rahmen eines individuellen Heilversuchs bei Patienten, für die bereits alle therapeutischen Möglichkeiten ausgeschöpft sind, kann die Durchführung bestimmter Interventionen als „letzte Möglichkeit“ gerechtfertigt sein. Eine kumulierte retrospektive Analyse derartiger Heilversuche anhand der erzeugten klinischen Daten hat das Potenzial, Hypothesen zu generieren, welche die Entwicklung einer zukünftigen Therapie anstoßen.

Ein weiterer Bereich, in dem SeConts neue Möglichkeiten für die biomedizinische Forschung eröffnet, ist derjenige der seltenen Erkrankungen. Die Erforschung seltener Erkrankungen ist aufgrund der per Definition geringen Fallzahlen zum einen nur sehr schwierig durchführbar, zum anderen für nicht universitäre Forschungseinrichtungen aus dem Bereich der Industrie aufgrund der zu erwartenden geringen Absätze äußerst unattraktiv. Dies kann zu einer – im Verhältnis zu anderen Erkrankungen – schlechteren Versorgung der Betroffenen führen. Die Möglichkeit der Kumulation der Behandlungsdaten von Patienten aus unterschiedlichen Krankenhäusern bringt die Hoffnung mit sich, diese Forschungslücken schneller zu schließen und die Entwicklung von Behandlungsmethoden voranzutreiben, da hier schneller hohe Fallzahlen mit relativ geringem organisatorischen und finanziellen Aufwand erreicht werden können (Elger et al. 2010). Tab. 2 fasst die genannten Nutzenpotenziale von SeConts zusammen.

Tab. 2. Nutzenpotenziale von SeConts

4 Herausforderungen für die Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten

Neben den genannten Nutzenpotenzialen sind Herausforderungen von bzw. für SeConts zu nennen (siehe hierzu auch den Beitrag von Anja Köngeter in diesem Band). Diese teilen wir in Probleme mit Datenqualität und -vollständigkeit, Interoperationalisierbarkeit und Verzerrung (Bias) ein.

Datenqualität und Vollständigkeit: Im Gegensatz zu Forschungsdaten werden klinische Daten per Definition mit dem primären Zweck der Patientenversorgung erhoben. Die Tatsache, dass Daten einen primären Zweck erfüllen, führt dazu, dass sie nicht optimal auf den sekundären Nutzen angepasst sind. So sind gewisse Informationen, welche im Forschungskontext wichtig sind, für den eigentlichen Erhebungszweck – den klinischen Alltag – mitunter weniger relevant und werden deshalb nur lückenhaft erhoben (Sturmer et al. 2011; Hersh et al. 2013). Derartige Lücken bestehen mitunter auch in Bezug auf Informationen zu etwaigen konfundierenden Faktoren, Outcome Werte o.ä., welche im klinischen Alltag oft nicht in der gleichen Ausführlichkeit kontrolliert und somit dokumentiert werden können wie es für die Forschung notwendig wäre (Meystre et al. 2017). Doch auch wenn ein Datensatz alle (für Forschung wesentlichen) Daten beinhaltet, birgt sein Ursprung im klinischen Alltag gewisse Schwierigkeiten hinsichtlich seiner Verwendung für die Forschung. So liegen klinische Daten aktuell noch immer häufig in unstrukturierter Weise vor, d. h. in natürlicher Sprache ohne eine systematische Codierung (z. B. Arztbriefe). Dieser Umstand bewirkt, dass eine effiziente Auswertung nur über den Umweg des sogenannten Natural Language Processing möglich ist (Murff et al. 2011; Xu et al. 2010). Wenngleich diese Technologie in den letzten Jahren große Fortschritte gemacht hat, so ist sie immer noch in der Entwicklung und potenziell fehleranfällig (Sheikhalishahi et al. 2019).

Eine weitere große Herausforderung für SeConts sind unterschiedliche Standards der Dateneingabe und -codierung oder gar unterschiedliche Erhebungsinstrumente in unterschiedlichen Kliniken und Arztpraxen (Meystre et al. 2017), welche die Interoperationalisierbarkeit von Daten aus mehreren Ursprungsorten erschwert (Geissbuhler et al. 2013; Ancker et al. 2011).Footnote 8 So existieren zahlreiche unterschiedliche klinische Informationssysteme (KIS) und klinische Routinen der Dokumentation, deren Daten vereinheitlicht werden müssen, sollen sie in einer Studie zusammengeführt werden. Die ex post Herstellung der Interoperationalisierbarkeit von Daten aus unterschiedlichen Quellen führt notwendigerweise zu gewissen Aufbereitungskosten und kann ihrerseits wiederum Fehler produzieren (Lee 2017). Zusätzlich zu den technischen Faktoren der Interoperationalisierbarkeit der Daten ist anzunehmen, dass ein potenzieller Unterschied in der Erfahrung der Diagnostiker und Behandler bei der Diagnosestellung und Dokumentation (Hersh et al. 2013) sich in geringer und vor allem nicht kontrollierbarer Inter-Rater-Reliabilität (d. h. der Zuverlässigkeit der Vergleichbarkeit von Informationen die von unterschiedlichen Personen dokumentiert werden) und somit in Schwierigkeiten der Vergleichbarkeit der aus der Diagnostik gewonnenen Daten niederschlägt.

Die bisher genannten Schwierigkeiten bei SeConts bzgl. Datenqualität, -vollständigkeit und Interoperationalisierbarkeit zeigen sich exemplarisch in einer Studie von Botsis et al. (Botsis et al. 2010). Hier wurde mit Hilfe elektronischer Krankenakten die Überlebenszeit von Patienten mit einem Pankreaskarzinom ausgewertet. Es zeigte sich, dass nur 33 % der vorhandenen Datensätze für die finale Analyse verwendet werden konnten, da in 67 % der Datensätze an relevanten Stellen Informationen fehlten. Vorhandene Informationen wurden zudem oft als ungenau eingestuft und mussten aufwändig aus unterschiedlichen Quellen zusammengestellt werden. Dies führte mitunter zu Inkonsistenzen in den Daten, die z. B. daraus resultierten, dass Patienten in unterschiedlichen Datenquellen unterschiedliche Diagnosen zugewiesen wurden.

Mit der Gefahr von Verzerrungen (Bias) hängt eine weitere Schwierigkeit der Sekundärnutzung ebenfalls mit der unsystematischen bzw. nicht an einer bestimmten Forschungslogik orientierten Art der Erhebung zusammen (Terris et al. 2007; Rusanov et al. 2014; Prada-Ramallal et al. 2019; Jones et al. 2017; Lee 2017). Mögliche Verzerrungen können verschiedene Ursachen haben. Es zeigt sich z. B., dass die klinische Dokumentation von Patienten mit schwerem Krankheitsverlauf potenziell ausführlicher vorliegt als diejenige von Patienten mit milden Verläufen. Dies führt bei einer Sekundärnutzung in der Forschung zu einer Verzerrung, die sich dahingehend äußert, dass – um die Vollständigkeit der verwendeten Datensätze zu gewährleisten – Patienten mit schwereren Verläufen überproportional häufig in entsprechenden Studien vertreten sind (Rusanov et al. 2014).

Außerdem können nicht erhobene konfundierende Faktoren Verzerrungen erzeugen. Zu konfundierenden Faktoren können z. B. spezielle Rahmenbedingungen in einer bestimmten Klinik gehören, welche zu einer Überrepräsentation bestimmter Patienten führen können. So kann eine bestimmte Station z. B. einen besonders guten Ruf haben, was dazu führen kann, dass sich dort besonders viele Patienten mit schweren Verläufen vorstellen, in der Hoffnung, ihnen würde dort besonders gut geholfen. Diese Information ist nicht notwendigerweise in den klinischen Daten sichtbar, kann aber eine Verzerrung in den Daten mit sich bringen.

Zusätzlich besteht die Gefahr des sogenannten „Upcodens“ (Meystre et al. 2017), d. h. der ungerechtfertigten oder zumindest „großzügigen“ Diagnosestellung. Im Rahmen eines in vielen Ländern gängigen Abrechnungssystems für Behandlungsleistungen werden diagnosebezogene Fallgruppen (diagnosis related groups (DRG)) als Grundlage für die Berechnung der von den Krankenkassen erstatteten Mittel verwendet. Jeder Behandlungsfall wird entsprechend einer Pauschale vergütet, die anhand der Diagnose definiert ist. „Upcoden“ wird in einem DRG Abrechnungssystem potenziellFootnote 9 aus ökonomischer Motivation durchgeführt um eigentlich nicht indizierte, aber profitablere Behandlungen durchführen und abrechnen können (Steinbusch et al. 2007). Derartiges „Upcoden” kann die Validität der Daten mitunter stark verzerren.

Ein Teil der genannten Einschränkungen und Herausforderungen für die Sekundärnutzung klinischer Daten für SeConts sind technischer und organisatorischer Natur und werden aller Voraussicht nach in den nächsten Jahren bzw. Jahrzehnten gelöst werden. Mit Investitionen in die digitale medizinische Infrastruktur und nationalen wie internationalen Harmonisierungsanstrengungen können Probleme der Interoperationalisierbarkeit der Daten, der Unstrukturiertheit bzw. der Umgang mit derselben und der Unvollständigkeit der Datensätze zumindest prinzipiell gelöst werden. Andere Einschränkungen hingegen, wie z. B. die Frage der Inter-Rater-Reliabilität oder auch verschiedene Formen einer möglichen Verzerrung der Daten sind Probleme, die bei der Bewertung und Durchführung stets beachtet werden müssen, um das Potenzial von SeConts bestmöglich ausschöpfen zu können. Tab. 3 fasst die genannten Herausforderungen zusammen.

Tab. 3. Herausforderungen für SeConts

5 Mögliche Risiken der Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten für Patienten und weitere Stakeholder

5.1 Die Gefahr von Datenpannen

Nachdem im vergangenen Abschnitt verschiedene technische, organisatorische und datenimmanente Herausforderungen von SeConts benannt wurden, sollen im Folgenden mögliche Risiken analysiert werden, welche SeConts für die beteiligten Stakeholder, insbesondere die Patienten, mit sich bringen kann. Die Durchführung von SeConts ist in verschiedenen Dimensionen auf einer breiten Skala vorstellbar: (1) punktuell mit (spezifischer) informierter Einwilligung, d. h. im Rahmen einzelner Studien, welche Patienten um die Einwilligung zur Datennutzung bitten; (2) semi-systematisch mit breiter Einwilligung, d. h. Patienten willigen in zukünftige SeConts ein, die zum Zeitpunkt der Einwilligung noch nicht feststeht; (3) systematisch ohne Einwilligung, d. h. Daten werden standardmäßig und ohne vorige Einwilligung der Forschungsnutzung (SeConts) zugeführt, so lange Patienten nicht widersprechen (Opt-Out). Zusätzlich sind weitere Einwilligungsmodelle denkbar. Während unser Text sich auf Nutzenpotenziale, Herausforderungen und Risiken für verschiedene Stakeholder bezieht, die grundsätzlich für alle Dimensionen der möglichen Durchführung von SeConts relevant sind, geht es nicht um die verschiedenen denkbaren Einwilligungsmodelle, sodass wir auch keine ethische Bewertung derselben durchführen.

Bei SeConts handelt es sich um einen Vorgang, bei dem besonders sensible Daten betroffen sind. Zwar sind personenbezogene Daten stets als schützenswert einzustufen. Nicht umsonst betont das Bundesverfassungsgericht, dass im Kontext der elektronischen Datenverarbeitung kein Datum belanglos ist (BVerfG, Urt. v. 15.12.1983 – 1 BvR 209 u.a./83, BVerGE 65, 1). Jedoch zeichnen sich klinische Daten durch ein besonders hohes Maß an Sensibilität aus (Rumbold und Pierscionek 2018), handelt es sich doch um Informationen über Patienten, welche besonders persönlicher Natur sind und potenziell Rückschlüsse auf viele Bereiche des Lebens (z. B. Lebensstil, Sexualverhalten, erwarteter zukünftiger Gesundheitsstatus etc.) des Einzelnen zulassen. Nicht zuletzt zählen Informationen dieser Art zu den „besonderen Kategorien von personenbezogenen Daten“ gemäß Art. 9 Abs. 1 DSGVO und werden zusätzlich von der ärztlichen Schweigepflicht geschützt.

Speicherung, Transfer und Verarbeitung von Daten birgt stets die Gefahr von Datenpannen. Mit dem Begriff der Datenpanne sind hier alle Arten von Ereignissen gemeint, bei denen die Vertraulichkeit und der geplante Schutz der Daten verletzt werden, sei es durch technisches Versagen, menschliche Unachtsamkeit oder durch vorsätzliche unethische oder kriminelle Handlungen. Das Spektrum möglicher Folgen derartiger Datenpannen mit klinischen Daten, z. B. nach einem Datendiebstahl, ist weit und könnte von Belästigung durch personalisierte Werbung bis hin zu Identitätsdiebstahl, Diskriminierung, Stigmatisierung oder Erpressung reichen (Benitez und Malin 2010; Kaplan 2016; Parker und Aggleton 2003; Laurie et al. 2014; Weichert 2018; Bundesamt für Gesundheit 2017).

Auch wenn uns im deutschsprachigen Raum keine systematischen Untersuchungen zu Datenpannen in Form konkreter Datendiebstähle in Krankenhäusern bekannt sindFootnote 10, so zeigen Untersuchungen z. B. aus den USA, dass dort bereits Daten aus elektronischen Patientenakten entwendet wurden. Liu und Kollegen geben an, dass zwischen 2010 und 2013 in amerikanischen Krankenhäusern insgesamt 949 unbefugte Zugriffe auf Informationen aus insgesamt fast 30 Mio. Patientenakten dokumentiert wurden. 552 der Datenpannen wurden explizit als Diebstahl klassifiziert (Liu et al. 2015). Eine Studie von Floyd et al. zeigt anhand von belegten Datenpannen (inklusive Datendiebstählen) in US-Krankenhäusern zwischen 2012 und 2015, dass die Mehrheit der betreffenden Daten aus Namen, Geburtsdatum, Sozialversicherungsnummer und ähnlichem besteht. Es wurden jedoch auch Daten wie Diagnosen und Behandlungsinformationen entwendet (Floyd et al. 2016). Die jeweilige Art des Missbrauchs der betroffenen Daten in Folge eines Datendiebstahls ist schwer zu erforschen. Eine genaue Nachverfolgung der missbräuchlichen Verwendungen und damit verbundener Folgen für die Betroffenen ist grundsätzlich schwierig. Mit Blick auf die Existenz zahlreicher (illegaler) Portale im sogenannten Darkweb, auf denen mit persönlichen Daten gehandelt wird, liegt die Vermutung nahe, dass auch gestohlene klinische Daten dort angeboten werden (Floyd et al. 2016).

5.2 Risiken für Patienten

Im Folgenden widmen wir uns zunächst den möglichen Risiken, die in erster Linie die Patienten selbst betreffen aber potenziell auch Auswirkungen für andere Stakeholder haben (zum Thema „Risiken“, siehe auch den Beitrag von Anja Köngeter in diesem Band). Hierbei legen wir den Schwerpunkt auf diejenigen Risiken, die direkt oder indirekt mit der Sicherheit der Daten in Verbindung stehen, zeigen aber auch Risiken auf, die im Rahmen von SeConts sogar ohne Datenpannen entstehen können. Dabei ist zu bedenken, dass es, wie es auf dem Gebiet der Beschäftigung mit neuartigen Entwicklungen oft vorkommt, keine einschlägigen empirisch gesicherten Kenntnisse gibt. Für eine bessere Einschätzung möglicher Risiken in Bezug auf den Missbrauch gestohlener Daten ist eine Verbesserung der Forschungslage erforderlich. Eine Pflicht für öffentliche Einrichtungen wie Krankenhäuser, Datenschutzpannen zu melden (vgl. Art. 33 DSGVO) stellt hierfür eine geeignete Grundlage dar. Die wissenschaftliche Aufbereitung derartiger Informationen ist im deutschen Kontext derzeit noch äußerst begrenzt. Die Wahrscheinlichkeit einer Datenpanne oder gar eines Datendiebstahls im Kontext von SeConts ist zudem äußerst schwierig abzuschätzen, da empirische Daten aktuell wenn, dann lediglich für die Krankenversorgung, nicht aber für SeConts vorliegen (siehe Abschn. 5.1). Gleiches gilt in verstärktem Maße für mögliche Arten des Missbrauchs, welche aus einer Datenpanne folgen können. Aus diesem Grund untersuchen wir mögliche Risiken aus Sicht eines „Negativszenarios“, dessen Eintrittswahrscheinlichkeit im Moment nur schwer einzuschätzen ist. Voraussetzung dafür, dass Daten missbraucht werden und dem Einzelnen schaden können, ist die Möglichkeit, Personen mit den, in den Daten enthaltenen, persönlichen Informationen zu verknüpfen (Re-Identifikation). Zwar ist es in der biomedizinischen Forschung üblich, mit pseudonymisierten (d. h. de-identifizierten) Daten zu arbeiten,Footnote 11 doch macht dies eine Re-Identifikation nicht unmöglich (zur datenschutzrechlichen Relevanz pseudonymisierter Daten, vgl. den Beitrag von Markus Spitz in diesem Band). Möglichkeit und Aufwand einer solchen Re-Identifikation schwankt je nach Inhalt, Struktur sowie dem jeweiligem Verwendungskontext des Datensatzes (Jungkunz et al. 2021). Doch drohen mögliche Risiken für Patienten im Zuge von Datenpannen nicht allein im konkreten Fall einer Datenpanne mit gezieltem Datenmissbrauch, welcher faktisch spürbare negative Auswirkungen auf die betroffenen Personen hat. Bereits die Kenntnis einer Datenpanne kann für die einzelne betroffene Person aufgrund der Ungewissheit über das Schicksal ihrer persönlichen Daten und darüber, ob diese irgendwo und irgendwann gegen sie verwendet werden, potenziell erheblich belastend sein (de Bruin 2010; Laurie et al. 2014).

Ausgehend von den genannten möglichen Risiken (Identitätsdiebstahl, Diskriminierung, Stigmatisierung oder Erpressung), welche für Patienten von einer möglichen Datenpanne ausgehen, lassen sich im Rahmen eines „Negativszenarios“ weitere mögliche unerwünschte Folgen vorstellen. Im Falle einer systematischen Durchführung von SeConts ohne Einwilligung (siehe Abschn. 5.1) könnte z. B. die Gefahr bestehen, dass Patienten, die sich Gedanken über mögliche Datenschutzrisiken machen, Vertrauen in das Gesundheitssystem verlieren (Platt und Kardia 2015), was ein Risiko darstellt, welches nicht allein auf Patienten beschränkt ist. Der Vertrauensverlust in das Gesundheitssystem könnte sich in einem Vertrauensverlust gegenüber dem Arzt niederschlagen und somit das Arzt-Patienten-Verhältnis negativ beeinflussen (Kelley et al. 2015). Ein Vertrauensverlust könnte auf der Sorge vor Einbußen der Vertraulichkeit der Daten beruhen (zum Thema Angst um die Vertraulichkeit, vgl. (King et al. 2012)). Studien zeigen, dass Patienten aufgrund mangelnden Vertrauens in die Sicherheit bei der Speicherung und Weitergabe ihrer Behandlungsdaten Informationen vorenthalten haben (Agaku et al. 2014; Campos-Castillo und Anthony 2015). Eine systematische Durchführung von SeConts ohne Einwilligung könnte diesen Effekt verstärken, so dass Patienten aus Angst um die Vertraulichkeit ihrer Daten im schlimmsten Fall behandlungsrelevante Informationen für sich behalten könnten (Kaplan 2016). Auch ist denkbar, dass Patienten aus Angst um die Vertraulichkeit ihrer Daten notwendige Arztbesuche nicht wahrnehmen.

Doch auch eine Durchführung von SeConts mit vorheriger Einwilligung könnte bei Patienten die Sorge um die Sicherheit der Daten und somit Belastungen für Patienten mit sich bringen, so wie es in jeder anderen Form der Datenverarbeitung der Fall sein kann. Im Falle von SeConts ist es zudem möglich, dass die Einwilligung des Patienten die Befürchtungen um die Sicherheit der Daten nicht adäquat abbildet, wenn eben jene Einwilligung durch soziale Erwünschtheit oder auch falsche Hoffnungen in Bezug auf den eigenen Nutzen von SeConts motiviert ist (Aitken et al. 2016) und deshalb eigene Befürchtungen hinten angestellt werden (vgl. hierzu die Debatte zum Begriff „therapeutic misconception“).

So ist es vorstellbar, dass Patienten hoffen, durch ihre Einwilligung in SeConts das Wohlwollen ihres Arztes und somit einen Vorteil für ihre Behandlung zu erlangen. Ebenso ist es möglich, dass Patienten sich von SeConts (bzw. deren Ergebnissen) einen persönlichen Vorteil erhoffen (Richter et al. 2018), der sie motiviert, der Nutzung zuzustimmen und dabei andere (entgegenstehende) persönliche Interessen und Werte nachzuordnen. SeConts ist dem Verständnis im vorliegenden Artikel zufolge nicht darauf ausgelegt, dem Patienten, der seine Daten bereitstellt, selbst zu nutzen. Es ist zwar nicht gänzlich auszuschließen, dass SeConts einen individuellen Nutzen für einzelne Patienten mit sich bringt, jedoch ist dies aufgrund der notwendigen Zeit, welche selbst die Umsetzung oder Implementierung von Kenntnissen aus Aktivitäten zur Kontrolle und Erforschung der Versorgung (oder bestimmter Versorgungssituationen) benötigt (von der Translation von Forschungskenntnisse in die Behandlung ganz zu schweigen), sehr unwahrscheinlich. So könnte SeConts bei (jungen) Patienten mit chronischen Erkrankungen mittelfristig eine Verbesserung der Behandlung hervorbringen, von denen sie auch selbst in Zukunft profitieren könnten. Aus unserer jetzigen Perspektive gehen wir jedoch davon aus, dass bei SeConts in aller Regel kein individueller Eigennutzen erwartet werden kann.

Es ist theoretisch möglich, dass Patienten durch die Rückmeldung sogenannter Zufalls- oder Zusatzbefunde von SeConts profitieren. Hierbei muss aber unterstrichen werden, dass es zu möglichen Zufallsbefunden bei SeConts, nach unserem Kenntnisstand, keine Erfahrungen und Berichte gibt. Es herrscht in der Bioethik eine lebhafte Diskussion um Zufallsbefunde aus der Forschung, d. h. aus der Analyse von Forschungsdaten, insbesondere bei Bildgebung (Erdmann 2015) und Genomik (Gitter 2019). Selbst bei genomischer Forschung ist jedoch unklar, ob Zufallsbefunde in relevanter Häufigkeit auftreten (Schuol et al. 2015). Im Gegensatz zum reinen Forschungskontext, in welchem Daten zu Forschungszwecken analysiert werden und nicht schon von einem (behandelnden) Arzt in Augenschein genommen wurden, stammen klinische Daten per Definition bereits aus klinischen Diagnosen und Therapien, für die sie erhoben wurden. Sie wurden also bereits von einem Behandler oder Diagnostiker zum Zwecke der Behandlung untersucht. Ein Zufallsbefund im Rahmen von SeConts durch Forscher ist aus unserer Sicht daher relativ unwahrscheinlich, so dass, zusammen mit dem völligen Mangel an Erfahrung, zum jetzigen Zeitpunkt wenig dafür spricht, in möglichen Zufallsbefunden einen ernstzunehmenden Grund für potenziellen persönlichen Nutzen für den Patienten zu sehen.

Etwaige Hoffnungen von Patienten, sie würden von der Zustimmung zu SeConts selbst profitieren, sind in der Regel unbegründet. Der Gefahr der falschen Hoffnungen auf einen persönlichen Nutzen ist also entgegenzuwirken, z. B. durch eine ausführliche Aufklärung von Patienten über Zweck, Möglichkeiten und Konsequenzen von SeConts.

5.3 Risiken für weitere Stakeholder

Neben den Risiken, die mehr oder weniger ausschließlich die Patienten betreffen, kann SeConts auch Risiken und Herausforderungen für Patienten und weitere Stakeholder mit sich bringen. Zwei derartige mögliche Risiken sollen im Folgenden angeführt werden: erstens die mögliche Belastung durch erhöhten Dokumentationsaufwand für Ärzte und Pflegepersonal und zweitens der Vergleich (von Qualität und Wirtschaftlichkeit) medizinischer Maßnahmen zwischen verschiedenen Behandlern oder Kliniken.

Werden Daten aus der Versorgung standardmäßig und systematisch der Forschung zugeführt, so verändert dies mit hoher Wahrscheinlichkeit die Dokumentationsroutinen der Versorgung selbst. Daten müssen in einer Form dokumentiert werden, welche eine spätere sekundäre Verarbeitung im Rahmen von SeConts ermöglicht. Ebenso könnte es zu der Entwicklung kommen, dass, vor dem Hintergrund der späteren Forschungsnutzung, eine größere Menge an Daten erhoben wird, als dies für die reine Versorgung notwendig wäre. Eine derartige Erhöhung der dokumentierten Datenmenge kann sowohl für das Personal selbst eine Belastung darstellen, als auch negative Auswirkungen auf die Patientenversorgung mit sich bringen. Zum einen träfe ein derartiger Mehraufwand bei der Datenerhebung auf ohnehin bereits knappe zeitliche Ressourcen des klinischen Personals, was für das Personal selbst eine physische und psychische Belastung wäre. Zudem würde das für die Dokumentation aufgewendete Mehr an Zeit an anderer Stelle in der Versorgung fehlen und somit negative Folgen für Patienten mit sich bringen. Gegen die Entwicklung in Richtung dieses negativen Szenarios spricht die Möglichkeit eines anderen, positiveren Szenarios. So kann eine standardisierte Dokumentation mit standardisierten digitalen Formularen – z. B. durch die Nutzung von festen Textbausteinen, welche für die Erstellung von Arztbriefen ausgewählt werden können – auch eine Zeitersparnis mit sich bringen. Voraussetzung hierfür ist jedoch die Implementierung eines ausgereiften, komplexen und möglichst bundesweit kompatiblen digitalen klinischen Informationssystems (KIS) mitsamt der entsprechenden IT-Infrastruktur und gut geschultem Personal.

Das zweite zu schildernde konkrete Risiko von SeConts besteht in der Möglichkeit eines Vergleichs von Qualität und anderen Parametern (z. B. Kosten) medizinischer Maßnahmen einzelner Ärzte, Abteilungen oder ganzer Kliniken. Zwar ist der Vergleich von Qualität etc. eine durchaus wichtige Maßnahme zur Qualitätskontrolle und -verbesserung sowie der Patientensicherheit. Jedoch erzeugen mögliche Vergleiche zwischen Behandlern oder zwischen Kliniken mitunter auch Ängste, (ungerechtfertigt) in ein schlechtes Licht gerückt zu werden (z. B. bei Kollegen; Vorgesetzten; den Forschern, die die Daten analysieren). Eine derartige Befürchtung kann sich z. B. für ein onkologisches Spitzenzentrum ergeben, an das sich überproportional viele Patienten mit negativen Prognosen wenden, wenn dieser spezielle Umstand in einem Vergleich der Leistungen, z. B. der Outcomes, mit anderen onkologischen Kliniken nicht angemessen berücksichtigt wird.

Auch ist zu befürchten, dass sich ein Vergleich von Stationen oder Kliniken nicht nur auf die Qualität der Versorgung, sondern auch und primär auf Wirtschaftlichkeit (Profitabilität und Kosten) fokussieren und in dieser Sphäre einen Konkurrenzdruck um die „günstigste oder profitabelste Behandlung“ weiter befeuern könnte. In einem Gesundheitssystem, welches ohnehin bereits unter hohem Kosten- und Ökonomisierungsdruck leidet (Strech et al. 2008; Fernau et al. 2017; Krause et al. 2013), könnte dies einen weiteren Faktor zur Zuspitzung der Lage darstellen und durchaus negative Auswirkungen auf die Versorgungssituation selbst haben. Allerdings ist auch zu bemerken, dass ein Blick auf die Kosten von Behandlung im Rahmen eines eingepflegten Wirtschaftlichkeitsgebots stets erforderlich ist und z. B. ganz besonders an den Stellen ethisch geboten ist, an denen die Gefahr einer Überversorgung aufgrund finanzieller Interessen der Kliniken droht. Vergleiche zwischen Ärzten oder Abteilungen/Kliniken im Rahmen von SeConts haben also auch das Potenzial, zur Aufdeckung derartiger problematischer Missstände beizutragen, etwa im Falle eines Übermaßes an Operationen mit fragwürdiger Wirksamkeit aber finanziellen Vorteilen für die jeweilige Klinik (Quintel et al. 2016).

6 Ausblick auf mögliche Maßnahmen zur Reduzierung der Risiken der Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten

6.1 Einschätzung der Höhe des Risikos für Patienten

Ein wichtiger erster Schritt, um Risiken zu reduzieren, ist die Identifikation derselben und eine Einschätzung ihrer Höhe. Das Gesamtrisiko für den einzelnen Patienten im Rahmen einer konkreten Form von SeConts lässt sich zwar nicht in absoluten Zahlen darstellen. Jedoch lassen sich Aspekte von Daten und deren Nutzung identifizieren, die für eine Einschätzung der Höhe des Risikos für Patienten aufschlussreich sind (Jungkunz et al. 2021). Die Identifikation und Einschätzung der Höhe eines Risikos für Patienten ermöglicht im nächsten Schritt die Ergreifung von (technisch-organisatorischen) Gegenmaßnahmen. Datensätze, die aufgrund ihrer hohen Variablen- und geringen Fallzahl die Re-Identifikation von Individuen verhältnismäßig „leicht“ machen (Bender et al. 2001; Mokken et al. 1992; Dankar et al. 2012; El Emam et al. 2009), können z. B., soweit es die Forschungsfrage zulässt, anders strukturiert werden um das Re-Identifikationsrisiko zu senken.Footnote 12 Ebenso ließen sich – unter Vorbehalt der Kompatibilität mit der Forschungsfrage sowie der technischen Machbarkeit – die Analysen u. U. vor Ort durchführen (dezentrale Analysen), so dass nur die kumulierten Ergebnisse herausgegeben würden, die auf der Basis der Vorgaben der Forscher erstellt wurden. Die klinischen Daten selbst würden somit die datenhaltende Stelle nicht verlassen.

6.2 Use and Access Committees

Zusätzlich zur Überprüfung durch eine Ethikkommission – wie bei Studien mit klinischen (personenbezogenen) Daten üblich – sollten mögliche Risiken und Implikationen für Betroffene auch von einem „Use and Access Committees (UAC)“ bewertet werden. UACs stellen ein wichtiges Element einer angemessenen Governance Struktur für SeConts dar. Ihre Aufgabe ist es, den Zugriff auf klinische Daten für SeConts strukturiert und transparent zu regeln. Dabei haben sie sowohl die Datenschutzinteressen der Patienten als auch die legitimen Interessen und Befürchtungen anderer Stakeholder im Blick (Shabani und Borry 2016). UACs können z. B. eventuell auf die Konditionen des Data Transfer Agreements bzw. der Datennutzungsbestimmungen einwirken, die mit dem anfragenden Forscher abgeschlossen werden (zum Thema der vertraglichen Regelungen zwischen Datensender und Datenempfänger, siehe den Beitrag von Markus Spitz in diesem Band). Mögliche Risiken wie z. B. das oben angesprochene Risiko eines unsachgemäßen und damit potenziell „ungerechten“ Vergleichs verschiedener Kliniken oder Abteilungen könnte durch gezielte Bestimmungen, welche entsprechende Aktivitäten der datenanfragenden Forscher unterbinden, reduziert werden. Ebenso kann ein UAC prüfen, ob der jeweilige datenanfragende Forscher bzw. die in Frage kommende Studie vorab definierte Kriterien erfüllt und diese ggf. einfordern bzw. die Datenherausgabe im Zweifel untersagen. Zu diesen Kriterien gehören beispielsweise Vorgaben in Bezug auf wissenschaftliche Transparenz und Gemeinwohlorientierung (Cheah und Piasecki 2020). Wie die Anforderungen an Studien in Bezug auf Transparenz und Gemeinwohlorientierung konkret aussehen, ist eine Frage, die noch geklärt werden muss (vgl. hierzu den Beitrag von Anja Köngeter in diesem Band).

6.3 Aufklärung und Widerspruchsmöglichkeit

Weitere Elemente für eine ethisch vertretbare Durchführung von SeConts finden sich auf der Ebene der Aufklärung, Einwilligung und der Gewährleistung einiger konkreter informationeller Selbstbestimmungsrechte wie insbesondere dem Recht auf Widerspruch (Opt-Out). Die Notwendigkeit der Widerspruchsmöglichkeit (Opt-Out) ergibt sich aus der Tatsache, dass eine Risikoabschätzung, wie wir sie oben (Abschn. 6.1) vorschlagen, stets nur eine ungefähre Abschätzung für einen Großteil der möglichen Patienten erfassen kann, nicht aber individuelle Variationen des Risikos. So erscheinen z. B. bestimmte Datentypen für viele Personen als relativ unbedenklich in Bezug auf ihre Sensibilität. Für einzelne Personen kann diese Einschätzung aber durchaus falsch sein. Ein Profi-Fußballspieler sieht sich bei der Weitergabe der Röntgenaufnahme einer Meniskusluxation im Kniegelenk mit Blick auf den Abschluss möglicher neuer lukrativer Arbeitsverträge anderen Risiken gegenüber als dies für die meisten anderen Personen (bei gleicher Wahrscheinlichkeit einer Re-Identifikation) der Fall ist.

Derartig spezielle Einzelfälle, welche in einer allgemeinen Risikoabschätzung nicht berücksichtigt werden (können), dürfen keinem individuell nicht tragbaren Risiko ausgesetzt werden. Eine Voraussetzung, um diesem individuellen Risiko für einzelne Patienten im Rahmen einer Widerspruchsmöglichkeit Rechnung zu tragen, ist eine verständliche Patientenaufklärung. Eine adäquate Aufklärung darüber, was mit seinen klinischen Daten geschehen soll, ermöglicht jedem Patienten, eine individuelle Risikoeinschätzung vorzunehmen und eine Entscheidung darüber zu treffen, ob er dieses Risiko tragen will oder nicht. Gleichzeitig dient die Aufklärung der Schaffung von Transparenz in Bezug auf SeConts und wirkt so falschen Hoffnungen bzgl. des Nutzens entgegen. Die Achtung der Patientenautonomie durch die Widerspruchsmöglichkeit kann in Verbindung mit der genannten Transparenz in Aufklärung und Kommunikation einem möglichen Vertrauensverlust von Patienten in ihre Ärzte, Gesundheitsinstitutionen oder in das Gesundheitssystem entgegenwirken. Die Auseinandersetzung mit der Frage ob die Widerspruchsmöglichkeit (im Sinne einer Minimalanforderung) oder aber vielmehr eine der verschiedenen Formen einer aktiven Einwilligung (z. B. Broad Consent, Tiered Consent, Meta-Consent, Dynamic Consent) als angemessen für SeConts angesehen werden kann, ist nach wie vor eine viel diskutierte Frage, der wir hier, wie bereits erwähnt, nicht nachgehen können. Tab. 4 fasst die erwähnten Risiken für Patienten und andere Stakeholder und die vorgeschlagenen Gegenmaßnahmen zusammen.

Tab. 4. Mögliche Risiken von SeConts für Patienten und weitere Stakeholder

7 Resümee

Wir haben im vorliegenden Aufsatz einen Vorschlag gemacht, die Sekundärnutzung klinischer Daten in datensammelnden, nicht-interventionellen Forschungs- oder Lernaktivitäten (SeConts) begrifflich zu fassen als: Nutzung von Daten aus der medizinischen Versorgung für Forschungs- oder Lernaktivitäten, ohne körperliche Eingriffe oder zusätzliche Maßnahmen zur Datengenerierung, zum Zweck der Verbesserung des biomedizinischen Wissens und der medizinischen Versorgung, jedoch nicht zum Eigennutzen des Patienten.

Im nächsten Schritt haben die wir die Vielzahl möglicher Arten von SeConts anhand konkreter Beispiele dargestellt und in Anwendungsfelder unterteilt. Als Anwendungsfelder von SeConts können nicht-interventionelle klinische Forschung, Aktivitäten zur Kontrolle und Erforschung der Versorgung (oder bestimmter Versorgungssituationen) und Public Health Forschung sowie in allen drei Bereichen die explorative Verwendung klinischer Daten gelten (vgl. Tab. 1).

Im Anschluss an die begriffliche Analyse von SeConts haben wir deren mögliche Nutzenpotenziale dargestellt, die wir in forschungsökonomischen, forschungsmethodischen und forschungsethischen Nutzen sowie im Nutzen für einzelne Patientengruppen sehen (vgl. Tab. 2). Gleichzeitig haben wir Herausforderungen für SeConts aufgezeigt, welche wir in der Datenqualität- und Vollständigkeit, der Interoperationalisierbarkeit und in möglichen Verzerrungen (Bias) identifizieren (vgl. Tab. 3). SeConts bringt, wenngleich auch keine physischen Risiken für Patienten, Risiken unterschiedlicher Art sowohl für Patienten als auch für andere Stakeholder mit sich. Zu diesen Risiken gehört für Patienten das Risiko der Re-Identifikation und des Datenmissbrauchs, Gefahren für das Vertrauen in der Arzt-Patientenbeziehung und das Wecken falscher Hoffnungen. Auf Seiten von Ärzten und Institutionen ist ein erhöhter Dokumentationsaufwand denkbar sowie ein erhöhter Leistungsdruck für Klinikmitarbeiter (und Kliniken) aufgrund der Möglichkeit eines Vergleiches der Daten unterschiedlicher Behandler oder Institutionen.

Mögliche Gegenmaßnahmen zu den genannten Risiken bestehen (neben der Schaffung einer „arbeitssparenden“ IT-Infrastruktur) unter anderem in einer SeConts vorgelagerten Identifikation und Einschätzung der Höhe des Risikos für Patienten. In der Folge können technisch-organisatorische Maßnahmen ergriffen werden, um das Risiko für Patienten zu verringern. Ebenso ist die Verwaltung der Daten durch ein Data Access Committee notwendig, welches sowohl die Datenschutzinteressen der Patienten als auch die legitimen Interessen und Befürchtungen anderer Stakeholder im Blick hat und den Datenzugriff regelt. Zusätzlich bleibt die Patientenaufklärung und Widerspruchsmöglichkeit ein wichtiges Element einer ethisch vertretbaren Durchführung von SeConts (vgl. Tab. 4).

Im Zuge des zunehmenden Interesses an SeConts ist zu erwarten, dass verschiedene Personen oder Einrichtungen (Wissenschaftler, Bioethiker, Forschungsförderer, Ethikkommissionen und Use and Access Committees) die wissenschaftliche und ethische Qualität und Legitimität bestimmter SeConts Vorhaben begutachten. Wir sind der Überzeugung dass bei einer derartigen Begutachtung all die Aspekte, die wir im vorliegenden Text ansprechen, von Relevanz sind, angefangen von den Herausforderungen über die Nutzenpotenziale bis hin zu den Risiken für verschiedene Stakeholder und den möglichen Maßnahmen der Governance und Risikoreduzierung.