Angesichts der Herausforderungen verlässlicher, verständlicher digitaler Gesundheitsinformationen für Patientenentscheidungen sowie der informierten Auseinandersetzung mit algorithmischen Entscheidungssystemen wurde schon 2016 mehr Risikokompetenz bei den Menschen gefordert [1]. In diesem Beitrag werden zwei kompetenzfördernde Techniken (Boosts) vorgestellt: Nutzeranleitungen und natürliche Häufigkeitsbäume.
Die Literatur zu ADM-Systemen verdeutlicht, dass diese Systeme immer auch fehlerhaft sind, wobei das Verhältnis von Fehlerarten (z. B. weniger übersehen, dafür mehr Fehlalarme) für den Anwender bzw. den Betroffenen persönlich relevant ist (z. B. fürchtet der eine, dass ein Krankheitsrisiko übersehen wird, während die andere verunsichert wird, wenn bei vielen Krankheitsrisiken fälschlich alarmiert wird). Um die Güte von ADM-Systemen kritisch und quantitativ beurteilen zu können, ist ein informierter Umgang vonnöten. Derselbe wird für eine ausgewogene Fairnessabwägung zwischen verschiedenen Zielgruppen des Algorithmus benötigt. Mithilfe von sogenannten Natural Frequency Trees können Laien die Güte als auch die jeweilige Fairnessbalancierung verständlich nachvollziehen.
Bis heute stehen evidenzbasierte und verlässliche Gesundheitsinformationen einer Vielzahl von Informationsangeboten gegenüber, die informiertes Entscheiden nicht unterstützt. Verschiedene Nutzeranleitungen, die in deutscher Sprache verfügbar sind, sollen deshalb helfen, qualitätsgesicherte und problematische Informationsangebote voneinander zu unterscheiden. Untersucht wurde die Wirksamkeit nach unserer Kenntnis nur für eine Nutzeranleitung, einen „fast-and-frugal tree“. So finden Nutzer eher evidenzbasierte Gesundheitsinformationen, wenn sie einen solchen Entscheidungsbaum nutzen können [18, 19]. Dies bietet eine Chance, informiertes Entscheiden zu fördern. Nach ihrer Erfahrung geben 84 % der Hausärzte an, dass Patienten durch Internetinformationen zu Gesundheit und Krankheit verwirrt und verunsichert werden, 72 % meinen, dass Patienten nervöser und ängstlicher würden. Umgekehrt sehen wenige, dass die Patienten sich sicherer fühlen würden (4 %) und informierter wären und die Ärzte besser verstehen würden (29 %; [31]). Die Informationen, welche die Patienten tatsächlich nutzen, sollten also in Zukunft verständlicher sein und informiertes Entscheiden ermöglichen. Die Angebotsseite könnte sich mit einem nationalen Gesundheitsinformationsportal und der geförderten Bekanntheit von Qualitätssiegeln ebenfalls verbessern. Nutzer, die institutionell tätig sind (Kindertageseinrichtungen, Schulen, Berufsschulen, Hochschulen, Arbeitgeber), können von Initiativen für mehr digitale Gesundheits- und Risikokompetenz profitieren. Für alle anderen, also vor allem für Laien, bieten sich kompetenzfördernde Nutzeranleitungen an. Die Herausforderungen in Bezug auf Nutzeranleitungen sind jedoch vielfältig.
Ein Kritikpunkt besteht darin, dass interessengeleitete Anbieter von Gesundheitsinformationen auf transparente Nutzeranleitungen durch Gaming reagieren können (zu Deutsch die Anleitungen ausspielen, z. B. erfundene Statistiken einfügen, die wissenschaftlich aussehen, aber vom Nutzer nicht überprüft werden können). Das bedeutet, dass sie versuchen, die Erfüllung der einzelnen Prüfmerkmale (von Checklisten, Kriterienrastern und Entscheidungsbäumen) soweit nachzuahmen („scheinzuerfüllen“), dass die Anwender der Nutzeranleitungen zu falschen Schlussfolgerungen gelangen. Das damit verbundene Problem sind aufwendige Erstellungs- und Aktualisierungsprozesse, um Merkmale, die durch Gaming, aber auch durch ein verändertes Gesamtangebot entwertet wurden, durch bessere Indikatoren zu ersetzen. Damit eine Nutzeranleitung valide im Hinblick auf tatsächlich von Laien gefundene Gesundheitsinformationen ist, muss sie an diesen entwickelt und unabhängig von der Entwicklungsgrundlage getestet werden. Das bedeutet, für jede Aktualisierung müssen neue Fälle echter Gesundheitsinformationen systematisch erhoben werden. Deren Prüfmerkmale und neue Kandidatenmerkmale müssen erfasst werden. Außerdem muss ein Kriteriumswert für jeden Fall ermittelt werden, z. B. bewerten Experten unabhängig voneinander jeden Fall. Durch einen solchen Aktualisierungsprozess verändert sich die Nutzeranleitung über die Zeit, alte Indikatoren werden entwertet, neue kommen hinzu.
Ein weiterer Kritikpunkt betrifft die Voraussetzungen, welche Nutzer mitbringen müssen. Das Bildungsniveau und die Lesefähigkeiten müssen ausreichen, um im Internet Recherchen durchführen und Texte lesen zu können. Durch Texte kaum angesprochene Nutzer wenden sich alternativ Gesundheitsvideos zu. Dieses Gesamtangebot ist jedoch ebenfalls von problematischer Qualität (z. B. anorexiefördernde englischsprachige Youtube-Videos), wodurch auch hier evidenzbasierte Varianten im Angebot benötigt werden (Helsana, Stiftung Gesundheit). Die Nutzer von textbezogenen Anleitungen müssen ferner Gesundheitsinformationen auf Merkmale prüfen können. Die Nutzeranleitungen von der Bertelsmann Stiftung und dem Harding-Zentrum für Risikokompetenz (Abb. 1) wurden nutzergetestet. Andere Nutzeranleitungen werfen die Frage auf, ob einzelne Prüfkriterien für Laien ausreichend verständlich sind, etwa ob sie wissen, was „große klinische Studien“ sind (ÄZQ), ob eine Autorin „die nötige Ausbildung“ hat (Medizin-transparent) oder was „Prozesse der Erstellung“ sind (IQWiG). Es wird deutlich, dass die Lücke zwischen dem Fachkriterium hinter dem Merkmal und der Prüfbarkeit durch Laien nicht in jedem Fall perfekt geschlossen werden kann, sofern auch der Aufwand für Laien begrenzt werden soll. Umso wichtiger ist die validierte Auswahl der trennschärfsten und zugleich laienverständlichen Prüfkriterien.
Grundlegender könnte man für bestimmte Bevölkerungsgruppen die Zielstellung von Nutzerentscheidungen auf Basis von statistischer Evidenz infrage stellen. Gerade Personen mit geringem Zahlenverständnis haben Schwierigkeiten, Tabellen zu interpretieren. Hier könnten jedoch geeignete Präsentationsformate helfen. Tatsächlich profitieren gerade sie von grafischen Präsentationsformaten, wie den Icon Arrays (in Feldern gruppierte Symbole; [47]), welche sich in evidenzbasierte Informationsangebote integrieren lassen [48]. Flankiert werden können diese Schlüsselinformationen von zielgruppengerechten Narrativen oder Videos. Gerade mit Blick auf Evidenzsuche und Evidenznutzung hilft zudem die Vermittlung von Konzepten zum informierten Entscheiden und zur Erkennung, ob eine Entscheidung wirklich informiert ist [49].
Mit Blick auf die informierte Auseinandersetzung mit ADM-Systemen stehen ebenfalls spezifische Voraussetzungen infrage. Die Bevölkerung gibt mehrheitlich an, Algorithmen nicht zu verstehen [50], und Statistik- und Programmierkenntnisse sind nur begrenzt verbreitet. Ein Zusammenspiel von Bildungsinterventionen in Kombination mit gesetzlichen Anforderungen an die Präsentation von ADM-Systemen und ihren Ergebnissen sollte nicht in Abrede gestellt werden. Interventionen zur Algorithmenkompetenz genauso wie Informationsbroschüren zu spezifischen ADM-Systemen könnten jedoch durch Prüfschemata wie die NFTs praxistauglich ergänzt werden. Verständlich gefragt, zeigt die Bevölkerung in Deutschland durchaus Präferenzen hinsichtlich der Gestaltung von ADM-Systemen [35]. Außerdem können Nebenfolgen des Einsatzes durch eine informierte Auseinandersetzung diskutiert und politisch bzw. möglicherweise auch durch die Betroffenen selbst kompensiert werden.
Ein Fallbeispiel für Nebenfolgen bietet die Symptomchecker-App Ada, die einen interaktiven algorithmenbasierten Assistenten mit diagnostischen Hinweisen anbietet. Hierbei besteht ein Schadenspotenzial. Nutzer, die trotz Disclaimer Aussagen von diagnostischen Algorithmen für wahre Diagnosen nehmen, laufen Gefahr, unnötige psychologische Belastungen zu erleben und vorschnell zu intervenieren. Aus hausärztlicher Sicht ist bekannt, dass schon jene, die sich im Internet intensiv zu Symptomen und Krankheit informieren, eher eine weiterführende apparative Diagnostik einfordern [31]. Die zugrunde liegenden Algorithmen von Ada machen Fehler und die enthaltenen diagnostischen Hinweise, die Ursachen, können falsch sein. Ada gehört im Vergleich mit 23 anderen Symptomcheckern zwar zu den akkuratesten Apps, jedoch weist der durchschnittliche PPV von 56 % (95 %-KI 41–69 %) darauf hin, dass fast jeder zweite „positive“ diagnostische Hinweis falsch sein kann [51], wobei die meisten Ergebnisse weiter abgeklärt werden müssten. Für das Gesundheitssystem als Ganzes würde vor allem die Abklärung von Auffälligkeiten und Fehlarmen von millionenfach genutzten Apps zu einem erheblichen Zeitverlust und Aufwand führen. Außerdem gibt es in Deutschland bereits jetzt ein Problem von Überdiagnosen [52]. Daher muss nicht nur für Gesundheits-Apps, sondern jedes ADM-System mit gesundheitlicher Relevanz das Nutzen-Schaden-Verhältnis seiner möglichen Implementierung in einem angemessenen Verfahren bestimmt werden. Angesichts der Relevanz von Gesundheitsdaten und des bereits beschriebenen Problemverhaltens [53] gehört auch eine datenschutzrechtliche Betrachtung dazu.
Informierte Nutzer wissen, woran sie hilfreiche Gesundheitsinformationen erkennen. Sie fragen, welche wissenschaftlichen Belege es für den Nutzen einer neuen Gesundheits-App gibt. Am Beispiel der Apps auf Rezept, die diesen medizinischen Nutzen oder eine patientenrelevante Struktur- und Verfahrensverbesserung in der Versorgung binnen eines Jahres nachweisen sollen, lässt sich in den nächsten 1 bis 2 Jahren ablesen, wie diese Informationen gewonnen, dargestellt und auch verstanden werden sollen. Hierzu sollten auch die Auswirkungen der digitalen Angebote auf die gesundheitsbezogene Chancenungleichheit analysiert werden [7]. Qualitätsgesicherte Evidenz zum Nutzen-Schaden-Verhältnis digitaler Innovationen sowie ein angemessener Gesundheitsdatenschutz bieten die Chance für eine überaus erfolgreiche Digitalisierung – ohne sie ist die Digitalisierung in der Prävention und Gesundheitsförderung für die Patienten von unbekanntem Wert und wird am Ende scheitern.