1 Einführung

Digitale Medien, soziale Netzwerkseiten wie Facebook und Instagram und mobile Endgeräte wie Smartphones haben nicht nur das Informations- und Kommunikationsverhalten der Menschen grundlegend verändert. Die voranschreitende Digitalisierung von Medienlandschaften hat zugleich vielfältige neue Forschungsbedarfe in der Medien- und Kommunikationswissenschaft geschaffen. Eine wachsende Zahl an Forscher*innen und Publikationen der Computational Communication Science ist hierfür ein eindrücklicher Nachweis. Gleichwohl nimmt der Großteil dieser innovativen Forschung vorwiegend die Produzent*innen digitaler Inhalte in den Blick. Dominante Studiengegenstände sind Facebook-Posts politischer Parteien oder populistischer Akteur*innen, Artikel etablierter und sogenannter alternativer Medien, „Inzivilität“ in Online-Kommentaren oder Twitter-Diskurse zu gesellschaftspolitischen Themen. Die Nutzung digitaler Inhalte durch die Bürger*innen wird dagegen weiterhin primär durch retrospektive Selbstauskünfte in Querschnittsbefragungen gemessen – ungeachtet eines gestiegenen Bewusstseins dafür, dass derartige Designs Validitäts- und Reliabilitätseinschränkungen mit sich bringen und die Dynamik und Vielschichtigkeit digitaler Mediennutzung nicht hinreichend abbilden können (vgl. Scharkow 2019; Parry et al. 2021).

In jüngeren Initiativen greifen Forschende zur besseren Messung der Mediennutzung im Internet auf (Verhaltens‑)Daten aus Marktforschungs-Panels zurück (vgl. Scharkow et al. 2020, S. 2763), setzen Mobile Experience Sampling-Tools ein (vgl. Naab et al. 2018) oder kreieren eigene Forschungssoftware wie z. B. Facebook-Scraper (vgl. Haim und Nienierza 2019; Beraldo et al. 2021) oder Browser-Plugins zur Aufzeichnung des Onlineverhaltens (vgl. Christner et al. 2021, S. 8). Diese Ansätze haben bereits einen grundlegenden Zwiespalt zwischen selbstentwickelter und kommerzieller Forschungssoftware offengelegt. Einerseits sind selbstentwickelte Lösungen meist in der Lage, spezifische Forschungsfragen unter Anwendung innovativer Verfahren zu beantworten. Ein wesentlicher Vorteil liegt in der Transparenz und vollständigen Kontrolle über die Daten, zum Beispiel im Hinblick auf angewandte (Vor‑)Verarbeitungsschritte. Andererseits sind kommerzielle Lösungen aufgrund ihrer Einbettung in Erlösstrukturen und entsprechende Refinanzierungsstrategien oft technisch ausgereifter (vgl. Anzt et al. 2021, S. 9–10). Um den komplexen Anforderungen an nachhaltige Softwareentwicklung begegnen zu können, wird daher gefordert, dass sich Gruppen von Forschenden zusammenfinden, um die Existenz und Einsetzbarkeit der Forschungssoftware über längere Zeit zu sichern, zu dokumentieren und die Qualität ebenso wie sich verändernde Forschungsbedarfe im Blick zu behalten (vgl. Hepp et al. 2021). Bestenfalls wird ein solches infrastrukturelles Vorhaben an zentralen wissenschaftlichen Einrichtungen gebündelt (vgl. Strippel 2021, S. 151–152).

Mit den in diesem Artikel vorgestellten Forschungssoftwares WebTrack und AppKit folgt GESIS, das Leibniz Institut für Sozialwissenschaften, diesem Paradigma. Im Rahmen einer dauerhaft finanzierten Erweiterung seines Angebots (vgl. Kohne et al. 2021, S. 442–446) verfolgt GESIS das Ziel, das Prinzip eigenentwickelter Software zu institutionalisieren, zu professionalisieren und die resultierenden Datenerhebungspotenziale über spezifische Forschungsprojekte hinaus einem größeren Kreis von Fachkolleg*innen zugänglich zu machen. Wie wir im ersten Teil dieses Beitrags diskutieren, erlauben es sowohl WebTrack als auch AppKit, einer Reihe zentraler Herausforderungen bei der Messung der Mediennutzung im digitalen Zeitalter zu begegnen. Diese Potenziale reflektieren wir vor dem Hintergrund des Leitbilds, dass verschiedene Lösungsansätze sich im Sinne eines geordneten Nebeneinanders wechselseitig ergänzen sollten. Um langfristig zu einer Verbesserung medien- und kommunikationswissenschaftlicher Forschung beitragen zu können, muss Forschungssoftware indes auch nachhaltig verfügbar sein; selbst das elaborierteste Forschungsdesign ist in der Gesamtschau sehr beschränkt, wenn es für die Forschungsgemeinschaft nicht dauerhaft zugänglich ist. Im zweiten Teil des Beitrags werden daher drei zentrale Anforderungen an nachhaltige Forschungssoftware (Zuverlässigkeit, Zugänglichkeit, Langlebigkeit) aus infrastruktureller Perspektive identifiziert und deren Umsetzung bei WebTrack und AppKit aufgezeigt.

2 Herausforderungen und Lösungsansätze für die Messung digitaler Mediennutzung

Digitalisierung bringt einen grundlegenden Wandel von Medienlandschaften mit sich, der sich nicht zuletzt in neuen Qualitäten der Mediennutzung abbildet. Im Vergleich zu traditioneller Massenkommunikation stellt sich Kommunikation im Internet als ungleich komplexeres und dynamischeres Geschehen dar (vgl. Neuberger 2022, S. 70–71), das mit einem gewandelten Charakter der Medieninhalte einhergeht. Im Internet verändern sich die Inhalte nahezu kontinuierlich, indem nicht nur Journalist*innen oder die eigentlichen Kommunikator*innen (z. B. Politiker*innen), sondern insbesondere auch die Nutzer*innen selbst durch Weiterleitungen, Shares, Likes und Kommentare auf deren Erscheinungsbild, Bedeutungsgehalt und Sichtbarkeit Einfluss nehmen (vgl. Brosius 2016, S. 365–366; Thorson und Wells 2016, S. 311–314). Daneben verbinden sich mit der Digitalisierung Fragmentierungstendenzen. Die Vervielfältigung der Informations‑, Kommunikations- und Beteiligungsformen im Internet hat den Nutzer*innen nie gekannte Möglichkeiten eröffnet, hochspezialisierte Mediennutzungsmuster auszubilden und ihre Mediennutzung mit ihren inhaltlichen Vorlieben in Einklang zu bringen (vgl. Mangold et al. 2017, S. 704–705). Hierbei stehen vor allem Online-Intermediäre wie soziale Medien und Suchmaschinen unter dem Verdacht, derartige Selektivitätstendenzen zu verstärken (konträr hierzu: vgl. Stier et al. 2022, S. 770–773). Schließlich bringt Digitalisierung nicht nur Veränderungen in den genutzten Medienquellen und -inhalten mit sich. Da insbesondere Smartphones eine ubiquitäre digitale Mediennutzung erlauben, haben sich auch die zeitlichen, räumlichen und sozialen Kontexte der Mediennutzung vervielfältigt (vgl. Schnauber-Stockmann und Mangold 2020, S. 466–469). Diese Eigenschaften der digitalen Mediennutzung verschärfen die oben genannten Validitäts- und Reliabilitätsprobleme enorm, schließlich multiplizieren fragmentierte, personalisierte und dynamische Medienumgebungen Fehler bei der retrospektiven Messung per Selbstauskunft. Die kontinuierliche Verfügbarkeit für den Empfang von Informationen und eine Mediennutzung, die vor allem durch kurze, häufige Nutzungsepisoden (zum Beispiel auf mobilen Endgeräten) gekennzeichnet ist, lassen sich kaum mit der Idee der retrospektiven Messung vereinbaren (vgl. Kuru et al. 2017; Naab et al. 2018, S. 2–5; Otto et al. 2022, S. 2–6).

Vor diesem Hintergrund lassen sich vier Basisanforderungen an die Messung der Mediennutzung im digitalen Zeitalter identifizieren:

  1. 1.

    Im Sinne einer Nutzer*innenzentrierung sollte die Messung der Mediennutzung unmittelbar bei den individuellen Nutzer*innen ansetzen, nicht hingegen bei den Publika einzelner Onlineangebote. „Without individual level information, one cannot contribute to theories of media use, which largely rely on individual traits and preferences.“ (Taneja 2016, S. 177) Aufgrund der vielfältigen Interdependenzen im Internet sind bedeutungsvolle Aussagen nur möglich, wenn die Nutzung verschiedener Onlineangebote im Verbund betrachtet wird. So kann etwa die Nutzung derselben Nachrichtenseite grundlegend andere Bestimmungsgrößen und Effekte haben, je nachdem ob der Nachrichtenzugang indirekt über Online-Intermediäre wie soziale Medien oder Suchmaschinen erfolgt oder die Nutzer*innen gewohnheitsmäßig ihre favorisierte Nachrichtenseite direkt ansteuern (vgl. Kümpel 2019; Möller et al. 2020, S. 618–620).

  2. 2.

    Die Messung sollte im Längsschnitt erfolgen, um Mediennutzung als Teil des dynamischen Prozessgeschehens im Internet analysierbar zu machen. Dies bildet nicht zuletzt eine zentrale Voraussetzung, um über eine reine Beschreibung digitaler Mediennutzung hinausgehen zu können. Jedwede Kausalaussagen zu den Bestimmungsgrößen wie auch zu individuellen und gesellschaftlichen Effekten von Mediennutzung erfordern notwendigerweise längsschnittliche Betrachtungen (vgl. Slater 2007).

  3. 3.

    Die Messung der Mediennutzung sollte unmittelbar im Moment der Nutzung erfolgen, denn eine retrospektive Rekonstruktion des Kommunikationsgeschehens im Internet ist vielfach schwierig bis unmöglich (vgl. Christner et al. 2021, S. 3). Über die Validitäts- und Reliabilitätseinschränkungen durch retrospektive Befragungen hinaus berührt der Momentbezug der Messung wichtige inhaltliche Forschungsfragen. So kann etwa nur eine Aufschlüsselung der Mediennutzung nach individuellen Nutzungsepisoden die erforderliche Informationstiefe liefern, um die vielfältigen Nutzungskontexte der Internetnutzung und die hiermit verbundenen situativen Einflüsse zu berücksichtigen. Eine ausschließliche Konzentration auf zeitlich invariante, situationsübergreifende Mediennutzungsroutinen und Präferenzen trägt der Vielschichtigkeit digitaler Mediennutzung nicht hinreichend Rechnung (vgl. Schnauber-Stockmann und Mangold 2020).

  4. 4.

    Die Messung der Mediennutzung sollte über die genutzten Onlinequellen hinaus auch die genutzten Medieninhalte erfassen. So bilden Themen nicht nur in vielerlei Hinsicht ein zentrales Strukturierungselement von Öffentlichkeit im Internet (vgl. Brosius 2016). Insbesondere betreffen viele Befürchtungen wegen einer Fragmentierung von Publika im Kern nicht die Frage, ob die Nutzer*innen divergente Quellen (also bild.de und/oder sueddeutsche.de) nutzen, sondern drehen sich um die Diversität der genutzten Inhalte (vgl. Fletcher und Nielsen 2017, S. 493). Aber auch bei individuellen Selektionsentscheidungen und Medienwirkungen spielen Medieninhalte eine zentrale Rolle (vgl. Messing und Westwood 2014, S. 1043–1046; Möller et al. 2020). Ohne deren Erhebung vermag die Messung der Mediennutzung oft nur an der Oberfläche zu kratzen. Entscheidende Theorien und Konzepte der Medien- und Kommunikationswissenschaft lassen sich nur über die Erfassung des genutzten Medieninhalts untersuchen (Fragmentierung, Polarisierung, selektive Exposition, Agenda Setting, Framing, Sensationalismus, Negativität etc.).

Im Folgenden wird zunächst skizziert, wie das Web-Tracking bei GESIS die genannten Anforderungen an die Messung der Mediennutzung im digitale Zeitalter erfüllt. Im Anschluss stellen wir das AppKit vor.

2.1 Infrastruktur I: Web-Tracking

Das Web-Tracking bei GESIS baut auf das Browser-Plugin WebTrack auf, das im Rahmen eines Drittmittelprojekts von Prof. Dr. Silke Adam und Prof. Dr. Michaela Maier entwickelt wurde (vgl. Aigenseer et al. 2019, S. 5–6). Dieses Tool wird Forschenden einerseits im Sinne einer Open-Source-Lösung für den Einsatz in eigenen Projekten zur Verfügung gestellt. Andererseits kommt es im Rahmen eigener Datenerhebungen von GESIS zum Einsatz. Für diese Erhebungen baut GESIS gegenwärtig ein neues Online-Panel auf, das speziell für die Verknüpfung digitaler Verhaltensdaten mit Längsschnitt-Befragungsdaten konzipiert ist. Über soziale Netzwerkplattformen (z. B. Facebook, Instagram) und aus bestehenden GESIS-Befragungen (z. B. ALLBUS, GESIS Panel) werden rund 1000 Personen rekrutiert, die regelmäßig befragt werden und das Browser-Plugin auf ihrem Desktop-Computer installieren. Das Plugin zeichnet die Onlinenutzung kontinuierlich auf der Ebene spezifischer Webseiten-Besuche auf. Die aufgezeichneten Daten werden mit den individuellen Antworten aus den Befragungen verknüpft und für die weitergehende Sekundärnutzung aufbereitet. Vor dem Hintergrund der oben umrissenen Anforderungen an die Messung digitaler Mediennutzung lässt sich das WebTrack-Tool weitergehend wie folgt beschreiben und von anderen Datenquellen abgrenzen.

Nutzer*innenzentrierung

Das Web-Tracking setzt unmittelbar bei den individuellen Onlinenutzer*innen an und zeichnet deren Browsing-Verhalten über verschiedene Onlineangebote hinweg auf. Im Gegensatz zu über APIs bezogenen Verhaltensdaten sind die Web-Tracking-Daten in ihrem Aussagegehalt nicht auf die Nutzung einzelner Onlineplattformen beschränkt. Gegenüber Verhaltensdaten von kommerziellen Anbietern wie comScore oder Nielsen, die für wissenschaftliche Sekundäranalysen oft nur auf der Aggregatebene zur Verfügung stehen (vgl. Webster und Ksiazek 2012, S. 48; Mukerjee et al. 2018, S. 45–46), erlaubt die Erhebung und Verknüpfung der individuellen Browsing-Historien mit den Panelbefragungen eine feingliedrigere Analyse. Sie gestattet nicht nur, die Divergenz in den individuellen Onlinenutzungsmustern bei der Analyse von Fragmentierungstendenzen besser zu berücksichtigen (vgl. Mangold et al. 2022, S. 2211–2214). Sie schafft zugleich eine zentrale Voraussetzung, um Theorien zu den individuellen Ursachen und Effekten von Onlinenutzung testen zu können (vgl. Taneja 2016, S. 176–177; Stier et al. 2020). Der nutzer*innenzentrierte, plattformübergreifende Messansatz gewährleistet ein breites inhaltliches Anwendungsspektrum der Tracking-Daten, das sich von der Nachrichtennutzung über die Nutzung gesundheitsrelevanter Informationen im Internet bis zur Unterhaltungsnutzung erstreckt.

Längsschnitterhebung

WebTrack erhebt das Browsing-Verhalten über die Zeit. Die individuellen Webseiten-Besuche werden hinsichtlich ihrer Startzeiten und Dauer sekundengenau erfasst. Der besondere Vorteil des Browser-Plugins besteht darin, dass es eine explizite Differenzierung erlaubt zwischen den Startzeiten von Webseiten-Besuchen einerseits und der tatsächlichen Reihenfolge andererseits, in der die individuellen Nutzer*innen die Onlineangebote anschauen. Diese Differenzierung ist elementar, um valide Aussagen über die Nutzungssequenzen von Onlinenutzer*innen tätigen zu können, die mehrere Browser-Tabs nutzen und ein nicht-lineares Browsing-Verhalten an den Tag legen (vgl. im Detail Robertson et al. 2021; Schmidt et al. 2023, S. 6–9; Wojcieszak et al. 2021, S. 9).

Inhalts- und Momentbezug

WebTrack speichert die jeweils genutzten Inhalte unmittelbar zum Zeitpunkt des Besuches einer URL (z. B. https://www.tagesschau.de/eilmeldung/eilmeldung-6925.html) in Form von HTML-Screenshots. Dies bildet die zentrale Voraussetzung, um einen hinreichenden Inhaltsbezug der Onlinenutzungsmessung herzustellen. Kommerzielle Lösungen erfordern demgegenüber ein retrospektives Scraping der genutzten Inhalte, denn sie stellen gemeinhin nur die besuchten URLs zur Verfügung – und dies in aller Regel nur mit einem erheblichen Zeitverzug. Dies bedeutet konkret, dass zum Beispiel die auf den Startseiten von Nachrichtenanbietern genutzten Inhalte nicht erfasst werden können, weil sie sich zwischen dem Zeitpunkt der Nutzung und dem späteren Scraping verändert haben. Kuratierte Informations- und Kommunikationsflüsse können lediglich durch eine Erfassung der Inhalte auf der Ebene der individuellen Nutzer*innen unmittelbar zum Zeitpunkt der Nutzung erfasst werden (vgl. Christner et al. 2021, S. 3). Demgegenüber besteht der größte Nachteil des Web-Trackings in der eingeschränkten Möglichkeit, die Internetnutzung in einem breiteren Nutzungskontext beforschen zu können, denn der Geltungsbereich der Erhebung wird durch deren Beschränkung auf Desktop-Computer von vorneherein eingeengt (vgl. Schnauber-Stockmann und Mangold 2020, S. 465–470). Die Entwicklung eines Web-Tracking-Tools, das die genutzten URLs und Online-Inhalte geräteübergreifend sowohl auf Desktop-Computern als auch Smartphones erheben kann, steht weiterhin aus.

In der Gesamtschau ist Web-Tracking ein bedeutender Entwicklungsschritt, um einigen drängenden Herausforderungen der Messung der Mediennutzung im digitalen Zeitalter zu begegnen. Gleichwohl ist auch Web-Tracking nur eine Annäherung an ein methodisches Ideal, wie die Begrenzung auf die Desktop-Nutzung verdeutlicht.

2.2 Infrastruktur II: AppKit

Datenerhebungen mithilfe von Smartphones sind in der Medien- und Kommunikationswissenschaft in den letzten Jahren immer beliebter geworden. Dies beinhaltet einerseits mobile Befragungen, insbesondere Mobile Experience Sampling-Designs, bei denen Befragte mehrmals täglich in-situ – also im Moment oder unmittelbar nach der Rezeption – zu ihrer Mediennutzung und zentralen abhängigen Variablen befragt werden (vgl. Kubey et al. 1996, S. 105–107; Karnowski und Doedens 2010; Hedstrom und Irwin 2017, S. 2–4). Andererseits werden auch passive Methoden, die auf mobile Sensordaten oder mobile Tracking-Methoden zurückgreifen, in der Medien- und Kommunikationswissenschaft zur Messung von Mediennutzung, aber auch Medienselektion und Medienwirkung genutzt (vgl. Bayer et al. 2018). Wie wir im Folgenden zeigen, erfüllen diese Ansätze einige der Kriterien, die für ein valide Messung der Mediennutzung, insbesondere mobiler Mediennutzung, entscheidend sind (vgl. Schnauber-Stockmann und Karnowski 2020, S. 464–466; Otto und Kruikemeier 2023).

Das GESIS-AppKit ermöglicht es Forschenden, über eine grafische Benutzeroberfläche mobile Umfragen zu entwerfen und Zeitpläne zum Ausspielen dieser Umfragen zu erstellen (zeitbasierte Experience Sampling-Designs). Zudem können Studienfortschritt und Teilnahme geprüft und Experimentalgruppen eingerichtet werden sowie Teilnehmende finanziell vergütet werden. Perspektivisch können Forschende auch passive Verhaltensdaten erheben, zum Beispiel zur App-Nutzung.

Nutzer*innenzentrierung

Mobile Designs wie Experience Sampling sind in hohem Maße nutzer*innenzentriert. Einerseits werden Daten auf individueller Ebene erhoben. Andererseits wird ein nahezu idiosynkratischer Ansatz verfolgt, bei dem individuelle Dynamiken ins Zentrum der Betrachtung rücken. Dies ist vor dem Hintergrund einer individuellen, fragmentierten und personalisierten Onlinemediennutzung von besonderer Bedeutung. Da das dynamische Medienangebot eine große Heterogenität von Mediennutzung zur Folge hat, sollten individuelle Prozesse im Mittelpunkt stehen, um die Realität digitaler Medienumgebungen realistischer erfassen zu können. Erhebungen auf Basis von Smartphones können damit am ehesten einem „personenspezifischen“ Mediennutzungs- und Medieneffektparadigma dienen, das von manchen Forschenden vor dem Hintergrund minimaler Medieneffekte diskutiert wird. Die Analyse individueller Dynamiken der Mediennutzung, die detailreiche und kleinteilige (Kausal‑)Prozesse abbilden, wird häufig als nächster Schritt in der medien- und kommunikationswissenschaftlichen Mediennutzungs- und Medienwirkungsforschung angesehen. Nur über diese individuellen Prozesse lassen sich kurze, dynamische Nutzungsepisoden realistisch modellieren und kumulative, minimale oder verzögerte Medieneffekte messen (vgl. Thomas et al. 2021, S. 189–192; Valkenburg et al. 2021).

Längsschnitterhebung und Momentbezug

Experience Sampling-Designs sind als intensiv-längsschnittliche Befragungen in der Lage, Dynamiken der Mediennutzung zu messen und kurzfristige, situative Mediennutzungsepisoden reliabler und valider abzubilden als retrospektive Querschnittsbefragungen (vgl. Schnauber-Stockmann und Karnowski 2020; Otto et al. 2022, S. 5–12). Da die Messung der Mediennutzung, aber auch der zentralen abhängigen Variablen – je nach Design – wenige Minuten oder Stunden nach der Mediennutzungsepisode erfolgt, kann die Messung ebenfalls als momentbezogen bezeichnet werden (vgl. für ein Beispiel Naab et al. 2018, S. 7–13). Damit können insbesondere auch solche Medienangebote einbezogen werden, die sich durch kurze, aber häufige Nutzungsepisoden auszeichnen, wie beispielsweise (mobile) Onlinekommunikation (vgl. Kuru et al. 2017, S. 105–107; Otto und Kruikemeier 2023).

Inhaltsbezug

In der Erfassung von Inhalten liegt (derzeit) das größte Defizit der Messung der Mediennutzung in Erhebungen per Smartphone. Ein „echtes“ Tracking, wie bei WebTrack, ist gegenwärtig im Bereich der mobilen Mediennutzung nicht ohne Weiteres möglich. Da die Mehrzahl der Medieninhalte auf Smartphones nicht über einen Browser, sondern über Apps genutzt wird, sind Browser-Plugin-Lösungen – wie oben skizziert – nicht zielführend (vgl. Christner et al. 2021, S. 7–11). Diese Einschränkung gilt auch für das AppKit. Forschende müssen auf andere Datenquellen setzen, um auf die Inhalte von Onlinemedien auf Smartphones zugreifen zu können. Bei spezifischen Fragestellungen kann die Nutzung bestimmter Apps und damit das App-Tracking als Proxy für bestimmte Inhalte dienen. Datenspenden, bei denen Studienteilnehmende digitale Daten verschiedener Plattformen bewusst teilen, können ebenfalls eine Alternative zu (mobilen) Tracking-Ansätzen sein (vgl. Araujo et al. 2022). Zudem können Screenshots, die durch Studienteilnehmende im Rahmen von Experience Sampling-Designs hochgeladen werden, bestimmte Medieninhalte abbilden (vgl. Otto et al. 2022; Otto und Kruikemeier 2023). Verschiedene Projekte zu Screenrecordings, also automatischen Aufnahmen von Smartphone-Bildschirmen, befinden sind derzeit in der Entwicklung, stellen bisher jedoch noch keine zugängliche und umfassende Lösung für die Messung von Inhalten dar (vgl. Reeves et al. 2021).

3 WebTrack und AppKit als komplementäre Zugänge

In der Gesamtschau bieten die skizzierten Zugänge von WebTrack und AppKit spezifische Vor- und Nachteile und ergänzen sich im Sinne komplementärer Zugänge bei der Messung digitaler Mediennutzung (Tab. 1). Während die Web-Tracking-Technologie spezifische Vorteile bei der Erfassung der genutzten Medieninhalte mit sich bringt, ist deren Erfassung für mobile Endgeräte bisher eine der größten Herausforderungen. Experience Sampling-Designs bieten demgegenüber Vorteile beim Momentbezug; durch ihre Vielseitigkeit erlauben es solche Designs, digitale Mediennutzung nicht nur plattform-, sondern darüber hinaus geräte- und (nutzungs‑)​kontextübergreifend zu messen (vgl. Otto und Thomas 2019; Otto et al. 2022).

Tab. 1 Erfüllung der Basisanforderungen an die Messung digitaler Mediennutzung durch die Forschungssoftwares

Bei der längsschnittlichen, beim Web-Tracking sogar kontinuierlichen Messung von Mediennutzung bieten beide Lösungen spezifische Vorteile. Dabei liefert die passive Datenerhebung, wie sie für Web-Tracking und Sensordaten charakteristisch ist, zusätzlich den Vorteil der geringen Belastung für Studienteilnehmende. Diese Belastung ist bei intensiv-längsschnittlichen Befragungen üblicherweise recht hoch. Beide Ansätze stellen die individuellen Nutzer*innen in den Mittelpunkt der Erhebung. Daher erfüllen sie ein wichtiges Kriterium im Bereich der Forschung zu Mediennutzung, -selektion, und -wirkung im digitalen Zeitalter (vgl. Valkenburg et al. 2021, S. 70–74).

Um die komplementären Zugänge von WebTrack und AppKit anhand einer Integration aus der Anwendungspraxis zu illustrieren, sei an dieser Stelle auf ein Forschungsprojekt zur „Negativität im Bundestagswahlkampf 2021“ verwiesen (vgl. Thomas et al., im Druck).Footnote 1 Mit der Wahlkampfkommunikation nahm sich das Projekt einer kommunikationswissenschaftlichen Kernthematik an, bei der viele der eingangs identifizierten Herausforderungen der Messung der Mediennutzung im digitalen Zeitalter in besonderem Maße zum Tragen kommen. Da die Quantität und Diversität der (politischen) Kommunikation zu Wahlkampfzeiten zunimmt und die Entstehung von fragmentierten und personalisierten Kommunikationsumgebungen begünstigt (vgl. Leidecker und Wilke 2015, S. 145–147; van Aelst et al. 2017), ist nicht nur die Gefahr von Messfehlern durch retrospektive Selbstauskünfte hoch (vgl. Niederdeppe 2014, S. 140–146). Dies gilt ebenfalls für die Notwendigkeit einer nutzer*innenzentrierten Messung, um die Diversität der Mediennutzungsmuster der Bürger*innen hinreichend erfassen zu können.

Konkret nutzte das Projekt ein integriertes Mehr-Methoden-Design, das sich aus einer Kombination von Panel-Befragungen, Web-Tracking und mobilen Datenerhebungen zusammensetzte. 355 per Quotenstichprobe rekrutierte Teilnehmende füllten während der heißen Wahlkampfzeit 30 Tage vor der Wahl Onlinefragebögen zu demografischen Basismerkmalen, politischen Einstellungen und Persönlichkeitsmerkmalen aus, installierten WebTrack auf ihren Computern und nahmen an bis zu fünf kürzeren mobilen Befragungen pro Tag teil. Neben der permanenten Erfassung ihrer digitalen Mediennutzung durch WebTrack machten die Teilnehmenden mit ihren Smartphones Fotos und Videos von wahlkampfbezogenen Kommunikationsinhalten (z. B. einem Wahlkampfplakat, einem Zeitungsartikel oder Inhalten in sozialen Medien) und stellten diese als Datenspende zur Verfügung.

Das gewählte Forschungsdesign zeichnet sich dadurch aus, dass die Limitationen von WebTrack, das Offlinekommunikation und mobile Onlinekommunikation nicht erfassen kann, in Teilen durch mobile Befragungen aufgefangen werden – nicht zuletzt bei deren Verknüpfung mit Datenspenden. Zugleich kann Web-Tracking die begrenzte Zahl an Messzeitpunkten in mobilen Experience Sampling-Designs durch die kontinuierliche Erhebung der Mediennutzung und ihrer Inhalte auffangen – wenn auch nur für Teile der Onlinekommunikation. Im Vergleich zu traditionellen Längsschnittbefragungen, deren Messzeitpunkte meist Wochen oder Monate auseinanderliegen, können so nicht nur die Inhalte der Mediennutzung deutlich genauer nachgezeichnet werden. Dies gilt vor allem auch für individuelle Dynamiken der Mediennutzung und ihre Wirkungen. Allerdings sind die Hürden für eine (aktive) Teilnahme an derartigen Mehr-Methoden-Studien trotz angemessener Vergütung hoch – sei es aufgrund technischer Schwierigkeiten (z. B. fehlerhafte Installation von Web-Tracking-Tools und Apps) oder einer fehlenden Motivation, über einen längeren Zeitraum an mobilen Erhebungen und am Web-Tracking teilzunehmen (vgl. Struminskaya et al. 2020). Während so Stichprobengrößen wie bei traditionellen Bevölkerungsumfragen nicht erreicht werden, ist die Anzahl der Messzeitpunkte dennoch deutlich größer als bei traditionellen Umfragen.

4 Nachhaltigkeit als infrastrukturelle Zielgröße

Die Diskussion über die Frage, welchen Kriterien eine nachhaltige Entwicklung und Bereitstellung von Forschungssoftware genügen sollte, ist in der Medien- und Kommunikationswissenschaft noch vergleichsweise jung. Infolgedessen mangelt es bislang an einem allgemein akzeptierten Kriterienkatalog, gleichwohl zeichnen sich unter dem Eindruck der Praktiken in anderen Disziplinen bereits eine Reihe von Grundtendenzen ab (vgl. z. B. Anzt et al. 2021; Haim 2021, S. 67–71). Neben technischen Aspekten spielt bei der nachhaltigen Entwicklung und Bereitstellung von Forschungssoftware deren organisationale Einbindung eine entscheidende Rolle. Dabei lässt sich grundsätzlich sagen: Eine Zuverlässigkeit von Forschungssoftware kann nicht nachhaltig gewährleistet werden, ohne zugleich ihre Zugänglichkeit und Langlebigkeit zu sichern. Diesen Dreiklang führen wir in der Folge weiter aus und wenden ihn auf das WebTrack und AppKit bei GESIS an.

4.1 Zuverlässigkeit

Zuverlässigkeit wird in der Literatur sowohl aus einer technischen als auch aus einer fachspezifischen Perspektive diskutiert. Unter technischen Gesichtspunkten meint Zuverlässigkeit, dass Forschungssoftware fehlerfrei und stabil funktioniert. Unter fachspezifischen Gesichtspunkten meint Zuverlässigkeit, dass Forschungssoftware valide Daten generiert und Reproduzierbarkeit gewährleistet ist (vgl. Haim 2021, S. 68–70). Die Leistungsfähigkeit der Software wird dabei sowohl von ihrer organisationalen Einbettung und den verfügbaren Ressourcen als auch von der technischen Umsetzung beeinflusst. Angesichts von sich stetig verändernden Online-Plattformen, Web-Browsern und Smartphone-Betriebssystemen ist die Wartung und Weiterentwicklung von Forschungssoftware eine anspruchsvolle Daueraufgabe. Am Beispiel der Eigenentwicklung von Software, die bislang zumeist im Rahmen von isolierten Vorhaben (oder auch „Insellösungen“, Hepp et al. 2021, S. 17) erfolgt, werden zentrale Fallstricke deutlich. So können projektspezifische Softwarelösungen zumeist nicht weiter als bis zu einem guten Prototyp entwickelt und nur begrenzt aktualisiert werden. Zudem ist die Softwareentwicklung und deren nachhaltige Dokumentation zeitaufwändig und wird sie im derzeitigen Wissenschaftssystem nur eingeschränkt vergütet (vgl. Katerbow und Feulner 2018, S. 7–9; Anzt et al. 2021, S. 12–15; Hepp et al. 2021, S. 14–17).

Um die Zuverlässigkeit der Forschungssoftwares WebTrack und AppKit technisch zu sichern, werden diese bei GESIS dauerhaft professionell betreut. Dies umfasst beispielsweise – wie von Haim (2021) genannt – die Implementierung automatisierter Teststrategien, die systematische Prüfung mit verschiedenen Endgeräten und Betriebssystemen sowie das Dokumentieren etwaiger technischer Ausfälle. Zur Sicherung der fachspezifischen Zuverlässigkeit erfolgt eine begleitende Methodenforschung. Hierdurch können etwa allgemeine Muster in der Teilnahmebereitschaft an Studien oder Auffälligkeiten in Teilnahmeraten aufgedeckt und in konkrete Empfehlungen für Forschende überführt werden. Auf diese Weise erkannte Einschränkungen und Fehlerquellen werden in regelmäßig aktualisierten Methodendokumentationen transparent an die Forschungsgemeinschaft kommuniziert.

4.2 Zugänglichkeit

Um die Zuverlässigkeit von Software für die Forschungsgemeinschaft beurteilen zu können, muss sowohl der Zugang zur Software selbst als auch der Zugriff auf die erhobenen Daten gewährleistet sein (vgl. zum Kriterium der Transparenz: Haim 2021, S. 67–68). Im Sinne einer Mindestanforderung müssen der Quellcode der Software verfügbar gemacht und Entwicklungsversionen transparent und in verständlicher Weise dokumentiert werden. Um nachhaltig in der Breite des Fachs zu einer Verbesserung des Forschungsstands beizutragen, sollte Software zudem leicht auffindbar und an die spezifischen Bedürfnisse der Forschenden anpassbar sein, sowohl was die verfügbaren finanziellen Ressourcen als auch die technischen Vorkenntnisse anbelangt (vgl. Anzt et al. 2021, S. 2).

Vor diesem Hintergrund teilt GESIS den Quellcode von WebTrack und AppKit in öffentlichen Repositorien und bearbeitet dabei Anfragen von Nutzenden. Der aktive Einbezug der Nutzenden ermöglicht darüber hinaus eine bedarfsorientierte Softwareentwicklung. Im Fall des AppKits wurde beispielsweise vor Beginn der eigentlichen Entwicklungsarbeit im Rahmen eines Workshops mit angewandten Forschenden gemeinsam ein Konzept erarbeitet, um zentrale Bedarfe und konkrete Funktionalitäten der Software abzustecken. Um die Nutzbarkeit der Softwares für Fachkolleg*innen sicherzustellen, wird sie in Beiträgen wie dem vorliegenden und auf einschlägigen Tagungen vorgestellt. Neben Handreichungen zur Verwendung der Forschungssoftwares bietet GESIS Beratungen zum Einsatz der Forschungssoftware und zur Auswertung der Daten in akademischen Projekten an.

Jenseits der Sicherung der Zugänglichkeit machen die Unterschiede in den technischen Anlagen der Forschungssoftwares sowie die Volumina und Sensitivität der jeweils generierten Daten angepasste Vorgehensweisen erforderlich. So funktioniert das AppKit ähnlich wie bekannte Online-Fragebogentools, und seine Nutzung setzt keinerlei Programmierkenntnisse voraus. Dies gilt insbesondere auch für die Zusammenstellung der studieneigenen App. Der Service wird auf GESIS-Servern für externe Nutzende betrieben, die ihre eigenen Forschungsdesigns in Primärdatenerhebungen umsetzen. Die praktische Zugänglichkeit ist damit mittelfristig gegeben, wenngleich bei ansteigenden Nutzungszahlen durch die Forschungsgemeinschaft und bei der Integration von Sensordaten ein Antragsprozess etabliert werden muss, um die verfügbaren Kapazitäten in einem fairen Verfahren zu verteilen.

Die Datenerhebung durch WebTrack erfordert eine Serverinfrastruktur, die in der Lage ist, mit verschiedenen Web-Browsern zu interagieren. Die Infrastruktur muss permanent mit den Computern der Studienteilnehmenden kommunizieren und die Daten aufgrund ihrer Sensitivität verschlüsselt übertragen. Da die anfallenden Datenmengen beträchtlich sind, kann GESIS diese Infrastruktur nicht für die Projekte externer Nutzender betreiben. GESIS berät Forschende beim Aufbau einer solchen Infrastruktur, aber für die meisten Forschungsprojekte ist diese Investition unrealistisch. Daher wird für das Web-Tracking eine Infrastruktur für die Erhebung von Primär- und Sekundärdaten im Rahmen des Online-Panels für digitale Verhaltensdaten aufgebaut. Forschende können über Calls for Submissions kostenfrei eigene inhaltliche Interessen in die Datenerhebungen des Panels einbringen, die für die Untersuchung medien- und kommunikationswissenschaftlicher Fragestellungen von spezifischer Bedeutung sind. Darüber hinaus wird GESIS verknüpfte Befragungs- und Tracking-Daten auf verschiedenen Aggregationsniveaus verfügbar machen und arbeitet an einer Infrastruktur für den rechtssicheren Zugriff auf die Rohdaten. Dieser integrierte Infrastrukturansatz soll Web-Tracking-Daten trotz der hohen Anforderungen bei Datenschutz und technischer Infrastruktur einem möglichst breiten Personenkreis zugänglich machen.

4.3 Langlebigkeit

Die Zielgrößen der Zuverlässigkeit und Zugänglichkeit lassen sich nicht durch kurzfristige Maßnahmen erreichen, sondern lediglich durch den dauerhaften Einsatz von Ressourcen (vgl. Anzt et al. 2021, S. 10–11). Zuverlässige Forschungssoftware, die in einer zugänglichen Forschungsinfrastruktur betrieben wird, erfordert ihren langfristigen Betrieb. Dies schließt nicht nur die Notwendigkeit einer regelmäßigen Wartung und Aktualisierung von Software ein, um ihre Kompatibilität mit den neuesten Technologien zu gewährleisten. Eine dauerhafte Bereitstellung der Forschungssoftware ist zugleich Voraussetzung für die Reproduzierbarkeit von Forschungsergebnissen. Das Gütekriterium der Langlebigkeit kann faktisch nur durch eine Dauerfinanzierung erreicht werden. Die strategische Erweiterung von GESIS (vgl. Kohne et al. 2021, S. 442–446) ermöglicht den permanenten Betrieb von WebTrack und AppKit. Neben einer für den Langfristbetrieb aufgebauten Hardware-Infrastruktur und verantwortlichen wissenschaftlichen Mitarbeiter*innen sichern entfristete Programmierer*innen die Langlebigkeit der Forschungssoftware.

Eine weitere wichtige Rahmenbedingung für den dauerhaft zuverlässigen und zugänglichen Betrieb von Forschungssoftware sind rechtliche und ethische Aspekte. Die Erhebung digitaler Verhaltensdaten geht in besonderem Maße mit der Speicherung von und Einsicht in personenbezogene Informationen einher. GESIS sichert für Nutzende die (datenschutz-)rechtliche und ethische Integrität durch entsprechende Prüfverfahren seiner Forschungssoftwares und der damit verknüpften Infrastrukturen. Dies wird gewährleistet durch interne juristische Expertise und eine Ethikkommission, jeweils mit spezifischer Erfahrung im Bereich digitale Verhaltensdaten. Nicht zuletzt um die Basis für eine längerfristig vertrauensvolle Zusammenarbeit mit Studienteilnehmenden zu schaffen, wird deren informierte Einwilligung vor jedweder Datenerhebung eingeholt.

5 Fazit

Die vorangegangene Diskussion zweier Software-Lösungen zur Messung digitaler Mediennutzung fördert mehrere Befunde zutage:

  1. 1.

    Eine nutzer*innenzentrierte Ausrichtung von Forschungssoftware bildet in vielerlei Hinsicht eine Grundvoraussetzung, um bedeutungsvolle theoretische und empirisch begründete Aussagen über die Mediennutzung im digitalen Zeitalter tätigen zu können. Daneben spielen die Messung der Mediennutzung im Längsschnitt und deren Moment- und Inhaltsbezug eine entscheidende Rolle, wobei die relative Bedeutsamkeit dieser Gütekriterien von der jeweiligen Forschungsfrage abhängt.

  2. 2.

    Jede Forschungssoftware misst nur einen Ausschnitt menschlichen Verhaltens. Die Messgegenstände variieren in Präzision und Geltungsbereich (Verhalten auf Desktop-Computern, in-situ Befragungen). Die Forschungssoftwares WebTrack und AppKit ermöglichen es für sich genommen, wichtige Herausforderungen bei der Messung von Mediennutzung im digitalen Zeitalter anzugehen. Durch die Kombination von Web-Tracking und mobilen Datenerhebungen lassen sich die Limitationen der jeweils anderen Software-Lösung in Teilen auffangen.

  3. 3.

    Die geräteübergreifende Erhebung von Verhaltensdaten zu den genutzten Onlineinhalten stellt sich mittel- bis langfristig als zentrale Herausforderung für die medien- und kommunikationswissenschaftliche Forschung dar. Um diese Herausforderung perspektivisch angehen zu können, gilt es zunächst, zugängliche Softwarelösungen für die Medieninhaltsmessung auf mobilen Endgeräten zu finden, die insbesondere auch die App-Nutzung einschließen.

  4. 4.

    Der Betrieb eigenentwickelter Forschungssoftware garantiert die Unabhängigkeit medien- und kommunikationswissenschaftlicher Forschung von kommerziellen Akteur*innen. Zugleich funktioniert keine Forschungssoftware für sich ohne begleitende IT-Infrastrukturen und institutionelle Einbettung. Eine integrierte Datenerhebungsinfrastruktur muss einen nachhaltigen Lebenszyklus der Software sicherstellen. Angesichts sich kontinuierlich verändernder technischer Rahmenbedingungen ist die stete Anpassung von Software eine infrastrukturelle Daueraufgabe, die nur mit technischer Fachkenntnis, einer systematischen Softwareentwicklung und idealerweise langfristigen Arbeitsverträgen zur Sicherung des Wissensbestands gelingen kann.

  5. 5.

    Der nachhaltige Betrieb verschiedener Forschungssoftwares im Rahmen einer integrierten Datenerhebungsinfrastruktur eröffnet zum einen Synergien. Zum anderen kann und sollte dieser Betrieb aufgrund der Diversität von Forschungssoftware nicht in Einheitslösungen münden. Im Sinne eines geordneten Nebeneinanders sollten standardisierte Vorgehensweisen durch angepasste Maßnahmen flankiert werden, um den Spezifika der Softwarelösungen Rechnung zu tragen und die resultierenden Datenerhebungspotenziale der Forschungsgemeinschaft dauerhaft in geeigneter Weise zugänglich zu machen.