Einleitung

Politische Akteure haben in hybriden Mediensystemen die Möglichkeit, klassische Gatekeeper zu umgehen und direkt mit der Wählerschaft zu kommunizieren. Während Politiker klassischer Parteien diese Möglichkeit in der Vergangenheit eher zögerlich ergriffen (für Deutschland vgl. Oelsner und Heimrich 2015, S. 466), zeichnen sich Repräsentanten neuer populistischer Parteien insbesondere dadurch aus, dass sie die direkte Verbindung durch soziale Medien intensiv und erfolgreich nutzen (vgl. Engesser et al. 2017; Ernst et al. 2018). Mehr noch: Es scheint, als seien die Kommunikationsbedingungen, die die Plattformen bieten, wie gemacht für die populistische Ansprache (vgl. Gerbaudo 2018; Dittrich 2017).

Der Praxis des Teilens journalistischer Inhalte kommt hierbei eine besondere Bedeutung zu. Der Verweis auf etablierte Medien unterstreicht den eigenen Geltungsanspruch als legitime Partei im politischen Diskurs. Gleichzeitig nutzen Populisten die der Hyperlink-Struktur innewohnende Rekontextualisierungslogik, um entsprechend ihrer ideologischen Ausrichtung Themen besonders hervorzuheben. Es ist bisher unklar, wie sich diese Verschiebung der Gatekeeper-Instanz inhaltlich auswirkt. Untersuchungen auf Quellenebene, beispielsweise die Zählung verlinkter Medienmarken, werden dem Phänomen nicht gerecht. Sie unterschätzen zudem mögliche Fragmentierungseffekte (vgl. Bechmann und Nielbo 2018, S. 999), da sie keine Aussagen darüber erlauben, ob verschiedenen Usergruppen durch unterschiedlich präsentierte Inhalte unterschiedliche Bilder von Realität vermittelt werden. Wie Stier et al. konstatierten, betrachtet beispielsweise nur ein kleiner Teil der Untersuchungen politischer Social-Media-Nutzung „the actual contents of communication going beyond meta data“ (Stier et al. 2018, S. 52). Die Frage, inwiefern secondary gatekeeping (vgl. Singer 2013) auf digitalen Plattformen beispielsweise zur Konzentration bestimmter Themen (also zu Vielfaltsreduktion) entlang spezifischer Gruppenidentitäten führt, lässt sich nur durch eine Analyse der mit den Links assoziierten Inhalte beantworten.

Um dieses Ziel zu erreichen, haben wir für diese Studie einen adaptiven Scraper eingesetzt, der unabhängig vom Aufbau einer Webseite enthaltene Textdaten in strukturierter Form extrahiert. So war es uns möglich, aus 846.744 von Bundestagsabgeordneten geposteten Tweets 56.107 assoziierte Textdateien zu speichern. Mit diesem Korpus haben wir durch Topic-Clustering die thematische Struktur der geteilten Inhalte analysiert und ihre relative Vielfalt bestimmt. Damit war es möglich, Akteure zu identifizieren, die als Gatekeeper vielfältige Gesellschaftsbereiche ansprechen, sowie solche, die der Öffentlichkeit einen Zerrspiegel vorhalten, indem sie primär Themen bedienen, die ihre Follower in ihrem Weltbild bestärken. Dass diese Strategie im Sinne der Engagement-Logik der Plattformen rational ist, zeigt die hohe Korrelation von populistischer Themenselektion und metrischem Erfolg.

Theoretischer Rahmen und Forschungsstand

Populistisches Gatekeeping und Identität

Populismus lässt sich als Organisationsform (ausgerichtet auf einen charismatischen Führer), als Kommunikationsstil (ohne intermediäre Instanzen, direkt zum Volk) oder beispielsweise als Diskurs (mit bestimmten rhetorischen Mustern) beschreiben. Wie Mudde jedoch betont, katalysieren diese Ausprägungen Populismus eher, als dass sie ihn definierten. Er selbst bezeichnet Populismus daher als dünne Ideologie (vgl. auch Freeden 2008, S. 485),

that considers society to be ultimately separated into two homogeneous and antagonistic groups, ‚the pure people‘ versus ‚the corrupt elite‘, and which argues that politics should be an expression of the volonté générale (general will) of the people.“ (Mudde 2004, S. 543, Hervorhebung im Original)

Die programmatische Leere der dünnen Ideologie sei es, die sie für verschiedene andere Ideologien anschlussfähig mache, beispielsweise Kommunismus, Ökologismus, Nationalismus oder Sozialismus (vgl. Mudde 2004, S. 544). Populismus manifestiert sich dementsprechend medial in einer beschränkten Anzahl spezifischer Themen. Ernst et al. (vgl. 2018, S. 172) sprechen von fünf populistischen Kernthemen: Migration, (regionale) Identität, Korruption und Verbrechen, (europäische/transnationale) Integration und wirtschaftliche Not. Dieses Agenda Setting wird mit verschiedenen kommunikativen Strategien aus der Berichterstattung derjenigen journalistischen Medien abgeleitet, zu denen sich populistische Akteure ansonsten antagonistisch positionieren – Haller und Holt sprechen hierbei von „paradoxical populism“ (vgl. Haller und Holt 2019).

Dieses Phänomen lässt sich insbesondere in den Kanälen sozialer Medien beobachten. Sie bilden die idealen „opportunity structures“ (Ernst et al. 2018) für populistische Kommunikation. Hier sind es nämlich nicht mehr traditionelle Massenmedien, die Aufmerksamkeit lenken – Thematisierungsprozesse werden vielmehr durch sozio-technologische Prozesse gesteuert und lassen sich als sekundäres (vgl. Singer 2013, S. 56) und kollektives Gatekeeping (vgl. Keyling 2017, S. 78–105) beschreiben.

So ist das Teilen massenmedialer Inhalte ein effektives Werkzeug, um sich einerseits als Teil des „Mainstream“-Diskurses zu legitimieren und sich andererseits abzugrenzen. Die Wahl (also auch die Empfehlung) von Medieninhalten ist in diesem Sinne nicht nur eine Frage der Informationsbeschaffung – sie ist vielmehr Vehikel von Selbstwahrnehmung und sozialer Identität (vgl. Ihm und Kim 2018, S. 4360; Slater 2007, S. 291) und wird als solches von strategisch-professionell agierenden Gatekeepern eingesetzt („strategic professionals“, Wallace 2018, S. 280). Diese Strategie ist besonders vielversprechend bei Individuen, die extreme rechtspopulistische Ideologien vertreten; homogene, bestätigende Medien wirken in diesem Umfeld besonders identitätsstiftend (vgl. Dvir-Gvirsman 2017, S. 1086).

In der Folge führt dies zu stark divergierenden issue agendas auf politischer Ebene, die auf soziale und affektive Polarisierung hindeuten (vgl. Suhay et al. 2017, S. 97). Gleichzeitig zeigen ältere theoretische Konzepte, beispielsweise die Idee der issue ownership (vgl. Petrocik 1996), dass es zu einem klassischen Merkmal ausdifferenzierter Parteiensysteme gehört, Themen parteipolitisch zu besetzen.

Populismus und soziale Medien

Die populistische Logik scheint mit Medien in einem synergetischen Funktionsverhältnis zu stehen: Gerbaudo weist in diesem Sinne auf eine „elective affinity“ (vgl. Gerbaudo 2018, S. 746) hin. Erfolg in den sozialen Medien sei ein hervorstechendes Merkmal verschiedener populistischer Parteien und Bewegungen. Die „condition of atomization“ innerhalb der sozialen Medien sei „ultimately conducive to the populist logic which is centrally concerned with fusing atomized individuals in the collective body of the people“ (Gerbaudo 2018, S. 748). Das sekundäre Gatekeeping ist nur als Resultat dieses Zusammenwirkens sozialer und technologischer Prozesse zu verstehen – Atomisierungs- und Kristallisationsprozesse sind der populistischen wie der algorithmischen Logik eigen (vgl. Krämer 2017, S. 1305). Dittrich veranschaulicht am Beispiel von Facebook, wie sich diese Symbiose in den Relevanz-oder Aufmerksamkeitsindikatoren der sozialen Medien spiegelt – populistische Akteure lösen deutlich mehr Interaktionen und Engagement aus als die Seiten anderer Parteien (vgl. Dittrich 2017, S. 11).

Externe und interne Vielfalt

Populisten konzentrieren sich wie beschrieben vor allem auf bestimmte Kernthemen – es ist daher zu erwarten, dass mit dem populistischen Gatekeeping eine Reduktion von Themenvielfalt einhergeht. Unklar ist hingegen, ob dies auch zu einer Beschränkung auf wenige Medienmarken führt. Im Gegenteil erscheint es bei einer Spezialisierung auf einen kleinen Ausschnitt der allgemeinen Medienagenda rational, möglichst viele Quellen einzubeziehen. Darüber hinaus entspräche es dem Kalkül der beschriebenen Legitimationsstrategie, die Anzahl „opportuner Zeugen“ (Hagen 1992, S. 449) zu maximieren, um die Relevanz populistischer Themen für die Gesellschaft zu unterstreichen.

Es erscheint daher von äußerster Wichtigkeit, terminologisch insbesondere zwischen der Vielfalt verlinkter Medien und der Vielfalt der verlinkten Inhalte zu unterscheiden. Schon zu Zeiten, in denen programmatisch-gebündelte Angebote den Medienmarkt dominierten, wurde darauf hingewiesen, dass die bloße Anzahl medialer Anbieter nicht mit der inhaltlichen Vielfalt ihres Angebots gleichgesetzt werden sollte (vgl. Van Cuilenberg 1999, S. 189). Vor dem Hintergrund heutiger Möglichkeiten der Individualisierung von Medienkonsum scheint es umso eher geboten, beides getrennt zu betrachten.

Terminologisch anschlussfähig erscheint hier die Trennung zwischen externer und interner Vielfalt (vgl. McQuail und Van Cuilenburg 1983, S. 151). Interne Vielfalt beschreibt die Inhaltsvielfalt (content diversity, vgl. Napoli 1999, S. 18–24), die sich als Pluralität von Akteuren, Sichtweisen oder Themen (siehe auch „media agenda diversity“, Tan und Weaver 2013, S. 774) manifestieren kann – ursprünglich innerhalb eines Mediums. Externe Vielfalt beschreibt das Vorhandensein verschiedener Medien und ihre Varianz hinsichtlich bestimmter CharakteristikaFootnote 1 – ursprünglich vor allem innerhalb eines Medienmarktes. Beide Termini lassen sich für die Analyse sekundärer Gatekeeping-Prozesse adaptieren.

Thematische Expansion

Während das populistische Gatekeeping wie oben beschrieben einer thematischen Engführung gleichkommt, kann es aus der Perspektive politischer Kommunikation ebenso rational sein, eine breite Themenpalette zu bedienen, um eine maximal große Wählerschaft anzusprechen. Diesem Kalkül folgend, ist es ferner plausibel anzunehmen, dass der Populismus in seiner parteipolitischen Ausprägung einen Ausgleich beider Strategien anzustreben versucht: identitätsstiftende Konzentration auf seine Kernthemen, gleichzeitig Kommunikation eines universellen Anspruchs, der politische Eignung (bzw. Regierungsfähigkeit) unterstreicht. Krämer beschreibt in diesem Sinne, wie sich rechter Populismus online sukzessiv von einer thin ideology zu einer full-blown ideology entwickele: „[W]e may witness the development of distinctively right-wing populist elements in the lifestyle of distinct milieus.“ (Krämer 2017, S. 1297).

Am Ende dieses Abschnitts steht also die Frage, welche theoretische Perspektive den Status Quo beschreibt: Sind soziale Medien in der Hand der Populisten Werkzeuge, die ihnen ermöglichen, mit Hilfe entbündelter Inhalte auf ihre Kernthemen aufmerksam zu machen? Oder lassen sich Indizien dafür finden, dass die thematischen Geltungsansprüche populistischer Kommunikation mittlerweile umfassender sind? Durch die Wahlerfolge rechtspopulistischer Parteien und die Besetzung politischer Positionen stehen der institutionalisierten populistischen Kommunikation heute deutlich mehr Ressourcen zur Verfügung als noch vor einigen Jahren. Es ist daher von äußerster Relevanz zu klären, inwiefern sich populistische Kommunikation professionalisiert hat und ob sich der neue umfassende GeltungsanspruchFootnote 2 in ihrer medialen Praxis spiegelt.

Auf diese Fragen suchen wir Antworten, indem wir das Kommunikationsverhalten populistischer Akteure relativ zum Verhalten anderer politischer Akteure analysieren. Dazu betrachten wir insbesondere die Praxis des Verlinkens als Mittel des sekundären Gatekeepings. Sie stellt einen geeigneten Messpunkt dar, da sich hier der thematische Geltungsanspruch einer Partei spiegelt. Konkret soll das ‚Verlinkungsverhalten‘ deutscher Bundestagsabgeordneter auf Twitter untersucht werden.

In einer der wenigen parteivergleichenden Inhaltsanalysen aus Deutschland fanden Caton et al. (2015, S. 8) im Kontext der Bundestagswahl 2013, dass sich insbesondere die Facebook-Posts größerer Parteien (CDU/CSU und SPD) ähneln – ähnlich folgert Tromble: „For parties in government, cohesion helps retain power.“ (Tromble 2016, S. 679) Auf der anderen Seite zeichnen sich kleinere Parteien jeweils durch eigene Charakteristika aus. Insbesondere Die Grünen stachen in der Untersuchung von Caton et al. als „least similar and most future-oriented party“ (Caton et al. 2015, S. 14) hervor. Es gibt bisher keine Erkenntnisse dazu, wie sich die AfD relativ zu den anderen Parteien in diesem Koordinatensystem positioniert.

Hypothesen

Vor dem Hintergrund der dargestellten Forschung erscheint es plausibel anzunehmen, dass die Praxis des Verlinkens besonders intensiv von rechtspopulistischen Akteuren als Mittel des sekundären Gatekeepings genutzt wird – wiewohl populistische Kommunikationsweisen im gesamten politischen Spektrum zu beobachten sind. Besonderes Augenmerk liegt in dieser Untersuchung daher auf der AfD als einziger rechtspopulistischer Partei im Bundestag (vgl. Rooduijn et al. 2019). Gleichzeitig soll das Kommunikationsverhalten der anderen Parteien im Verhältnis zur AfD betrachtet werden.

Die dargestellten Evidenzen deuten außerdem mehrheitlich darauf hin, dass es insbesondere beim populistischen Gatekeeping zu einer inhaltlich-thematischen Reduktion der Agenda auf typische Kernthemen kommt und dass dieses Verhalten in einem synergetischen Verhältnis zu den Engagement-Metriken der sozialen Medien steht.

Aus diesen Punkten ergeben sich für diese Arbeit folgende Hypothesen:

H1

Im Vergleich zur Verlinkungspraxis der anderen Parteien auf Twitter spiegelt sich in den von der AfD verlinkten Texten eine weniger vielfältige Themen-Agenda.

H2

Themen, die von der AfD besetzt werden, sind – gemessen an Engagement-Metriken (Likes, Shares) – erfolgreicher als Themen anderer Parteien auf Twitter.

Daten: Beschaffung

Den Ausgangspunkt der Untersuchung bilden 846.744 von BundestagsabgeordnetenFootnote 3 gepostete Tweets, die via API (und rtweet, vgl. Kearney 2019) gesammelt und jeweils einer Partei zugeordnet wurden. Die Tweets wurden im Oktober 2019 gespeichert – redundante und alle vor dem 24.10.2017 veröffentlichten Tweets wurden gelöscht, so dass der Datensatz ausschließlich singuläre und in dieser Legislaturperiode veröffentlichte Posts enthält (übrig blieben 515.782 Tweets)Footnote 4. Insgesamt wurden in 29 % dieser Tweets Links gepostet (151.885 Links zu insgesamt 132.582 verschiedenen URLs).

Es wäre mit herkömmlichen Scrapern, die an jede Seitenstruktur angepasst werden müssen und nur bedingt generalisierbar sind, forschungsökonomisch nicht realisierbar gewesen, diesen heterogenen URL-Datensatz auszulesen. Um dennoch ein Korpus generieren zu können, haben wir den kostenpflichtigen Service Diffbot genutztFootnote 5. Der Anspruch des kalifornischen Unternehmens ist es, „to create an autonomous system that can read and understand all of the documents on the public web, convert these to structured entities, and make this accessible as a service to others“ (Diffbot 2019). Mit Hilfe des von Diffbot bereitgestellten R‑Clients (vgl. Tung 2019) wurden im nächsten Schritt die mit den (zuvor formatierten und bereinigtenFootnote 6) Links assoziierten Texte bezogen. Die API des Service gibt eine strukturierte Textdatei aus, in der neben dem Artikel beispielsweise Überschrift, Datum, Autor erkannt werden. Insgesamt konnten so für 72 % der über Diffbot abgefragten Links Texte heruntergeladen werden (N = 60.667).

Bei den nicht erfolgreich gespeicherten Webseiten handelte es sich zum Großteil um Bilddaten oder Multimedia-Websites (Videos, interaktive Grafiken etc.). Der Scraper versagte nur bei wenigen Webseiten systematisch. Von den für die Untersuchung besonders relevanten Seiten waren es einzig Inhalte der Domain Bild.de, die Diffbot nicht erkennen konnte und die mit Hilfe eines zweiten, browserbasierten Scrapers (vgl. Octoparse 2019) ergänzt werden mussten. Der so zusammengetragene Datensatz war weiter zu bereinigenFootnote 7: Texte mit weniger als 15 Wörtern wurden entfernt. Außerdem wurden längere Texte randomisiert gekürzt (auf das dritte Quartil der Textlängen ≙ 396 Wörter), um einen übermäßigen Einfluss langer Texte auf das Themenmodell zu vermeiden. In die Vokabelmenge wurden 76.527 unterschiedliche Worte (types) aufgenommen (Kriterien: zwischen 3 bis 39 Zeichen und mehr als zehn Entsprechungen im reduzierten Datensatz).

Texte, die keine (oder nicht hauptsächlich) Wörter der deutschen Sprache enthielten, wurden eliminiert (beispielsweise fremdsprachige Texte oder Blindtexte, die beim Scrapen von verschlüsselten Bezahlartikeln gespeichert werden). Hierzu wurde mit Hilfe des R‑Pakets spelling (vgl. Ooms und Hester 2019) der Anteil deutscher Wörter in den Texten identifiziert – Texte, deren Wörter zu 30 oder mehr ProzentFootnote 8 aus nicht-deutschen Vokabeln bestanden, wurden gelöscht. Diese Vorverarbeitung resultierte in einem Korpus mit insgesamt 56.107 Artikeln.

Daten: Beschreibung

Politiker/Parteien auf Twitter

Im Oktober 2019 waren 536 Bundestagsabgeordnete auf Twitter vertreten – das entspricht 76 % aller Parlamentarier (522 davon im gesamten Datensatz enthalten, 479 im reduzierten/gesäuberten). Ein Vergleich der Ergebnisse mit früheren Studien zeigt deutlich, dass die Twitter-Adoption der Politiker in den vergangenen Jahren in Wellen verlief: Ende 2010 waren 33 % aller Bundestagsabgeordneten aktiv auf Twitter (vgl. Saalfeld und Dobmeier 2012, S. 320). Dieses Niveau stagnierte zunächst, auch 2012 hatten nicht mehr als ein Drittel der Parlamentarier einen Account (vgl. Oelsner und Heimrich 2015, S. 459). Ein Jahr später jedoch, zur Bundestagswahl 2013, waren bereits mehr als die Hälfte der Politiker auf Twitter aktiv (vgl. Nuernbergk und Conrad 2016, S. 4), vier Jahre später zur nächsten Wahl 65 % (vgl. Schmidt 2017, S. 616). Die Aktivierung der Accounts ist eindeutig assoziiert mit den Bundestagswahlen. Dies bestätigt auch eine Analyse der Entstehungszeitpunkte der Accounts (siehe Abb. 1). In der laufenden Legislaturperiode sind 12 % (63 Accounts) der heute aktiven Twitter-Accounts hinzugekommen. Am aktuellen Rand sind es besonders Politiker von AfD (gegründet 2013) und FDP (in der letzten Legislaturperiode nicht im Bundestag vertreten), die neue Twitter-Accounts eingerichtet haben.

Abb. 1
figure 1

Die Kurven beschreiben die aggregierten Zahlen von Twitter-Accounts der Bundestagsabgeordneten jeder Partei. Die verschiedenen Fraktionen sind in ihren geläufigen Farben dargestellt (Die Linke in Purpur, SPD in Rot, Die Grünen in Grün, CDU/CSU in Schwarz, FDP in Gelb und AfD in Blau). Die vertikalen Linien markieren Bundestagswahlen

Analysiert man die Parteienzusammensetzung, ergibt sich folgendes BildFootnote 9: 25 % aller Parlamentarier auf Twitter gehören CDU oder CSU an, 22 % der SPD, 11 % der Linken, 12 % den Grünen, 16 % der AfD, 14 % der FDP. Gemessen an der Zahl der Accounts sind Politiker der Partei Die Grünen die aktivsten Twitterer – 96 % aller Grünen-Politiker im Bundestag sind auf Twitter vertreten (92 % AfD, 91 % FDP, 87 % Die Linke, 76 % SPD, 55 % CDU/CSU). Gemessen an der Anzahl der Posts im Datensatz sind SPD-Politiker die aktivsten – 22 % aller Tweets stammen von SPD-Politikern (CDU/CSU 20 %, Die Grünen 18 %, Die Linke 16 %, FDP 12 %, AfD 10 %). Gemessen an den Verlinkungen in den Posts ergibt sich ein leicht verändertes Bild: Hier ist die AfD die aktivste Partei – 23 % aller Link-Posts im gesäuberten Datensatz stammen von Abgeordneten der rechtspopulistischen Partei (20 % Die Grünen, 18 % Die Linke, 13 % FDP, 12 % CDU/CSU, 12 % SPD).

Verlinkte Webseiten/Medien

Betrachtet man die verlinkten Webseiten und Medien, wird deutlich, dass journalistische Nachrichtenmedien mit deutlichem Abstand zu den meistverlinkten Seiten gehören: Im analysierten URL-Datensatz befinden sich unter den 62 Seiten, die mehr als 100-mal geteilt wurden, nur zehn Seiten ohne redaktionelles AngebotFootnote 10: die Webseiten der Fraktionen (AfD, CDU/CSU, SPD, FDP, Grüne), die Webpräsenzen des Auswärtigen Amts und des Bundestags, zwei Seiten einzelner Politiker sowie die Plattform Facebook.

Vergleicht man die von den Parteien verlinkten Medien, ist es schwierig, gravierende Unterschiede festzustellen. Selbst die von der AfD am häufigsten verlinkten Seiten setzen sich fast ausschließlich aus journalistischen Medien zusammen (siehe Tab. 1). Die AfD-Politiker teilen sowohl Inhalte von Medien, die als konservativ gelten, als auch Links zu liberalen Medien, Boulevard-Inhalte genauso wie Texte aus Qualitätszeitungen.

Tab. 1 Die 15 Webseiten, die am häufigsten von Parlamentariern der AfD verlinkt wurden (Grundmenge: gesäuberter URL-Datensatz); zusätzlich die Anzahl der Posts pro Partei, die auf Seiten der Domain verlinken

Vergleicht man nun die externe Vielfalt anhand der Anzahl der unterschiedlichen verlinkten InformationsmedienFootnote 11 pro Partei, ergibt sich folgendes Bild: Grünen-Politiker verlinkten auf 179 verschiedene Quellen, die AfD auf 175, die Linke auf 174, FDP auf 165, SPD auf 164, CDU/CSU auf 157.

Methode

Topic-Modeling-Verfahren wie LDA (vgl. Blei et al. 2003) ermöglichen es, latente thematische Zusammenhänge in großen Textkorpora sichtbar zu machen. Der Ausgangspunkt dieser automatischen Mustererkennung ist die Korrelation zwischen der Bedeutungsähnlichkeit linguistischer Einheiten (Wörter, Phrasen) und der Ähnlichkeit ihrer Verteilung über bestimmte sprachliche Kontexte. Bei der LDA werden diese Zusammenhänge als Topics modelliert, als Wahrscheinlichkeitsverteilungen über alle Wörter. Jedes Dokument im Korpus kann ebenfalls als Wahrscheinlichkeitsverteilung (über die Topics) dargestellt werden. Die Topics der LDA können grobe Themenstrukturen aber auch feinere Zusammenhänge spiegeln – ihre Granularität ist abhängig von verschiedenen Variablen: der Beschaffenheit des Korpus, der Länge und der Anzahl der Dokumente, ihrer thematischen Durchmischung und Zusammensetzung; aber auch von den Voreinstellungen, für die sich der Forscher entscheidet. Auch unüberwachte Verfahren erfordern nämlich eine Kalibrierung – bei LDA ist beispielsweise die Variable K von großer Bedeutung (vgl. Jacobi et al. 2016, S. 100). Sie gibt die Anzahl der Topic-Cluster an, die gebildet werden sollen – sie entscheidet also maßgeblich über die „Auflösung“ der Topics – ein größeres K entspricht einer höheren Granularität.

Eine weitere zentrale, bisher wenig beachtete Herausforderung im Zusammenhang mit LDA ist die Reliabilität der generierten Modelle. Da es sich um ein probabilistisches Verfahren handelt, erzeugen gleiche Variablenkonstellationen abweichende Cluster. Beide zentralen Herausforderungen wurden im Zuge dieser Arbeit berücksichtigt (s. unten).

Analysen mit LDA zielen oft auf die bloße Beschreibung von Themenverteilungen in Korpora. Die Modelle bieten jedoch durchaus weiterführende Möglichkeiten der Analyse (vgl. Puschmann und Scheffler 2016, S. 13). Die Interpretation der LDA-Modelle als Indikatoren für interne Vielfalt ist in diesem Sinne ein Beispiel dafür, wie sich durch Topic Modeling Erkenntnisse über Themenverteilungen hinaus generieren lassen.

Vielfaltsmessung mittels LDA

Durch das Topic-Clustering-Verfahren wird jedem Wort (gemeint sind token) eines Korpus genau ein Thema zugeordnet. Zusätzlich ist jedem Wort im Falle dieser Untersuchung eine Partei zugeordnet – je nachdem, welcher Partei der Politiker angehört, der den zum Text gehörigen Link gepostet hat (wurde ein Text von Politikern unterschiedlicher Parteien verlinkt, wurden den Worten des Artikels mehrere Parteien zugewiesen). Es lässt sich also der Anteil jeder Partei an jedem Topic feststellen. Hierbei ist es natürlich möglich, dass eine Partei ein Topic stark dominiert, weil Politiker der Partei besonders viel zu diesem Thema gepostet haben, oder dass ein Topic von allen Parteien gleichermaßen bedient wird, und daher eine gleichmäßige Durchmischung aufweist. Um nun mathematisch zu beschreiben, wie vielfältig die in den Verlinkungen gespiegelte Themenagenda einer Partei ist, sind wir folgendermaßen vorgegangen:

  • Normierung

    Um eine Vergleichbarkeit von Topics und Parteien untereinander zu gewährleistet, muss verhindert werden, dass die Größe der Topics das Ergebnis beeinflusst. Gleiches gilt für die absolute Anzahl der Wörter, die einer Partei zugeordnet wurden. Wir haben die absoluten Werte daher so normiert, dass die Summe eines jedes Topics 1 ergibt, d. h. jedes Topic erhält dasselbe Gewicht. Anschließend haben wir mit der Summe der Wort-Partei-Zuordnungen über alle Topics normiert, sodass die absolute Anzahl der Wörter, die einer Partei zugeordnet werden, die Interpretation nicht verzerrt. Die resultierende Matrix kann als Heatmap dargestellt werden: Hier wird die relative Anzahl der Zuordnungen von Wörtern aus Partei-Artikeln zu einem Topic dargestellt (siehe Abb. 2). Diese Darstellung ermöglicht Vergleiche von Topics innerhalb einer Partei und von Parteien innerhalb eines Topics.

  • Gini-Koeffizient

    Thematische Vielfalt wird in dieser Untersuchung aus zwei Perspektiven analysiert: Ausgehend von dem einzelnen Topic wird die Frage beantwortet, wie gleichmäßig es sich über die Parteien verteilt, und ausgehend von der einzelnen Partei wird betrachtet, wie gleichmäßig sie die Themen adressiert. Sowohl die Vielfalt eines Topics über die Parteien hinweg, wie auch die Gleichmäßigkeit der Themenadressierung durch eine Partei können mit dem Gini-Koeffizienten (vgl. Hartung et al. 2009: 52–53) berechnet werden. Der Gini-Koeffizient ist ein statistisches Maß für Ungleichverteilungen und nimmt Werte im Bereich (0,1) an, wobei 0 für eine perfekte Gleichverteilung steht – in diesem Fall ein Topic, das von allen Parteien gleichermaßen adressiert wird beziehungsweise aus Sicht der Parteien: eine Partei, die zu allen Topics im selben Umfang twittert. Höhere Werte indizieren eine höhere Heterogenität der Agenda einer Partei beziehungsweise ein gesteigertes Ungleichgewicht der Aufteilung eines Themas auf die untersuchten Parteien.

Abb. 2
figure 2

Heatmap der auf Topicsumme und Fraktionssumme normierten Topiczuordnungen pro Fraktion für die Protoypen-LDA mit K = 30 und α = η = 1/30. Je intensiver die rötliche Färbung einer Zelle ist, desto stärker ausgeprägt ist die Fokussierung dieser Fraktion auf dieses Topic, wohingegen intensivere Blautöne für Vernachlässigung dieser Themen im Vergleich zu anderen Fraktionen stehen. Die Topics bzw. Fraktionen wurden hierarchisch mit Complete Linkage auf den Distanzen der normierten Topiczuordnungen geclustert (vgl. Hastie et al. 2009, S. 520–525). Das heißt zum Beispiel, dass die AfD und Die Linke sich näher sind als die AfD bzw. Die Linke der unähnlichsten Fraktion aus dem Cluster aus SPD, CDU/CSU, FDP, Die Grünen. Topic-Überschriften basieren auf einer Interpretation von Top-Words (den repräsentativsten Wörtern eines Topics) und Top-Artikeln (den repräsentativsten Texten)

Um die Reliabilität der Vielfaltsmessung zu gewährleisten – also modellunabhängige Inferenzen – haben wir die Gini-Koeffizienten auf LDAs mit 56 verschiedenen Variablenkonstellationen nach Griffiths und Steyvers (2004) gerechnet. Der Hypothesentest (H1) ist also unabhängig von der Betrachtung einzelner Modelle möglich.

LDA-Prototyp

Zur qualitativen Interpretation einzelner LDAs (vgl. Koppers et al. 2019) haben wir für ausgesuchte Variablenkonstellationen zusätzlich einen LDA-Prototypen gebildet (R-Paket ldaPrototype, vgl. Rieger 2020) – so erhöhen wir die Reliabilität des zu interpretierenden Modells (vgl. Rieger et al. 2020). Vergleichbar mit Niekler und Jähnichen (2012) berechnen wir hierbei im ersten Schritt eine Ähnlichkeit der Topics verschiedener Modelle zueinander (mittels eines modifizierten Jaccard-Koeffizienten). Hieraus lässt sich ein Reliabilitätskoeffizient (beispielsweise einer bestimmten Variablenkonstellation) ableiten, indem eine durchschnittliche Ähnlichkeit aller Topics zueinander angegeben wird (vgl. Maier et al. 2018, S. 97). Zur Berechnung des LDA-Prototypen gehen wir einen Schritt weiter, indem wir dasjenige Modell herausgreifen, dessen Topics die größte Ähnlichkeit zu den Topics aller anderen Modelle aufweist. Der LDA-Prototyp ist dann also das Modell mit dem größten Ähnlichkeitswert über alle Paarungen. So wird verhindert, dass das zu interpretierende Modell eine extreme beziehungsweise instabile Ausprägung einer bestimmten Variablenkonstellation darstellt.

Topics mit hohem Engagement

Um die zweite Hypothese zu prüfen, haben wir berechnet, wie viel Engagement einzelne Themen auf Twitter auslösen – also welche Themen nach den Relevanzindikatoren der Plattform besonders relevant sind. Hierfür haben wir für jeden Text einen Engagement-Wert berechnet, der sich aus der Summe von Retweets und Likes des zugrundeliegenden Tweets ergibt. Dieser Wert lässt sich für jeden von einer Partei geteilten Text berechnen. Wir haben nun anhand der Topicverteilung eines jeden Textes die latenten Engagement-Werte für jedes Topic in jedem Text ermittelt. Auf Basis dieser Kennwerte lassen sich durch Normierung mit der Anzahl der zugehörigen Tweets die mittleren Engagement-Werte pro Partei und Topic berechnen. Der Wert gibt also an, wie viel Engagement eine Partei in den entsprechenden Topics pro geteiltem Text generiert. Mit anderen Worten: Der Wert lässt eine Aussage darüber zu, wie viel Engagement ein Thema auslöst, wenn es von Politikern einer bestimmten Partei adressiert wird. Setzt man diesen Wert ins Verhältnis zu der Themenverteilung pro Partei, wird deutlich, inwiefern die Themen, die von den Politikern adressiert werden, auch diejenigen sind, die Engagement auslösen. Über diese Korrelation wird das Maß an Synergie zwischen sozialem und technologischem Gatekeeping beschrieben (H2). Auch hier wird durch mehrfache Berechnung (für jedes LDA-Modell) Reliabilität gewährleistet.

Resultate

H1

Im Vergleich zur Verlinkungspraxis der anderen Parteien auf Twitter spiegelt sich in den von der AfD verlinkten Texten eine weniger vielfältige Themen-Agenda.

Betrachtet man die Durchmischung der Themen, lassen sich zunächst grob zwei Kategorien von Topics unterscheiden: Cluster, die deutlich von einer (oder von wenigen) Parteien dominiert werden (mit einem hohen Gini-Koeffizienten >0,2) und Themen, die eine relativ gleichmäßige Durchmischung aufweisen (mit einem kleinen Gini-Koeffizienten <0,1). Für ein Modell mit 30 TopicsFootnote 12 (siehe Abb. 1) ergibt sich nach dieser Klassifizierung ein Verhältnis von 11 homogeneren Querschnittsthemen zu 19 Themen, bei denen nur 1–2 Parteien einen inhaltlichen Schwerpunkt setzen. Insbesondere der Blick auf die Themen der letztgenannten Kategorie verdeutlicht die inhaltliche Nähe der Verlinkungspraxis zur jeweiligen politischen Programmatik. So gibt es Expertentopics, die eindeutig von einer bestimmten Partei bedient werden: Die Grünen besetzen beispielsweise die Themenbereiche Daten- und Naturschutz; FDP-Politiker posten intensiv zu Themen wie Verkehr und Wirtschaft; Politiker der Linken posten vermehrt zu internationalen Konflikten. Neben diesen durch Issue-Ownership charakterisierten Topics gibt es Themenbereiche, in denen eine deutliche Polarisierung zwischen zwei Parteien sichtbar wird: Beispielsweise dominieren Grüne und FDP in den umstrittenen Bereichen Klimaschutz und Autoindustrie (in der Heatmap sind die Themen für beide Parteien rötlich eingefärbt) – die Parteien stehen sich daher auch thematisch nahe.

Neben diesen Topics, die von zwei diametral positionierten Parteien dominiert werden, gibt es solche, in denen die Regierung kritisch thematisiert wird, besonders deutlich im Topic Innere Sicherheit (Top-Words z. B. Anfrage, Untersuchungsausschuss oder Amri) – hier äußern sich alle Parteien bis auf die Regierungsfraktionen. Zu den Themen, zu denen sich alle Parteien gleichermaßen äußern, gehören der Brexit oder die EU (mit sehr kleinem Gini-Koeffizient, gleichmäßige Einfärbung in der Heatmap).

Die rechtspopulistische AfD nimmt eine Sonderrolle ein: Die vier Themen, die am deutlichsten durch eine Partei besetzt werden und daher auch den höchsten Gini-Koeffizienten aufweisen, sind populistische Kernthemen, die von der AfD bedient werden (unten links in der Heatmap – in geringer thematischer Distanz: Migration, Kriminalität, RechtsextremismusFootnote 13 und Minderheiten). Gleichzeitig spielt die AfD in vielen Themenbereichen keine Rolle, beispielsweise in den Bereichen Daten‑, Klima- und Umweltschutz.

Die AfD ist damit eindeutig die Partei, deren thematisches Engagement sich am wenigsten gleichmäßig über die Palette der Topics verteilt. Mit anderen Worten: Die Themenpalette der AfD weist deutlich weniger Vielfalt auf als die der anderen Parteien. Diese Inferenz lässt sich modellunabhängig bestätigen. Bei jeder der gerechneten 56 Variablenkonstellation (dargestellt durch den Boxplot, siehe Abb. 3) ergibt sich diese Sonderstellung der AfD. Vergleicht man nun die durchschnittliche Vielfalt der Posts der einzelnen Politiker einer Partei (in Abb. 3 durch Beans dargestellt), wird deutlich, dass auch hier die AfD eine exponierte Position einnimmt: Die AfD-Politiker twittern, betrachtet auf der Akteursebene, verhältnismäßig heterogen (resultierend in einem niedrigen Gini-Koeffizienten). Sie sind thematische Generalisten in dem Sinne, dass die meisten von ihnen mehrere Kernthemen der populistischen Partei bedienen. Gleichzeitig ist der Gini-Koeffizient der Partei der mit Abstand höchste (visualisiert durch die Boxplots in Abb. 3) – die Agenda der AfD konzentriert sich, wie oben beschrieben, auf wenige Themen und ist damit wenig vielfältig in Relation zu den anderen Parteien.

Abb. 3
figure 3

a Jeweils ein Boxplot der Verteilung der Gini-Koeffizienten der entsprechenden Fraktion über 56 verschiedene Parameterkombinationen für die LDA (K = 20, …, 75, α = η = 1/K). Der farblich gekennzeichnete Punkt gibt den Gini-Koeffizienten der jeweiligen Fraktion in der betrachteten Prototypen-LDA mit K = 30 und α = η = 1/30 wieder. b Beanplots der Verteilungen der Gini-Koeffizienten pro Twitterer der untersuchten Fraktionen im Bundestag für die Protoypen-LDA mit K = 30 und α = η = 1/30

Anders sieht es beispielsweise bei den sich thematisch nahestehenden Koalitionsparteien SPD und CDU/CSU aus: Sie gehören zu den Parteien mit den heterogensten, vielfältigsten Themenprofilen (resultierend in einem niedrigen Gini-Koeffizienten). Diese entstehen auf individueller Ebene durch das Zusammenwirken unterschiedlicher thematischer Spezialisten, die vor allem zu ihrem jeweiligen Thema twittern: Die Analyse von SPD und CDU/CSU ergibt also im Aggregat einen niedrigen (dargestellt durch den Boxplot in Abb. 3), auf individueller Ebene einen hohen Gini-Koeffizienten (dargestellt durch den Beanplot in Abb. 3). Interessanterweise ist bei der FDP ein ähnlicher Spezialisierungsgrad wie bei den Koalitionsparteien zu beobachten; da die Experten aber unter sich homogener sind, ist die thematische Vielfalt im Aggregat niedriger als bei den Koalitionsparteien. Bei Linken und Grünen ist der Spezialisierungsgrad der Politiker weniger stark ausgeprägt, was sich hier in einer breiteren individuellen Themenagenda spiegelt. Insbesondere Die Grünen stechen hervor; sie adressieren von allen Parteien die vielfältigste Palette an Themen.

H2

Themen, die von der AfD besetzt werden, sind – gemessen an Engagement-Metriken (Likes, Shares) – erfolgreicher als Themen anderer Parteien auf Twitter.

Posts der AfD-Bundestagsabgeordneten lösen mehr Engagement aus als die der anderen Parlamentarier. Das gilt für die Gesamtheit der Tweets und noch deutlicher für Tweets im untersuchten Datensatz (also Posts, in denen auf andere Seiten verlinkt wird) – absolut für alle Tweets in Summe und auch relativ für das mittlere Engagement pro Tweet. Betrachtet man die LDA mit 30 Topics, sind es Posts der AfD zu Themen wie Kriminalität, Rechtsextremismus, Migration, Minderheiten und Ungleichheit/Umverteilung, die (sowohl relativ als auch absolut gesehen) am meisten Engagement auslösen. Keine Partei schafft es mit ihren Tweets, ähnlich viele Likes und Retweets zu evozieren. Nach der AfD folgen mit weitem Abstand Die Linke (Themen mit dem größten mittleren Engagement: Ungleichheit/Umverteilung, Türkei/Syrien), Die Grünen (Rechtsextremismus, Klimaschutz), SPD (Rechtsextremismus, linke Programmatik), FDP (Klimaschutz, Haushalt) und die Union (Rechtsextremismus, Wahlen).

Des Weiteren haben wir untersucht, ob der Engagement-Erfolg einzelner Themen mit den Selektionsentscheidungen der Politiker korreliert. Wir haben also den Zusammenhang analysiert zwischen dem metrisch quantifizierbaren Erfolg von Tweets zu einem Thema und der Menge der Posts, die zu ebendiesem Thema von einer Partei veröffentlicht wurden. Hierbei zeigt sich, dass die Korrelation zwischen der Themensetzung durch die verlinkten Texte und dem Engagement-Erfolg der zugehörigen Tweets bei keiner der anderen Parteien so deutlich ist wie bei der AfD (siehe Abb. 4).

Abb. 4
figure 4

Korrelation des Engagement-Scores pro Thema und Partei mit der absoluten Anzahl an Topiczuordnungen pro Partei (Rangkorrelationskoeffizient nach Spearman) – für insgesamt 56 verschiedene Parameterkombinationen (K = 20, …, 75, α = η = 1/K)

Fazit

Ziel dieser Untersuchung war es zum einen, die Verlinkungspraxis populistischer Akteure auf Basis repräsentativer Daten zu beschreiben. Zum anderen sollte das synergetische Zusammenwirken aus Engagement-Metriken und populistischer Themensetzung offengelegt werden. Hierzu haben wir 56.107 Texte analysiert, die von Bundestagsabgeordneten in der laufenden Legislaturperiode in Tweets geteilt wurden. Die zentralen Ergebnisse der Untersuchung sind:

  1. 1.

    Die Themenagenda rechtspopulistischer Akteure (hier am Beispiel der AfD) unterscheidet sich deutlich von den Themenprioritäten anderer Parteien. Sie weist eine andere Struktur auf – wenige Themen werden intensiv adressiert – und umfasst andere inhaltliche Schwerpunkte (s. unten). Hypothese 1 kann somit als bestätigt angesehen werden: Im Vergleich zu den Verlinkungen der anderen Parteien auf Twitter spiegelt sich in denen der AfD eine weniger vielfältige Themen-Agenda – dieses Ergebnis konnte für jede der gerechneten LDA-Variablenkonstellationen bestätigt werden.

    Das Mittel des Teilens journalistischer Inhalte ist offenbar zentral für die populistische Kommunikationsstrategie: Während die AfD-Poltiker auf Twitter ansonsten nicht aktiver sind als andere Parlamentarier, stechen sie beim Sharing deutlich hervor.

  2. 2.

    Die Themenselektion der populistischen Akteure korreliert stärker mit dem metrischen Erfolg einzelner Themen, als dies bei anderen Parteien der Fall ist – ein synergetisches Verhältnis konnte hier also deutlich nachgewiesen werden. Auch dieses Ergebnis ergab sich gleichermaßen für jede der gerechneten LDA-Variablenkonstellationen. Hypothese 2 wurde hiermit bestätigt: Themen, die von der AfD besetzt werden, sind – gemessen an Engagement-Metriken (Likes, Shares) – erfolgreicher als die Themen anderer Parteien auf Twitter.

Die Themen, die in der Literatur als charakteristisch für Populisten beschrieben werden (vgl. Ernst et al. 2018, S. 172), spiegeln sich in den Themen, mit denen AfD-Politiker am meisten Engagement auslösen: Migration, die Verhandlung von Identität in der Auseinandersetzung mit Rechtsextremismus und Minderheiten (also outgroups), Kriminalität, also Korruption und Verbrechen, sowie die Thematisierung wirtschaftlicher Not, insbesondere über Chancen- und Verteilungsfragen. Einzig der in der Literatur als typisch beschriebene Themenkomplex der europäischen Integration spielt im untersuchten Fall eine untergeordnete Rolle.

Es konnten des Weiteren keine Indizien für die These einer inhaltlichen Expansion (vgl. Krämer 2017) über die typisch populistischen Themenbereiche hinaus nachgewiesen werden. Allerdings würde die strategische Umsetzung des Anspruchs der neuen „Volkspartei“, die sukzessive Erschließung neuer Themenbereiche, erst durch eine longitudinale Analyse sichtbar. Die vorliegende Studie bietet hierfür einen geeigneten Ausgangspunkt.

In einem nächsten Schritt wäre beispielsweise zu fragen, wie die Verzerrung der Medienagenda durch das populistische Gatekeeping auf den Journalismus zurückwirkt – beispielsweise vermittelt durch eine redaktionelle Orientierung an den Relevanzindikatoren der Plattformen (vgl. Caplan und Boyd 2018, S. 5–8). Des Weiteren wäre es naheliegend, die Entstehung der Engagement-Agenda-Korrelation qualitativ oder longitudinal quantitativ zu beleuchten: Agieren AfD-Politiker strategisch, indem sie erfolgsversprechende Themen besetzen? Gibt es also ein Wechselspiel zwischen Themensetzung und metrischem Erfolg? Bedienen sie bewusst die Identität eines bestimmten Kollektivs?

Aus methodischer Perspektive hat sich bestätigt, dass die Analyse externer Vielfalt zu anderen Inferenzen führt als eine Betrachtung der internen Vielfalt. Würde man allein die Vielfalt verlinkter Medien vergleichen, käme man zum Schluss, dass sich das Gatekeeping der AfD nicht deutlich von dem der anderen Parteien unterscheidet. Der methodische Schwerpunkt auf externe Vielfalt könnte so zu einer Normalisierung populistischer Kommunikation beitragen. Der Mehrwert einer Analyse auf Inhaltsebene – statt nur auf Quellenebene – wird hier evident. Die Kontrastierung beider Ebenen ermöglicht darüber hinaus, die Beobachtung der Paradoxie populistischer Kommunikation (vgl. Haller und Holt 2019) auf die Ebene des Gatekeepings zu übertragen: Die Verlinkung tradierter journalistischer Quellen verleiht der dahinterstehenden populistischen Agenda Seriosität. Diese unterstützt als Zerrspiegel der journalistischen Agenda paradoxerweise gleichzeitig die populistische Kritik an journalistischer Themensetzung.

Auch in Hinblick auf die anderen Parteien liefert die vorliegende Arbeit interessante Erkenntnisse: Besonders frappierend ist die Ähnlichkeit der Koalitionsparteien in allen gemessenen Dimensionen. Hiermit werden frühere Studien zur inhaltlichen Nähe der Regierungsparteien bestätigt (vgl. Caton et al. 2015, S. 8; Tromble 2016, S. 679). Bei den Oppositionsparteien stechen FDP und Die Grünen hervor. Ähnlich wie die AfD-Parlamentarier verlinken Politiker der FDP vor allem Texte zu bestimmten Kernthemen, die Engagement auslösen. Inhaltlich unterscheiden sich diese indes stark von den Themen der Rechtspopulisten: Bundestagsabgeordnete der FDP konzentrieren sich zum einen auf Expertentopics im ökonomischen Bereich und zum anderen auf polarisierende Themen, bei denen sie oft eine Gegenposition zu den Grünen einnehmen.

Analog zu früheren Studien (vgl. Caton et al. 2015, S. 14) kann bestätigt werden, dass sich besonders das Social-Media-Verhalten der Grünen von dem der anderen Parteien unterscheidet. Sie stellen in mehrerlei Hinsicht das Gegenmodell zur AfD dar: Sie haben die vielfältigste Themenagenda und ihre Themenselektion korreliert am wenigsten mit dem Engagement der User. Während die AfD durch die issue-ownership typisch populistischer Themen und eine damit verbundene Vielfaltsreduktion hervorsticht, kommunizieren die Grünen vergleichsweise vielfältig.

Die vorgelegten Ergebnisse sind insbesondere in zweierlei Hinsicht limitiert: Sie beschränken sich auf die Plattform Twitter, die zwar für Elitenkommunikation relevant ist, jedoch nur beschränkt für die Kommunikation zwischen Politikern und Wählerschaft. Politiker erreichen auf anderen Plattformen, insbesondere Facebook, eine größere Zielgruppe. Es wäre daher zu prüfen, ob sich die Ergebnisse dieser Studie in einem Cross-Plattform-Vergleich bestätigen ließen. Außerdem beschränkt sich die Analyse auf Texte, zu denen der Scraper Zugriff hatte – Multimedia-Inhalte wurden in der Analyse nicht berücksichtigt, genauso fehlen Inhalte von Facebook. In einem nächsten Schritt wäre es daher beispielsweise wünschenswert, das Korpus um Social-Media-Posts und transkribierte Video- und Audioinhalte zu ergänzen.