Advertisement

Netzwerkanalyse in der Politikwissenschaft

  • Philip LeifeldEmail author
Living reference work entry
Part of the Springer Reference Sozialwissenschaften book series (SRS)

Zusammenfassung

Die Netzwerkanalyse ist eine Sammlung von Methoden zur Analyse von Interaktionen oder Beziehungen zwischen Akteuren. In der Politikwissenschaft finden diese Methoden breite Anwendung, da Politik häufig in Gruppenkontexten mit potenzieller gegenseitiger Relevanz der Akteure abläuft, während konventionelle Nicht-Netzwerk-Methoden die Unabhängigkeit (oder höchstens triviale Abhängigkeit) der Akteure in diesen Kontexten annehmen. Netzwerkanalyse erlaubt die gleichzeitige Analyse von Akteuren und ihren Beziehungen als komplexes System. Es existieren Methoden zur Beschreibung und Visualisierung von Netzwerken sowie zur statistischen Modellierung von Netzwerken. Die statistischen Methoden lassen sich grob in statische Modelle für einen beobachteten Zeitpunkt und in temporale Netzwerkmodelle unterteilen sowie in Modelle für Netzwerke oder Dyaden als abhängige Variable und Modelle für in Netzwerken geschachtelte individuelle Beobachtungen. Das Kapitel gibt einen Überblick über diese verschiedenen Methoden und ihre Anwendung in der Politikwissenschaft und stellt den aktuellen Forschungsstand vor.

Schlüsselwörter

Netzwerk Relationale Daten Graph Inferenz Abhängige Beobachtungen Komplexe Systeme 

1 Anwendungsbereich der Netzwerkanalyse in der Politikwissenschaft

Politikwissenschaftler interessieren sich häufig für Themen wie die Aktivitäten von Abgeordneten in einem Parlament, Staaten im internationalen System oder Interessengruppen in einem Politikfeld. Diesen Themen ist gemein, dass sie durch Akteure charakterisiert sind, die untereinander komplexe Beziehungen aufweisen können. Abgeordnete können etwa durch gemeinsame Gesetzesvorlagen, Mitgliedschaften in denselben Ausschüssen oder ähnliches Wahlverhalten miteinander verbunden sein. Staaten können untereinander Allianzen eingehen, Kriege führen oder Handel treiben. Interessengruppen können zusammenarbeiten (Heaney und Leifeld 2018), in Konkurrenz zueinander treten oder staatliche Akteure beeinflussen. Solche Vorgänge sind komplexe soziale Systeme, in denen die einzelnen Handlungen voneinander abhängig sind. Ob ein Land mit einem anderen ein Abkommen eingeht, kann z. B. von den weiteren Allianzen der beiden Länder abhängen.

Abb. 1 gibt einen Überblick über einige prominente empirische Beispiele von Netzwerken in der Politik. Ein semantisches Netzwerk (Abb. 1A) ist ein System von Wörtern, die miteinander über gemeinsame Nutzung verbunden sind. Rule et al. (2015) setzen die 1000 wichtigsten Wörter in den State-of-the-Union-Reden des US-Präsidenten vor dem US-Kongress von 1790 bis 2014 über das Erscheinen im selben Absatz in Verbindung, um thematische Cluster und Änderungen über die Zeit zu identifizieren. Krebs (2001) zeichnet das Netzwerk der Flugzeugentführer bei den terroristischen Anschlägen am 11. September 2001 anhand von gemeinsamen Aktivitäten nach (Abb. 1B). Montgomery und Nyhan (2017) untersuchen die Verbindungen von Abgeordneten im 107. US-Kongress über Beschäftigte, die von einem Abgeordneten zu einem anderen wechseln (Abb. 1C). Leifeld und Fisher (2017) analysieren die gegenseitigen Mitgliedschaftsnominierungen der Mitglieder einer epistemischen Gemeinschaft, dem Millennium Ecosystem Assessment, um persönliche Faktoren in der Rekrutierung von Experten zu belegen (Abb. 1D). Cranmer et al. (2012) erklären das System der bilateralen Allianzen zwischen Staaten (hier abgebildet: 2003) anhand von Netzwerkeffekten (Abb. 1E). In Nagels (2016) Visualisierung des Diskursnetzwerkes öffentlicher Akteure im Mobilisierungsprozess um Stuttgart 21 werden polarisierte Diskurskoalitionen sichtbar, die in der öffentlichen Debatte ähnliche Argumente verwenden (Abb. 1F).
Abb. 1

Empirische Beispiele der Netzwerkanalyse in der Politikwissenschaft. 1C: (c) 2017 Southern Political Science Association. All rights reserved. 0022-3816/2017/7903-0001$10.00. All use subject to University of Chicago Press Terms and Conditions (http://www.journals.uchicago.edu/t-and-c). 1E: © 2012 by Cranmer et al. Reprinted by Permission of SAGE Publications, Ltd

Anhand dieser Beispiele wird deutlich, wie unterschiedlich die Strukturen (auch Topologien genannt) verschiedener politischer Netzwerke sein können, von dezentralen (1A und 1B) über zentralisierte (1D), segregierte (1E) bis hin zu polarisierten (1F) Netzwerkstrukturen. Immer wenn Politik wie in diesen Beispielen als ein komplexes System von Akteuren und ihren Beziehungen abläuft, sind Methoden der Netzwerkanalyse für die Beschreibung und Erklärung der Vorgänge hilfreich.

Netzwerke werden hierbei als abstrakte Modelle verwendet. Sie bestehen aus Knoten und Kanten, wobei die Kanten einige der Knoten miteinander verbinden. Kanten können je nach Anwendung binär, also ungewichtet (vorhanden oder nicht vorhanden) sein oder eine Gewichtung aufweisen, die die Intensität oder Häufigkeit der Verbindung beschreibt. Sie können darüber hinaus eine Richtung anzeigen oder ungerichtet sein. Zum Beispiel können Abgeordnete in einem Parlament als Knoten und die Anzahl der von je zwei Abgeordneten gemeinsam eingebrachten Gesetzesvorlagen als gewichtete, ungerichtete Kanten modelliert werden. Ein anderes Beispiel sind Staaten als Knoten und Kriegserklärungen als ungewichtete, gerichtete Kanten.

2 Was ist der Mehrwert der Netzwerkanalyse?

Die klassische Methodenlehre und Statistik geht von fallweisen Beobachtungen aus, wobei eine Beobachtung ein Charakteristikum oder Attribut einer Einheit (z. B. Akteur) darstellt, z. B. die Punktzahl eines Landes auf einer Demokratieskala oder das Wahlverhalten eines Abgeordneten. Diese Art der Modellierung war auch deshalb notwendig, weil konventionelle Modelle in der Regel zwischen Einheiten vergleichen, und ein Paarvergleich nur dann erfolgreich durchgeführt werden kann, wenn der eine Teil eines Paares nicht den anderen Teil beeinflusst. Regressionsmodelle verlangen etwa in der Regel, dass die Beobachtungen identisch und unabhängig verteilt (i. i. d.) sind, da Regressionsmodelle im Rahmen der wissenschaftlichen Methode Fälle miteinander vergleichen. Mehrebenenmodelle können für einfache Abhängigkeiten zwischen Datenpunkten (z. B. Schachtelung von Datenpunkten in räumlichen, zeitlichen oder organisatorischen Kontexten) kontrollieren. Netzwerkanalyse hingegen kommt dann zum Einsatz, wenn die Abhängigkeiten komplexer sind und als Beziehungsgeflecht dargestellt werden können. In der Netzwerkanalyse verschiebt sich der Fokus von den Knoten auf die Kanten – oder Dyaden – als Untersuchungseinheit.

Genauso, wie es häufig nicht ausreicht, isolierte Knoten als Untersuchungseinheiten zu betrachten, reicht es jedoch auch häufig nicht aus, Kanten oder Dyaden in Isolation per Vergleich zu betrachten. Zum Beispiel kann das Vorhandensein von Kanten zwischen den Knoten A und B sowie B und C zur Entstehung einer Kante zwischen A und C führen. Deshalb hat sich in der jüngeren Literatur der Fokus von Kanten als Untersuchungseinheiten hin zum Gesamtsystem der Kanten in einem Netzwerk als Untersuchungseinheit verschoben. Politik wird in diesem Fall nicht mehr als Sammlung untereinander unabhängiger Kanten (z. B. Dyaden im internationalen System), sondern vielmehr als komplexes System (z. B. das System der Konflikte im internationalen System) aufgefasst, das nur zusammen betrachtet werden kann (ähnlich wie in Abb. 1E).

Als Konsequenz aus dieser Erkenntnis wird der Einsatz von Methoden der Netzwerkanalyse häufig mit einem der folgenden beiden Narrative gerechtfertigt: Die theoretische Rechtfertigung eines Einsatzes von Netzwerkmethoden besteht in der Erkenntnis, dass viele Forschungsgegenstände in der Politikwissenschaft inhärent relational sind und die Ausklammerung von Relationen zwischen den Einheiten nur eine unvollständige Erklärung zulassen würde. Netzwerkanalyse bietet demnach den entscheidenden Vorteil, neue theoretische Möglichkeiten zu eröffnen und die relationalen Theorien auch empirisch testen zu können. Etwa kann im Bereich der internationalen Konflikte zusätzlich zu den Eigenschaften der beteiligten Staaten (etwa Nachbarschaft oder Militärausgaben) nun auch die strukturelle Balance im Sinne von triadischen Konfigurationen in die Theorien einbezogen werden (etwa der Feind meines Freundes ist mein Feind, woraus sich die Abwesenheit von geschlossenen Triaden im Konfliktnetzwerk ergibt).

Die statistische Begründung eines Einsatzes von Netzwerkmethoden besteht häufig in dem Verweis auf die Verletzung der i. i. d.-Annahme, wenn keine Netzwerkmodelle eingesetzt werden. Häufig sind Politikwissenschaftler nach wie vor an konventionellen, nicht-relationalen Theorien interessiert. Wenn sie jedoch eine Theorie mit Knoten als Untersuchungseinheiten testen wollen und die Knoten als Netzwerkkomponenten nicht unabhängig voneinander sind, müssen Netzwerkmodelle eingesetzt werden, um für die Netzwerkabhängigkeiten zu „kontrollieren“ und somit einen unverzerrten Test der Theorie zu erlauben. Würden die Abhängigkeiten nicht berücksichtigt, ergäbe sich ein omitted variable bias, und die Ergebnisse des statistischen Modells wären verzerrt.

Da traditionell dyadische oder monadische Designs in vielen Bereichen der Politikwissenschaft und internationalen Beziehungen eingesetzt worden sind und sich zunehmend die Erkenntnis durchsetzt, dass die Auslassung von Netzwerkkomponenten in vielen dieser Bereiche zu möglichen theoretischen und statistischen Limitationen führt, kann insgesamt erwartet werden, dass auch viele bereits publizierte Studien falsche Schlussfolgerungen enthalten (Cranmer et al. 2017).

Die statistische Modellierung von politischen Prozessen und Systemen bedarf der Netzwerkanalyse immer dann, wenn die Interaktionen zwischen den Einheiten komplexe Abhängigkeiten aufweisen, also die Attribute oder Beziehungen von Akteuren endogen auf nicht-triviale Weise miteinander kausal verbunden sind. Hierbei besteht jedoch ein Rechtfertigungsdilemma: Nicht immer weisen politische Prozesse oder Systeme solche komplexen Abhängigkeiten zwischen den Beobachtungen auf. In diesen Fällen ist Netzwerkanalyse nicht notwendig. Trotzdem kann man als Forscher a priori nicht wissen, ob das System Abhängigkeiten aufweisen wird. Deshalb sollte als Vorsichtsmaßnahme immer dann auf Netzwerkmethoden zurückgegriffen werden, wenn es sich um Systeme handelt, bei denen potenziell komplexe Abhängigkeiten bestehen. Dies umfasst im Wesentlichen alle Prozesse, die in Gruppenkontexten ablaufen oder bei denen eine mögliche gegenseitige Wahrnehmung zwischen den Akteuren oder Einheiten besteht.

3 Deskriptive Ansätze

Die klassische Form der Netzwerkanalyse ist die beschreibende Netzwerkanalyse. Der Standardkanon an deskriptiven Methoden wird in einigen klassischen Lehrbüchern wiedergegeben (Hennig et al. 2012; Scott 2017; Wasserman und Faust 1994). Beispiele für Anwendungen von deskriptiven Verfahren finden sich beispielsweise in Schneider et al. (2009). Deskriptive Netzwerkanalyse ist ein wichtiges Fundament, um später auch die inferenzstatistische Netzwerkanalyse zu verstehen. Netzwerke können auf drei Ebenen beschrieben werden: Auf der Ebene des Gesamtnetzwerks (Visualisierung, Netzwerkindizes), auf einer Zwischenebene (Subgruppenanalyse) und auf der Ebene der Knoten (Zentralität).

3.1 Beschreibung auf Ebene des Gesamtnetzwerks

Zu den deskriptiven Verfahren auf der Ebene des Gesamtnetzwerkes zählt insbesondere die Visualisierung von Netzwerken. Da Netzwerke aufgrund ihrer Komplexität eine hohe intrinsische Dimensionalität aufweisen, ist das Ziel der Visualisierung, Netzwerke in zwei oder drei zentralen Dimensionen wahrnehmbar darzustellen und strukturelle Eigenschaften deutlich zu machen. Die Informatik hat sich unter dem Label Graph Drawing mit Prinzipien und Algorithmen der Netzwerkvisualisierung beschäftigt und einige Standardlayouts entwickelt, die Eingang in die Netzwerkliteratur und Visualisierungssoftware wie visone, Netdraw oder Gephi gefunden haben (Kaufmann und Wagner 2003). Spezialisierte methodische Verfahren für Politiknetzwerke sind hierbei z. B. für die Visualisierung von Status oder Macht (Brandes et al. 2001) oder der Zentralität von Akteuren in Netzwerken (Brandes et al. 1999, 2003, 2006) entwickelt worden. Klassische dimensionsreduzierende Verfahren aus der multivariaten Statistik finden in diesem Bereich ebenso Anwendung. Beispiele hierfür sind die multidimensionale Skalierung, Korrespondenzanalyse und Faktorenanalyse.

Neben der Visualisierung können Netzwerke durch Indizes wie Dichte (d. h. die Anzahl der Kanten), Zentralisierung (d. h. Konzentration der strukturellen Wichtigkeit von Knoten auf wenige Knoten) oder Clustering (d. h. die Tendenz zur Bildung von geschlossenen Triaden oder „Cliquen“, also kohäsiven Subgruppen von Knoten) beschrieben werden. Dies kann informativ sein, um verschiedene Netzwerke als Fälle miteinander zu vergleichen – etwa mehrere Policy-Netzwerke oder das internationale System zu mehreren Zeitpunkten.

3.2 Subgruppenanalyse

Neben der Beschreibung von Gesamtnetzwerken ist ein wichtiges Ziel der deskriptiven Netzwerkanalyse die Identifikation von Subgruppen in Netzwerken. Entsprechende Analyseverfahren firmieren unter den Labels Subgruppenanalyse, Clusteranalyse, Graph Clustering, Blockmodelle und Community Detection. Das Ziel all dieser Verfahren und ihrer Unterarten ist das Auffinden von Bereichen im Netzwerk, in denen die Knoten besonders dicht miteinander und besonders spärlich mit der Umgebung verbunden sind. Diese Subgruppen von Knoten werden dann je nach Theorie als Koalitionen von Akteuren mit ähnlichen Interessen oder Überzeugungen oder Allianzen interpretiert.

Ein Beispiel aus der Policy-Forschung ist die Identifikation von Diskurskoalitionen oder Advocacy-Koalitionen in Policy-Debatten mit Hilfe von hierarchischer Clusteranalyse (Leifeld 2016) und Girvan-Newman Community Detection (Leifeld 2017) und die Beschreibung ihrer Veränderung über die Zeit, bevor wichtige Reformen durchgesetzt werden. Dieser Ansatz wird auch als Diskursnetzwerkanalyse bezeichnet (Leifeld 2016, 2017). Die Identifikation von Koalitionen im politischen Prozess mittels Verfahren der Clusteranalyse stellt hierbei ein wichtiges Ziel dar (Leifeld 2013; Leifeld und Haunss 2012; Fisher et al. 2013a, b).

Ein Beispiel aus den Internationalen Beziehungen ist die Analyse von Cranmer et al. (2015), in der die Autoren Communities im internationalen System (anhand von gemeinsamen Mitgliedschaften in internationalen Organisationen, gemeinsamer Demokratie und Handel zwischen den Nationen) mittels der sogenannten Multilayer-Modularität untersuchen. Diese ist ein Maß dafür, wie stark ein Netzwerk über verschiedene Beziehungsarten hinweg in Untergruppen segregiert ist. Die Autoren erklären die Anzahl von zwischenstaatlichen Konflikten in einem gegebenen Jahr mit der Tendenz, dass sich das internationale System in jenem Jahr in unterschiedliche Communities zerfasert.

3.3 Analyse auf Knotenebene

Ein wichtiger Bereich der deskriptiven Netzwerkanalyse auf Knotenebene ist die Analyse von Zentralität. Es gibt Hunderte von Zentralitätsmaßen, die unterschiedliche Aspekte des Zentralitätskonzepts operationalisieren. Zentralität als abstraktes Konzept ist zunächst nichts weiter als die Wichtigkeit eines Knotens im Netzwerk. Die Wichtigkeit eines Knotens kann auf der Basis unterschiedlicher theoretischer Kriterien beschrieben werden.

Ein geläufiges Verfahren operationalisiert Zentralität etwa über die Nähe eines Knotens zu allen anderen Knoten. Dies kann Wichtigkeit bedeuten, weil ein zentraler Knoten z. B. schnell Informationen an alle anderen verteilen oder von ihnen erhalten kann. Das entsprechende Maß nennt sich Closeness-Zentralität oder Nähe-Zentralität. Ein anderes geläufiges Verfahren, die Betweenness-Zentralität, definiert Wichtigkeit über die Anzahl der kürzesten Pfade zwischen anderen Knotenpaaren im Netzwerk, auf denen ein Knoten liegt. Dies kann etwa theoretisch interessant sein, da Knoten mit hohen Werten auf diesem Maß die Informationsflüsse zwischen vielen anderen Knoten kontrollieren können oder da sie als Broker zwischen Koalitionen vermitteln oder diese strategisch ausspielen können. Ein drittes geläufiges Maß ist die Degree-Zentralität oder Grad-Zentralität, bei der lediglich die Anzahl der Kanten gezählt wird, an denen ein Knoten beteiligt ist. Komplexere Maße wie die Eigenvector-Zentralität bauen hierauf auf und gewichten das Maß mit der Wichtigkeit oder Zentralität der Knoten, mit denen der jeweilige Knoten verbunden ist.

Schoch und Brandes (2016) zeigen mit einem axiomatischen Ansatz, dass die Vielzahl von Zentralitätsmaßen auf bestimmte Grundregeln (Positional Dominance) reduziert werden kann. Aus den Grundregeln können dann theoretisch gehaltvolle Maße abgeleitet werden.

4 Inferenzstatistische Netzwerkmodelle

Politikwissenschaftliche Forschung interessiert sich häufig für (kausale) Zusammenhänge zwischen sozialen Phänomenen. Da deskriptive Verfahren häufig schwer mit dem Anspruch der hypothesentestenden internationalen Politikwissenschaft vereinbar waren, hat die in den 2000er-Jahren aufkommende statistisch orientierte Netzwerkanalyse („inferenzstatistische Netzwerkanalyse“, Cranmer et al. 2017) der Netzwerkanalyse in der Politikwissenschaft letztlich zum Durchbruch verholfen. Methoden der inferenzstatistischen Netzwerkanalyse erlauben die Erklärung von Netzwerkstrukturen durch multiple unabhängige Variablen sowie endogene Prozesse innerhalb des datengenerierenden Prozesses (DGP).

Es ist zum einen zwischen Querschnittsmodellen, in denen ein einzelnes Netzwerk untersucht wird, und temporalen Modellen, in denen die Netzwerkformation oder -evolution über die Zeit untersucht wird, zu unterscheiden. Zum anderen ist zwischen solchen Modellen zu unterscheiden, die Netzwerke als abhängige Variable oder Explanandum betrachten, und solchen, die Netzwerkprozesse auf der Seite der Erklärungsfaktoren für individuelles oder organisationales Verhalten von Knoten ansehen.

4.1 Modelle für einen Beobachtungszeitpunkt

In diesem Abschnitt sollen Methoden zur Erklärung von Netzwerkstrukturen im Querschnitt beleuchtet werden, während temporale Netzwerke im nächsten Abschnitt und die entgegengesetzte kausale Richtung (Netzwerke als unabhängige Variable, sowohl im Querschnitt wie im Längsschnitt) im übernächsten Abschnitt betrachtet werden. Zunächst soll das Exponential Random Graph Model (ERGM) beschrieben werden, da es die populärste und vielleicht theoretisch flexibelste Methode zur empirischen Modellierung von Netzwerken im Querschnitt darstellt.1

Die Modellierung von Netzwerken kann analytisch auf unterschiedlichen Ebenen interpretiert werden: auf der dyadischen Ebene oder auf der globalen Ebene. Beide Interpretationen sind miteinander kompatibel und implizieren dieselben statistischen Modelle.

Auf der dyadischen Ebene versucht man zu erklären, warum ein Knoten eine Kante zu einem anderen Knoten hat. Man erklärt damit die Existenz oder Absenz von Kanten (oder in manchen Modellen das Kantengewicht) zwischen den Knoten. Diese Erklärung erfolgt als Funktion der Eigenschaften der beteiligten Knoten sowie in Abhängigkeit von Prozessen, die mehrere Knoten umfassen und keine exogenen Daten beinhalten (sogenannte endogene Prozesse oder Netzwerkstatistiken höherer Ordnung).

Auf der globalen Ebene versucht man zu erklären, warum ein Netzwerk eine bestimmte Topologie, also Struktur von Kanten zwischen den Knoten, ausbildet. Warum sieht ein Netzwerk mit einem bestimmten DGP (etwa ein Konfliktnetzwerk) anders aus als ein Netzwerk mit einem anderen DGP (etwa ein Allianznetzwerk) oder als ein zufälliges Netzwerk? Indem man die exogenen Kovariaten und die endogenen Prozesse modelliert, erklärt man nicht nur die dyadischen Zustände zwischen Knoten, sondern zugleich die Gesamttopologie des zu modellierenden Netzwerks. Hierbei begreift man den DGP als Interaktion von lokalen Prozessen, die überall im Netzwerk dezentralisiert und zeitgleich ablaufen und über die Zeit im Gleichgewicht die beobachtete Topologie produzieren. Das Explanandum ist daher das Netzwerk als eine multivariate, komplexe Beobachtung. Die Logik soll im Folgenden anhand zweier Beispiele illustriert werden.

Beispielsweise kann ein Koautorennetzwerk zwischen Politikwissenschaftlern (Leifeld und Ingold 2016; Leifeld et al. 2017; Leifeld 2018) durch die Knoteneigenschaften der beteiligten Wissenschaftler erklärt werden. Ein Koautorennetzwerk ist ein ungerichtetes Netzwerk, weshalb nicht zwischen den Rollen eines Senders/einer Quelle und eines Empfängers/Ziels unterschieden werden muss. Zu den Knoteneigenschaften, die zur Erklärung herangezogen werden können, zählen monadische (d. h. jeweils auf einen Knoten bezogene) exogene Kovariaten wie auch dyadische exogene Kovariaten. Als monadische Erklärungsfaktoren kommen etwa die Seniorität oder der Spezialisierungsgrad eines Wissenschaftlers in Frage. Diese beiden Variablen erklären grundsätzlich, warum ein Wissenschaftler mehr oder weniger Kanten zu anderen Wissenschaftlern aufweist. Als dyadische Erklärungsfaktoren kommen Netzwerkrelationen wie Betreuungsverhältnisse zwischen Professoren und Doktoranden, gemeinsame Affiliation oder geografische Distanz oder auch Ähnlichkeitsrelationen wie ähnliches Publikationsverhalten oder inhaltliche Ähnlichkeit in Frage. Diese dyadischen Faktoren erklären, warum zwei bestimmte Wissenschaftler miteinander zusammenarbeiten.

All diese exogenen Kovariaten können in einem konventionellen generalisierten Regressionsmodell wie der logistischen Regression genutzt werden. Jedoch führt dies zu einem omitted variable bias, da die Netzwerkabhängigkeiten zwischen den Kanten nicht in die Erklärung einbezogen würden. Selbst wenn sie mit Hilfe sogenannter Change-Statistiken in eine dyadische Form überführt werden können und in die Erklärung einbezogen werden, führt die Schätzung mittels maximum pseudolikelihood estimation (MPLE) zu verzerrten Standardfehlern und bei kleineren Netzwerken auch zu verzerrten Schätzern. Aus diesen Gründen müssen entweder zusätzliche endogene Netzwerkstatistiken mit einbezogen werden, oder es muss auf andere Weise für die Abhängigkeiten korrigiert werden (Cranmer et al. 2017). Die Einbeziehung zusätzlicher endogener Statistiken kann im Rahmen des ERGM mit Markov-Chain-Monte-Carlo-Maximum-Likelihood-Schätzung (MCMC-MLE) geleistet werden. Hierdurch können Netzwerktheorien explizit getestet werden, die endogene Prozesse postulieren.

Im Beispiel der Koautorennetzwerke könnte man etwa vermuten, dass es zu vermehrter Triadenbildung im Netzwerk kommt, weil Publikationen bisweilen mehr als zwei Autoren aufweisen. Mehrere Autoren in einer Publikation führen automatisch dazu, dass besonders viele geschlossene Triaden erwartet werden können. Dies sind lokale Strukturen mit drei Knoten, in denen alle drei Knoten miteinander verbunden sind (hier etwa durch eine gemeinsame Publikation). Deshalb sollte in einem ERGM die Anzahl der geschlossenen Triaden im Netzwerk (oder zumindest die Tendenz für Clustering) in die Modellspezifikation miteinbezogen werden.

Darüber hinaus kann man erwarten, dass manche Autoren sehr populär sind, während die meisten Autoren nur wenige Koautoren haben. Zum Teil dürfte dies in exogenen Variablen wie Seniorität verortet liegen, aber man könnte etwa die verbleibende Variabilität in der Gradzentralität von Autoren durch die Anzahl der 2-stars operationalisieren und testen. Dies fängt die Tendenz ein, dass ein Knoten, der eine Verbindung hat, eine weitere Kante aufweist. Eine hohe Anzahl solcher 2-stars würde für eine schiefe Verteilung der Gradzentralität im Netzwerk sorgen und somit realistischere Netzwerke abbilden. Man kann explizit testen, ob die Anzahl der 2-stars im beobachteten Netzwerk höher oder niedriger ist, als man in einem Zufallsgraphen (also einem Netzwerk mit gleicher, homogener Kantenwahrscheinlichkeit in allen Dyaden) erwarten würde.

Die Einbeziehung dieser endogenen Prozesse als Kontrollvariablen oder Hypothesen ist notwendig, um die übrigen (exogenen) Modellterme interpretieren zu können. Die Schätzung eines ERGMs über MCMC-MLE produziert Koeffizienten für die monadischen und dyadischen exogenen Kovariaten sowie für die einzelnen endogenen Netzwerkstatistiken, also die Anzahl der Triaden und 2-stars. Die Interpretation der Koeffizienten erlaubt Rückschlüsse darauf, welche Merkmale eine starke Rolle in der Netzwerkformation gespielt haben und die Topologie maßgeblich beeinflussen (oder auf der dyadischen Ebene: welche Merkmale eine starke Rolle in der Erklärung der dyadischen Zustände zwischen den Wissenschaftlern spielen).

Die Ergebnisse eines ERGMs können nur dann sinnvoll interpretiert werden, wenn das Modell die endogenen Prozesse der Netzwerkformation adäquat einfängt. Um dies zu testen, kann die endogene Modellgüte (goodness of fit) mit Hilfe von Simulationen untersucht werden. Nach der Schätzung simuliert man hierfür eine Vielzahl neuer Netzwerke anhand der geschätzten Koeffizienten und der modellierten Terme und vergleicht die Netzwerkeigenschaften der simulierten Netzwerke mit den Eigenschaften des beobachteten Netzwerks anhand von Hilfsstatistiken. Wenn z. B. die Verteilungen der Gradzentralität, der kürzesten Pfade, der Triaden usw. zwischen Simulationen und Originalnetzwerk in etwa übereinstimmen, kann man daraus schließen, dass der endogene Teil des DGP zufriedenstellend modelliert worden ist, so dass man die Koeffizienten sinnvoll interpretieren kann. Wenn der Vergleich eine starke Divergenz zeigt, sollte man die Modellspezifikation ändern und ein neues Modell schätzen und erneut die Modellgüte untersuchen. Der Vergleich wird in der Regel durchgeführt, indem pro Hilfsstatistik eine Kurve für die jeweilige Verteilung der Statistik in dem beobachteten Netzwerk gezeichnet wird und Boxplots für die simulierten Netzwerke darübergelegt werden. Wenn die Linie in etwa die Medianlinien der Boxplots berührt, ist die Modellgüte hoch. Beispiele für solche Vergleiche finden sich in Leifeld und Schneider (2012), Ingold und Leifeld (2016) und Cranmer et al. (2017). Die Vergleichsmethode wurde ursprünglich von Hunter et al. (2008a) vorgeschlagen. Eine Implementation verschiedener Modellgütemaße und -techniken findet sich im R-Paket xergm, das Erweiterungen von ERGMs und verwandten Modellen beinhaltet (Leifeld et al. 2018).

Ein zweites Beispiel soll den Mehrwert von ERGMs gegenüber generalisierten Regressionsmodellen und verschiedenen Hypothesenarten verdeutlichen. Internationale Konflikte (militarized interstate disputes, MID) stellen ein gerichtetes Netzwerk dar, wenn man annimmt, dass ein Sender-Knoten einen Empfänger-Knoten angreifen kann. Zur Erklärung von Konflikten werden typischerweise einige der folgenden Faktoren herangezogen. Die militärische Ausstattung eines Landes kann abschreckende Wirkung haben und kann deshalb in einem ERGM als Empfänger-Knotenattribut getestet werden. Ein negativ signifikanter Koeffizient würde anzeigen, dass ein Land mit großer militärischer Ausstattung weniger häufig angegriffen wird als andere Länder. Weiterhin kann man eine Reihe von dyadischen exogenen Kovariaten testen, u. a. gemeinsame Demokratie, geografische Nachbarschaft und Handelsabhängigkeit eines Landes von einem anderen Land.

Um die endogenen Prozesse vollständig zu modellieren, kann man eine Reihe von endogenen Statistiken hinzufügen. Dies sollte nach Möglichkeit theoriegeleitet erfolgen. In der Analyse von Konflikten hat die Literatur über strukturelle Balance eine lange Tradition (Cartwright und Harary 1956). Die Idee ist, dass (1) Freunde von Freunden ebenfalls direkte Freunde sind, (2) Feinde von Feinden direkte Freunde sind, (3) Feinde von Freunden direkte Feinde sind und (4) Freunde von Feinden direkte Feinde sind. Diese axiomatischen Beziehungsmuster lassen sich in endogene Netzwerkstatistiken überführen und als lokale Graphenstrukturen in einem ERGM testen. Beispielsweise impliziert die zweite Regel, dass man überdurchschnittlich viele eingehende 2-stars finden sollte, also Konfigurationen, in denen die Kanten A-B und C-B, jedoch nicht A-C oder C-A zu finden sind. Da geschlossene Triaden (z. B. A-B-C-A) die Regeln 2, 3 und 4 verletzen würden, kann man erwarten, dass besonders wenige geschlossene Triaden im Netzwerk zu finden sind. Dies kann man z. B. testen, indem man die Anzahl der geschlossenen Triaden im Netzwerk zählt und dafür kontrolliert. Weiterhin implizieren die Regeln 2, 3 und 4, dass man besonders viele 4-cycles finden sollte. Dies sind Strukturen A-B-C-D-A, in denen keine Kanten A-C und B-D vorkommen dürfen. In einem ERGM kann man die Anzahl der 4-cycles als weiteren Modellterm aufnehmen, um strukturelle Balance zu testen und kontrollieren. Ein Blick auf die Modellgüte verrät, dass diese theoriegeleitete Konfiguration von exogenen und endogenen Statistiken die Abhängigkeiten gut einfängt (Li et al. 2017).2

ERGMs sind nur anwendbar auf ungewichtete Netzwerke. Es existieren jedoch Erweiterungen für gewichtete Netzwerke. Insbesondere ist hier das generalisierte ERGM (GERGM) zu nennen (Desmarais und Cranmer 2012; Wilson et al. 2017).

Abschließend soll eine mögliche Schwäche von ERGMs erwähnt werden. Die Schätzung von ERGMs mittels MCMC-MLE ist anfällig für Modell-Degeneriertheit (model degeneracy), d. h., der Schätzalgorithmus konvergiert bei vielen möglichen Kombinationen von endogenen Modelltermen nicht. Der Grund ist, dass viele Kombinationen von Modelltermen theoretisch unplausibel sind und per lokalen Interaktionen zu vollständig verbundenen oder leeren Netzwerken führen würden. Degeneriertheit tritt bei der Mehrzahl der geschätzten Modelle auf und kann nur durch theoriegeleitete Spezifikation sowie in der Praxis durch Ausprobieren verschiedener theoretisch gehaltvoller Konfigurationen vermieden werden. Diese Schwäche von ERGMs ist zugleich eine versteckte Stärke, da unrealistische Modelle erst gar nicht geschätzt werden können und somit der Forscher vor groben Fehlspezifikationen bewahrt wird.

Insbesondere anfällig sind Modellterme wie geschlossene oder offene Triaden. Der Grund hierfür ist, dass bei steigender Dichte (d. h. Anzahl von Kanten) in einem Netzwerk automatisch auch die Anzahl der geschlossenen und offenen Triaden steigt. Somit kann der Schätzalgorithmus häufig kaum entscheiden, auf welchen der Terme (Anzahl der Kanten oder Triaden-Term) die Wahrscheinlichkeitsmasse verteilt werden soll. Abhilfe schaffen in diesem Fall Modellterme höherer Ordnung wie geometrically weighted edge-wise shared partners (GWESP) oder geometrically weighted degree (GWD), die annähernd dieselben theoretischen Konzepte wie geschlossene Triaden und offene Triaden (d. h. 2-stars) testen, aber eine geometrische Glättung über alle übrigen Knoten im Netzwerk vornehmen, indem jeder zusätzliche gemeinsame Partner oder Kontakt weniger stark gewichtet wird (Hunter 2007; Snijders et al. 2006). Hierdurch wird die Korrelation mit der Dichte des Netzwerks und somit Degeneriertheit häufig vermieden.

Abhilfe für Degeneriertheit schaffen auch hierarchische ERGMs (HERGM). Bei dieser neueren Entwicklung wird zunächst eine Partitionierung des Netzwerks in Blöcke und anschließend die Schätzung für die separaten Blöcke vorgenommen. Somit wird globale Abhängigkeit von Kanten untereinander durch lokale Abhängigkeit innerhalb von Nachbarschaften im Netzwerk ersetzt, was sowohl die Korrelation zwischen den Modelltermen mindert als auch die Annahme der Homogenität des DGP über die Netzwerktopologie hinweg auflöst. Bei beiden Problemlösungen – geometrisch gewichtete Modellterme und HERGM – ist jedoch zugleich zu konstatieren, dass die Interpretation etwas aufwändiger ist als bei einfachen ERGMs mit lokalen Modelltermen. Deshalb sind in der Regel zunächst einfache ERGMs zu bevorzugen und im Problemfall die fortgeschrittenen Techniken einzusetzen. Die Lösung des Degeneracy-Problems ist weiterhin Gegenstand aktueller Forschung in der Statistik (z. B. Fellows und Handcock 2017).

Neben ERGMs existieren zwei weitere populäre inferenzstatistische Techniken für einmalig beobachtete Netzwerke: die quadratic assignment procedure (QAP) (Krackhardt 1988; Dekker et al. 2007) und Latent-Space-Modelle (Hoff et al. 2002).3 Beide Techniken erlauben die Korrektur der Schätzer und Standardfehler, wenn unmodellierte komplexe Abhängigkeiten zwischen den Beobachtungen eines dyadischen Regressionsmodells vorliegen. Sie stellen effektive Alternativen zum ERGM dar, wenn das theoretische Interesse primär die exogenen Kovariaten betrifft und sich die zu testende Theorie nicht auf die endogenen Prozesse bezieht. Da keine endogenen Modellterme modelliert werden müssen, ist die praktische Handhabung einfacher und die Schätzung weniger rechenintensiv. Man erkauft sich diese Vorteile jedoch durch eine geringere Flexibilität bei der Modellierung der endogenen Netzwerkprozesse (Cranmer et al. 2017).

Die QAP-Methode ist ein Permutationsansatz, bei dem – vereinfacht dargestellt – die Reihenfolge der Zeilen und Spalten wiederholt umsortiert und das Modell neu geschätzt wird, um eine Referenzverteilung der Schätzer bei abhängigen Beobachtungen, aber Unabhängigkeit zwischen der abhängigen Variable und den unabhängigen Variablen zu erzeugen. Die geschätzten Koeffizienten für das beobachtete Netzwerk können dann mit dieser neuen Referenzverteilung/Null-Hypothese verglichen werden, um Signifikanz zu ermitteln (Krackhardt 1988; Dekker et al. 2007).

Latent-Space-Modelle sind ebenfalls eine Erweiterung von generalisierten Regressionsmodellen für dyadische Daten. Der aktuelle Forschungsstand sind Additive und Multiplikative Modelle für Netzwerke und Relationale Daten (AMEN). Diese Modelle sind im R-Paket amen implementiert (Hoff 2015; Hoff et al. 2017) und stellen eine Kombination des Social-Relations-Modells (Kenny und La Voie 1984), des Random-Effects-Modells und des bilinearen (multiplikativen) Latent-Space-Modells (Hoff 2005) dar. Die Grundidee bei Latent-Space-Modellen ist die Schätzung eines generalisierten linearen Regressionsmodells mit zusätzlichen Parametern für die Positionen der Knoten in einem latenten sozialen Raum, der mehrere Dimensionen umfassen kann und die Abhängigkeiten zwischen den Kanten in Distanzen zwischen den Knoten überführt und abbildet. Der latente Raum gruppiert direkt verbundene Knoten näher aneinander als nicht direkt verbundene Knoten (Hoff et al. 2002) und versucht somit, nicht-modellierte Homophilie zwischen Knoten anhand der dyadischen Informationen zu erfassen, um effektiv für diese Abhängigkeiten zu kontrollieren (Ward et al. 2007).

4.2 Modelle für dynamische Netzwerkdaten

ERGMs nehmen an, dass das beobachtete Netzwerk das Gleichgewichtsresultat eines temporalen Netzwerkformationsprozesses ist, der unbeobachtet bleibt. Daher sind ERGMs theoretisch kompatibel mit temporalen Prozessen. Dennoch erlauben sie per se nicht die explizite Modellierung dieser temporalen Prozesse, sondern nur des Ergebnisses.

Es existiert jedoch eine Erweiterung des ERGM für wiederholt beobachtete Netzwerke, mit der zusätzlich zur Modellierung der jeweils beobachteten Netzwerke in einem gemeinsamen DGP die Abhängigkeiten über die Zeit zwischen den Beobachtungszeitpunkten erfasst werden können. Diese sogenannten temporalen ERGMs (TERGM) modellieren also eine temporale Sequenz von Netzwerken (Abb. 2, untere Reihe) und erklären sowohl die Topologie als auch die Veränderung in der Topologie, d. h. die Evolution des Netzwerks, mittels temporaler Dependenz.
Abb. 2

Verschiedene Daten-Szenarien in der inferenzstatistischen Netzwerkanalyse

Als Beispiel können wiederum internationale Konflikte dienen, die üblicherweise in jährliche Beobachtungsintervalle gruppiert werden und von 1816 bis 2010 verfügbar sind. Ein TERGM wie etwa bei Li et al. (2017) erklärt die Topologie aller Konflikte zwischen Staaten wie in einem über die Zeit gepoolten ERGM und fügt zusätzlich Modellterme für die Stabilität von Konfliktbeziehungen (z. B. zwischen dem jeweils aktuellen und dem vorherigen Jahr) ins Modell ein. Alternativ kann auch die Stabilität von Nicht-Konflikten als Modellterm mit einbezogen werden. Es können auch komplexere temporale Abhängigkeiten wie Reziprozität über zwei Zeitpunkte hinweg (A-B zum Zeitpunkt t und B-A zum Zeitpunkt t+1) oder Triadenbildung über mehrere Zeitpunkte hinweg (z. B. A-B und A-C zum Zeitpunkt t und B-C zum Zeitpunkt t+1) erfasst werden. Zusätzlich besteht die Möglichkeit, temporale Heterogenität von Modelltermen mittels Interaktionen zwischen einer beliebigen Funktion von Zeit und exogenen Kovariaten über einen timecov-Modellterm zu modellieren.

Eine moderne Einführung in TERGMs und die Schätzung mit dem R-Paket btergm (als Teil des xergm-Pakets) findet sich in Leifeld et al. (2018). Eine alternative Implementation, jedoch ohne effiziente Schätzung mittels MPLE mit Bootstrapping-Korrektur, findet sich im R-Paket tergm. Dieses Paket implementiert jedoch das separierbare TERGM (STERGM), das statt der beobachteten Topologien die Übergangsmatrizen zwischen den Zeitpunkten (also die Sequenz der Matrizen für Kantenbildung und Kantenauflösung) als separate Prozesse modelliert (Krivitsky und Handcock 2014).

Auch für das Latent-Space-Modell ist eine Längsschnittversion für wiederholt beobachtete Netzwerke (d. h. Panel-Netzwerkdaten) verfügbar (Ward et al. 2013), jedoch nicht für QAP.

Ein weiteres Modell für Panel-Netzwerkdaten ist das Stochastic Actor-Oriented Model (SAOM), das im R-Paket RSiena implementiert ist (Snijders et al. 2010). Die Grundidee dieses Modells ist eine Simulation von individuellem Akteursverhalten von einem beobachteten Zeitpunkt zum nächsten über eine Vielzahl von künstlich erzeugten Mini-Schritten, an denen die Akteure neue Kanten erzeugen oder existierende Kanten auflösen können, um ihre Zielfunktion zu maximieren. Diese Zielfunktion enthält Modellterme, die analog zu den ERGM-Modelltermen definiert werden. Durch die wiederholte Simulation dieser Sequenzen wird die Zielfunktion an die beobachteten Daten geschätzt, um auf diese Weise Koeffizienten für die Modellterme zu erhalten. Das SAOM modelliert den Netzwerkformationsprozess also auf der Mikro-Ebene aus der Akteursperspektive – anders als das TERGM, bei dem wie im ERGM die Topologie (und deren Veränderung) modelliert wird, was wiederum Hypothesen auf der Knotenebene und über die Veränderung über die Zeit beinhalten kann. Wenngleich beide Modelle viele Ähnlichkeiten aufweisen, ergeben sich eine Reihe von subtilen Unterschieden, die zum Teil für eine unterschiedliche Modellgüte und theoretische Angemessenheit sorgen können (Leifeld und Cranmer 2018).

Alternativ zu diskreten Beobachtungszeitpunkten können Netzwerkdaten gelegentlich auf einer kontinuierlichen Zeitskala (z. B. E-Mails als Kanten zwischen Individuen) oder auf einer hoch aufgelösten Zeitachse (z. B. täglich beobachtete Statements von Akteuren in einem Diskursnetzwerk oder Handlungen von Parlamentariern) beobachtet werden. In diesen Fällen können Kanten als relationale Ereignisse aufgefasst werden (Abb. 2, Mitte rechts). Für diese Arten von temporalen Netzwerken existiert eine andere Klasse von Modellen: relationale Ereignismodelle (relational event model), kurz REM (Butts 2008a). Eine Implementation existiert in den R-Paketen relevent und informR (Marcum und Butts 2015). Diese Modelle sind im Wesentlichen Survival- oder Event-History-Modelle (siehe auch den Beitrag von Jäckle in diesem Band), bei denen die komplexen Abhängigkeiten zwischen den beobachteten Events ähnlich wie in einem ERGM modelliert werden.

REMs mit ordinaler Zeit (d. h. eine temporale Sequenz von relationalen Events) können mit einem Cox-Proportional-Hazards-Modell (z. B. mittels conditional logit estimation) geschätzt werden. In diesem Fall modelliert man die Wahrscheinlichkeit eines Events zu einem bestimmten Zeitpunkt und fügt Null-Events als Referenz ein. Zu jedem Beobachtungszeitpunkt hängt die Wahrscheinlichkeit eines Events von allen bisherigen Events ab, die in Form von Netzwerkstatistiken über die bisherigen Events ausgedrückt werden. Auf diese Weise macht man die Events konditional unabhängig, so dass die Annahmen des Modells nicht verletzt werden. In REMs mit kontinuierlicher Zeit modelliert man die Wartezeit bis zu einem Event in Abhängigkeit von den bisher beobachteten Events ebenfalls über solche Statistiken.

Da lang zurückliegende Events möglicherweise weniger relevant für aktuelle Ereignisse sind, können die Statistiken zeitlich gewichtet werden, etwa mit einem exponentiellen oder geometrischen Decay (Lerner et al. 2013). Dies ist im R-Paket rem implementiert, das auch Two-Mode-REMs schätzen kann (Brandenberger 2017). Eine Anwendung des Two-Mode-REMs mit zeitlichem Decay auf Koordinationsnetzwerke zwischen nationalen europäischen Parlamenten findet sich in Malang et al. (2018) und auf Cosponsorship-Netzwerke zwischen Abgeordneten bei Brandenberger (2018). Eine Anwendung auf Diskursnetzwerke wird in Leifeld (2017) diskutiert.

4.3 Modelle für Knotenattribute in Netzwerken

Abhängigkeiten zwischen Beobachtungen können auch bei nicht-dyadischen Daten auftreten. Beispielsweise ist das Wahlverhalten von Parlamentariern mutmaßlich nicht unabhängig von anderen Parlamentariern. Auch der Grad der Demokratie versus Autokratie eines Landes kann etwa von den Handelspartnern des Landes beeinflusst werden. In diesen Fällen möchte man Knotenattribute wie Wahlverhalten oder Demokratie erklären, aber die Knoten sind in einem Netzwerk eingebettet, weshalb bei Benutzung eines einfachen Regressionsmodells wiederum die Annahmen verletzt wären.

Eine partielle Lösung ist der Einsatz eines räumlichen Regressionsmodells, insbesondere des Spatial Autoregressive Model (SAR), das im Netzwerkkontext als Network Autocorrelation Model bezeichnet wird (Doreian et al. 1984; Leenders 2002). Hierbei wird ein zusätzlicher Modellterm aufgenommen, der die Netzwerkabhängigkeiten modelliert, indem von benachbarten oder befreundeten Knoten die Attributwerte auf der zu erklärenden Variable aufaddiert werden und als Kovariate für den jeweiligen Knoten genutzt werden. Zum Beispiel können für die Erklärung von Demokratiewerten von Staaten die Demokratiewerte der übrigen Staaten aufsummiert werden, jeweils gewichtet mit der Handelsabhängigkeit des aktuellen Landes von diesen übrigen Staaten. Dies kann für weitere Netzwerkrelationen in separaten Modelltermen wiederholt werden, um weitere Abhängigkeiten zu erfassen. Alternativ kann statt der summierten gewichteten Werte der gewichtete Durchschnittswert (d. h. zeilensummierte Werte) verwendet werden, wenn statt des Gesamteinflusses der Freunde der durchschnittliche Einfluss der Freunde auf den aktuellen Knoten erfasst werden soll. Eine Implementation des Netzwerk-Autokorrelationsmodells für einen einzelnen Beobachtungszeitpunkt in Form eines linearen Modells existiert in der lnam-Funktion im sna-Paket (Butts 2008b). Mit dem Spatio-Temporal Autoregressive Model (STAR) liegt eine Erweiterung auf Panel-Daten vor (Hays et al. 2010).

Autoregressive Modellterme bilden jedoch nur einen Teil der Abhängigkeiten ab, die theoretisch auftreten können. Sie fangen z. B. nicht den Einfluss von indirekten Freunden zweiten oder dritten Grades ein. Sie modellieren nicht den Einfluss von strukturell ähnlichen Knoten, den diese haben können, obwohl sie möglicherweise nicht direkt verbunden sind. Sie modellieren nicht den Effekt, den die Zentralität eines Knotens auf sein Verhalten haben kann. Und sie ignorieren z. B. mögliche Abhängigkeiten, die nur dann entstehen, wenn ein Akteur mit mehreren anderen Akteuren in einer komplett verbundenen Clique ko-existiert und von diesen engen Freunden lernt. Das Temporal Network Autocorrelation Model (TNAM) füllt diese Lücke und erlaubt neben einfachen räumlichen Lags die Modellierung solch komplexer Abhängigkeiten in Paneldaten oder einmalig beobachteten Attribut- und Netzwerkdatensätzen (Leifeld und Cranmer 2017).

Ein verwandtes Thema in der temporalen Modellierung von Netzwerken ist die Koevolution von Knotenattributen und Netzwerken. Beide Ebenen für sich können komplexe Abhängigkeiten aufweisen, sich aber auch gegenseitig beeinflussen. Ein koevolutionäres Modell für Netzwerke und Verhalten existiert im Rahmen des SAOM (Snijders et al. 2010). Ein koevolutionäres Modell, das TERGMs und TNAM verbindet, wäre prinzipiell denkbar, ist aber bislang nicht implementiert. Da in diesen Modellen jedoch keine Simulation zwischen den Zeitpunkten erfolgt, können beide Prozesse hilfsweise separat modelliert werden.

5 Ausblick: Aktuelle Entwicklungen in der Netzwerkanalyse

Wie in den vorherigen Abschnitten ersichtlich wurde, existieren statistische Netzwerkmodelle für eine Vielzahl von Szenarien. Abb. 2 fasst einige typische Szenarien zusammen: mehrere Gruppen (Multigruppen- oder Multilevel-Netzwerke; oben links), mehrere Relationen oder Ebenen (multiplexe oder Multilayer-Netzwerke; oben rechts), mehrere Knotenarten (Two-Mode-Netzwerke; Mitte links), mehrere Zeitpunkte (Panel-Netzwerke; unten) sowie relationale Events (Mitte rechts). Es ist davon auszugehen, dass zukünftig komplexe Kombinationen einiger dieser Modelle und Szenarien implementiert werden, so dass soziale und politische Prozesse noch realistischer modelliert werden können. Denkbar wäre etwa ein multi-relationales, temporales, generalisiertes ERGM für multiple Gruppen mit koevolutionärer TNAM-Komponente. Mit solchen Kombinationen steigt leider auch die Komplexität der jeweiligen Implementation, so dass dies ein langfristiger Prozess sein dürfte.

Eine weitere aktuelle Entwicklung ist die Kombination zwischen statistischen Netzwerkmodellen und Methoden der Textanalyse wie etwa Topic-Modellen. Beispielsweise werden zurzeit Techniken entwickelt, mit denen Informationsflüsse zwischen Akteuren über die Zeit modelliert werden können, indem der Inhalt der Kommunikation in die Modellierung der Abhängigkeiten einfließt (Bomin et al. 2017).

Ein drittes aktuelles Thema in der Netzwerkforschung ist die Anreicherung von Netzwerkanalyse durch Techniken der kausalen Inferenz. Hier sind insbesondere zwei Forschungsfragen relevant: (1) Wie kann man mit Beobachtungsdaten sozialen Einfluss (d. h. Knoten A überträgt ein Attribut auf Knoten B per Kante) von sozialer Auswahl (d. h. A und B bilden eine Kante, weil sie die gleichen Attribute haben) trennen? Dies ist eines der schwierigsten Probleme in der Netzwerkanalyse (Shalizi und Thomas 2011). Erste Erfolge können mit einem Permutationsansatz verbucht werden, wenn temporale Daten mit einer hohen zeitlichen Auflösung vorliegen (Malang et al. 2018). (2) Wie kann man (Feld-) Experimente in Netzwerkkontexten durchführen, ohne dass die Stable-Unit-Treatment-Value-Annahme (SUTVA) verletzt wird, d. h. ohne dass sich die zu vergleichenden Einheiten per Netzwerk mit dem Treatment anstecken? Einen Überblick über diese Thematik bieten Phadke und Desmarais (2016). Verbunden damit stellt sich die Frage, ob Methoden der kausalen Inferenz entwickelt werden können, mit denen solche Fragestellungen anhand von Beobachtungsdaten ausdifferenziert werden können.

Ein weiteres aktuelles Forschungsthema in der Netzwerkanalyse ist die Inferenz von latenten Netzwerken aus beobachteten Sequenzen von Events. Beispielsweise kann man über viele Fälle hinweg empirisch die Reihenfolge beobachten, in der Staaten internationale Verträge ratifizieren. Hieraus ergeben sich latente Einflusskanäle unter den Staaten, da vorherige Handlungen nachzeitige Handlungen beeinflussen (Böhmelt et al. 2017). Ein anderes Beispiel sind die latenten Diffusionspfade zwischen amerikanischen Bundesstaaten, die sich aus der beobachteten Einführung neuer Policies in den jeweiligen Staaten und deren zeitlicher Abfolge ergeben (Desmarais et al. 2015). Aktuelle methodologische Arbeiten konzentrieren sich zum einen auf Modelle, mit denen die latenten Netzwerke identifiziert werden können, etwa mit dem NetInf-Algorithmus (Gomez-Rodriguez et al. 2012; Linder und Desmarais 2018), und zum anderen auf Modelle, mit denen diese latenten Einflüsse parametrisch modelliert werden können (Böhmelt et al. 2017).

Die Netzwerkanalyse ist heute mehr denn je ein innovatives Forschungsgebiet. Die Politikwissenschaft insbesondere kann von diesen Entwicklungen profitieren und diese weiter vorantreiben, da Politik häufig in Gruppenkontexten mit gegenseitiger Relevanz der Akteure stattfindet.

6 Kommentiertes Literaturverzeichnis

Als Einstieg in die Datensammlung und deskriptive Netzwerkanalyse wird das einfache Lehrbuch von Hennig et al. (2012) empfohlen. Als zweites und drittes Lehrbuch kommen Scott (2017) und Wasserman und Faust (1994) in Frage. Als Einführung in die Diskursnetzwerkanalyse eignet sich Leifeld (2017). Einen Einstieg in die inferenzstatistische Netzwerkanalyse bietet der Artikel von Cranmer et al. (2017) in der Workshop-Sektion des American Journal of Political Science. Als Lehrbuch wird Lusher et al. (2013) empfohlen. Sonderheft 24 des Journal of Statistical Software aus dem Jahr 2008 enthält eine Sammlung von einführenden Artikeln aus einer Software-bezogenen Perspektive.

Fußnoten

  1. 1.

    Für einen Vergleich verschiedener Querschnittsmodelle wird die Lektüre von Cranmer et al. (2017) empfohlen.

  2. 2.

    Für eine detaillierte Darstellung der Wahrscheinlichkeitsdichtefunktion, der Spezifikation von ERGM-Modelltermen und des MCMC-MLE-Schätzverfahrens vgl. z. B. Cranmer et al. (2017), Cranmer und Desmarais (2011), Lusher et al. (2013) und Robins et al. (2007). Für einen Software-basierten Einstieg sei interessierten Lesern auch die Lektüre der Artikel über das R-Paket statnet im Sonderheft des Journal of Statistical Software im Jahr 2008 empfohlen (insbesondere Handcock et al. 2008; Goodreau et al. 2008; Hunter et al. 2008b; Morris et al. 2008). statnet ist die populärste Software für ERGMs. Eine Alternative ist die grafische Anwendung Pnet (Wang et al. 2006), die jedoch nicht open-source ist und eine gänzlich eigene Terminologie für die Spezifikation von Modelltermen nutzt. ERGMs sind aktuell nicht in anderer Standard-Statistiksoftware wie STATA, SPSS oder SAS verfügbar.

  3. 3.

    Einen ausführlichen Vergleich zwischen ERGM, QAP und Latent-Space-Modellen aus der Anwendungsperspektive nehmen Cranmer et al. (2017) vor.

Literatur

  1. Böhmelt, Tobias, Benjamin Campbell, Skyler Cranmer, Bailey Fosdick, und Frank Marrs. 2017. Ratifying environmental agreements: A joint analysis of exogenous influences, network dependence, and spatial effects. Vortrag an der 10. Political Networks Conference, Columbus, 14–17. Juni.Google Scholar
  2. Bomin, Kim, Zachary Jones, Bruce Desmarais, und Hanna Wallach. 2017. A network model for continuous-time textual communications with application to government email corpora. Vortrag an der 10. Political Networks Conference, Columbus, 14–17. Juni.Google Scholar
  3. Brandenberger, Laurence. 2017. rem: Relational event models (REM). R-Paket Version 1.2.8. https://CRAN.R-project.org/package=rem. Zugegriffen am 01.09.2018.
  4. Brandenberger, Laurence. 2018. Trading favors – Examining the temporal dynamics of reciprocity in Congressional collaborations using relational event models. Social Networks 54:238–253.Google Scholar
  5. Brandes, Ulrik, Patrick Kenis, Jörg Raab, Volker Schneider, und Dorothea Wagner. 1999. Explorations into the visualization of policy networks. Journal of Theoretical Politics 11(1): 75–106.Google Scholar
  6. Brandes, Ulrik, Jörg Raab, und Dorothea Wagner. 2001. Exploratory network visualizations: Simultaneous display of actor status and connections. Journal of Social Structure 2(4). https://www.cmu.edu/joss/content/articles/volume2/BrandesRaabWagner.html.
  7. Brandes, Ulrik, Patrick Kenis, und Dorothea Wagner. 2003. Communicating centrality in policy network drawings. IEEE Transactions on Visualization and Computer Graphics 9(2): 241–253.Google Scholar
  8. Brandes, Ulrik, Patrick Kenis, und Jörg Raab. 2006. Explanation through network visualization. Methodology 2(1): 16.Google Scholar
  9. Butts, Carter T. 2008a. A relational event framework for social action. Sociological Methodology 38(1): 155–200.Google Scholar
  10. Butts, Carter T. 2008b. Social network analysis with sna. Journal of Statistical Software 24(6): 1–51.Google Scholar
  11. Cartwright, Dorwin, und Frank Harary. 1956. Structikural balance: A generalization of Heider’s Theory. Psychological Review 63(5): 277–293.Google Scholar
  12. Cranmer, Skyler J., und Bruce A. Desmarais. 2011. Inferential network analysis with exponential random graph models. Political Analysis 19(1): 66–86.Google Scholar
  13. Cranmer, Skyler J., Bruce A. Desmarais, und Elizabeth J. Menninga. 2012. Complex dependencies in the alliance network. Conflict Management and Peace Science 29(3): 279–313.Google Scholar
  14. Cranmer, Skyler J., Elizabeth J. Menninga, und Peter J. Mucha. 2015. Kantian fractionalization predicts the conflict propensity of the international system. Proceedings of the National Academy of Sciences 112(38): 11812–11816.Google Scholar
  15. Cranmer, Skyler J., Philip Leifeld, Scott D. McClurg, und Meredith Rolfe. 2017. Navigating the range of statistical tools for inferential network Analysis. American Journal of Political Science 61(1): 237–251.Google Scholar
  16. Dekker, David, David Krackhardt, und Tom A. B. Snijders. 2007. Sensitivity of MRQAP tests to collinearity and autocorrelation conditions. Psychometrika 72(4): 563–581.Google Scholar
  17. Desmarais, Bruce A., und Skyler J. Cranmer. 2012. Statistical inference for valued-edge networks: The generalized exponential random graph model. PloS ONE 7(1): e30136.Google Scholar
  18. Desmarais, Bruce A., Jeffrey J. Harden, und Frederick J. Boehmke. 2015. Persistent policy pathways: Inferring diffusion networks in the American states. American Political Science Review 109(2): 392–406.Google Scholar
  19. Doreian, Patrick, Klaus Teuter, und Chi-Hsein Wang. 1984. Network autocorrelation models: Some Monte Carlo results. Sociological Methods & Research 13(2): 155–200.Google Scholar
  20. Fellows, Ian, und Mark Handcock. 2017. Removing phase transitions from Gibbs measures. In Proceedings of the 20th international conference on artificial intelligence and statistics, 289–297.Google Scholar
  21. Fisher, Dana R., Philip Leifeld, und Yoko Iwaki. 2013a. Mapping the ideological networks of American climate politics. Climatic Change 116(3–4): 523–545.Google Scholar
  22. Fisher, Dana R., Joseph Waggle, und Philip Leifeld. 2013b. Where does political polarization come from? Locating polarization within the US climate change debate. American Behavioral Scientist 57(1): 70–92.Google Scholar
  23. Gomez-Rodriguez, Manuel, Jure Leskovec, und Andreas Krause. 2012. Inferring networks of diffusion and influence. In Proceedings of the 16th ACM SIGKDD international conference on knowledge discovery and data mining, 1019–1028. ACM.Google Scholar
  24. Goodreau, Steven M., Mark S. Handcock, David R. Hunter, Carter T. Butts, und Martina Morris. 2008. A statnet tutorial. Journal of Statistical Software 24(9): 1–26.Google Scholar
  25. Handcock, Mark S., David R. Hunter, Carter T. Butts, Steven M. Goodreau, und Martina Morris. 2008. statnet: Software tools for the representation, visualization, analysis and simulation of network data. Journal of Statistical Software 24(1): 1–11.Google Scholar
  26. Hays, Jude C., Aya Kachi, und Robert J. Franzese. 2010. A spatial model incorporating dynamic, endogenous network interdependence: A political science application. Statistical Methodology 7(3): 406–428.Google Scholar
  27. Heaney, Michael T., und Philip Leifeld. 2018. Contributions by interest groups to lobbying coalitions. The Journal of Politics 80(2): 494–509.Google Scholar
  28. Hennig, Marina, Ulrik Brandes, Jürgen Pfeffer, und Ines Mergel. 2012. Studying social networks: A guide to empirical research. Frankfurt a. M.: Campus Verlag.Google Scholar
  29. Hoff, Peter D. 2005. Bilinear mixed-effects models for dyadic data. Journal of the American Statistical Association 100(469): 286–295.Google Scholar
  30. Hoff, Peter D. 2015. Dyadic data analysis with amen. arXiv Preprint arXiv: 1506.08237.Google Scholar
  31. Hoff, Peter D., Adrian E. Raftery, und Mark S. Handcock. 2002. Latent space approaches to social network analysis. Journal of the American Statistical Association 97(460): 1090–1098.Google Scholar
  32. Hoff, Peter D., Bailey Fosdick, Alex Volfovsky, und Yanjun He. 2017. amen: Additive and multiplicative effects models for networks and relational data. R-Paket Version 1.3. https://CRAN.R-project.org/package=amen. Zugegriffen am 24.11.2018.
  33. Hunter, David R. 2007. Curved exponential family models for social networks. Social Networks 29(2): 216–230.Google Scholar
  34. Hunter, David R., Steven M. Goodreau, und Mark S. Handcock. 2008a. Goodness of fit of social network models. Journal of the American Statistical Association 103(481): 248–258.Google Scholar
  35. Hunter, David R., Mark S. Handcock, Carter T. Butts, Steven M. Goodreau, und Martina Morris. 2008b. ergm: A package to fit, simulate and diagnose exponential-family models for networks. Journal of Statistical Software 24(3): 1–29.Google Scholar
  36. Ingold, Karin, und Philip Leifeld. 2016. Structural and institutional determinants of influence reputation: A comparison of collaborative and adversarial policy networks in decision making and implementation. Journal of Public Administration Research and Theory 26(1): 1–18.Google Scholar
  37. Kaufmann, Michael, und Dorothea Wagner. 2003. Drawing graphs: Methods and models. In Lecture notes in computer science 2025. Berlin: Springer.Google Scholar
  38. Kenny, David A., und Lawrence La Voie. 1984. The social relations model. Advances in Experimental Social Psychology 18:141–182.Google Scholar
  39. Krackhardt, David. 1988. Predicting with networks: Nonparametric multiple regression analysis of dyadic data. Social Networks 10(4): 359–381.Google Scholar
  40. Krebs, Vladis E. 2001. Mapping networks of terrorist cells. Connections 24(3): 43–52.Google Scholar
  41. Krivitsky, Pavel N., und Mark S. Handcock. 2014. A sparable model for dynamic networks. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 76(1): 29–46.Google Scholar
  42. Leenders, Roger Th. A. J. 2002. Modeling social influence through network autocorrelation: Constructing the weight matrix. Social Networks 24(1): 21–47.Google Scholar
  43. Leifeld, Philip. 2013. Reconceptualizing major policy change in the advocacy coalition framework: A discourse network analysis of German pension politics. Policy Studies Journal 41(1): 169–198.Google Scholar
  44. Leifeld, Philip. 2016. Policy debates as dynamic networks: German pension politics and privatization discourse. Frankfurt a. M./New York: Campus.Google Scholar
  45. Leifeld, Philip. 2017. Discourse network analysis: Policy debates as dynamic networks. In The Oxford handbook of political networks, Hrsg. J. N. Victor, M. N. Lubell und A. H. Montgomery, 301–326. Oxford University Press.Google Scholar
  46. Leifeld, Philip. 2018. Polarization in the social sciences: Assortative mixing in social science collaboration networks is resilient to interventions. Physica A: Statistical Mechanics and its Applications 507:510–523.Google Scholar
  47. Leifeld, Philip, und Skyler J. Cranmer. 2017. tnam. Temporal network autocorrelation models. R-Paket Version 1.6.5. https://CRAN.R-project.org/package=tnam. Zugegriffen am 24.11.2018.
  48. Leifeld, Philip, und Skyler J. Cranmer. 2018. A theoretical and empirical comparison of the temporal exponential random graph model and the stochastic actor-oriented model. Network Science. [vor Druck].Google Scholar
  49. Leifeld, Philip, und Dana R. Fisher. 2017. Membership nominations in international scientific assessments. Nature Climate Change 7(10): 730–735.Google Scholar
  50. Leifeld, Philip, und Sebastian Haunss. 2012. Political discourse networks and the conflict over software patents in Europe. European Journal of Political Research 51(3): 382–409.Google Scholar
  51. Leifeld, Philip, und Karin Ingold. 2016. Co-authorship networks in Swiss political research. Swiss Political Science Review 22(2): 264–287.Google Scholar
  52. Leifeld, Philip, und Volker Schneider. 2012. Information exchange in policy networks. American Journal of Political Science 56(3): 731–744.Google Scholar
  53. Leifeld, Philip, Sandra Wankmüller, Valentin T. Z. Berger, Karin Ingold, und Christiane Steiner. 2017. Collaboration patterns in the German political science co-authorship network. PLoS ONE 12(4): e0174671.Google Scholar
  54. Leifeld, Philip, Skyler J. Cranmer, und Bruce A. Desmarais. 2018. Temporal exponential random graph models with btergm: Estimation and bootstrap confidence intervals. Journal of Statistical Software 83(6): 1–36.Google Scholar
  55. Lerner, Jürgen, Margit Bussmann, Tom A. B. Snijders, und Ulrk Brandes. 2013. Modeling frequency and type of interaction in event networks. Corvinus Journal of Sociology and Social Policy 4(1): 3–32.Google Scholar
  56. Li, Weihua, Aisha E. Bradshaw, Caitlin B. Clary, und Skyler J. Cranmer. 2017. A three-degree horizon of peace in the military alliance network. Science Advances 3(3): e1601895.Google Scholar
  57. Linder, Fridolin, und Bruce A. Desmarais. 2018. NetworkInference: Inferring latent diffusion networks. R-Paket Version 1.2.3. https://CRAN.R-project.org/package=NetworkInference. Zugegriffen am 24.11.2018.
  58. Lusher, Dean, Johan Koskinen, und Garry Robins. 2013. Exponential random graph models for social networks: Theory, methods, and applications. New York: Cambridge University Press.Google Scholar
  59. Malang, Thomas, Laurence Brandenberger, und Philip Leifeld. 2018. Networks and social influence in European legislative politics. British Journal of Political Science. Vor Druck.Google Scholar
  60. Marcum, Christopher S., und Carter T. Butts. 2015. Constructing and modifying sequence statistics for relevent using informR in R. Journal of Statistical Software 64(5): 1–36.Google Scholar
  61. Montgomery, Jacob M., und Brendan Nyhan. 2017. The effects of Congressional staff networks in the US House of Representatives. The eJournal of Politics 79(3): 745–761.Google Scholar
  62. Morris, Martina, Mark S. Handcock, und David R. Hunter. 2008. Specification of exponential-family random graph models: Terms and computational aspects. Journal of Statistical Software 24(4): 1–24.Google Scholar
  63. Nagels, Melanie. 2016. Polarisierung im politischen Diskurs: Eine Netzwerkanalyse zum Konflikt um „Stuttgart 21“. Berlin: Springer.Google Scholar
  64. Phadke, Sayali, und Bruce A. Desmarais. 2016. Network effects in field experiments on interactive groups: Cases from legislative studies. Vortrag an der 9. Political Networks Conference, Washington University in St. Louis, 23–25. Juni. https://ssrn.com/abstract=2799074. Zugegriffen am 24.11.2018.
  65. Robins, Garry, Pip Pattison, Yuval Kalish, und Dean Lusher. 2007. An introduction to exponential random graph (p*) models for social networks. Social Networks 29(2): 173–191.Google Scholar
  66. Rule, Alix, Jean-Philippe Cointet, und Peter S. Bearman. 2015. Lexical shifts, substantive changes, and continuity in state of the union discourse, 1790–2014. Proceedings of the National Academy of Sciences 112(35): 10837–10844.Google Scholar
  67. Schneider, Volker, Frank Janning, Philip Leifeld, und Thomas Malang. 2009. Politiknetzwerke. Modelle, Anwendungen und Visualisierungen. Wiesbaden: VS Verlag.Google Scholar
  68. Schoch, David, und Ulrik Brandes. 2016. Re-conceptualizing centrality in social networks. European Journal of Applied Mathematics 27(6): 971–985.Google Scholar
  69. Scott, John. 2017. Social network analysis, 4. Aufl. Thousand Oaks: Sage.Google Scholar
  70. Shalizi, Cosma R., und Andrew C. Thomas. 2011. Homophily and contagion are generically confounded in observational social network studies. Sociological Methods & Research 40(2): 211–239.Google Scholar
  71. Snijders, Tom A., Philippa E. Pattison, Garry L. Robins, und Mark S. Handcock. 2006. New specifications for exponential random graph models. Sociological Methodology 36(1): 99–153.Google Scholar
  72. Snijders, Tom A., Gerhard G. van de Bunt, und Christian E. G. Steglich. 2010. Introduction to stochastic actor-based models for network dynamics. Social Networks 32(1): 44–60.Google Scholar
  73. Wang, Peng, Garry Robins, und Philippa E. Pattison. 2006. PNet: A program for the simulation and estimation of exponential random graph models. Melbourne: University of Melbourne.Google Scholar
  74. Ward, Michael D., Randolph M. Siverson, und Xun Cao. 2007. Disputes, democracies, and dependencies: A reexamination of the Kantian peace. American Journal of Political Science 51(3): 583–601.Google Scholar
  75. Ward, Michael D., John S. Ahlquist, und Arturas Rozenas. 2013. Gravity’s rainbow: A dynamic latent space model for the world trade network. Network Science 1(1): 95–118.Google Scholar
  76. Wasserman, Stanley, und Katherine Faust. 1994. Social network analysis: Methods and applications. New York: Cambridge University Press.Google Scholar
  77. Wilson, James D., Matthew J. Denny, Shankar Bhamidi, Skyler J. Cranmer, und Bruce A. Desmarais. 2017. Stochastic weighted graphs: Flexible model specification and simulation. Social Networks 49:37–473.Google Scholar

Copyright information

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019

Authors and Affiliations

  1. 1.Department of GovernmentUniversity of Essex, Wivenhoe ParkColchesterGroßbritannien

Personalised recommendations