Skip to main content
Log in

Die Schätzung von kausalen Effekten: Überlegungen zu Methoden der Kausalanalyse anhand von Kontexteffekten in der Schule

The estimation of causal effectss: an introduction to methods of causal inference based on peer effects in education

  • Abhandlungen
  • Published:
KZfSS Kölner Zeitschrift für Soziologie und Sozialpsychologie Aims and scope Submit manuscript

Zusammenfassung

Im Vordergrund eines Großteils quantitativer Sozialforschung steht die Schätzung von kausalen Effekten. Um ein besseres Verständnis des Problems der kausalen Inferenz zu entwickeln, wird in diesem Beitrag das Kausalitätsproblem anhand einer klassischen Frage der Bildungssoziologie veranschaulicht: Dem Effekt der sozialen Zusammensetzung der Mitschüler auf die Leistungen von Schülern. Dabei werden nach einer Einführung in die Frage von Peer-Effekten in der Schule derkontrafaktische Ansatz zur Kausalität sowie das fundamentale Problem der Kausalanalyse anhand dieses Beispiels verdeutlicht und anschließend sowohl Experimente als auch eine Reihe von statistischen Verfahren zur Lösung des Selektionsproblems diskutiert. Im Einzelnen behandelt der Beitrag neben der Kontrolle nach Kovariaten durch die heute gängigen Regressionsmodelle, Matchingverfahren (etwa Propensity Score Matching), Fixed-Effekt und Difference-in-Difference-Modelle sowie instrumentelle Variablen und das Regression Discontinuity Design. Das Augenmerk der Einführung liegt nicht auf dem mathematischen Hintergrund oder den Schätzverfahren sondern vielmehr auf der generellen Logik der Ansätze sowie den impliziten Annahmen. Abschließend wird der adäquate Umgang mit möglichen Selektionsprozessen anhand einer beispielhaften Analyse zu Kontexteffekten in der Schule veranschaulicht.

Abstract

This article discusses the problem of causal inference based on contextual peer effects in education. For this purpose, I first introduce the counterfactual approach to causality and the fundamental problem of causal inference. Subsequently, experiments and a number of statistical methods are discussed as possible approaches to estimate causal effects. In particular, conditioning on observables using common linear regression models as well as matching procedures (such as propensity score matching), fixed-effects models, the difference-in-difference approach, instrumental variables, and the regression discontinuity design are discussed. The introduction of these methods is neither focused on the mathematical background nor on the estimation procedure but rather on the general logic and the assumptions connected with a causal interpretation of the estimated effects. The paper closes with an analysis of compositional peer effects in German elementary schools to illustrate the adequate treatment of selection processes.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1
Abb. 2
Abb. 3
Abb. 4
Abb. 5

Notes

  1. Englischsprachige Einführungen in die hier diskutierten Methoden finden sich in Artikellänge bei Gangl (2010) und Sobel (1996,2000) und in Buchlänge bei Morgan und Winship (2007) mit soziologischen Beispielen und bei Angrist und Pischke (2008) mit Beispielen aus den Wirtschaftswissenschaften. Eine weniger komplexe, aber sehr gute Einführung in das Thema findet sich auch bei Gelman und Hill (2007, Kap. 9 und 10). Weitere Literaturhinweise befinden sich in den Abschnitten zu den einzelnen Analyseverfahren.

  2. Bei Beobachtungsdaten handelt es sich um Daten, wo der Treatmentstatus beobachtet wird und nicht unter Kontrolle des Sozialforschers liegt.

  3. Auch bei experimentellen Daten ist die Kontrolle nach Kovariaten mit Hilfe von Regressionen in der Regel sinnvoll (Angrist und Pischke,2008, 23): Erstens ist die Zuweisung des Treatmentstatus oft nicht zufällig in Bezug auf die gesamte Stichprobe, sondern nur nach Kontrolle bestimmter Variablen. Zweitens können pre-treatment Variablen die Unsicherheit (also den Standardfehler) des geschätzten kausalen Effektes verringern. Man beachte allerdings, dass eine Kontrolle nach post-treatment Variablen in der Regel nicht angebracht ist (Gelman und Hill2007, 190 f.).

  4. Dies bezieht sich insbesondere auf Feldexperimente und weniger auf Laborexperimente, wie sie etwa in der Spieltheorie üblich sind (Diekmann2008).

  5. Die Ergebnisse dieses experimentellen Designs zeigen, dass kleinere Klassen einen klaren Vorteil für die Lernentwicklung von Schülern bieten, was frühere Ergebnisse auf Basis von nichtexperimentellen Designs widerlegt (Finn und Achilles1990).

  6. Vom STAR Experiment ist beispielweise bekannt, dass Eltern Druck auf die beteiligen Schulen und Lehrer ausgeübt haben, um ihre Kinder den kleineren Klassen zuzuweisen, was vereinzelt zu Klassenwechseln während der Laufzeit der Studie geführt hat.

  7. Die diskutierten Methoden und Annahmen beziehen sich nicht nur auf lineare Regressionsmodelle mit kontinuierlichen abhängigen Variablen, sondern auch allgemein auf Generalisierte Lineare Modelle (etwa logistische Regressionen), Quantilregressionen und andere Verfahren.

  8. Alternativ wird diese Annahme auch als ignorability of the treatment assignment oder selection on observables bezeichnet. Ersteres bezieht sich darauf, dass der Selektionsprozess nach Kontrolle der weiteren unabhängigen Variablen ignoriert werden kann, da kein systematischer Selektionsbias mehr in der Zuweisung des Treatmentstatus vorliegt. Die zweite Bezeichnung hingegen verweist auf die Implikation der Annahme, dass die Selektion in die Treatment- und Kontrollgruppe nur auf beobachtbaren Variablen beruht und nicht auf weiteren Variablen, die unbeobachtet sind.

  9. Externe Validität bezieht sich auf die Frage, zu welchem Grad sich die Ergebnisse auf die Grandgesamtheit sowie zeitlich und geografisch andere Umstände übertragen lassen.

  10. Da sich Difference-in-Difference Modelle nur schwer auf das hier diskutierte Anwendungsbeispiel beziehen lassen, werden in diesem Abschnitt andere Anwendungsbeispiele zur Verdeutlichung herangezogen.

  11. Ein weiteres Beispiel ist die berühmte Studie von Card und Krueger (1994; siehe auch2000 für eine spätere Replikationen mit anderen Ergebnissen) zu den Auswirkungen von Mindestlöhnen auf die Arbeitsmarktbeteiligung.

  12. Die zugänglichsten Einführungen in das Thema finden sich in den bereits genannten Überblickswerken (Gelman und Hill2007, S. 212 ff.; Angrist und Pischke2008, 251 ff.). Andere Einführungen sind selten und meist auf einem technisch hohem Niveau wie etwa Imbens und Lemieux (2008).

  13. In der Regel unterscheidet man zwischen „sharp“ und „fuzzy“ RD-Designs. Im ersten Fall wird der Treatmentstatus komplett durch den Grenzwert determiniert und der Treatment-Effekt lässt sich durch lokale lineare Regressionsmodelle schätzen, wobei die Beobachtungen nahe dem Grenzwert höher gewichtet werden. Im zweiten Fall besteht eine Wahrscheinlichkeitsbeziehung zwischen der pre-Treatment Variable und dem Treatmentstatus, sodass die Beobachtungen über dem Grenzwert nicht zwangsläufig in die Treatmentgruppe fallen, aber eine deutlich höhere Wahrscheinlichkeit haben. Die Schätzung des Treatment-Effekt beim „fuzzy“ RD-Designs greift auf ähnliche Methoden wie instrumentelle Variablen zurück, wobei das Instrument über den Grenzwert definiert wird.

  14. Als Statistik zum Vergleich der simulierten und beobachteten Werte wird die durchschnittliche quadrierte Abweichung der Klassenmittelwerte vom Schulmittelwert verwendet\({{t}_{j}}=\frac{1}{{{n}_{j}}}{{\sum\nolimits_{k=1}^{{{n}_{j}}}{({{{\bar{y}}}_{jk}}-{{{\bar{y}}}_{j}})}}^{2}}\) wobei j Schulen indiziert und k Klassen. Y bezeichnet den sozioökonomischen Status oder eine andere Variable und yj dementsprechend den Mittelwert der Schule j und yjk den Mittelwert der Klasse k in Schule j. nj bezeichnet die Anzahl von Klassen in Schule j. Wenn die Anzahl der Schüler in den Klassen gleich ist, handelt es sich um die Varianz der Klassenmittelwerte innerhalb einer Schule.

  15. Um diese Schulen zu identifizieren, wurde ein einfacher z-Test verwendet, der den Anteil der Schüler mit Migrationshintergrund zwischen den Klassen vergleicht. Alle Schulen mit einem p-Wert von unter 0,1 – also einem signifikanten Unterschied im Anteil der Schüler mit Migrationshintergrund zwischen den Klassen – wurden von der Analyse ausgeschlossen.

  16. Alternativ lassen sich auch jeder Einheit in der Treatmentgruppe mehrere Einheiten aus der Kontrollgruppe zuweisen (k:1 nearest neighbor matching).

Literatur

  • Allison, Paul D. 1994. Using panel data to estimate the effects of events.Sociological Methods & Research 23:174–199.

    Article  Google Scholar 

  • Allison, Paul D. 2009.Fixed effects regression models. Thousand Oaks: Sage.

  • Ammermueller, Andreas, und Jörn-Steffen Pischke. 2009. Peer effects in European primary schools: Evidence from the progress in international reading literacy study.Journal of Labor Economics 27:315–348.

    Article  Google Scholar 

  • Angrist, Joshua, und Alan B. Krueger. 2001. Instrumental variables and the search for identification: From supply and demand to natural experiments.Journal of Economic Perspectives 15:69–85.

    Article  Google Scholar 

  • Angrist, Joshua D., und Jörn-Steffen Pischke. 2008.Mostly harmless econometrics: An empiricist’s companion. Princeton: Princeton University Press.

    Google Scholar 

  • Baumert, Jürgen, Petra Stanat und Rainer Watermann. 2006. Schulstruktur und die Entstehung differenzieller Lern- und Entwicklungsmilieus. InHerkunftsbedingte Disparitäten im Bildungswesen: Differenzielle Bildungsprozesse und Probleme der Verteilungsgerechtigkeit: Vertiefende Analysen im Rahmen von PISA 2000, Hrsg. Jürgen Baumert, Petra Stanat und Rainer Watermann, 99–185. Wiesbaden: VS Verlag für Sozialwissenschaften.

    Chapter  Google Scholar 

  • Boozer, Michael A., und Stephen E. Cacciola. 2001.Inside theBlack Box of Project STAR: Estimation of peer effects using experimental data. New Haven: Yale University.

    Google Scholar 

  • Budig, Michelle J., und Paula England. 2001. The wage penalty for motherhood.American Sociological Review 66:204–225.

    Article  Google Scholar 

  • Card, David, und Alan B. Krueger. 1994. Minimum wages and employment: A case study of the fast-food industry in New Jersey and Pennsylvania.The American Economic Review 84:772–793.

    Google Scholar 

  • Card, David, und Alan B. Krueger. 2000. Minimum wages and employment: A case study of the fast-food industry in New Jersey and Pennsylvania: Reply.American Economic Review 90:1397–1420.

    Article  Google Scholar 

  • Coleman, James. 1966.Equality of educational opportunity. Washington: U.S. Dept. of Health, Education, and Welfare, Office of Education.

    Google Scholar 

  • Cook, Thomas D., und Vivian C. Wong. 2008. Empirical tests of the validity of the regression discontinuity design.Annales d’Economie et de Statistique 91:127–150.

    Google Scholar 

  • Crosnoe, Robert. 2009. Low-income students and the socioeconomic composition of public high schools.American Sociological Review 74:709–730.

    Article  Google Scholar 

  • Diekmann, Andreas. 2008. Soziologie und Ökonomie: Der Beitrag experimenteller Wirtschaftsforschung zur Sozialtheorie.Kölner Zeitschrift für Soziologie und Sozialpsychologie 60:528–550.

    Article  Google Scholar 

  • DiPrete, Thomas A., und Markus Gangl. 2004. Assessing bias in the estimation of causal effects: Rosenbaum bounds on matching estimators and instrumental variables estimation with imperfect instruments.Sociological Methodology 34:271–310.

    Article  Google Scholar 

  • Finn, Jeremy D., und Charles M. Achilles. 1990. Answers and questions about class size: A statewide experiment.American Educational Research Journal 27:557–577.

    Google Scholar 

  • Gangl, Markus. 2010. Causal inference in sociological research.Annual Review of Sociology 36:21–47.

    Article  Google Scholar 

  • Gangl, Markus, und Thomas A. DiPrete. 2004. Kausalanalyse durch Matchingverfahren. InKölner Zeitschrift für Soziologie und Sozialpsychologie: Methoden der Sozialforschung, Hrsg. Andreas Diekmann, 396–420. Wiesbaden: VS Verlag für Sozialwissenschaften.

    Google Scholar 

  • Gelman, Andrew, und Jennifer Hill. 2007.Data analysis using regression and multilevel/hierarchical models. Cambridge: Cambridge University Press.

    Google Scholar 

  • Halaby, Charles N. 2004. Panel models in sociological research: Theory into practice.Annual Review of Sociology 30:507–544.

    Article  Google Scholar 

  • Hedström, Peter. 2005.Dissecting the social: On the principles of analytical sociology. Cambridge: Cambridge University Press.

    Book  Google Scholar 

  • Hedström, Peter, und Peter Bearman. 2009.The Oxford handbook of analytical sociology. Oxford: Oxford University Press.

    Google Scholar 

  • Helbig, Marcel. 2010. Sind Lehrerinnen für den geringeren Schulerfolg von Jungen verantwortlich?Kölner Zeitschrift für Soziologie und Sozialpsychologie 62:93–111.

    Article  Google Scholar 

  • Ho, Daniel E., Kosuke Imai, Gary King und Elizabeth A. Stuart. 2007. Matching as nonparametric preprocessing for reducing model dependence in parametric causal inference.Political Analysis 15:199–236.

    Article  Google Scholar 

  • Imbens, Guido, und Thomas Lemieux. 2008. Regression discontinuity designs: A guide to practice.Journal of Econometrics 142:615–635.

    Article  Google Scholar 

  • Imberman, Scott, Adriana Kugler und Bruce Sacerdote. 2009.Katrina’s children: A natural experiment in peer effects from hurricane evacuees. NBER Working Paper No. 15291.

  • Legewie, Joscha, und Thomas A. DiPrete. 2011.Gender differences in the effect of peer SES: Evidence from a second quasi-experimental case study. Working paper, Columbia University.

  • Legewie, Joscha, und Thomas A. DiPrete. 2012. School context and the gender gap in educational achievement.American Sociological Review 77:3.

  • Lehmann, Rainer, und Jenny Lenkeit. 2008.ELEMENT. Abschlussbericht über die Untersuchungen 2003, 2004 und 2005 an Berliner Grundschulen und grundständigen Gymnasien. Berlin: Humboldt Universität zu Berlin.

    Google Scholar 

  • Meyer, Bruce D. 1995. Natural und quasi-experiments in economics.Journal of Business & Economic Statistics 13:151–161.

    Article  Google Scholar 

  • Morgan, Stephen L., und David J. Harding. 2006. Matching estimators of causal effects: Prospects and pitfalls in theory and practice.Sociological Methods Research 35:3–60.

    Article  Google Scholar 

  • Morgan, Stephen L., und Christopher Winship. 2007.Counterfactuals and causal inference: Methods and principles for social research. Cambridge: Cambridge University Press.

    Google Scholar 

  • Pischke, Jörn-Steffen. 2007. The impact of length of the school year on student performance and earnings: Evidence from the German short school years.The Economic Journal 117:1216–1242.

    Article  Google Scholar 

  • Pop-Eleches, Cristian, und Miguel Urquiola. 2008. The consequences of going to a better school. Columbia University.

  • Rosenbaum, Paul R. 2009.Design of observational studies. New York: Springer.

    Google Scholar 

  • Rumberger, Russell W., und Gregory J. Palardy. 2005. Does segregation still matter? The impact of student composition on academic achievement in High School.Teachers College Record 107:1999–2045.

    Article  Google Scholar 

  • Sacerdote, Bruce. 2011. Peer effects in education: How might they work, how big are they, and how much do we know thus far? InHandbook of Economics of Education, vol. 3, Hrsg. Eric A. Hanushek, Stephen Machin und Ludger Woessmann, 249–277. Amsterdam: North-Holland.

    Google Scholar 

  • Schulze, Alexander, Felix Wolter und Rainer Unger. 2009. Bildungschancen von Grundschülern: Die Bedeutung des Klassen- und Schulkontextes am Übergang auf die Sekundarstufe I.Kölner Zeitschrift für Soziologie und Sozialpsychologie 61:411–435.

    Article  Google Scholar 

  • Shadish, William R., M. H. Clark und Peter M. Steiner. 2008. Can nonrandomized experiments yield accurate Answers? A randomized experiment comparing random and nonrandom assignments.Journal of the American Statistical Association 103:1334–1344.

    Article  Google Scholar 

  • Smith, Jeffrey A., und Petra E. Todd. 2005. Does matching overcome LaLonde’s critique of nonexperimental estimators?Journal of Econometrics 125:305–353.

    Article  Google Scholar 

  • Sobel, Michael E. 1996. An introduction to causal inference.Sociological Methods Research 24:353–379.

    Article  Google Scholar 

  • Sobel, Michael E. 2000. Causal inference in the social sciences.Journal of the American Statistical Association 95:647–651.

    Article  Google Scholar 

  • Sørensen, Aage B., und Stephen L. Morgan. 2006. School effects: Theoretical and methodological issues. InHandbook of the Sociology of Education, Hrsg. Maureen T. Hallinan, 137–160. New York: Springer.

    Google Scholar 

  • Steiner, Peter M., Thomas D. Cook und William R. Shadish. 2011. On the importance of reliable covariate measurement in selection bias adjustments using propensity scores.Journal of Educational and Behavioral Statistics 36:213–236.

  • Stuart, Elizabeth A. 2010. Matching methods for causal inference: A review and a look forward.Statistical Science: A Review Journal of the Institute of Mathematical Statistics 25:1–21.

    Google Scholar 

Download references

Danksagung

Ich danke Tom DiPrete, Martin Ehlert, Anette Fasang, Nicolas Legewie und Merlin Schaeffer für hilfreiche Kommentare.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Joscha Legewie.

Appendices

Anhang A – Analyseverfahren

In diesem Anhang werden weitere Details zu den verschiedenen Analyseverfahren vorgestellt. In Bezug auf Matchingverfahren wird das genaue Vorgehen in vier Schritten ausführlicher beschrieben und bei den anderen Verfahren erste, sehr verkürzte Hinweise auf die statistische Umsetzung der Verfahren gegeben.

Matchingverfahren

Stuart (2010) beschreibt das Vorgehen bei der Umsetzung von Matchingverfahren anschaulich in vier Schritten (weitere Details finden sich auch bei Rosenbaum2009 oder Morgan und Harding2006). Demnach wird im ersten Schritt zunächst ein Unterschiedsmaß definiert, auf deren Basis die Beobachtungseinheiten verglichen werden. Unterscheiden lässt sich grundsätzlich zwischen einer exakten Maßzahl auf der einen Seite und eindimensionalen Unterschiedsmaßen auf der anderen Seite. Beim exakten Matching werden nur Einheiten gepaart, die in allen verwendeten Kovariaten übereinstimmen. Gerade bei einer hohen Anzahl von Kovariaten und kontinuierlichen Variablen ist dieser Ansatz allerdings aufgrund zu kleiner Zellgrößen in der Regel nicht durchführbar. Als Alternative werden verschiedene eindimensionale Unterschiedsmaße verwendet. Darunter fällt auch der prominente Ansatz des propensity score (p-score) matching. Unter der wahren propensity score versteht man die (unbekannte) Wahrscheinlichkeit, dass eine bestimmte Einheit das Treatment erhält. In der Regel ist die wahre propensity score allerdings unbekannt, sodass die geschätzte Wahrscheinlichkeit des Treatments bei bestimmten Kovariaten verwendet wird. Diese lässt sich unter anderem durch eine direkte Modellierung des Selektionsprozesses mit Hilfe von logistischen Regressionen oder ähnlichen Verfahren als P(Ti = 1|X) berechnen. Entscheidend im ersten Schritt ist auch die Frage, welche Variablen in die Berechnung der Distanz zwischen Beobachtungen einbezogen werden. Grundsätzlich gelten die gleichen, bereits diskutierten Kriterien wie auch bei Regressionsmodellen. Da in diesem Schritt allerdings das vornehmliche Ziel in der Vorhersage der propensity scores besteht, lassen sich weitgehend problemlos eine große Anzahl von Variablen verwenden, solange diese Variablen nicht selbst vom Treatment beeinflusst werden (pre-treatment-Variablen).

Im zweiten Schritt wird das eigentlich Matching auf Basis der zuvor definierten Distanz durchgeführt, wobei unterschiedliche Methoden wie etwa „nearest neighbor matching“ oder „full matching“ in der Literatur zur Anwendung kommen. Diese Methoden unterscheiden sich im Wesentlich dadurch, wie viele Einheiten nach dem Matching erhalten bleiben und welches Gewicht den verschiedenen Einheiten zugesprochen wird. Beim einfachsten Verfahren, dem 1:1 „nearest neighbor matching“, wird etwa jede Einheit aus der Treatmentgruppe mit der Einheit aus der Kontrollgruppe gepaart, die ihr im Hinblick auf die zuvor definierte Distanz am ähnlichsten ist.Footnote 16 Weitere Methoden werden etwa von Stuart (2010, S. 7–10) diskutiert.

Im dritten Schritt wird die Qualität der gematchten Stichprobe durch eine Evaluation des Bias zwischen der Treatment- und Kontrollgruppe analysiert. Eigentliches Ziel ist es, dass die multivariate Verteilung aller beobachten Kovariaten zwischen den beiden Gruppen gleich ist. Ein Vergleich von multivariaten Verteilungen ist allerdings mit Schwierigkeiten verbunden. Daher werden in der Praxis normalerweise Statistiken auf Basis von einzelnen Variablen verwendet, wie etwa die standardisierte Differenz zwischen den Mittelwerten. Sollte die gematchte Stichprobe die Unterschiede zwischen den Gruppen im Vergleich zu der Ausgangsstichprobe nicht eindeutig reduzieren oder weiterhin einen klaren Bias aufweisen, wird der erste bis dritte Schritt wiederholt, solange bis die gematchte Stichprobe möglichst kleine Unterschiede zwischen den beiden Gruppen aufweist.

Schließlich wird im vierten Schritt zum ersten Mal die abhängige Variable einbezogen und der kausale Effekt auf Basis der gematchten Stichprobe geschätzt. Ho et al. (2007) empfehlen, das gleiche Regressionsmodell zu verwenden, dass auch ohne Matching zur Anwendung gekommen wäre. Abschließend sollten auch Sensitivitätsanalysen durchgeführt werden, wie in der Literatur zu Matchingverfahren besprochen (Gangl und DiPrete2004).

Fixed-Effekt-Modelle

Statistisch lassen sich FE-Modelle durch einfache Regressionsmodelle mit einer zusätzlichen Dummy-Variable für jede Gruppe/jedes Individuum schätzen, was identisch mit einer getrennten Konstante für jede Gruppe ist:

$ {{y}_{\textit{ij}}}={{\alpha }_{j}}+\theta {{T}_{\textit{ij}}}+{{X}_{ij}}\beta +{{\varepsilon }_{ij}} $

wobei sich j auf die Gruppe und i auf die Beobachtung innerhalb der Gruppe bezieht. Der Index j für die Konstante α bedeutet, dass eine gruppenspezifische Konstante geschätzt wird. Diese Spezifikation ist allerdings bei einer hohen Anzahl von Gruppen mit Problemen verbunden, da für jede Gruppe ein getrennter Koeffizient geschätzt werden muss. Dementsprechend werden FE-Modelle üblicherweise nach der Subtraktion der gruppenspezifischen Mittelwerte geschätzt. Dies führt zu identischen Koeffizienten, aber macht es unnötig, getrennte gruppenspezifische Konstanten zu schätzen:

$ ({{y}_{\textit{ij}}}-{{\bar{y}}_{j}})=\theta ({{T}_{\textit{ij}}}-{{\bar{T}}_{j}})+({{X}_{\textit{ij}}}-{{\bar{X}}_{j}})\beta +({{\varepsilon }_{ij}}-{{\bar{\varepsilon }}_{j}}) $

Difference-in-Difference-Ansatz

Statistisch lässt sich der kausale Effekt in DD-Modellen durch einfache Regressionen mit einer gruppenspezifischen Konstante wie bei FE Modellen sowie einem Interaktionsterm berechnen:

$ {{y}_{ijt}}={{\alpha }_{j}}{{\gamma }_{t}}+\theta {{T}_{ijt}}+{{\varepsilon }_{ijt}} $

wobei αj den zeitkonstanten, gruppenspezifischen Effekt darstellt, γt den zeitspezifischen Effekt, der den Gruppen gemein ist und Tijt einen Interaktionsterm der Zeitpunkte und Gruppen, wo die Intervention aufgetreten ist (in Abb. 1 die Beobachtungen der oberen Trendlinie zu den Zeitpunkten 6 und 7). Dementsprechend stellt θ den Treatmenteffekt dar. Diese Modelle lassen sich einfach erweitern, etwa durch Kontrollvariablen in der Form von Xijtβ (Meyer1995).

IV-Modelle

Statistisch lassen sich IV-Modelle durch two-stage least square (2SLS) Verfahren berechnen. Dabei wird in einem ersten Schritt der Effekt des Instruments Z auf den Treatmentstatus T geschätzt (Formel 2) und in einem zweiten Schritt der Effekt des aus dem ersten Schritt vorhergesagten Treatmentstatus T auf die abhängige Variable Y (Formel 3). Diese first und second stage Regressionen lassen sich darstellen als

$ {{\hat{T}}_{i}}={{\alpha }_{1}}+\delta {{Z}_{i}}+{{X}_{i}}{{\beta }_{1}}+{{\varepsilon }_{i}} $
(2)
$ {{y}_{i}}={{\alpha }_{2}}+\theta {{\hat{T}}_{t}}+{{X}_{i}}{{\beta }_{2}}+{{\varepsilon }_{i}} $
(3)

wobei es sich bei\(\hat{\rm{T}}_{\rm{i}}\) um den endogenen Treatmentstatus handelt, bei Zi um ein exogenes Instrument für den Treatmentstatus und bei Xi um zusätzliche exogene Kovariaten nach denen kontrolliert wird. Angrist und Pischke (2008, 121 ff.) diskutieren das 2SLS Verfahren im Detail sowie alternative Schätzverfahren. Eine gute Einführung findet sich auch bei Angrist und Krueger (2001).

Anhang B – Kontrollvariablen

Tab. 1 Beschreibung der Kontrollvariablen

Rights and permissions

Reprints and permissions

About this article

Cite this article

Legewie, J. Die Schätzung von kausalen Effekten: Überlegungen zu Methoden der Kausalanalyse anhand von Kontexteffekten in der Schule. Köln Z Soziol 64, 123–153 (2012). https://doi.org/10.1007/s11577-012-0158-5

Download citation

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s11577-012-0158-5

Schlüsselwörter

Keywords

Navigation