Skip to main content

Multiple Regression mit voneinander abhängigen Beobachtungen

Random-Effects und Fixed-Effects

  • Living reference work entry
  • Latest version View entry history
  • First Online:
Handbuch Methoden der Politikwissenschaft

Part of the book series: Springer Reference Sozialwissenschaften ((SRS))

  • 2443 Accesses

Zusammenfassung

Ein Großteil der in der empirisch-vergleichenden Politikwissenschaft verwendeten Datensätze ist räumlich und/oder zeitlich strukturiert. Räumliche und zeitliche Strukturen gehen in der Regel mit statistischen Abhängigkeiten einher, die bei der Datenanalyse mitberücksichtigt werden müssen. Dieser Beitrag stellt Random-Effects-Modelle (RE) und Fixed-Effects-Modelle (FE) als Analysemethoden für voneinander abhängige Beobachtungen vor. Dabei wird auf den Problemgegenstand eingegangen und die Anwendung von RE- und FE-Modellen erklärt. Darüber hinaus werden Entscheidungsheuristiken und Hinweise für die praktische Anwendung gegeben.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Institutional subscriptions

Notes

  1. 1.

    Im Vergleich zu Paneldaten handelt es sich bei TSCS-Daten um Aggregatdaten, bei denen die Anzahl der Zeitpunkte T in der Regel größer ist als die Anzahl der Untersuchungseinheiten N (T > N). Sowohl bei Panel- als auch TSCS-Daten ergeben sich ähnliche Problematiken hinsichtlich statistischer Abhängigkeit (zu Besonderheiten von TSCS-Daten siehe Beck und Katz 1995).

  2. 2.

    In Bezug auf die Terminologie ist zu beachten, dass auch in RE-Modellen die geschätzten Koeffizienten mitunter als Fixed-Effects bezeichnet werden (z. B. im Rahmen der Mehrebenenanalyse, siehe auch den Beitrag von Pötschke in diesem Band). Dies soll verdeutlichen, dass die Effekte für alle Gruppen in der untersuchten Population als identisch bzw. fix angenommen werden. Hingegen beziehen sich hier die Bezeichnungen RE und FE auf Modellklassen, mit jeweils distinkten Eigenschaften.

  3. 3.

    Gruppen haben in der Regel keinen intrinsischen Informationsgehalt, sind austauschbar und beinhalten eine große Anzahl an Kategorien (analog zur Definition höherer Ebenen/Level in der Mehrebenenanalyseliteratur). Merkmale, die diese Kriterien nicht erfüllen (z. B. Geschlecht), gelten als Variable und nicht als Gruppe.

  4. 4.

    Neben einer solchen räumlich-kategorialen Abhängigkeit, können auch Formen räumlich-kontinuierlicher Abhängigkeit existieren, bei der nahe beieinander liegende Beobachtungen sich ähnlich sind und diese Ähnlichkeit mit zunehmender räumlicher Distanz abnimmt. In solchen Fällen kommen spezielle räumliche Regressionsverfahren zum Einsatz, bei denen Merkmale der umliegenden Beobachtungen gewichtet nach ihrer Distanz zueinander einbezogen werden.

  5. 5.

    Formal zeigt diese Maßzahl die Korrelation von Werten zweier zufällig ausgewählter Beobachtungseinheiten derselben (zufällig ausgewählten) Gruppe j an: \( Corr\left({y}_{ij},{y}_{kj}\right)=\frac{\, Cov\left({y}_{ij},{y}_{kj}\right)}{\sqrt{\, Var\left({y}_{ij}\right)}\ast \sqrt{\, Var\left({y}_{kj}\right)}}\stackrel{\wedge}{=}\frac{\sigma_u^2}{\sigma_u^2+{\sigma}_e^2},i\ne k. \)

  6. 6.

    Das Ausmaß des Fehlers der Beobachtung i darf also keinen Effekt auf das Ausmaß (oder die Richtung) des Fehlers der Beobachtung k haben. Formell ausgedrückt: Corr(ei, ek) = 0, für alle ik. Der Erwartungswert aller paarweisen Produkte von Fehlern ist folglich null.

  7. 7.

    Unverzerrtheit (auch als Erwartungstreue bezeichnet) bedeutet, dass der Durchschnitt hypothetisch vieler unabhängiger Replikationen einer Schätzung (mit wiederholt gezogenen Stichproben) dem tatsächlichen Populationswert entspricht oder ihm zumindest sehr nahe kommt. Konsistenz bedeutet zudem, dass ein Schätzer mit immer größerem Stichprobenumfang immer genauer wird.

  8. 8.

    Zum Beispiel zeigt in Stata „rho“ im Output des „xtreg var1 var2 etc., re“-Befehls den Anteil unerklärter Varianz der Gruppenebene gegeben das jeweilige Modell an.

  9. 9.

    Ist die Homoskedastizitätsannahme (einheitliche Verteilung der Fehler) verletzt, beeinträchtigt dies ebenfalls die Unverzerrtheit von Standardfehlern und Gültigkeit von Teststatistiken. Verletzungen dieser Annahme können zum Beispiel mithilfe des White-Tests geprüft werden.

  10. 10.

    Häufig wird angenommen, dass die serielle Korrelation zwischen zwei aufeinander folgenden Beobachtungszeitpunkten am stärksten ist und mit wachsendem zeitlichem Abstand rasch abnimmt. Diese auch als Autokorrelation erster Ordnung (AR(1)) bezeichnete Fehlerstruktur kann beispielsweise in Stata mit den Befehlen „xtgee var1 var2 etc., corr(ar1)“ oder „xtregar var1 var2 etc.“ modelliert werden.

  11. 11.

    Dabei muss betont werden, dass das Ausmaß an Verzerrung von der Höhe der Korrelation zwischen Prädiktor und Fehlerterm abhängt (siehe dazu die Simulationsstudien in Clark und Linzer 2015 sowie Vaisey und Miles 2017).

  12. 12.

    Weitere Ursachen für eine Verletzung der Exogenitätsannahme, auch als Endogenenitätsverzerrung (Endogeneity-Bias) bezeichnet, sind Messfehler sowie wechselseitige Kausalität.

  13. 13.

    Auch als Schätzer, Effekt, Steigungsparameter oder Regressionsgewicht bezeichnet.

  14. 14.

    Neben der Exogenitätsannahme wird die Linearität der Parameter vorausgesetzt, es darf keine perfekte Multikollinearität zwischen den Variablen herrschen und x muss variable Werte aufweisen (bzw. darf nicht konstant sein). Damit auch die Standardfehler (und damit Teststatistiken) unverzerrt sind, müssen die Fehler einen Erwartungswert von null aufweisen, normalverteilt sein und die Varianz der Fehler muss konstant für alle Ausprägungen von x sein (Homoskedastizität). Zudem darf keine serielle Korrelation vorherrschen. Eine weitere Annahme ist, dass die Beobachtungen eine zufällige Auswahl aus einer bestimmten Grundgesamtheit bzw. Population widerspiegeln, was für die Gültigkeit statistischer Inferenz notwendig ist.

  15. 15.

    Wäre Verträglichkeit die einzige ausgelassene Variable und gäbe es einen passenden Indikator, den wir in die Gleichung einbeziehen könnten, wäre der Effekt von Einkommenszufriedenheit für Verträglichkeit kontrolliert. Die Exogenitätsannahme wäre somit erfüllt und der Koeffizient für Einkommenszufriedenheit unverzerrt.

  16. 16.

    Tests wie der Ramsey-RESET-Test zeigen zwar Missspezifikationen im Hinblick auf bereits im Modell vorhandene Variablen an, jedoch nicht, ob weitere ausgelassene Variablen relevant sind. Welche ausgelassenen Variablen relevant sind, sollte sich daher vorrangig nach theoretischen Überlegungen richten.

  17. 17.

    Analog dazu bezieht sich der sogenannte Between-Schätzer auf eine Regression, die nur die Gruppendurchschnitte einbezieht. Der Within-Schätzer bezieht sich auf Regressionen mit Beobachtungen der jeweiligen Gruppen. Gemittelte Within-Schätzer sind äquivalent zu Koeffizienten aus FE-Modellen (siehe Abschn. 3.2).

  18. 18.

    Werden Variablen der Gruppenebene in ein OLS-Modell aufgenommen, resultieren daraus in der Regel Schätzer mit zu geringen Standardfehlern, was wiederum zu invaliden Teststatistiken führt (Moulton 1986).

  19. 19.

    Zudem werden auch in RE-Modellen Linearität der Parameter, keine perfekte Multikollinearität, Fehlerterme (auch der Fehlerterm der Gruppenebene) mit einem Erwartungswert von null, normalverteilte Fehlerterme, konstante Varianz der Fehlerterme, keine serielle Korrelation der Fehler sowie Unkorreliertheit der Fehler (u, e) untereinander angenommen. Untersuchungseinheiten sollten eine zufällige Auswahl aus einer Grundgesamtheit sein. Darüber hinaus wird angenommen, dass auch die Untersuchungseinheiten der Gruppenebene eine zufällige Auswahl aus einer Grundgesamtheit (bzw. einem Universum von Gruppen) sind. Wenn Länder die Gruppeneinheit darstellen, ist diese Annahme nicht plausibel. Daher sollten die Ergebnisse in diesem Fall nicht als Vorhersagen über zugrundeliegende Populationen, sondern nur in Bezug auf die Länderauswahl im jeweiligen Sample interpretiert werden. Ob man in diesem Fall für die Parameter der Gruppenebene überhaupt statistische Inferenz durchführen sollte, ist eine offene Frage.

  20. 20.

    Es werden J-1 Dummies geschätzt, da eine Gruppe als Referenzkategorie ausgelassen wird, um das Modell zu identifizieren.

  21. 21.

    Programmierte FE-Routinen in Statistikprogrammen (z. B. „xtreg var1 var2 etc., fe“ in Stata) nutzen in der Regel diese Variante.

  22. 22.

    Neben Exogenität der Prädiktorvariablen werden auch im FE-Modell Linearität, keine perfekte Multikollinearität und bestimmte Eigenschaften der Fehler (Erwartungswert von null, Normalverteilung, konstante Varianz, keine serielle Korrelation) angenommen. Auch müssen die Beobachtungseinheiten eine zufällige Auswahl aus der Grundgesamtheit darstellen (bei Paneldaten zumindest zu Beginn des Beobachtungszeitraums), damit statistische Testverfahren gültig sind.

  23. 23.

    Wie bei den Ausführungen zu RE-Modellen betont wurde, hängt das Ausmaß, in dem eine RE-Schätzung in Richtung FE-Schätzer gewichtet ist, von der Anzahl an Perioden (Paneldaten) bzw. der durchschnittlichen Fallzahl pro Gruppe ab. Bei Querschnittsdaten mit hoher Fallzahl pro Gruppe (ländervergleichende Umfragedaten) werden daher die Schätzer von RE- und FE-Modellen kaum wesentlich voneinander abweichen. Im Falle von Paneldaten (insbesondere mit geringer Anzahl an Wellen), basieren RE-Modelle stärker auf Between-Group-Variance, was Abweichungen im Modellvergleich wahrscheinlicher macht.

  24. 24.

    Clark und Linzer (2015, S. 405 f.) finden in einer Simulationsstudie, dass bei Vorliegen selbst kleinster Korrelationen zwischen gruppenbezogenem Fehlerterm und den Prädiktorvariablen FE-Modelle der Verwendung von OLS- oder RE-Modellen vorzuziehen sind. Nur in einem (praktisch eher unwahrscheinlichen) Szenario, in dem die korrelierte unbeobachtete Heterogenität nicht allzu groß, die Fallzahl innerhalb der Gruppen gering (<20) und die Varianz innerhalb der Gruppen sehr gering waren (auch als Slow-Moving oder Sluggish-Data bezeichnet), wiesen RE-Modelle eine geringere Verzerrung als FE-Schätzer auf.

  25. 25.

    Zwar können Gruppeneigenschaften mit Variablen innerhalb von Gruppen interagiert werden. Allerdings lässt sich damit nicht der allgemeine Einfluss einer Gruppeneigenschaft abbilden, sondern ob und wie stark der Effekt einer Intra-Gruppenvariable entlang eines bestimmten Gruppenmerkmales variiert.

  26. 26.

    Dies entspricht einer Zentrierung am Gruppenmittelwert. Darüber hinaus wurden weitere Varianten der Desaggregation von Prädiktorvariablen vorgeschlagen, insbesondere wenn Prädiktorvariablen einen zeitlichen Trend aufweisen (siehe Curran und Bauer 2011 und Wang und Maxwell 2015).

  27. 27.

    Zum Beispiel untersuchen Schmidt-Catran und Spies (2016), ob sich Zuwanderung in Deutschland auf die Unterstützung für wohlfahrtsstaatliche Maßnahmen auswirkt. Dabei desaggregieren die Autoren die Variable Zuwanderung in eine Within- und Between-Komponente. Die Ergebnisse des Hybrid-Modells zeigen, dass nur der Within-Schätzer einen signifikanten (negativen) Einfluss auf wohlfahrtsstaatliche Unterstützung hat, was als Beleg für die Relevanz zeitlicher Veränderungen (im Vergleich zum langfristigen Gesamtniveau) gewertet wird.

  28. 28.

    Bei Paneldaten bezieht sich der idiosynkratischen Fehler auf unbeobachtete zeitveränderliche Prozesse. Bei gruppierten Querschnittsdaten aus einer Umfrage, welche sich in der Regel weitaus weniger für die Identifikation kausaler Effekte eignen, bezieht sich der idiosynkratische Fehler auf unbeobachtete Befragtenmerkmale.

  29. 29.

    Bei einer Einbettung in mehrere nicht-hierarchische Kontexte kommen sogenannte Cross-Classified-Mehrebenenmodelle in Betracht (Snijders und Bosker 2012, S. 205 ff.).

  30. 30.

    Als Ausreißer werden einflussreiche Fälle verstanden, die Koeffizientenschätzer maßgeblich beeinflussen und unter deren Exklusion sich die Interpretation der Ergebnisse verändern würde.

  31. 31.

    Ein Grund für die dennoch häufige Verwendung von ML ist, dass Modellvergleiche mit Devianztests wie dem Likelihood-Ratio-Test auf ML-Schätzungen beruhen müssen.

Literatur

  • Allison, Paul D. 2009. Fixed effects regression models. Los Angeles: Sage.

    Book  Google Scholar 

  • Allison, Paul D., Richard Williams, und Enrique Moral-Benito. 2017. Maximum likelihood for cross-lagged panel models with fixed effects. Socius 3:1–17.

    Google Scholar 

  • Andreß, Hans-Jürgen, Katrin Golsch, und Alexander W. Schmidt. 2013. Applied panel data analysis for economic and social surveys. Heidelberg: Springer Science & Business Media.

    Book  Google Scholar 

  • Angrist, Joshua D., und Jörn-Steffen Pischke. 2009. Mostly harmless econometrics: An empiricist’s companion. Princeton/Oxford: Princeton University Press.

    Google Scholar 

  • Beck, Nathaniel, und Jonathan N. Katz. 1995. What to do (and not to do) with time-series cross-section data. American Political Science Review 89(3): 634–647.

    Article  Google Scholar 

  • Bellemare, Marc F., Takaaki Masaki, und Thomas B. Pepinsky. 2017. Lagged explanatory variables and the estimation of causal effect. The Journal of Politics 79(3): 949–963.

    Article  Google Scholar 

  • Bollen, Kenneth A. 1989. Structual equations with latent variables. New York: Wiley.

    Google Scholar 

  • Brüderl, Joself, und Volker Ludwig. 2015. Fixed-effects panel regression. In The SAGE handbook of regression analysis and causal inference, Hrsg. H. Best und C. Wolf, 327–357. Los Angeles: Sage.

    Google Scholar 

  • Bryan, Mark L., und Stephen P. Jenkins. 2016. Multilevel modelling of country effects: A cautionary tale. European Sociological Review 32(1): 3–22.

    Article  Google Scholar 

  • Cameron, A. Colin, und Douglas L. Miller. 2015. A practitioner’s guide to cluster-robust inference. Journal of Human Resources 50(2): 317–372.

    Article  Google Scholar 

  • Clark, Tom S., und Drew A. Linzer. 2015. Should I use fixed or random effects? Political Science Research and Methods 3(2): 399–408.

    Article  Google Scholar 

  • Curran, Patrick J., und Daniel J. Bauer. 2011. The disaggregation of within-person and between-person effects in longitudinal models of change. Annual Review of Psychology 62:583–619.

    Article  Google Scholar 

  • Drukker, David M. 2003. Testing for serial correlation in linear panel-data models. Stata Journal 3(2): 168–177.

    Google Scholar 

  • Elff, Martin, Jand P. Heisig, Merlin Schaeffer, und Susumu Shikano. 2016. No need to turn Bayesian in multilevel analysis with few clusters: How frequentist methods provide unbiased estimates and accurate inference. Working Paper. https://doi.org/10.31235/osf.io/z65s4. Zugegriffen am 08.01.2018.

  • Enders, Craig K., und Davood Tofighi. 2007. Centering predictor variables in cross-sectional multilevel models: A new look at an old issue. Psychological Methods 12(2): 121.

    Article  Google Scholar 

  • Gelman, Andrew. 2005. Analysis of variance – Why it is more important than ever. The Annals of Statistics 33(1): 1–53.

    Article  Google Scholar 

  • Greene, William H. 2003. Econometric analysis, 5. Aufl. Upper Saddle River: Prentice Hall.

    Google Scholar 

  • Hakhverdian, Armen, und Quinton Mayne. 2012. Institutional trust, education, and corruption: A micro-macro interactive approach. The Journal of Politics 74(3): 739–750.

    Article  Google Scholar 

  • Hamaker, Ellen L., Rebecca M. Kuiper, und Raoul P. P. P. Grasman. 2015. A critique of the cross-lagged panel model. Psychological Methods 20(1): 102–116.

    Article  Google Scholar 

  • Hausman, Jerry A. 1978. Specification tests in econometrics. Econometrica: Journal of the Econometric Society 46(6): 1251–1271.

    Article  Google Scholar 

  • King, Gary, und Margaret E. Roberts. 2015. How robust standard errors expose methodological problems they do not fix, and what to do about it. Political Analysis 23(2): 159–179.

    Article  Google Scholar 

  • Lewis-Beck, Michael S., und Mary Stegmaier. 2000. Economic determinants of electoral outcomes. Annual Review of Political Science 3(1): 183–219.

    Article  Google Scholar 

  • Morgan, Stephen L., und Christopher Winship. 2007. Counterfactuals and causal analysis: Methods and principles for social research. Cambridge, UK: Harvard University Press.

    Google Scholar 

  • Moulton, Brent R. 1986. Random group effects and the precision of regression estimates. Journal of Econometrics 32(3): 385–397.

    Article  Google Scholar 

  • Rabe-Hesketh, Sophia, und Anders Skrondal. 2012. Multilevel and longitudinal modeling using Stata. College Station: Stata Press Publication.

    Google Scholar 

  • Schmidt-Catran, Alexander W., und Malcolm Fairbrother. 2016. The random effects in multilevel models: Getting them wrong and getting them right. European Sociological Review 32(1): 23–38.

    Article  Google Scholar 

  • Schmidt-Catran, Alexander W., und Dennis C. Spies. 2016. Immigration and welfare support in Germany. American Sociological Review 81(2): 242–261.

    Article  Google Scholar 

  • Snijders, Tom A. B., und Roel J. Bosker. 2012. Multilevel analysis. An introduction to basic and advanced multilevel modeling, 2. Aufl. Los Angeles: Sage.

    Google Scholar 

  • Stegmueller, Daniel. 2013. How many countries for multilevel modeling? A comparison of frequentist and Bayesian approaches. American Journal of Political Science 57(3): 748–761.

    Article  Google Scholar 

  • Tilley, James, Anja Neundorf, und Sara Hobolt. 2018. When the pound in people’s pocket matters: How changes to personal financial circumstances affect party choice. The Journal of Politics 80(2): 555–569.

    Article  Google Scholar 

  • Vaisey, Stephen, und Andrew Miles. 2017. What you can – and can’t – do with three-wave panel data. Sociological Methods & Research 46(1): 44–67.

    Article  Google Scholar 

  • Van der Brug, Wouter, Cees Van der Eijk, und Mark Franklin. 2007. The economy and the vote: Economic conditions and elections in fifteen countries. Cambridge, MA: Cambridge University Press.

    Book  Google Scholar 

  • Verbeek, Marno. 2004. A guide to modern econometrics. Chichester: Wiley.

    Google Scholar 

  • Wang, Lijuan Peggy, und Scott E. Maxwell. 2015. On disaggregating between-person and within-person effects with longitudinal data using multilevel models. Psychological Methods 20(1): 63–83.

    Article  Google Scholar 

  • Wooldridge, Jeffrey M. 2009. Introductory econometrics: A modern approach. Boston: Cengage Learning.

    Google Scholar 

  • Ziller, Conrad, und Marc Helbling. 2017. Antidiscrimination laws, policy knowledge, and political support. British Journal of Political Science. First View: 1–18. https://doi.org/10.1017/S0007123417000163.

  • Ziller, Conrad, und Thomas Schübel. 2015. „The pure people“ versus „the corrupt elite“? Political corruption, political trust and the success of radical right parties in Europe. Journal of Elections, Public Opinion and Parties 25(3): 368–386.

    Article  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Conrad Ziller .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2018 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this entry

Check for updates. Verify currency and authenticity via CrossMark

Cite this entry

Ziller, C. (2018). Multiple Regression mit voneinander abhängigen Beobachtungen. In: Wagemann, C., Goerres, A., Siewert, M. (eds) Handbuch Methoden der Politikwissenschaft. Springer Reference Sozialwissenschaften. Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-16937-4_28-2

Download citation

  • DOI: https://doi.org/10.1007/978-3-658-16937-4_28-2

  • Received:

  • Accepted:

  • Published:

  • Publisher Name: Springer VS, Wiesbaden

  • Print ISBN: 978-3-658-16937-4

  • Online ISBN: 978-3-658-16937-4

  • eBook Packages: Springer Referenz Sozialwissenschaften und Recht

Publish with us

Policies and ethics

Chapter history

  1. Latest

    Multiple Regression mit voneinander abhängigen Beobachtungen
    Published:
    16 October 2018

    DOI: https://doi.org/10.1007/978-3-658-16937-4_28-2

  2. Original

    Multiple Regression mit voneinander anhängigen Beobachtungen
    Published:
    24 July 2018

    DOI: https://doi.org/10.1007/978-3-658-16937-4_28-1