Advertisement

Modellvergleich und Ergebnisinterpretation in Logit- und Probit-Regressionen

  • Henning Best
  • Christof Wolf
Berichte und Diskussionen

Zusammenfassung

Logit- und Probitregression werden als multivariate Analyseverfahren zur Analyse von dichotomen abhängigen Variablen in den Sozialwissenschaften routinemäßig eingesetzt. Beide Verfahren können so interpretiert werden, dass sich aus einer linearen Modellierung einer unbeobachteten Variabley* eine nichtlineare Modellierung der Wahrscheinlichkeiten füry = 1 ergibt. Wir zeigen erstens, dass diese Nichtlinearität im Vergleich zu linearen Regressionsverfahren zu Problemen bei der Interpretation der Modellergebnisse führt. Insbesondere die in der logistischen Regression häufig verwendeten odds ratios (exponierte Logit-Koeffizienten) sind unseres Erachtens problematisch. Stattdessen empfehlen wir neben graphischen Interpretationshilfen die Verwendung von (korrigierten) durchschnittlich marginalen Effekten (AME). Zweitens zeigen wir anhand einer Serie von Monte-Carlo-Simulationen, dass die üblichen Regressionskoeffizienten bei Logit- und Probitanalysen nicht zwischen verschachtelten Modellen verglichen werden können. Da in den Sozialwissenschaften bei der Modellbildung jedoch häufig schrittweise vorgegangen wird, wäre ein Verfahren, das einen validen Vergleich von Effektstärken zwischen den Modellen erlaubt, sehr nützlich. Wie wir anhand unserer Simulationsstudie zeigen, führen durchschnittlich marginale Effekte und Koeffizienten, die nach dem Vorschlag von Karlson et al. (Sociological Methodology 42, 2012) korrigiert wurden, in sehr verschiedenen Situationen zu gültigen Ergebnissen.y*-standardisierte Koeffizienten sind für einen Modellvergleich hingegen weniger geeignet und Koeffizienten eines linearen Wahrscheinlichkeitsmodells sollten ausschließlich bei normalverteilten Variablen verwendet werden.

Schlüsselwörter

Logistische Regression Unbeobachtete Heterogenität Marginal effects Simulation Logit Probit Binary choice 

Comparing nested models and interpreting results from logit and probit regression

Abstract

In the social sciences logit and probit models are often used multivariate data analysis procedures for binary dependent variables. Both procedures can be thought of as resting on a linear model for an unobserved variable y* from which a nonlinear model for the probability of y = 1 is derived. We first show that compared to linear models this nonlinearity leads to problems of interpreting results from such analysis. In particular odds ratios (exponentiated logit coefficients) often used in logistic regression are problematic in this respect. Instead we recommend using graphical procedures and reporting (corrected) average marginal effects (AME). Based on a series of Monte-Carlo simulations we next demonstrate that the regression coefficients from logit and probit models should not be compared between nested models. Because model building in the social sciences often employs a stepwise procedure a method allowing valid comparisons of effect sizes between models would be advantageous. Results from our simulation study show that average marginal effects and regression coefficients corrected by a method proposed by Karlson et al. (Sociological Methodology 42, 2012) lead to satisfactory results in many different scenarios. In contrast, y*-standardized coefficients are of limited utility and coefficients from a linear probability model should only be used with normally distributed variables.

Keywords

Logistic regression Unobserved heterogeneity Marginal effects Simulation Logit Probit Binary choice 

Notes

Danksagung

Wir danken Klaus Pforr für hilfreiche Hinweise zu einer früheren Version des Manuskripts.

Literatur

  1. Allison, Paul D. 1999. Comparing logit and probit coefficients across groups.Sociological Methods & Research 28:186–208.CrossRefGoogle Scholar
  2. Auspurg, Katrin, und Thomas Hinz. 2011. Gruppenvergleiche bei Regressionen mit binären abhängigen Variablen – Probleme und Fehleinschätzungen am Beispiel von Bildungschancen im Kohortenverlauf.Zeitschrift für Soziologie 40:62–73.Google Scholar
  3. Bauer, Gerrit. 2010. Graphische Darstellung regressionsanalytischer Ergebnisse. InHandbuch der sozialwissenschaftlichen Datenanalyse, Hrsg. Christof Wolf und Henning Best, 905–927. Wiesbaden: VS Verlag für Sozialwissenschaften.CrossRefGoogle Scholar
  4. Best, Henning, und Christof Wolf. 2010. Logistische Regression. InHandbuch der sozialwissenschaftlichen Datenanalyse, Hrsg. Christof Wolf und Henning Best, 827–854. Wiesbaden: VS Verlag für Sozialwissenschaften.CrossRefGoogle Scholar
  5. Breen, Richard, Kristian Bernt Karlson und Anders Holm. 2011. A reinterpretation of coefficients from logit, probit, and other non-linear probability models: Consequences for comparative sociological research available at SSRN.http://ssrn.com/abstract=1857431.
  6. Cornwell, Benjamin, und Edward O. Laumann. 2011. Network position and sexual dysfunction: Implications of partner betweenness for men. American Journal of Sociology 117:172–208.CrossRefGoogle Scholar
  7. DeMaris, Alfred. 1992.Logit modeling. Practicle applications. Thousand Oaks: Sage.Google Scholar
  8. Karlson, Kristian Bernt, Anders Holm und Richard Breen. 2012. Comparing regression coefficients between same-sample nested models using logit and probit: A new method.Sociological Methodology 42.Google Scholar
  9. Kohler, Ulrich, Kristian Bernt Karlson und Anders Holm. 2011. Comparing coefficients of nested nonlinear probability models.The Stata Journal 11:420–438.Google Scholar
  10. Long, J. Scott. 1997. Regression models for categorical and limited dependent variables. Thousand Oaks: Sage.Google Scholar
  11. Long, J. Scott, und Jeremy Freese. 2006. Regression models for categorical dependent variables using stata. College Station: Stata Press.Google Scholar
  12. McKelvey, R., und W. Zavoina. 1975. A statistical model for the analysis of ordinal level dependent variables.Journal of Mathematical Sociology 4:103–120.CrossRefGoogle Scholar
  13. Mood, Carina. 2010. Logistic regression: Why we cannot do what we think we can do, and what we can do about it.European Sociological Review 26:67–82.CrossRefGoogle Scholar
  14. Winship, Christopher, und Robert D. Mare. 1984. Regression models with ordinal variables.American Sociological Review 49:512–525.CrossRefGoogle Scholar
  15. Wooldridge, Jeffrey M. 2002.Econometric analysis of cross section and panel data. Cambridge: MIT Press.Google Scholar

Copyright information

© VS Verlag für Sozialwissenschaften 2012

Authors and Affiliations

  1. 1.GESIS – Leibniz-Institut für SozialwissenschaftenMannheimDeutschland

Personalised recommendations