Skip to main content
Log in

Vorsicht (!) bei Regressionsanalysen mit Interaktionsvariablen

Die Skalierung der unabhängigen Variablen kann die Höhe, Richtung und Signifikanz der Regressionskoeffizienten bestimmen

Be Cautious When Estimating Regression Models with Interaction Variables

The Scaling of Independent Variables May Determine the Size, Direction, and Significance of Regression Coefficients

  • Berichte und Diskussionen
  • Published:
KZfSS Kölner Zeitschrift für Soziologie und Sozialpsychologie Aims and scope Submit manuscript

Zusammenfassung

Der Beitrag thematisiert einige methodische Fallstricke bei der Schätzung und Interpretation von linearen Regressionsmodellen mit Interaktionseffekten. Es wird gezeigt, dass bei der Interpretation von Haupteffekten in Interaktionsmodellen immer dann höchste Vorsicht geboten ist, wenn eine der an der Interaktion beteiligten Variablen keinen empirisch gültigen Nullwert aufweist. Auch wird gezeigt, welchen Einfluss die Entscheidung der Variablenskalierung auf die Schätzergebnisse haben kann und welche Interpretationsprobleme dabei auftreten können.

Abstract

This article discusses several pitfalls involved with the estimation and interpretation of linear regression models with interaction effects. It shows that one should be cautious in interpreting main effects in interaction models whenever any of the variables involved in the interaction cannot meaningfully take on the value of zero. The article also shows how the scaling of variables can impact the estimated results and the types of interpretation problems that can thereby arise.

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1a
Abb. 1b
Abb. 1c

Notes

  1. Vgl. dazu Mayerl und Urban (2019).

  2. Zur Logik, Konstruktion und Schätzung von Regressionsmodellen mit Interaktionseffekten vgl. Urban und Mayerl (2018).

  3. Die Daten stammen aus dem DFG-geförderten Forschungsprojekt ARIS. Das Akronym „ARIS“ steht für „Antwortreaktionszeiten in der Survey-Forschung“ Im ARIS-Projekt wurden insgesamt n = 2002 zufällig ausgewählte deutschsprachige Personen ab 18 Jahren in einem CATI-Survey befragt (vgl. Mayerl und Urban 2008).

  4. Zu den exakten Itemformulierungen und deskriptiven Statistiken vgl. Anhang, Tab. 6. Die bivariaten Korrelationen zwischen den verwendeten Variablen betragen: r(Einstellung, Urteilssicherheit) = 0,111; r(Einstellung, Spendeabsicht) = 0,332; r(Urteilssicherheit, Spendeabsicht) = 0,125.

  5. In der Einstellungsforschung wird in diesem Zusammenhang auch von starken Einstellungen gesprochen, welche kognitiv hochgradig chronisch zugänglich sowie stabil und resistent sind (vgl. z. B. Mayerl 2009).

  6. Zur Ableitung dieser Formel vgl. Cohen et al. (2003, S. 265).

  7. Warum das so ist, haben Aiken und West in einer beeindruckenden algebraischen Argumentation nachgewiesen (Aiken und West 1991, S. 29 f.).

  8. Vgl. dazu auch Brambor und Golder (2006, S. 71), Dalal und Zickar (2012), Disatnik und Sivan (2014), Echambadi und Hess (2007), Hayes (2013, S. 282–290), Jaccard und Turrisi (2003, S. 25 f.), Kromrey und Foster-Johnson (1998).

  9. In praktischer Hinsicht kann bei der Regressionsanalyse mit Interaktionsvariablen auch die Berechnung und graphische Darstellung der Steigungskoeffizienten der konditionalen Regressionsfunktionen beim größten und kleinsten Wert der jeweils anderen unabhängigen Variablen hilfreich sein.

  10. Diese Einsicht und die folgenden, darauf aufbauenden Argumente verdanken wir der vorzüglichen Abhandlung von Friedrich (1982).

  11. In gleicher Weise sind in jedem interaktiven bzw. multiplikativen Modell auch die Standardfehler der betreffenden X/Z-Koeffizienten als konditionale Größen zu verstehen, die nicht immer nur die Streuung eines einzigen Modellkoeffizienten betreffen, sondern die Streuungen mehrerer Modellkoeffizienten berücksichtigen, was häufig zu einem Anstieg der betreffenden Standardfehler führt (nach Friedrich 1982, S. 810): SE(b1 + b3Z) = √[ var(b1) + Z2var(b3) + 2Zcov(b1b3) ] (7).

    Deshalb sind auch die Standardfehler in einem interaktiven Modell üblicherweise (in der Forschungspraxis) größer als in einem additiven Modell. Dies sollte diese Modelle aber nicht diskreditieren oder sie im Vergleich zu den additiven Modellen als unterlegen erscheinen lassen. Überzeugende Monte Carlo-Simulationen haben gezeigt, dass interaktive Modelle trotz Multikollinearität und trotz der damit verbundenen hohen Standardfehler gute und akkurate Parameter-Schätzwerte liefern (vgl. Friedrich 1982, S. 818 f).

  12. Formal betrachtet ist die Interpretation der Haupteffekte in Interaktionsmodellen zudem immer dann problematisch, wenn die X‑ und Z‑Variablen intervallskaliert sind und somit Verschiebungen ihres Nullpunktes zulässig sind. Hat die Verschiebung des Nullpunktes jedoch, wie oben demonstriert, einen Einfluss auf die Schätzergebnisse der Steigungskoeffizienten der Haupteffekte, so sind diese Koeffizienten reine Artefakte der Messskala und ohne empirischen Gehalt.

Literatur

  • Aiken, Leona S., und Stephen G. West. 1991. Multiple regression: Testing and interpreting interactions. London: Sage.

    Google Scholar 

  • Brambor, Thomas, William R. Clark und Matt Golder. 2006. Understanding interaction models: Improving empirical analysis. Political Analysis 14:63–82.

    Article  Google Scholar 

  • Cohen, J., Patricia, Stephen G. West und Leona S. Aiken. 2003. Applied multiple regression/correlation analysis for the behavioral sciences (3rd edition). Hillsdale: Erlbaum.

    Google Scholar 

  • Dalal, Dev K., und Michael J. Zickar. 2012. Some common myths about centering predictor variables in moderated multiple regression and polynomial regression. Organisational Research Methods 15:339–362.

    Article  Google Scholar 

  • Disatnik, D., und L. Sivan. 2014. The multicollinearity illusion in moderated regression analysis. Marketing Letters, 11.12.2014.

  • Echambadi, Raj, und James D. Hess. 2007. Mean-centering does not alleviate collinearity problems in moderated multiple regression models. Marketing Science 26:438–445.

    Article  Google Scholar 

  • Friedrich, Robert J. 1982. In defense of multiplicative terms in multiple regression equations. American Journal of Political Science 26:797–833.

    Article  Google Scholar 

  • Hayes, Andrew F. 2013. Introduction to mediation, moderation, and conditional process analysis. A regression-based approach. New York: Guilford.

    Google Scholar 

  • Jaccard, James, und Robert Turrisi. 2003. Interaction effects in multiple regression (2nd edition). Newbury Park: Sage.

    Book  Google Scholar 

  • Kromrey, Jeffrey D., und Lynn Foster-Johnson. 1998. Mean centering in moderated multiple regression: Much ado about nothing. Educational and Psychological Measurement 58:42–67.

    Article  Google Scholar 

  • Mayerl, Jochen. 2009. Kognitive Grundlagen sozialen Verhaltens. Einstellungen, Framing und Rationalität. Wiesbaden: VS Verlag für Sozialwissenschaften.

    Google Scholar 

  • Mayerl, Jochen, und Dieter Urban. 2008. Antwortreaktionszeiten in Survey-Analysen. Messung, Auswertung und Anwendungen. Wiesbaden: VS Verlag für Sozialwissenschaften.

    Google Scholar 

  • Mayerl, Jochen, und Dieter Urban. 2019. Der Mythos von der „gefährlichen“ Multikollinearität bei der Schätzung von Interaktionseffekten. In Grundlagen – Methoden – Anwendungen in den Sozialwissenschaften. Festschrift zu Ehren von Steffen M. Kühnel. Wiesbaden: Springer VS. In Druck.

    Google Scholar 

  • Nisic, Natascha. 2010. Mitgegangen – mitgefangen. Die Folgen von Haushaltsumzügen für die Einkommenssituation von Frauen in Partnerschaften. Kölner Zeitschrift für Soziologie und Sozialpsychologie 62:515–549.

    Article  Google Scholar 

  • Sauer, Carsten, Peter Valet und Stefan Liebig. 2016. Welche Lohnungleichheiten sind gerecht? Arbeitsmarktbezogene Ursachen von Lohnungleichheiten und die wahrgenommene (Un-)Gerechtigkeit des eigenen Erwerbseinkommens. Kölner Zeitschrift für Soziologie und Sozialpsychologie 68:619–645.

    Article  Google Scholar 

  • Schneider, Thorsten, und Julia Dohrmann. 2015. Religion und Bildungserfolg in Westdeutschland unter besonderer Berücksichtigung von Diasporaeffekten. Kölner Zeitschrift für Soziologie und Sozialpsychologie 67:293–320.

    Article  Google Scholar 

  • Schunk, Reinhard. 2016. Reich und schön? Eine Untersuchung zur ungleichen Verteilung physischer Attraktivität. Kölner Zeitschrift für Soziologie und Sozialpsychologie 68:113–137.

    Article  Google Scholar 

  • Urban, Dieter, und Jochen Mayerl. 2018. Angewandte Regressionsanalyse: Theorie, Technik und Praxis (5. Auflage). Wiesbaden: Springer VS.

    Book  Google Scholar 

Download references

Danksagung

Wir danken den Gutachtern für hilfreiche Kommentare zu einer früheren Version dieses Beitrags.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Jochen Mayerl.

Anhang

Anhang

 

Tab. 6 Items und deskriptive Kennzahlen

Rights and permissions

Reprints and permissions

About this article

Check for updates. Verify currency and authenticity via CrossMark

Cite this article

Mayerl, J., Urban, D. Vorsicht (!) bei Regressionsanalysen mit Interaktionsvariablen. Köln Z Soziol 71, 135–156 (2019). https://doi.org/10.1007/s11577-019-00590-1

Download citation

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s11577-019-00590-1

Schlüsselwörter

Keywords

Navigation