Zusammenfassung
Der Beitrag thematisiert einige methodische Fallstricke bei der Schätzung und Interpretation von linearen Regressionsmodellen mit Interaktionseffekten. Es wird gezeigt, dass bei der Interpretation von Haupteffekten in Interaktionsmodellen immer dann höchste Vorsicht geboten ist, wenn eine der an der Interaktion beteiligten Variablen keinen empirisch gültigen Nullwert aufweist. Auch wird gezeigt, welchen Einfluss die Entscheidung der Variablenskalierung auf die Schätzergebnisse haben kann und welche Interpretationsprobleme dabei auftreten können.
Abstract
This article discusses several pitfalls involved with the estimation and interpretation of linear regression models with interaction effects. It shows that one should be cautious in interpreting main effects in interaction models whenever any of the variables involved in the interaction cannot meaningfully take on the value of zero. The article also shows how the scaling of variables can impact the estimated results and the types of interpretation problems that can thereby arise.
Notes
Vgl. dazu Mayerl und Urban (2019).
Zur Logik, Konstruktion und Schätzung von Regressionsmodellen mit Interaktionseffekten vgl. Urban und Mayerl (2018).
Die Daten stammen aus dem DFG-geförderten Forschungsprojekt ARIS. Das Akronym „ARIS“ steht für „Antwortreaktionszeiten in der Survey-Forschung“ Im ARIS-Projekt wurden insgesamt n = 2002 zufällig ausgewählte deutschsprachige Personen ab 18 Jahren in einem CATI-Survey befragt (vgl. Mayerl und Urban 2008).
Zu den exakten Itemformulierungen und deskriptiven Statistiken vgl. Anhang, Tab. 6. Die bivariaten Korrelationen zwischen den verwendeten Variablen betragen: r(Einstellung, Urteilssicherheit) = 0,111; r(Einstellung, Spendeabsicht) = 0,332; r(Urteilssicherheit, Spendeabsicht) = 0,125.
In der Einstellungsforschung wird in diesem Zusammenhang auch von starken Einstellungen gesprochen, welche kognitiv hochgradig chronisch zugänglich sowie stabil und resistent sind (vgl. z. B. Mayerl 2009).
Zur Ableitung dieser Formel vgl. Cohen et al. (2003, S. 265).
Warum das so ist, haben Aiken und West in einer beeindruckenden algebraischen Argumentation nachgewiesen (Aiken und West 1991, S. 29 f.).
In praktischer Hinsicht kann bei der Regressionsanalyse mit Interaktionsvariablen auch die Berechnung und graphische Darstellung der Steigungskoeffizienten der konditionalen Regressionsfunktionen beim größten und kleinsten Wert der jeweils anderen unabhängigen Variablen hilfreich sein.
Diese Einsicht und die folgenden, darauf aufbauenden Argumente verdanken wir der vorzüglichen Abhandlung von Friedrich (1982).
In gleicher Weise sind in jedem interaktiven bzw. multiplikativen Modell auch die Standardfehler der betreffenden X/Z-Koeffizienten als konditionale Größen zu verstehen, die nicht immer nur die Streuung eines einzigen Modellkoeffizienten betreffen, sondern die Streuungen mehrerer Modellkoeffizienten berücksichtigen, was häufig zu einem Anstieg der betreffenden Standardfehler führt (nach Friedrich 1982, S. 810): SE(b1 + b3Z) = √[ var(b1) + Z2var(b3) + 2Zcov(b1b3) ] (7).
Deshalb sind auch die Standardfehler in einem interaktiven Modell üblicherweise (in der Forschungspraxis) größer als in einem additiven Modell. Dies sollte diese Modelle aber nicht diskreditieren oder sie im Vergleich zu den additiven Modellen als unterlegen erscheinen lassen. Überzeugende Monte Carlo-Simulationen haben gezeigt, dass interaktive Modelle trotz Multikollinearität und trotz der damit verbundenen hohen Standardfehler gute und akkurate Parameter-Schätzwerte liefern (vgl. Friedrich 1982, S. 818 f).
Formal betrachtet ist die Interpretation der Haupteffekte in Interaktionsmodellen zudem immer dann problematisch, wenn die X‑ und Z‑Variablen intervallskaliert sind und somit Verschiebungen ihres Nullpunktes zulässig sind. Hat die Verschiebung des Nullpunktes jedoch, wie oben demonstriert, einen Einfluss auf die Schätzergebnisse der Steigungskoeffizienten der Haupteffekte, so sind diese Koeffizienten reine Artefakte der Messskala und ohne empirischen Gehalt.
Literatur
Aiken, Leona S., und Stephen G. West. 1991. Multiple regression: Testing and interpreting interactions. London: Sage.
Brambor, Thomas, William R. Clark und Matt Golder. 2006. Understanding interaction models: Improving empirical analysis. Political Analysis 14:63–82.
Cohen, J., Patricia, Stephen G. West und Leona S. Aiken. 2003. Applied multiple regression/correlation analysis for the behavioral sciences (3rd edition). Hillsdale: Erlbaum.
Dalal, Dev K., und Michael J. Zickar. 2012. Some common myths about centering predictor variables in moderated multiple regression and polynomial regression. Organisational Research Methods 15:339–362.
Disatnik, D., und L. Sivan. 2014. The multicollinearity illusion in moderated regression analysis. Marketing Letters, 11.12.2014.
Echambadi, Raj, und James D. Hess. 2007. Mean-centering does not alleviate collinearity problems in moderated multiple regression models. Marketing Science 26:438–445.
Friedrich, Robert J. 1982. In defense of multiplicative terms in multiple regression equations. American Journal of Political Science 26:797–833.
Hayes, Andrew F. 2013. Introduction to mediation, moderation, and conditional process analysis. A regression-based approach. New York: Guilford.
Jaccard, James, und Robert Turrisi. 2003. Interaction effects in multiple regression (2nd edition). Newbury Park: Sage.
Kromrey, Jeffrey D., und Lynn Foster-Johnson. 1998. Mean centering in moderated multiple regression: Much ado about nothing. Educational and Psychological Measurement 58:42–67.
Mayerl, Jochen. 2009. Kognitive Grundlagen sozialen Verhaltens. Einstellungen, Framing und Rationalität. Wiesbaden: VS Verlag für Sozialwissenschaften.
Mayerl, Jochen, und Dieter Urban. 2008. Antwortreaktionszeiten in Survey-Analysen. Messung, Auswertung und Anwendungen. Wiesbaden: VS Verlag für Sozialwissenschaften.
Mayerl, Jochen, und Dieter Urban. 2019. Der Mythos von der „gefährlichen“ Multikollinearität bei der Schätzung von Interaktionseffekten. In Grundlagen – Methoden – Anwendungen in den Sozialwissenschaften. Festschrift zu Ehren von Steffen M. Kühnel. Wiesbaden: Springer VS. In Druck.
Nisic, Natascha. 2010. Mitgegangen – mitgefangen. Die Folgen von Haushaltsumzügen für die Einkommenssituation von Frauen in Partnerschaften. Kölner Zeitschrift für Soziologie und Sozialpsychologie 62:515–549.
Sauer, Carsten, Peter Valet und Stefan Liebig. 2016. Welche Lohnungleichheiten sind gerecht? Arbeitsmarktbezogene Ursachen von Lohnungleichheiten und die wahrgenommene (Un-)Gerechtigkeit des eigenen Erwerbseinkommens. Kölner Zeitschrift für Soziologie und Sozialpsychologie 68:619–645.
Schneider, Thorsten, und Julia Dohrmann. 2015. Religion und Bildungserfolg in Westdeutschland unter besonderer Berücksichtigung von Diasporaeffekten. Kölner Zeitschrift für Soziologie und Sozialpsychologie 67:293–320.
Schunk, Reinhard. 2016. Reich und schön? Eine Untersuchung zur ungleichen Verteilung physischer Attraktivität. Kölner Zeitschrift für Soziologie und Sozialpsychologie 68:113–137.
Urban, Dieter, und Jochen Mayerl. 2018. Angewandte Regressionsanalyse: Theorie, Technik und Praxis (5. Auflage). Wiesbaden: Springer VS.
Danksagung
Wir danken den Gutachtern für hilfreiche Kommentare zu einer früheren Version dieses Beitrags.
Author information
Authors and Affiliations
Corresponding author
Anhang
Anhang
Rights and permissions
About this article
Cite this article
Mayerl, J., Urban, D. Vorsicht (!) bei Regressionsanalysen mit Interaktionsvariablen. Köln Z Soziol 71, 135–156 (2019). https://doi.org/10.1007/s11577-019-00590-1
Published:
Issue Date:
DOI: https://doi.org/10.1007/s11577-019-00590-1