Skip to main content

Hauptkomponentenanalyse und explorative Faktorenanalyse

Part of the Springer Reference Sozialwissenschaften book series (SRS)

Zusammenfassung

Der Beitrag führt in die Grundlagen der Hauptkomponentenanalyse (PCA) und explorativen Faktorenanalyse (EFA) ein. Gemeinsam ist diesen Verfahren eine Reduktion von einer Menge von korrelierten Variablen auf wenige Komponenten mit den Zielen der Vereinfachung, der leichteren Interpretation und zur Darstellung von zugrunde liegenden latenten Variablen. Zunächst werden die mathematischen Grundlagen der PCA erörtert, bevor Kriterien zur Bestimmung der idealen Anzahl der Komponenten und Rotationsverfahren zur Vereinfachung der Interpretation vorgestellt werden. Anschließend werden zwei Anwendungsbeispiele aus der Politikwissenschaft diskutiert. Darauf folgend wird die PCA von der EFA abgegrenzt sowie die EFA als induktives Datenmodellierungsverfahren eingeführt. Abschließend erfolgt eine kommentierte Darstellung von Einführungswerken und weiterführender Literatur.

Schlüsselwörter

  • Hauptkomponentenanalyse
  • Faktorenanalyse
  • Dimensionsreduktion
  • Principal Component Analysis (PCA)
  • Explorative Faktorenanalyse (EFA)

Für wertvolle Hinweise bei der Überarbeitung gilt Dank an Bernd Schlipphak. Für Hilfe bei der Erstellung und kritische Diskussion gilt mein Dank Achim Goerres und David Johann sowie den Hilfskräften Jakob Kemper, Sebastian Krause und Erik Wenker.

This is a preview of subscription content, access via your institution.

Abb. 1
Abb. 2
Abb. 3

Notes

  1. 1.

    Allerdings gibt es Autoren, die die Durchführung einer Hauptkomponenten-/Faktorenanalyse auch für dichotome Variablen als möglich beurteilen (siehe beispielsweise Arminger 1979, S. 159). Siehe dazu auch Abschn. 2.1.2.

  2. 2.

    Ausnahme ist der eher hypothetische Fall perfekt korrelierter Variablen, hier erklärt bereits die erste Komponente die Gesamtvarianz.

  3. 3.

    In den gängigen Statistikprogrammen (R, SPSS, Stata) geschieht dies automatisch durch die Verwendung der Korrelationsmatrix als Ausgangspunkt der PCA.

  4. 4.

    Das folgende Beispiel geht auf Bartholomew et al. (2002, S. 116–120) zurück.

  5. 5.

    Siehe für eine detaillierte Darstellung der mathematischen Grundlagen der Transformation Bortz und Schuster (2010, S. 397–400).

  6. 6.

    Dabei stehen noch andere Berechnungsverfahren zur Verfügung: Für ordinale Variablen kann beispielsweise auch das Verfahren der polychorischen PCA bzw. EFA angewendet werden, das beispielsweise in Stata 14 über das Ado „polychoricpca“ verfügbar ist. Bei dichotomen Variablen kann auf die logistische PCA zurückgegriffen werden, die beispielsweise als Package für R zur Verfügung steht (Landgraf und Lee 2015).

  7. 7.

    Dieser kann standardmäßig bei SPSS 22 über/PRINT=KMO angefordert werden, für Stata 14 ist das Ado „factortest“ verfügbar.

  8. 8.

    Bartholomew et al. (2002, S. 167) verweisen darauf, dass bei einer PCA die erste Hauptkomponente immer die gleichen Ladungen aufweist, egal, wie viele Komponenten beibehalten werden, während dies bei einer Faktorenanalyse (siehe Abschn. 4) nicht der Fall ist. Daher solle die Rotation der Ladungen für eine PCA nicht vorgenommen werden, da diese mit einem Informationsverlust verbunden ist, während dies bei der EFA nicht zutrifft. Dennoch erscheint der Zugewinn durch die erleichterte Interpretation, die ja das Ziel der PCA ist, ausreichend, um eine Rotation der Komponenten durchzuführen, wie dies auch durch andere Autoren vorgeschlagen wird.

  9. 9.

    Für die praktische Durchführung empfiehlt sich bei der PCA zuerst die Durchführung der orthogonalen Rotation. Anschließend werden die Komponenten interpretiert, indem sie benannt werden. Sollte nach der Benennung eine Korrelation der Komponenten wahrscheinlich erscheinen, sollte die Rotation erneut mit einem obliquen Verfahren durchgeführt werden, das dann angemessener wäre.

  10. 10.

    Für eine weiterführende Darstellung wird auf Eid et al. (2015) verwiesen.

  11. 11.

    Bei schiefwinkligen Rotationen kann der Nutzer in der Regel einen Wert p für die zulässige Höhe der Korrelationen zwischen den Komponenten angeben, der nach Empfehlung einiger Autoren (z. B. Lawley und Maxwell 1971) nicht über 4 liegen sollte, da die Komponenten sonst zu stark korreliert sind. Der Standardwert für das Promax-Verfahren ist bei SPSS p=4 und bei Stata p=3. Beim Promax-Verfahren erhält der Nutzer zuerst eine Struktur- und dann eine Mustermatrix, wobei letztere die eigentlich zu interpretierenden Komponentenladungen enthält.

  12. 12.

    Dies erfolgt in Stata 14 mit dem Befehlt predict comp1 comp2, score.

  13. 13.

    In manchen Statistikprogrammen, so beispielsweise Stata, erhält man statt der Kommunalität die Uniqueness (1 – Kommunalität) einer Variablen, also den Teil der Informationen der Indikatorvariablen, der nicht über die Faktoren dargestellt werden kann.

  14. 14.

    Dabei werden beide Verfahren nicht selten vermischt, siehe beispielsweise Ray (2007), der eine PCA durchführt, aber mit EFA benennt.

  15. 15.

    Die Berechnung verläuft dabei ähnlich wie bei der PCA, es wird jedoch eine Residualvariable berücksichtigt, siehe weiterführend Eid et al. (2015).

Literatur

  • Arminger, Gerhard. 1979. Faktorenanalyse. Stuttgart: Teubner.

    CrossRef  Google Scholar 

  • Backhaus, Klaus, Bernd Erichson, Rolf Weiber, und Wulff Plinke, Hrsg. 2016. Faktorenanalyse. In Multivariate Analysemethoden, 385–452. Berlin/Heidelberg: Springer.

    Google Scholar 

  • Bartholomew, David J., Fiona Steele, Irini Moustaki, und Jane I. Galbraith. 2002. The analysis and interpration of multivariate data for social scientists. Boca Raton: Chapman & Hall/CRC.

    Google Scholar 

  • Bartlett, Maurice Stevenson. 1950. Tests of significance in factor analysis. British Journal of Statistical Psychology 3(2): 77–85. https://doi.org/10.1111/j.2044-8317.1950.tb00285.x.

    CrossRef  Google Scholar 

  • Bortz, Jürgen, und Christof Schuster. 2010. Statistik für Human- und Sozialwissenschaftler. Berlin/Heidelberg: Springer.

    CrossRef  Google Scholar 

  • Cattell, R. B. 1966. The scree test for the number of factors. Multivariate Behavioral Research 1(2): 245–276. https://doi.org/10.1207/s15327906mbr0102_10.

    CrossRef  Google Scholar 

  • Cleff, Thomas, Hrsg. 2015. Faktorenanalyse. In Deskriptive Statistik und Explorative Datenanalyse: Eine computergestützte Einführung mit Excel, SPSS und STATA, 217–234. Wiesbaden: Gabler Verlag.

    Google Scholar 

  • Cureton, Edward E., und Ralph B. D‘Agostino. 2009. Factor analysis: An applied approach. New York: Psychology Press.

    Google Scholar 

  • Dziuban, Charles D., und Edwin C. Shirkey. 1974. When is a correlation matrix appropriate for factor analysis? Some decision rules. Psychological Bulletin 81(6): 358.

    CrossRef  Google Scholar 

  • Eid, Michael, Mario Gollwitzer, und Manfred Schmitt. 2015. Statistik und Forschungsmethoden: Mit Online-Materialien. 4., überarb. u. erw. Aufl. Weinheim/Basel: Beltz.

    Google Scholar 

  • Eijk, Cees van der, und Jonathan Rose. 2015. „Risky business: Factor analysis of survey data – Assessing the probability of incorrect dimensionalisation.“ PloS one 10(3): e0118900. https://doi.org/10.1371/journal.pone.0118900.

    CrossRef  Google Scholar 

  • Evans, Jocelyn A. J. 2000. „Contrasting attitudinal bases to Euroscepticism amongst the French electorate.“ Electoral Studies 19(4): 539–561. http://www.sciencedirect.com/science/article/pii/S0261379499000293. Zugegriffen am 04.08.2017.

    CrossRef  Google Scholar 

  • Fabrigar, Leandre R., Duane T. Wegener, Robert C. MacCallum, und Erin J. Strahan. 1999. Evaluating the use of exploratory factor analysis in psychological research. Psychological Methods 4(3): 272–299.

    CrossRef  Google Scholar 

  • Field, Andy. 2013. Discovering statistics using IBM SPSS statistics: And sex and drugs and rock ,n‘ roll, 4. Aufl MobileStudy. Los Angeles/London/New Delhi: Sage.

    Google Scholar 

  • Field, Andy, Jeremy Miles, und Zoë Field. 2013. Discovering statistics using R. Los Angeles: Sage. (Reprint).

    Google Scholar 

  • Gabel, Matthew J., und John D. Huber. 2000. Putting parties in their place: Inferring party left-right ideological positions from party manifestos data. American Journal of Political Science 44(1): 94–103.

    CrossRef  Google Scholar 

  • Hotelling, Harold. 1933. Analysis of a complex of statistical variables into principal components. Journal of Educational Psychology 24(6): 417–441.

    CrossRef  Google Scholar 

  • Jackman, Robert W., und Ross A. Miller. 1996. A renaissance of political culture? American Journal of Political Science 40(3): 632–659. https://doi.org/10.2307/2111787.

    CrossRef  Google Scholar 

  • Kaiser, H. F. 1958. The varimax criterion for analytic rotation in factor analysis. Psychometrica 23: 187–200.

    CrossRef  Google Scholar 

  • Kaiser, H. F., und K. Dickman. 1959. Analytic determination of common factors. American Psychological Reports 14:425–438.

    Google Scholar 

  • Kenny, Graham K. 1986. The metric properties of rating scales employed in evaluation research. Evaluation Review 10(3): 397–408. https://doi.org/10.1177/0193841X8601000309.

    CrossRef  Google Scholar 

  • Kim, Jae-On, und Charles W. Mueller. 1978. Factor analysis. Statistical methods and pratical issues. Newbury Park: Sage.

    Google Scholar 

  • Landgraf, Andrew J., und Yoonkyung Lee. 2015. Dimensionality reduction for binary data through the projection of natural parameters. arXiv:1510.06112.

    Google Scholar 

  • Lawley, D. N., und A. E. Maxwell. 1971. Factor analysis as a statistical method, 2. Aufl. New York: American Elsevier Pub. Co.

    Google Scholar 

  • Netjes, Catherine E., und Harmen A. Binnema. 2007. The salience of the European integration issue: Three data sources compared. Electoral Studies 26(1): 39–49. https://doi.org/10.1016/j.electstud.2006.04.007.

    CrossRef  Google Scholar 

  • Pearson, Karl. 1901. On lines and planes of closest fit to systems of points in space. Philosophical Magazine 2:559–572.

    Google Scholar 

  • Ray, Leonard. 2007. Validity of measured party positions on European integration: Assumptions, approaches, and a comparison of alternative measures. Electoral Studies 26(1): 11–22. https://doi.org/10.1016/j.electstud.2006.03.008.

    CrossRef  Google Scholar 

  • Thurstone, Louis Leon. 1947. Multiple factor analysis. Chicago: University of Chicago Press.

    Google Scholar 

  • Wolff, Hans-Georg, und Johann Bacher. 2010. Hauptkomponentenanalyse und explorative Faktorenanalyse. In Handbuch der sozialwissenschaftlichen Datenanalyse, Hrsg. Christof Wolf, 1. Aufl., 333–365. Wiesbaden: VS Verl. für Sozialwiss.

    CrossRef  Google Scholar 

Verwendete Datensätze und Stata-Ados

  • Bischof, Daniel. 2017. New graphic schemes for stata: Plotplain & plottig. Stata Journal 17(3): 748–759.

    Google Scholar 

  • GESIS. 2017a. Allgemeine Bevölkerungsumfrage der Sozialwissenschaften ALLBUS 2016. Version 2.1.0: GESIS Datenarchiv, Köln. https://doi.org/10.4232/1.12796.

  • GESIS. 2017b. GESIS Panel – Standard Edition. ZA5665 Data file Version 20.0.0: GESIS Datenarchiv, Köln. https://doi.org/10.4232/1.12766.

  • Rattinger, Hans, Sigrid Roßteutscher, Rüdiger Schmitt-Beck, Bernhard Weßels, Christof Wolf, Aiko Wagner, und Heiko Giebler. 2017. Post-election Cross Section (GLES 2013). Version 3.0.0: GESIS Data Archive, Cologne. https://doi.org/10.4232/1.12809.

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Sabrina J. Mayer .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and Permissions

Copyright information

© 2018 Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature

About this entry

Verify currency and authenticity via CrossMark

Cite this entry

Mayer, S.J. (2018). Hauptkomponentenanalyse und explorative Faktorenanalyse. In: Wagemann, C., Goerres, A., Siewert, M. (eds) Handbuch Methoden der Politikwissenschaft. Springer Reference Sozialwissenschaften. Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-16937-4_31-1

Download citation

  • DOI: https://doi.org/10.1007/978-3-658-16937-4_31-1

  • Received:

  • Accepted:

  • Published:

  • Publisher Name: Springer VS, Wiesbaden

  • Print ISBN: 978-3-658-16937-4

  • Online ISBN: 978-3-658-16937-4

  • eBook Packages: Springer Referenz Sozialwissenschaften & Recht