Advertisement

Clusteranalysen

  • Pascal D. König
Living reference work entry
Part of the Springer Reference Sozialwissenschaften book series (SRS)

Zusammenfassung

Das Kapitel gibt einen Überblick über wichtige generelle Schritte und Entscheidungen bei der Durchführung von Clusteranalysen und stellt drei zentrale Varianten vor: (1) die hierarchisch-agglomerative Clusteranalyse, (2) das K-Means-Verfahren und (3) die modellbasierte Gruppenbildung auf Basis angenommener Wahrscheinlichkeitsverteilungen. Im Zuge der Beschreibung der grundlegenden Funktionsweise dieser Verfahren wird auch auf Umsetzungsbeispiele in der politikwissenschaftlichen Forschung sowie auf verfügbare Softwarelösungen verwiesen. Außerdem verdeutlicht die Anwendung der Verfahren auf Beispieldaten, wie die behandelten Verfahren Strukturen in Daten auffinden, wie die Ergebnisse zu interpretieren sind und inwieweit die Varianten im direkten Vergleich zu ähnlichen Ergebnissen gelangen.

Schlüsselwörter

Cluster Gruppierung Klassifikation Strukturidentifizierend Hierarchisch K-Means Partition Modellbasiert Mixture density-based clustering 

Literatur

  1. Aggarwal, Charu C., und Cheng Xiang Zhai, Hrsg. 2012. Mining text data. New York: Springer.Google Scholar
  2. Ahlquist, John S., und Christian Breunig. 2012. Model-based clustering and typologies in the social sciences. Political Analysis 20(1): 92–112.  https://doi.org/10.1093/pan/mpr039.CrossRefGoogle Scholar
  3. Arts, W. I. L., und John Gelissen. 2002. Three worlds of welfare capitalism or more? A state-of-the-art report. Journal of European Social Policy 12(2): 137–158.  https://doi.org/10.1177/0952872002012002114.CrossRefGoogle Scholar
  4. Bacher, Johann, und Jeroen K. Vermunt. 2010. „Analyse latenter Klassen“. In Handbuch der sozialwissenschaftlichen Datenanalyse, Hrsg. Christof von Wolf und Henning Best, 553–574. Wiesbaden: VS Verlag für Sozialwissenschaften.  https://doi.org/10.1007/978-3-531-92038-2_22.
  5. Bacher, Johann, Andreas Pöge, und Knut Wenzig. 2010. Clusteranalyse: anwendungsorientierte Einführung in Klassifikationsverfahren, 3., erg. vollst. überarb. u. neu gestaltete Aufl. München: Oldenbourg.Google Scholar
  6. Backhaus, Klaus, Bernd Erichson, Wulff Plinke, und Rolf Weiber. 2016. Multivariate Analysemethoden: eine anwendungsorientierte Einführung, 14., überarb. u. ak. Aufl. Lehrbuch. Berlin/Heidelberg: Springer Gabler.Google Scholar
  7. Bambra, Clare. 2007. Defamilisation and welfare state regimes: A cluster analysis. International Journal of Social Welfare 16(4): 326–338.  https://doi.org/10.1111/j.1468-2397.2007.00486.x.CrossRefGoogle Scholar
  8. Banfield, Jeffrey D., und Adrian E. Raftery. 1993. Model-based gaussian and non-gaussian clustering. Biometrics 49(3): 803.  https://doi.org/10.2307/2532201.CrossRefGoogle Scholar
  9. Castles, Francis Geoffrey, Hrsg. 1993. Families of nations. Patterns of public policy in western democracies. Aldershot: Dartmouth.Google Scholar
  10. De Amorim, Renato Cordeiro. 2012. Feature weighting for clustering. Saarbrücken: Lap Lambert Academic Publ.Google Scholar
  11. Ennser, Laurenz. 2012. The homogeneity of West European party families: The radical right in comparative perspective. Party Politics 18(2): 151–171.  https://doi.org/10.1177/1354068810382936.CrossRefGoogle Scholar
  12. Esping-Andersen, Gosta. 1990. The three worlds of welfare capitalism. Cambridge: Polity Press.Google Scholar
  13. Everitt, Brian S., und Torsten Hothorn. 2011a. An introduction to applied multivariate analysis with R. New York: Springer New York.  https://doi.org/10.1007/978-1-4419-9650-3.CrossRefGoogle Scholar
  14. Everitt, Brian S., und Torsten Hothorn. 2011b. Cluster analysis. In An introduction to applied multivariate analysis with R, 163–200. New York: Springer New York.  https://doi.org/10.1007/978-1-4419-9650-3_6.CrossRefGoogle Scholar
  15. Everitt, Brian S., Sabine Landau, Morven Leese, und Daniel Stahl, Hrsg. 2011. Cluster analysis, Wiley series in probability and statistics, 5. Aufl. Chichester: Wiley.Google Scholar
  16. Francia, Peter L., John C. Green, Paul S. Herrnson, Lynda W. Powell, und Clyde Wilcox. 2005. Limousine liberals and corporate conservatives: The financial constituencies of the democratic and republican parties. Social Science Quarterly 86(4): 761–778.  https://doi.org/10.1111/j.0038-4941.2005.00354.x.CrossRefGoogle Scholar
  17. Gehne, David H. 2008. Bürgermeisterwahlen in Nordrhein-Westfalen, Stadtforschung aktuell, Bd. 111. Wiesbaden: VS Verlag für Sozialwissenschaften.Google Scholar
  18. Geiling, Heiko, Hrsg. 2011. Migration – Teilhabe – Milieus: Spätaussiedler und türkeistämmige Deutsche im sozialen Raum, 1. Aufl. Wiesbaden: VS Verlag für Sozialwissenschaften.Google Scholar
  19. Gnanadesikan, R., J. R. Kettenring, und S. L. Tsao. 1995. Weighting and selection of variables for cluster analysis. Journal of Classification 12(1): 113–136.  https://doi.org/10.1007/BF01202271.CrossRefGoogle Scholar
  20. Grimmer, Justin. 2010. A bayesian hierarchical topic model for political texts: Measuring expressed agendas in senate press releases. Political Analysis 18(1): 1–35.  https://doi.org/10.1093/pan/mpp034.CrossRefGoogle Scholar
  21. Grimmer, Justin, und Brandon M. Stewart. 2013. Text as data: The promise and pitfalls of automatic content analysis methods for political texts. Political Analysis 21(3): 267–297.  https://doi.org/10.1093/pan/mps028.CrossRefGoogle Scholar
  22. Handl, Andreas, und Torben Kuhlenkasper. 2017. Multivariate Analysemethoden: Theorie und Praxis mit R, 3., wesentl. überarb. Aufl. Statistik und ihre Anwendungen. Berlin: Springer Spektrum.Google Scholar
  23. Hellbrück, Reiner. 2016. Angewandte Statistik mit R. Wiesbaden: Springer Fachmedien Wiesbaden.  https://doi.org/10.1007/978-3-658-12862-3.CrossRefGoogle Scholar
  24. Hennig, Christian M. 2016. Clustering strategy and method selection. In Handbook of cluster analysis. Chapman & Hall/CRC handbooks of modern statistical methods 9, Hrsg. Christian M. Hennig, Marina Meilă, Fionn Murtagh und Roberto Rocci, 703–730. Boca Raton: CRC Press, Taylor & Francis Group.Google Scholar
  25. Hennig, Christian M., Marina Meilă, Fionn Murtagh, und Roberto Rocci, Hrsg. 2016. Handbook of cluster analysis, Chapman & Hall/CRC handbooks of modern statistical methods 9. Boca Raton: CRC Press, Taylor & Francis Group.Google Scholar
  26. Höppner, Frank, Frank Klawonn, Rudolf Kruse, und Thomas Runkler. 1999. Fuzzy cluster analysis: Methods for classification, data analysis, and image recognition. Chichester/New York: J. Wiley.Google Scholar
  27. Huang, Hanwen, Yufeng Liu, David N. Hayes, Andrew Nobel, J. S. Marron, und Christian M. Hennig. 2016. Significance testing in clustering. In Handbook of cluster analysis. Chapman & Hall/CRC handbooks of modern statistical methods 9, Hrsg. Christian M. Hennig, Marina Meilă, Fionn Murtagh und Roberto Rocci, 315–335. Boca Raton: CRC Press, Taylor & Francis Group.Google Scholar
  28. Jain, Anil K. 2010. Data clustering: 50 years beyond K-means. Pattern Recognition Letters 31(8): 651–666.  https://doi.org/10.1016/j.patrec.2009.09.011.CrossRefGoogle Scholar
  29. Jang, Jaewon, und David Hitchcock. 2012. Model-based cluster analysis of democracies. Journal of Data Science 10(2): 321–343.Google Scholar
  30. Jayaram, Balasubramaniam, und Frank Klawonn. 2013. Can fuzzy clustering avoid local minima and undesired partitions? In Computational intelligence in intelligent data analysis, Hrsg. Christian Moewes und Andreas Nürnberger, 31–44. Berlin/Heidelberg: Springer Berlin Heidelberg.  https://doi.org/10.1007/978-3-642-32378-2_3.CrossRefGoogle Scholar
  31. Jefferson West, W. 2005. Regional cleavages in turkish politics: An electoral geography of the 1999 and 2002 national elections. Political Geography 24(4): 499–523.  https://doi.org/10.1016/j.polgeo.2005.01.003.CrossRefGoogle Scholar
  32. Kaufman, Leonard, und Peter J. Rousseeuw. 2005. Finding groups in data: An introduction to cluster analysis, Wiley series in probability and mathematical statistics. Hoboken: Wiley.Google Scholar
  33. Klawonn, Frank. 2004. Fuzzy clustering: Insights and new approach. Mathware and Soft Computing 11(2–3): 125–142.Google Scholar
  34. Leisch, Friedrich. 2016. Resampling methods for exploring cluster stability. In Handbook of cluster analysis. Chapman & Hall/CRC handbooks of modern statistical methods 9, Hrsg. Christian M. Hennig, Marina Meilă, Fionn Murtagh und Roberto Rocci, 637–652. Boca Raton: CRC Press, Taylor & Francis Group.Google Scholar
  35. Lemke, Matthias, und Gregor Wiedemann, Hrsg. 2016. Text Mining in den Sozialwissenschaften. Wiesbaden: Springer Fachmedien Wiesbaden.  https://doi.org/10.1007/978-3-658-07224-7.CrossRefGoogle Scholar
  36. Lijphart, Arend. 1999. Patterns of democracy : Government forms and performance in thirty-six countries. New Haven: Yale University Press.Google Scholar
  37. Maag, Simon, und Hanspeter Kriesi. 2016. Politicisation, conflicts and the structuring of the EU political space. In Politicising Europe, Hrsg. Swen Hutter, Edgar Grande und Hanspeter Kriesi, 207–239. Cambridge: Cambridge University Press.  https://doi.org/10.1017/CBO9781316422991.010.CrossRefGoogle Scholar
  38. Milligan, Glenn W., und Martha C. Cooper. 1988. A study of standardization of variables in cluster analysis. Journal of Classification 5(2): 181–204.  https://doi.org/10.1007/BF01897163.CrossRefGoogle Scholar
  39. Mirkin, Boris. 2016. Quadratic error and k-means. In Handbook of cluster analysis. Chapman & Hall/CRC handbooks of modern statistical methods 9, Hrsg. Christian M. Hennig, Marina Meilă, Fionn Murtagh und Roberto Rocci, 33–54. Boca Raton: CRC Press, Taylor & Francis Group.Google Scholar
  40. Mochmann, Ingvill C., und Yasemin El-menouar. 2005. Lifestyle groups, social milieus and party preference in eastern and western Germany: Theoretical considerations and empirical results. German Politics 14(4): 417–437.  https://doi.org/10.1080/09644000500340594.CrossRefGoogle Scholar
  41. Mojena, Richard. 1977. Hierarchical grouping methods and stopping rules: An evaluation. The Computer Journal 20(4): 359–363.  https://doi.org/10.1093/comjnl/20.4.359.CrossRefGoogle Scholar
  42. Obinger, Herbert, und Uwe Wagschal. 2001. Families of nations and public policy. West European Politics 24(1): 99–114.  https://doi.org/10.1080/01402380108425419.CrossRefGoogle Scholar
  43. Powell, Martin, und Armando Barrientos. 2004. Welfare regimes and the welfare mix. European Journal of Political Research 43(1): 83–105.  https://doi.org/10.1111/j.1475-6765.2004.00146.x.CrossRefGoogle Scholar
  44. Rabe-Hesketh, Sophia, und Brian S. Everitt. 2007. A handbook of statistical analyses using Stata, 4. Aufl. Boca Raton: Chapman & Hall/CRC.Google Scholar
  45. Rousseeuw, Peter J. 1987. Silhouettes: A graphical aid to the interpretation and validation of cluster analysis. Journal of Computational and Applied Mathematics 20:53–65.  https://doi.org/10.1016/0377-0427(87)90125-7.CrossRefGoogle Scholar
  46. Saint-Arnaud, Sébastien, und Paul Bernard. 2003. Convergence or resilience? A hierarchical cluster analysis of the welfare regimes in advanced countries. Current Sociology 51(5): 499–527.  https://doi.org/10.1177/00113921030515004.CrossRefGoogle Scholar
  47. Schneider, Martin R., und Mihai Paunescu. 2012. Changing varieties of capitalism and revealed comparative advantages from 1990 to 2005: A test of the hall and soskice claims. Socio-Economic Review 10(4): 731–753.  https://doi.org/10.1093/ser/mwr038.CrossRefGoogle Scholar
  48. Stahl, Daniel, und Hannah Sallis. 2012. Model-based cluster analysis. Wiley Interdisciplinary Reviews: Computational Statistics 4(4): 341–358.  https://doi.org/10.1002/wics.1204.CrossRefGoogle Scholar
  49. Steinley, Douglas. 2016. K-Medoids and other criteria for crisp clustering. In Handbook of cluster analysis. Chapman & Hall/CRC handbooks of modern statistical methods 9, Hrsg. Christian M. Hennig, Marina Meilă, Fionn Murtagh und Roberto Rocci, 55–66. Boca Raton: CRC Press, Taylor & Francis Group.Google Scholar
  50. Steinley, Douglas, und Michael J. Brusco. 2007. Initializing K-means batch clustering: A critical evaluation of several techniques. Journal of Classification 24(1): 99–121.  https://doi.org/10.1007/s00357-007-0003-0.CrossRefGoogle Scholar
  51. Steinley, Douglas, und Michael J. Brusco. 2008. Selection of variables in cluster analysis: An empirical comparison of eight procedures. Psychometrika 73(1): 125–144.  https://doi.org/10.1007/s11336-007-9019-y.CrossRefGoogle Scholar
  52. Tenscher, Jens, und Philipp Scherer. 2012. Jugend, Politik und Medien: politische Orientierungen und Verhaltensweisen von Jugendlichen in Rheinland-Pfalz, Studien zur politischen Kommunikation, Bd. 4. Wien: Lit.Google Scholar
  53. Tibshirani, Robert, Guenther Walther, und Trevor Hastie. 2001. Estimating the number of clusters in a data set via the gap statistic. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 63(2): 411–423.  https://doi.org/10.1111/1467-9868.00293.CrossRefGoogle Scholar
  54. Wagschal, Uwe. 1999. Statistik für Politikwissenschaftler. München: Oldenbourg.Google Scholar
  55. Weiss, Sholom M., Nitin Indurkhya, und Tong Zhang. 2010. Fundamentals of predictive text mining, Texts in computer science. London: Springer London.  https://doi.org/10.1007/978-1-84996-226-1.CrossRefGoogle Scholar
  56. Wiedenbeck, Michael, und Cornelia Züll. 2010. Clusteranalyse. In Handbuch der sozialwissenschaftlichen Datenanalyse, Hrsg. Christof Wolf und Henning Best, 525–552. Wiesbaden: VS Verlag für Sozialwissenschaften.  https://doi.org/10.1007/978-3-531-92038-2_21.
  57. Wolfson, Murray, Zagros Madjd-Sadjadi, und Patrick James. 2004. Identifying national types: A cluster analysis of politics, economics, and conflict. Journal of Peace Research 41(5): 607–623.  https://doi.org/10.1177/0022343304045975.CrossRefGoogle Scholar
  58. Xu, Rui, und Donald C. Wunsch. 2009. Clustering, IEEE Press series on computational intelligence. Hoboken/Piscataway: Wiley/IEEE Press.Google Scholar

Copyright information

© Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2018

Authors and Affiliations

  1. 1.Institut für PolitikwissenschaftGoethe Universität FrankfurtFrankfurtDeutschland

Personalised recommendations