Zusammenfassung
Das Ziel des vorliegenden Beitrags besteht darin, die Bedeutung von Messinvarianz für die vergleichende Forschung herauszustellen und exemplarisch anhand des in der Studie PIRLS eingesetzten Instruments des Leseselbstkonzepts für die Staaten Deutschland, Niederlande, Norwegen und Schweden für die Jahre 2001 und 2006 zu überprüfen. Anhand von Multigruppenvergleichen im Rahmen konfirmatorischer Faktorenanalysen kann für das Jahr 2006 statistische Invarianz bestätigt werden. Für das Jahr 2001 liegt partielle strikte faktorielle Invarianz vor, ein Item für einen Staat wurde zu diesem Zweck freigesetzt.
Abstract
This paper illustrates the importance of testing for measurement invariance in comparative studies by the example of the reading self-concept in PIRLS 2001 and PIRLS 2006 for four countries: Germany, Netherlands, Norway and Sweden. Using multigroup confirmatory factor analyses, measurement invariance is confirmed for the data of 2006. For the data of 2001 partial measurement invariance can be assumed; one item in one state is freed for this purpose.
Notes
Die Theta Parametrisation ermöglicht es gegenüber der Delta Parametrisation, die Residualvarianzen für latente Response-Variablen der beobachteten kategorialen abhängigen Variablen zu schätzen. Dafür wird in einer Gruppe die Residualvarianz standardmäßig aus Identifikationsgründen auf eins fixiert und in allen anderen Gruppen frei geschätzt (Muthén und Muthén 1998–2012).
Auch wenn die unstandardisierten Parameter über die Staaten hinweg gleichgesetzt werden, können sich die standardisierten Lösungen für die einzelnen Staaten unterscheiden. Ursache hierfür ist die unterschiedliche Höhe der Varianz in den einzelnen Staaten, die in die Schätzung der standardisierten Pfadkoeffizienten eingeht.
Eine Übersicht über diese Projekte kann der Homepage „Lesen in Deutschland“ unter http://www.lesen-in-deutschland.de/html/index.php [letzter Zugriff: 14.12.2011] entnommen werden.
Literatur
Arbeitsgruppe Internationale Vergleichsstudie (Bundesministerium für Bildung und Forschung). (Hrsg.). (2007). Vertiefender Vergleich der Schulsysteme ausgewählter PISA-Teilnehmerstaaten (3. Aufl.), Bundesministerium für Bildung und Forschung (BMBF). Bildungsforschung: 2. Verfügbar unter http://www.bmbf.de/pub/pisa-vergleichsstudie.pdf. Zugegriffen: 21. Juni 2011.
Bos, W., Valtin, R., Lankes, E.-M., Schwippert, K., Voss, A., Badel, I., et al. (2004). Lesekompetenzen am Ende der vierten Jahrgangsstufe in einigen Ländern der Bundesrepublik Deutschland im nationalen und internationalen Vergleich. In W. Bos, E. M. Lankes, M. Prenzel, K. Schwippert, R. Valtin, & G. Walther (Hrsg.), IGLU. Einige Länder der Bundesrepublik Deutschland im nationalen und internationalen Vergleich (S. 49–92). Münster: Waxmann.
Bos, W., Valtin, R., Hornberg, S., Buddeberg, I., Goy, M., & Voss, A. (2007). Internationaler Vergleich 2006: Lesekompetenzen von Schülerinnen und Schülern am Ende der vierten Jahrgangsstufe. In W. Bos, S. Hornberg, K.-H. Arnold, G. Faust, L. Fried, E. M. Lankes, et al. (Hrsg.), IGLU 2006. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich (S. 109–160). Münster: Waxmann.
Bos, W., Strietholt, R., Goy, M., Stubbe, T. C., Tarelli, I., & Hornberg, S. (2010). IGLU 2006– Dokumentation der Erhebungsinstrumente. Münster: Waxmann.
Byrne, B. M., Shavelson, R. J., & Muthén, B. O. (1989). Testing for the equivalence of factor covariance and mean structures: The issue of partial measurement invariance. Psychological Bulletin, 105, 456–466.
Chapman, J. W., Tunmer, W. E., & Prochnow, J. E. (2000). Early reading-related skills and performance, reading self-concept, and the development of academic self-concept: A longitudinal study. Journal of Educational Psychology, 92, 703–708.
Cheung, G. W., & Rensvold, R. B. (2002). Evaluating goodness-of-fit indexes for testing measurement invariance. Structural Equation Modeling, 9, 233–255.
Döbert, H. (2010). Deutschland. In H. Döbert, W. Hörner, B. von Kopp, & L. R. Reuter (Hrsg.), Die Bildungssysteme Europas (3. Aufl., S. 175–203). Baltmannsweiler: Schneider.
Döbert H., & Sroka W. (Hrsg.). (2004). Features of successful school systems. A comparison of schooling in six countries (Studien zur International und Interkulturell Vergleichenden Erziehungswissenschaft, Bd. 4). Münster: Waxmann.
Döbert H., Klieme E., & Sroka W. (Hrsg.). (2004). Conditions of school performance in seven countries. A quest for understanding the international variation of PISA results (Studien zur International und Interkulturell Vergleichenden Erziehungswissenschaft, Bd. 3). Münster: Waxmann.
Elley W. B. (Hrsg.). (1994). The IEA Study of Reading Literacy. Achievement and instruction in thirty-two school systems. Oxford: Pergamon Press.
Hannover, B., & Kühnen, U. (2002). Der Einfluss independenter und interdependenter Selbstkonstruktion auf die Informationsverarbeitung im sozialen Kontext. Psychologische Rundschau, 53(2), 61–76.
Helfrich, H. (1993). Methodologie kulturvergleichender psychologischer Forschung. In A. Thomas (Hrsg.), Kulturvergleichende Psychologie. Eine Einführung (S. 81–102). Göttingen: Hogrefe.
Helmke, A. (1992). Selbstvertrauen und schulische Leistungen. Göttingen: Hogrefe.
Horn, J. L. (1991). Comments on ‚Issues of Factorial Invariance‘. In L. M. Collins & J. L. Horn (Hrsg.), Best methods for the analysis of change (S. 114–125). Washington, DC: American Psychological Association.
Horn, J. L., & McArdle, J. J. (1992). A practical and theoretical guide to measurement invariance in aging Research. Experimental Aging Research, 3, 117–144.
Hornberg, S., Bos, W., Buddeberg, I., Potthoff, B., & Stubbe, T. C. (2007). Anlage und Durchführung von IGLU 2006. In W. Bos, S. Hornberg, K.-H. Arnold, G. Faust, L. Fried, E.-M. Lankes, et al. (Hrsg.), IGLU 2006. Lesekompetenzen von Grundschulkindern in Deutschland im internationalen Vergleich (S. 21–45). Münster: Waxmann.
Hu, L.-T., & Bentler, P. M. (1999). Cutoff criteria for fit indexes in covariance structure analysis: Conventional criteria versus new alternatives. Structural Equation Modeling, 6, 1–55.
Kelly, D. L. (2003). Developing the PIRLS background questionnaires. In M. O. Martin, I. V. S. Mullis, & A. M. Kennedy (Hrsg.), PIRLS 2001 technical report (S. 29–40). Chestnut Hill: International Study Center.
Krapp, A. (1997). Selbstkonzept und Leistung – Dynamik ihres Zusammenspiels: Literaturüberblick. In F. E. Weinert & A. Helmke (Hrsg.), Entwicklung im Grundschulalter (S. 325–339). Weinheim: Beltz.
Kühnen, U., & Hannover, B. (2003). Kultur, Selbstkonzept und Kognition. Zeitschrift für Psychologie, 211(4), 212–224.
Lankes, E.-M., Bos, W., Mohr, I., Plaßmeier, N., Schwippert, K., Sibberns, H., et al. (2003). Anlage und Durchführung der Internationalen Grundschul-Lese-Untersuchung (IGLU) und ihrer Erweiterung um Mathematik und Naturwissenschaften (IGLU-E). In W. Bos, E.-M. Lankes, M. Prenzel, K. Schwippert, G. Walther, & R. Valtin (Hrsg.), Erste Ergebnisse aus IGLU. Schülerleistungen am Ende der vierten Jahrgangsstufe im internationalen Vergleich (S. 7–28). Münster: Waxmann.
Lüdtke, O., Robitzsch, A., Trautwein, U., & Köller, O. (2007). Umgang mit fehlenden Werten in der psychologischen Forschung: Probleme und Lösungen. Psychologische Rundschau, 58, 103–117.
MacCallum, R. C., Browne, M. W., & Sugawara, H. M. (1996). Power analysis and determination of sample size for covariance structure modeling. Psychological Methods, 1, 130–149.
Markus, H. R., & Kitayama, S. (1991). Culture and the self: Implications for cognition, emotion, and motivation. Psychological Review, 98(2), 224–253.
Marsh, H. W. (1990). A multidimensional, hierarchical model of self-concept: Theoretical and empirical justification. Educational Psychology Review, 2, 77–172.
Marsh, H. W., Byrne, B. M., & Shavelson, R. (1988). A multifaceted academic self-concept: Its hierarchical structure and its relation to academic achievement. Journal of Educational Psychology, 80, 366–380.
Martin, M. O., Mullis, I. V. S., & Kennedy, A. M. (Hrsg.). (2003). PIRLS 2001 technical report. Chestnut Hill: International Study Center.
Mead, G. H. (1934). Mind, self, and society. Chicago: University of Chicago Press.
Meade, A. W., Johnson, E. C., & Braddy, P. W. (2008). Power and sensitivity of alternative fit indices in tests of measurement invariance. Journal of Applied Psychology, 93, 568–592.
Meredith, W. (1993). Measurement invariance, factor analysis and factorial invariance. Psychometrika, 58, 525–543.
Millsap, R. E., & Yun-Tein, J. (2004). Assessing factorial invariance in ordered-categorial measures. Multivariate Behavioral Research, 39, 479–515.
Möller, J., & Trautwein, U. (2009). Selbstkonzept. In E. Wild & J. Möller (Hrsg.), Pädagogische Psychologie (S. 179–204). Berlin: Springer.
Mullis, I. V. S., Martin, M. O., Gonzalez, E., & Kennedy, A. M. (2003). PIRLS 2001 international report: IEA’s study of reading literacy achievement in primary school in 35 countries. Chestnut Hill: International Study Center.
Muthén, L. K., & Muthén, B. O. (1998–2010). Mplus (Version 6.1) (Computer Software). Los Angeles.
Muthén, L. K., & Muthén, B. O. (1998–2012). Mplus User’s Guide (7. Aufl.). Los Angeles: Muthén & Muthén.
Muthén, L. K., & Muthén, B. O. (2002). How to use a monte carlo study to decide on sample size and determine power. Structural Equation Modeling, 9(4), 599–620.
Muthén, B., du Toit, S. H. C., & Spisic, D. (1997). Robust inference using weighted least squares and quadratic estimating equations in latent variable modeling with categorical and continuous outcomes. Accepted for publication in Psychometrika.
Nagy, G., & Neumann, M. (2010). Psychometrische Aspekte des Tests zu den voruniversitären Mathematikleistungen in TOSCA-2002 und TOSCA-2006: Unterrichtsvalidität, Rasch-Homogenität und Messäquivalenz. In U. Trautwein, M. Neumann, G. Nagy, O. Lüdtke, & K. Maaz (Hrsg.), Schulleistungen von Abiturienten: Die neu geordnete gymnasiale Oberstufe auf dem Prüfstand (S. 281–306). Wiesbaden: VS Verlag für Sozialwissenschaften.
Nonte, S. (2012). Die Überprüfung von geschlechtsbezogener Messinvarianz des Fähigkeitsselbstkonzepts von Grundschülern in der Schuleingangsphase. Empirische Pädagogik, 26(4), 478–503.
Pöhlmann, C., Hannover, B., Kühnen, U., & Birkner, N. (2002). Independente und interdependente Selbstkonzepte als Determinanten des Selbstwerts. Zeitschrift für Sozialpsychologie, 33(2), 111–121.
Reinecke, J. (2005). Strukturgleichungsmodelle in den Sozialwissenschaften. München: Oldenbourg.
Rippl, S., & Seipel, C. (1997). Gruppenunterschiede – Fakt oder Artefakt? Das Problem der Bedeutungsäquivalenz am Beispiel der Rechtsextremismusforschung. Zeitschrift für Soziologie, 26(2), 139–150.
Rippl, S., & Seipel, C. (2008). Methoden kulturvergleichender Sozialforschung: Eine Einführung. Wiesbaden: VS Verlag für Sozialwissenschaften.
Rutkowski, L., Gonzalez, E., Joncas, M., & von Davier, M. (2010). International Large-Scale Assessment Data: Issues in Secondary Analysis and Reporting. Educational Researcher, 39(2), 142–151.
Schulz, W., & Fraillon, J. (2009, September). The analysis of measurement invariance in international studies using the rasch model. Paper presented to the symposium on „Rasch measurement: present, past and future“ at the European Conference on Educational Research (ECER), Vienna.
Shavelson, R. J., Hubner, J. J., & Stanton, G. C. (1976). Self-concept: Validation of construct interpretations. Review of Educational Research, 46(3), 407–441.
Steenkamp, J.-B. E. M., & Baumgartner, H. (1998). Assessing measurement invariance in cross-national consumer research. Journal of Consumer Research, 25, 78–90.
Torsheim, T., Samdal, O., Rasmussen, M., Freeman, J., Griebler, R., & Dür, W. (2010). Cross-national measurement invariance of the teacher and classmate support scale. Social Indicators Research, 10.1007/s11205-010-9770-9.
Valtin, R., Bos, W., Buddeberg, I., Goy, M., & Potthoff, B. (2008). Lesekompetenzen von Schülerinnen und Schülern am Ende der vierten Jahrgangsstufe im nationalen und internationalen Vergleich. In W. Bos, S. Hornberg, K. H. Arnold, G. Faust, L. Fried, & E.-M. Lankes (Hrsg.), IGLU-E 2006: Die Länder der Bundesrepublik Deutschland im nationalen und internationalen Vergleich (S. 51–101). Münster: Waxmann.
Vandenberg, R. J., & Lance, C. E. (2003). A Review and Synthesis of the Measurement Invariance Literature: Suggestions, Practices, and Recommendations for Organizational Research. Organizational Research Methods, 3(1), 4–70.
Van de Ven, B. (2010). Niederlande. In H. Döbert, W. Hörner, B. von Kopp, & L. R. Reuter (Hrsg.), Die Bildungssysteme Europas (3. Aufl., S. 506–525). Baltmannsweiler: Schneider.
Walther, G., Schwippert, K., Lankes, E.-M., & Stubbe, T. (2008). Können Mädchen doch rechnen? Vertiefende Analysen zu Geschlechtsdifferenzen im Bereich Mathematik auf Basis der Internationalen Grundschule-Lese-Untersuchung. Zeitschrift für Erziehungswissenschaft, 11, 30–46.
Weins, C. (2008). Möglichkeiten und Grenzen des internationalen Vergleichs fremdenfeindlicher Vorurteile. Sozialwissenschaftlicher Fachinformationsdienst soFid, Methoden und Instrumente der Sozialwissenschaften, 1, 25–43. http://www.ssoar.info/ssoar/View/?resid=20515. Zugegriffen: 29. Juni 2011.
Widaman, K. F., Ferrer, E., & Conger, R. D. (2010). Factorial invariance within longitudinal structural equation models: Measuring the same construct across time. Child Development Perspectives, 4(1), 10–18.
Wu, A. D., Li, Z., & Zumbo, B. D. (2007). Decoding the meaning of factorial invariance and updating the practice of multi-group confirmatory factor analysis: a demonstration with TIMSS data. Pratical Assessment. Research & Evaluation, 12(3), 1–26.
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
About this article
Cite this article
Schulte, K., Nonte, S. & Schwippert, K. Die Überprüfung von Messinvarianz in international vergleichenden Schulleistungsstudien am Beispiel der Studie PIRLS. Z f Bildungsforsch 3, 99–118 (2013). https://doi.org/10.1007/s35834-013-0062-8
Accepted:
Published:
Issue Date:
DOI: https://doi.org/10.1007/s35834-013-0062-8