Zusammenfassung
Wie bereits in TIMSS II erfolgten die Testkonstruktion und Interpretation der Testergebnisse auf der Grundlage logistischer Testmodelle. Die dabei verwendete Software ConQuest (vgl. Adams, Wilson, & Wu, 1997; Wu, 1998) kann die Aufgabenparameter und Probandenparameter auch dann schätzen, wenn ein großer Aufgabenvorrat so auf mehrere Testhefte verteilt wird, dass ein Testheft immer nur einen Teil der Aufgaben enthält, es aber in je zwei Testheften immer gemeinsame Aufgaben gibt. Solche verbindenden Aufgaben nennt man Ankeraufgaben.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Preview
Unable to display preview. Download preview PDF.
Literatur
Adams, R. (2002). Scaling PISA cognitive data. In R. Adams & M. Wu, PISA 2000 Technical Report (pp. 99–108 ). Paris: OECD.
Adams, R., & Carstensen, C. (2002). Scaling Outcomes. In R. Adams & M. Wu, PISA 2000 Technical Report (pp. 149–162 ). Paris: OECD.
Adams, R. J., Wilson, M. R., & Wu, M. L. (1997). Multilevel item response modeling: An approach to errors in variables regression. Journal of Educational and Behavioral Statistics, 22, 47–76.
Andersen, E. B. (1991). The statistical analysis of categorial data. Berlin: Springer.
Artelt, C., Stanat, P., Schneider, W., & Schiefele, U. (2001). Lesekompetenz: Testkon-zeption und Ergebnisse. In J. Baumert, E. Klieme, M. Neubrand, M. Prenzel, U. Schiefele, W. Schneider, P. Stanat, K.-J. Tillmann, & M. Weiß (Hrsg.), PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 69–137 ). Opladen: Leske + Budrich.
Baumert, J., Klieme, E., Neubrand, M., Prenzel, M., Schiefele, U., Schneider, W., Stanat, P., Tillmann, K.-J., & Weiß, M. (Hrsg.). (2001). PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich. Opladen: Leske + Budrich.
Baumert, J., Stanat, P., & Demmrich, A. (2001). PISA 2000: Untersuchungsgegenstand, theoretische Grundlagen und Durchführung der Studie. In J. Baumert, E. Klieme, M. Neubrand, M. Prenzel, U. Schiefele, W. Schneider, P. Stanat, K.-J. Tillmann, & M. Weiß (Hrsg.), PISA 2000. Basiskompetenzen von Schülerinnen und Schülern im internationalen Vergleich (S. 15–68 ). Opladen: Leske + Budrich.
Beaton, A. E., & Allen, N. L. (1992). Interpreting scales through scale anchoring. Journal of Educational Statistics, 17 (2), 191–204.
Bock, R. D., & Aitken, M. (1981). Marginal likelihood estimation of item parameters: An application of the EM algorithm. Psychometrika, 46, 443–459.
Dempster, A. P., Laird, N. M., & Rubin, D. B. (1977). Maximum likelihood from incom-plete data via the EM algorithm. Journal of the Royal Statistical Society, Series B, 39, 1–38.
Fischer, G., & Molenaar, I. W. (Eds.). (1995). Rasch models: Foundations, recent developments and applications. New York: Springer.
Knoche, N., & Lind, D. (2000). Eine Analyse der Aussagen und Interpretationen von TIMSS unter Betonung methodologischer Aspekte. Journal für Mathematik-Didaktik, 21 (1), 3–27.
Knoche, N., Lind, D., Blum, W., Cohors-Fresenborg, E., Flade, L., Löding, W., Möller, G., Neubrand, M., & Wynands, A. (Deutsche PISA-2000-Expertengruppe Mathematik). (2002). Die PISA-2000-Studie, einige Ergebnisse und Analysen. Journal für Mathematik-Didaktik, 23 (3/4), 159–202.
Lind, D. (1994). Probabilistische Testmodelle in der Empirischen Pädagogik. Mannheim: Wissenschaftsverlag.
Lord, F. M. (1980). Applications of item response theory to practical testing problems. Hillsdale, Nf: Erlbaum.
Lord, F. M., & Novick, M. R. (& Birnbaum, A.). (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
Masters, G. N. (1982). A Rasch model for partial credit scoring. Psychometrika, 47, 149–174.
Mislevy, R. J., Beaton, A. E., Kaplan, B., & Sheehan, K. M. (1992). Estimating population characteristics from sparse matrix samples of item responses. Journal of Educational Measurement, 2C ) (2), 133–161.
Mislevy, R. J., Johnson, E. G., & Musaki, E. (1992). Scaling procedures in NAEP. Journal of Educational Statistics, 17 (2), 131–154.
Rasch, G. (1980). Probabilistic models for some intelligence and attainment tests. Chicago: University of Chicago Press. [Original work published 1960 ]
Rost, J. (1996). Lehrbuch Testtheorie, Testkonstruktion. Bern: Huber.
Thissen, D., Steinberg, L., & Gerard, M. (1986). Beyond group mean differences: The concept of item bias. Psychological Bulletin, 99, 118–128
Thissen, D., Steinberg, L., & Wainer, H. (1988). Use of item response theory in the study of group differences in trace lines. In H. Wainer & H. Braum (Eds.), Test validity (pp. 147–169 ). Hillsdale, NJ: Erlbaum.
Thissen, D., Steinberg, L., & Wainer, H. (1993). Detection of differential item functioning using the parameters of item response models. In P. Holland & H. Wainer (Eds.), Differential item functioning (pp. 67–113 ). Hillsdale, NJ: Erlbaum.
Wang, W.-C. (2000). The simultaneous factorial analysis of differential item functioning. Methods of Psychological Research Online 2000, 5 (1), 57–75.
Wilson, M. R., & Adams, R. J. (1996). Rasch models for item bundles. Psychometrika, 60, 181–198.
Wu, M. L. (1998). ACER ConQuest: Generalised item response modelling software manual. Melbourne: ACER.
Editor information
Rights and permissions
Copyright information
© 2004 VS Verlag für Sozialwissenschaften/GWV Fachverlage GmbH, Wiesbaden
About this chapter
Cite this chapter
Lind, D., Knoche, N. (2004). Testtheoretische Modelle und Verfahren bei PISA-2000-Mathematik. In: Neubrand, M. (eds) Mathematische Kompetenzen von Schülerinnen und Schülern in Deutschland. VS Verlag für Sozialwissenschaften. https://doi.org/10.1007/978-3-322-80661-1_4
Download citation
DOI: https://doi.org/10.1007/978-3-322-80661-1_4
Publisher Name: VS Verlag für Sozialwissenschaften
Print ISBN: 978-3-531-14456-6
Online ISBN: 978-3-322-80661-1
eBook Packages: Springer Book Archive