Zusammenfassung
Ein Test/Fragebogen ist umso wissenschaftlicher, je mehr Qualitätsanforderungen („Gütekriterien“) bei einer Konstruktion erfüllt werden. Die Berücksichtigung folgender „allgemeiner“ Gütekriterien erfordert keine besonderen testtheoretischen Kenntnisse: Durchführungs-, Auswertungs- und Interpretationsobjektivität, aber auch weitere Aspekte wie Ökonomie, Nützlichkeit, Zumutbarkeit, Fairness und Unverfälschbarkeit. Für wissenschaftliche Tests/Fragebogen sind zudem die „speziellen, testtheoriebasierten“ Gütekriterien der Reliabilität und Validität relevant. Sie setzen testtheoretische Grundlagen und Betrachtungen voraus. Die Reliabilität befasst sich mit der Überprüfung der Messgenauigkeit und die Validität mit der Frage, ob ein Test das Merkmal, das er messen soll, auch wirklich misst, und vor allem, ob die auf einem Testergebnis aufbauenden Interpretationen und Schlussfolgerungen belastbar sind. Hierbei ist besonders die Kriteriumsvalidität bedeutsam für die Berechtigung extrapolierender Schlussfolgerungen sowie die Konstruktvalidität für die Struktur und Dimensionalität der untersuchten Merkmale.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
- 2.
Im Fall der Schuleingangsuntersuchung, die sehr unterschiedliche Merkmale erfasst (u. a. Seh- und Hörvermögen, Aufmerksamkeit), ist zu erwarten, dass sich eine mehrdimensionale Lösung ergeben würde.
- 3.
Der Begriff des „simulationsorientierten Zugangs“ unterscheidet sich vom gleichnamigen Begriff, wie er beispielsweise in der Pädagogik verwendet wird, wenn eingeweihte Akteure (etwa Schauspieler) in einer Untersuchungssituation eine Situation selbst „simulieren“.
Literatur
Bollen, K. A. (1980). Issues in the comparative measurement of political democracy. American Sociological Review, 45, 370–390.
Bortz, J. & Schuster, C. (2010). Statistik für Human und Sozialwissenschaftler. Berlin, Heidelberg: Springer.
Cattell, R. B. & Weiß, R. H. (1971). Grundintelligenztest Skala 3 (CFT 3). Göttingen: Hogrefe.
Costa, P. T. & McCrae, R. R. (1985). The NEO Personality Inventory Manual. Odessa, FL: Psychological Assessment Resources.
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297–334.
Cronbach, L. J. & Meehl, P. E. (1955). Construct Validity in Psychological Tests. Psychological Bulletin, 52, 281–302.
Deutsches Institut für Normung e.V. (DIN). (2002). DIN 33430:2002-06: Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen. Berlin: Beuth.
Deutsches Institut für Normung e.V. (DIN). (2016). DIN 33430:2016-07: Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen. Berlin: Beuth.
Eid, M. (2000). A multitrait-multimethod model with minimal assumptions. Psychometrika, 65, 241–261.
Eid, M. & Schmidt, K. (2014). Testtheorie und Testkonstruktion. Göttingen: Hogrefe.
Heilbrun, A. B. (1964). Social learning theory, social desirability, and the MMPI. Psychological Bulletin, 61, 377–387.
Institut für Test- und Begabungsforschung (Hrsg.). (1988). Test für medizinische Studiengänge (aktualisierte Originalversion 2). Herausgegeben im Auftrag der Kultusminister der Länder der BRD (2. Aufl.). Göttingen: Hogrefe.
Jöreskog, K. G. & Sörbom, D. (1996). LISREL 8 User’s Reference Guide. Chicago: Scientific Software International.
Kendall, M. G. (1962). Rank Correlation Methods. London, UK: Griffin.
Kubinger, K. D. (1997). Zur Renaissance der objektiven Persönlichkeitstests sensu R. B. Cattell. In H. Mandl (Hrsg.), Bericht über den 40. Kongreß der Deutschen Gesellschaft für Psychologie in München 1996 (S. 755–761). Göttingen: Hogrefe.
Kubinger, K. D. (2001). Zur Qualitätssicherung psychologischer Tests – Am Beispiel des AID 2. Psychologie in Österreich, 21, 82–85.
Kubinger, K. D. (2003). Gütekriterien. In K. D. Kubinger & R. S. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik. (S. 195–204). Weinheim: Beltz PVU.
Lazarsfeld, P. F. & Henry, N. W. (1968). Latent structure analysis. Boston, MA: Houghton Mifflin.
Lienert, G. A. & Raatz, U. (1998). Testaufbau und Testanalyse. (6. Aufl.). Weinheim: Psychologie Verlags Union.
Liepmann, D., Beauducel, A., Brocke, B. & Amthauer, R. (2007). I-S-T 2000R Intelligenz-Struktur-Test 2000 R (2. Aufl.). Göttingen: Hogrefe.
Lord, F. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
Messick, S. (1989). Validity. In R. L. Linn (Ed.), Educational measurement (pp. 13–103). New York, NY: American Council on Education and Macmillan.
Michel, L. & Conrad, W. (1982). Testtheoretische Grundlagen psychometrischer Tests. In K.-J. Groffmann & L. Michel (Hrsg.), Enzyklopädie der Psychologie (Bd. 6, S. 19–70). Göttingen: Hogrefe.
McDonald, R. P. (1999). Test Theory: A Unified Treatment. New York, NY: Psychology Press.
Moosbrugger, H. & Goldhammer, F. (2007). Frankfurter Adaptiver Konzentrationsleistungs-Test (FAKT II): Grundlegend neu bearbeitete und neu normierte 2. Auflage des FAKT von Moosbrugger und Heyden (1997). Göttingen: Hogrefe.
Moosbrugger, H. & Hartig, J. (2003). Klassische Testtheorie. In K. Kubinger und R. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik (S. 408–415). Weinheim: Psychologie Verlags Union.
Moosbrugger, H. & Kelava, A. (Hrsg.). (2012). Testtheorie und Fragebogenkonstruktion (2. Aufl.). Berlin, Heidelberg: Springer.
Moosbrugger, H. & Oehlschlägel, J. (2011). Frankfurter Aufmerksamkeits-Inventar 2 (FAIR-2). Bern, Göttingen: Huber.
Moosbrugger, H. & Rauch, W. (2010). Grundkenntnisse über Verfahren der Eignungsbeurteilung. In K. Westhoff, C. Hagemeister, M. Kersting, F. Lang, H. Moosbrugger, G. Reimann, G. Stemmler (Hrsg.), Grundwissen für die berufsbezogene Eignungsbeurteilung nach DIN 33430 (3. Aufl., S. 146–148). Lengerich: Pabst.
Ortner, T. M., Proyer, R. T. & Kubinger, K. D. (Hrsg.). (2006). Theorie und Praxis Objektiver Persönlichkeitstests. Bern, Stuttgart, Hans Huber.
Raykov, T. & Marcoulides, G. A. (2011). Psychometric Theory. New York, NY: Routledge.
Reiß, S. & Sarris, V. (2012). Experimentelle Psychologie. München: Pearson.
Revelle, W. & Condon, D. M. (2018). Reliability. In P. Irwing, T. Booth & D. Hughes (Eds.), The Wiley Blackwell Handbook of Psychometric Testing (pp. 709–749). Chichester, West Sussex, UK: Blackwell Publishing Ltd.
Revelle, W. & Zinbarg, R. E. (2009). Coefficients alpha, beta, omega, and the glb: Comments on Sijtsma. Psychometrika, 74, 145–154.
Rosenthal, R. & Rosnow, R. L. (1969). The volunteer subject. In R. Rosenthal & R. L. Rosnow (Eds.), Artifact in behavioral research (pp. 59–118). New York, NY: Academic Press.
Roskam, E. E. (1996). Latent-Trait-Modelle. In E. Erdfelder, R. Mausfeld, Th. Meiser & G. Rudinger (Hrsg.), Handbuch Quantitative Methoden (S. 431–458). Weinheim: Psychologie Verlags Union.
Rost, J. (1996). Lehrbuch Testtheorie, Testkonstruktion. Bern: Huber.
Steyer, R. (1987). Konsistenz und Spezifität: Definition zweier zentraler Begriffe der Differentiellen Psychologie und ein einfaches Modell zu ihrer Identifikation. Zeitschrift für Differentielle und Diagnostische Psychologie, 8, 245–258.
Steyer, R. & Eid, M. (2001). Messen und Testen (2. Aufl.). Berlin, Heidelberg: Springer.
Steyer, R., Mayer, A., Geiser, C. & Cole, D. A. (2015). A theory of states and traits-revised. Annual Review of Clinical Psychology, 11, 71–98.
Stumpf, H. (1996). Klassische Testtheorie. In: E. Erdfelder, R. Mansfeld, T. Meiser & G. Rudinger (Hrsg.), Handbuch Quantitative Methoden (S. 411–430). Weinheim: Beltz PVU.
Süß, H.-M. (2003). Culture fair. In K. D. Kubinger & R. S. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik (S. 82–86). Weinheim: Beltz.
Tent, L. & Stelzl, I. (1993). Pädagogisch-psychologische Diagnostik. Band 1: Theoretische und methodische Grundlagen. Göttingen: Hogrefe.
Testkuratorium (der Föderation deutscher Psychologenverbände). (1986). Mitteilung. Diagnostica, 32, 358–360.
Trost, G. (1994). Test für medizinische Studiengänge (TMS): Studien zur Evaluation (18. Arbeitsbericht). Bonn: ITB.
Viswesvaran, C. & Ones, D. S. (1999). Meta-analysis of fakability estimates: Implications for personality measurement. Educational and Psychological Measurement, 59, 197–210.
Westhoff, K., Hagemeister, C., Kersting, M., Lang, F., Moosbrugger, H., Reimann, G. & Stemmler, G. (Hrsg.). (2010). Grundwissen für die berufsbezogene Eignungsbeurteilung nach DIN 33430 (3. Aufl.). Lengerich: Pabst.
Wirtz, M. & Caspar, F. (2002). Beurteilerübereinstimmung und Beurteilerreliabilität. Methoden zur Bestimmung und Verbesserung der Zuverlässigkeit von Einschätzungen mittels Kategoriensystemen und Ratingskalen. Göttingen: Hogrefe.
Zinbarg, R. E., Revelle, W., Yovel, I. & Li, W. (2005). Cronbach’s α, Revelle’s β, and McDonald’s ωH: Their relations with each other and two alternative conceptualizations of reliability. Psychometrika, 70, 1–11.
Author information
Authors and Affiliations
Corresponding author
Editor information
Editors and Affiliations
Rights and permissions
Copyright information
© 2020 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature
About this chapter
Cite this chapter
Moosbrugger, H., Kelava, A. (2020). Qualitätsanforderungen an Tests und Fragebogen („Gütekriterien“). In: Moosbrugger, H., Kelava, A. (eds) Testtheorie und Fragebogenkonstruktion. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61532-4_2
Download citation
DOI: https://doi.org/10.1007/978-3-662-61532-4_2
Published:
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-662-61531-7
Online ISBN: 978-3-662-61532-4
eBook Packages: Psychology (German Language)