Qualitätsanforderungen an Tests und Fragebogen („Gütekriterien“)

Moosbrugger, Helfried; Kelava, Augustin

doi:10.1007/978-3-662-61532-4_2

Helfried Moosbrugger³ &
Augustin Kelava⁴

79k Accesses
21 Citations

Zusammenfassung

Ein Test/Fragebogen ist umso wissenschaftlicher, je mehr Qualitätsanforderungen („Gütekriterien“) bei einer Konstruktion erfüllt werden. Die Berücksichtigung folgender „allgemeiner“ Gütekriterien erfordert keine besonderen testtheoretischen Kenntnisse: Durchführungs-, Auswertungs- und Interpretationsobjektivität, aber auch weitere Aspekte wie Ökonomie, Nützlichkeit, Zumutbarkeit, Fairness und Unverfälschbarkeit. Für wissenschaftliche Tests/Fragebogen sind zudem die „speziellen, testtheoriebasierten“ Gütekriterien der Reliabilität und Validität relevant. Sie setzen testtheoretische Grundlagen und Betrachtungen voraus. Die Reliabilität befasst sich mit der Überprüfung der Messgenauigkeit und die Validität mit der Frage, ob ein Test das Merkmal, das er messen soll, auch wirklich misst, und vor allem, ob die auf einem Testergebnis aufbauenden Interpretationen und Schlussfolgerungen belastbar sind. Hierbei ist besonders die Kriteriumsvalidität bedeutsam für die Berechtigung extrapolierender Schlussfolgerungen sowie die Konstruktvalidität für die Struktur und Dimensionalität der untersuchten Merkmale.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 54.99; Price excludes VAT (USA)

Hardcover Book: USD 69.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

1.
Die Definition wurde gegenüber der an Lienert und Raatz (1998) orientierten Fassung der 2. Auflage (Moosbrugger und Kelava 2012) erneut überarbeitet und um den „relativen“ Grad sowie um „qualitative Kategorien“ erweitert.
2.
Im Fall der Schuleingangsuntersuchung, die sehr unterschiedliche Merkmale erfasst (u. a. Seh- und Hörvermögen, Aufmerksamkeit), ist zu erwarten, dass sich eine mehrdimensionale Lösung ergeben würde.
3.
Der Begriff des „simulationsorientierten Zugangs“ unterscheidet sich vom gleichnamigen Begriff, wie er beispielsweise in der Pädagogik verwendet wird, wenn eingeweihte Akteure (etwa Schauspieler) in einer Untersuchungssituation eine Situation selbst „simulieren“.

Literatur

Bollen, K. A. (1980). Issues in the comparative measurement of political democracy. American Sociological Review, 45, 370–390.
Google Scholar
Bortz, J. & Schuster, C. (2010). Statistik für Human und Sozialwissenschaftler. Berlin, Heidelberg: Springer.
Google Scholar
Cattell, R. B. & Weiß, R. H. (1971). Grundintelligenztest Skala 3 (CFT 3). Göttingen: Hogrefe.
Google Scholar
Costa, P. T. & McCrae, R. R. (1985). The NEO Personality Inventory Manual. Odessa, FL: Psychological Assessment Resources.
Google Scholar
Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297–334.
Google Scholar
Cronbach, L. J. & Meehl, P. E. (1955). Construct Validity in Psychological Tests. Psychological Bulletin, 52, 281–302.
PubMed Google Scholar
Deutsches Institut für Normung e.V. (DIN). (2002). DIN 33430:2002-06: Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen. Berlin: Beuth.
Google Scholar
Deutsches Institut für Normung e.V. (DIN). (2016). DIN 33430:2016-07: Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen. Berlin: Beuth.
Google Scholar
Eid, M. (2000). A multitrait-multimethod model with minimal assumptions. Psychometrika, 65, 241–261.
Google Scholar
Eid, M. & Schmidt, K. (2014). Testtheorie und Testkonstruktion. Göttingen: Hogrefe.
Google Scholar
Heilbrun, A. B. (1964). Social learning theory, social desirability, and the MMPI. Psychological Bulletin, 61, 377–387.
PubMed Google Scholar
Institut für Test- und Begabungsforschung (Hrsg.). (1988). Test für medizinische Studiengänge (aktualisierte Originalversion 2). Herausgegeben im Auftrag der Kultusminister der Länder der BRD (2. Aufl.). Göttingen: Hogrefe.
Google Scholar
Jöreskog, K. G. & Sörbom, D. (1996). LISREL 8 User’s Reference Guide. Chicago: Scientific Software International.
Google Scholar
Kendall, M. G. (1962). Rank Correlation Methods. London, UK: Griffin.
Google Scholar
Kubinger, K. D. (1997). Zur Renaissance der objektiven Persönlichkeitstests sensu R. B. Cattell. In H. Mandl (Hrsg.), Bericht über den 40. Kongreß der Deutschen Gesellschaft für Psychologie in München 1996 (S. 755–761). Göttingen: Hogrefe.
Google Scholar
Kubinger, K. D. (2001). Zur Qualitätssicherung psychologischer Tests – Am Beispiel des AID 2. Psychologie in Österreich, 21, 82–85.
Google Scholar
Kubinger, K. D. (2003). Gütekriterien. In K. D. Kubinger & R. S. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik. (S. 195–204). Weinheim: Beltz PVU.
Google Scholar
Lazarsfeld, P. F. & Henry, N. W. (1968). Latent structure analysis. Boston, MA: Houghton Mifflin.
Google Scholar
Lienert, G. A. & Raatz, U. (1998). Testaufbau und Testanalyse. (6. Aufl.). Weinheim: Psychologie Verlags Union.
Google Scholar
Liepmann, D., Beauducel, A., Brocke, B. & Amthauer, R. (2007). I-S-T 2000R Intelligenz-Struktur-Test 2000 R (2. Aufl.). Göttingen: Hogrefe.
Google Scholar
Lord, F. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
Google Scholar
Messick, S. (1989). Validity. In R. L. Linn (Ed.), Educational measurement (pp. 13–103). New York, NY: American Council on Education and Macmillan.
Google Scholar
Michel, L. & Conrad, W. (1982). Testtheoretische Grundlagen psychometrischer Tests. In K.-J. Groffmann & L. Michel (Hrsg.), Enzyklopädie der Psychologie (Bd. 6, S. 19–70). Göttingen: Hogrefe.
Google Scholar
McDonald, R. P. (1999). Test Theory: A Unified Treatment. New York, NY: Psychology Press.
Google Scholar
Moosbrugger, H. & Goldhammer, F. (2007). Frankfurter Adaptiver Konzentrationsleistungs-Test (FAKT II): Grundlegend neu bearbeitete und neu normierte 2. Auflage des FAKT von Moosbrugger und Heyden (1997). Göttingen: Hogrefe.
Google Scholar
Moosbrugger, H. & Hartig, J. (2003). Klassische Testtheorie. In K. Kubinger und R. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik (S. 408–415). Weinheim: Psychologie Verlags Union.
Google Scholar
Moosbrugger, H. & Kelava, A. (Hrsg.). (2012). Testtheorie und Fragebogenkonstruktion (2. Aufl.). Berlin, Heidelberg: Springer.
Google Scholar
Moosbrugger, H. & Oehlschlägel, J. (2011). Frankfurter Aufmerksamkeits-Inventar 2 (FAIR-2). Bern, Göttingen: Huber.
Google Scholar
Moosbrugger, H. & Rauch, W. (2010). Grundkenntnisse über Verfahren der Eignungsbeurteilung. In K. Westhoff, C. Hagemeister, M. Kersting, F. Lang, H. Moosbrugger, G. Reimann, G. Stemmler (Hrsg.), Grundwissen für die berufsbezogene Eignungsbeurteilung nach DIN 33430 (3. Aufl., S. 146–148). Lengerich: Pabst.
Google Scholar
Ortner, T. M., Proyer, R. T. & Kubinger, K. D. (Hrsg.). (2006). Theorie und Praxis Objektiver Persönlichkeitstests. Bern, Stuttgart, Hans Huber.
Google Scholar
Raykov, T. & Marcoulides, G. A. (2011). Psychometric Theory. New York, NY: Routledge.
Google Scholar
Reiß, S. & Sarris, V. (2012). Experimentelle Psychologie. München: Pearson.
Google Scholar
Revelle, W. & Condon, D. M. (2018). Reliability. In P. Irwing, T. Booth & D. Hughes (Eds.), The Wiley Blackwell Handbook of Psychometric Testing (pp. 709–749). Chichester, West Sussex, UK: Blackwell Publishing Ltd.
Google Scholar
Revelle, W. & Zinbarg, R. E. (2009). Coefficients alpha, beta, omega, and the glb: Comments on Sijtsma. Psychometrika, 74, 145–154.
Google Scholar
Rosenthal, R. & Rosnow, R. L. (1969). The volunteer subject. In R. Rosenthal & R. L. Rosnow (Eds.), Artifact in behavioral research (pp. 59–118). New York, NY: Academic Press.
Google Scholar
Roskam, E. E. (1996). Latent-Trait-Modelle. In E. Erdfelder, R. Mausfeld, Th. Meiser & G. Rudinger (Hrsg.), Handbuch Quantitative Methoden (S. 431–458). Weinheim: Psychologie Verlags Union.
Google Scholar
Rost, J. (1996). Lehrbuch Testtheorie, Testkonstruktion. Bern: Huber.
Google Scholar
Steyer, R. (1987). Konsistenz und Spezifität: Definition zweier zentraler Begriffe der Differentiellen Psychologie und ein einfaches Modell zu ihrer Identifikation. Zeitschrift für Differentielle und Diagnostische Psychologie, 8, 245–258.
Google Scholar
Steyer, R. & Eid, M. (2001). Messen und Testen (2. Aufl.). Berlin, Heidelberg: Springer.
Google Scholar
Steyer, R., Mayer, A., Geiser, C. & Cole, D. A. (2015). A theory of states and traits-revised. Annual Review of Clinical Psychology, 11, 71–98.
PubMed Google Scholar
Stumpf, H. (1996). Klassische Testtheorie. In: E. Erdfelder, R. Mansfeld, T. Meiser & G. Rudinger (Hrsg.), Handbuch Quantitative Methoden (S. 411–430). Weinheim: Beltz PVU.
Google Scholar
Süß, H.-M. (2003). Culture fair. In K. D. Kubinger & R. S. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik (S. 82–86). Weinheim: Beltz.
Google Scholar
Tent, L. & Stelzl, I. (1993). Pädagogisch-psychologische Diagnostik. Band 1: Theoretische und methodische Grundlagen. Göttingen: Hogrefe.
Google Scholar
Testkuratorium (der Föderation deutscher Psychologenverbände). (1986). Mitteilung. Diagnostica, 32, 358–360.
Google Scholar
Trost, G. (1994). Test für medizinische Studiengänge (TMS): Studien zur Evaluation (18. Arbeitsbericht). Bonn: ITB.
Google Scholar
Viswesvaran, C. & Ones, D. S. (1999). Meta-analysis of fakability estimates: Implications for personality measurement. Educational and Psychological Measurement, 59, 197–210.
Google Scholar
Westhoff, K., Hagemeister, C., Kersting, M., Lang, F., Moosbrugger, H., Reimann, G. & Stemmler, G. (Hrsg.). (2010). Grundwissen für die berufsbezogene Eignungsbeurteilung nach DIN 33430 (3. Aufl.). Lengerich: Pabst.
Google Scholar
Wirtz, M. & Caspar, F. (2002). Beurteilerübereinstimmung und Beurteilerreliabilität. Methoden zur Bestimmung und Verbesserung der Zuverlässigkeit von Einschätzungen mittels Kategoriensystemen und Ratingskalen. Göttingen: Hogrefe.
Google Scholar
Zinbarg, R. E., Revelle, W., Yovel, I. & Li, W. (2005). Cronbach’s α, Revelle’s β, and McDonald’s ω_H: Their relations with each other and two alternative conceptualizations of reliability. Psychometrika, 70, 1–11.
Google Scholar

Download references

Author information

Authors and Affiliations

Institut für Psychologie, Goethe-Universität Frankfurt am Main, Theodor-W.-Adorno-Platz 6, 60629, Frankfurt am Main, Deutschland
Prof. Dr. Helfried Moosbrugger
Methodenzentrum, Eberhard Karls Universität Tübingen, Hölderlinstr. 29, 72074, Tübingen, Deutschland
Prof. Dr. Augustin Kelava

Authors

Prof. Dr. Helfried Moosbrugger
View author publications
You can also search for this author in PubMed Google Scholar
Prof. Dr. Augustin Kelava
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Helfried Moosbrugger .

Editor information

Editors and Affiliations

Institut für Psychologie, Goethe-Universität Frankfurt am Main, Frankfurt am Main, Hessen, Germany
Helfried Moosbrugger
Methodenzentrum, Eberhard Karls Universität Tübingen, Tübingen, Baden-Württemberg, Germany
Augustin Kelava

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Moosbrugger, H., Kelava, A. (2020). Qualitätsanforderungen an Tests und Fragebogen („Gütekriterien“). In: Moosbrugger, H., Kelava, A. (eds) Testtheorie und Fragebogenkonstruktion. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61532-4_2

Download citation

DOI: https://doi.org/10.1007/978-3-662-61532-4_2
Published: 26 August 2020
Publisher Name: Springer, Berlin, Heidelberg
Print ISBN: 978-3-662-61531-7
Online ISBN: 978-3-662-61532-4
eBook Packages: Psychology (German Language)

Publish with us

Policies and ethics