Skip to main content

Qualitätsanforderungen an Tests und Fragebogen („Gütekriterien“)

  • Chapter
  • First Online:
Testtheorie und Fragebogenkonstruktion

Zusammenfassung

Ein Test/Fragebogen ist umso wissenschaftlicher, je mehr Qualitätsanforderungen („Gütekriterien“) bei einer Konstruktion erfüllt werden. Die Berücksichtigung folgender „allgemeiner“ Gütekriterien erfordert keine besonderen testtheoretischen Kenntnisse: Durchführungs-, Auswertungs- und Interpretationsobjektivität, aber auch weitere Aspekte wie Ökonomie, Nützlichkeit, Zumutbarkeit, Fairness und Unverfälschbarkeit. Für wissenschaftliche Tests/Fragebogen sind zudem die „speziellen, testtheoriebasierten“ Gütekriterien der Reliabilität und Validität relevant. Sie setzen testtheoretische Grundlagen und Betrachtungen voraus. Die Reliabilität befasst sich mit der Überprüfung der Messgenauigkeit und die Validität mit der Frage, ob ein Test das Merkmal, das er messen soll, auch wirklich misst, und vor allem, ob die auf einem Testergebnis aufbauenden Interpretationen und Schlussfolgerungen belastbar sind. Hierbei ist besonders die Kriteriumsvalidität bedeutsam für die Berechtigung extrapolierender Schlussfolgerungen sowie die Konstruktvalidität für die Struktur und Dimensionalität der untersuchten Merkmale.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 54.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Hardcover Book
USD 69.99
Price excludes VAT (USA)
  • Durable hardcover edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Die Definition wurde gegenüber der an Lienert und Raatz (1998) orientierten Fassung der 2. Auflage (Moosbrugger und Kelava 2012) erneut überarbeitet und um den „relativen“ Grad sowie um „qualitative Kategorien“ erweitert.

  2. 2.

    Im Fall der Schuleingangsuntersuchung, die sehr unterschiedliche Merkmale erfasst (u. a. Seh- und Hörvermögen, Aufmerksamkeit), ist zu erwarten, dass sich eine mehrdimensionale Lösung ergeben würde.

  3. 3.

    Der Begriff des „simulationsorientierten Zugangs“ unterscheidet sich vom gleichnamigen Begriff, wie er beispielsweise in der Pädagogik verwendet wird, wenn eingeweihte Akteure (etwa Schauspieler) in einer Untersuchungssituation eine Situation selbst „simulieren“.

Literatur

  • Bollen, K. A. (1980). Issues in the comparative measurement of political democracy. American Sociological Review, 45, 370–390.

    Google Scholar 

  • Bortz, J. & Schuster, C. (2010). Statistik für Human und Sozialwissenschaftler. Berlin, Heidelberg: Springer.

    Google Scholar 

  • Cattell, R. B. & Weiß, R. H. (1971). Grundintelligenztest Skala 3 (CFT 3). Göttingen: Hogrefe.

    Google Scholar 

  • Costa, P. T. & McCrae, R. R. (1985). The NEO Personality Inventory Manual. Odessa, FL: Psychological Assessment Resources.

    Google Scholar 

  • Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16, 297–334.

    Google Scholar 

  • Cronbach, L. J. & Meehl, P. E. (1955). Construct Validity in Psychological Tests. Psychological Bulletin, 52, 281–302.

    PubMed  Google Scholar 

  • Deutsches Institut für Normung e.V. (DIN). (2002). DIN 33430:2002-06: Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen. Berlin: Beuth.

    Google Scholar 

  • Deutsches Institut für Normung e.V. (DIN). (2016). DIN 33430:2016-07: Anforderungen an Verfahren und deren Einsatz bei berufsbezogenen Eignungsbeurteilungen. Berlin: Beuth.

    Google Scholar 

  • Eid, M. (2000). A multitrait-multimethod model with minimal assumptions. Psychometrika, 65, 241–261.

    Google Scholar 

  • Eid, M. & Schmidt, K. (2014). Testtheorie und Testkonstruktion. Göttingen: Hogrefe.

    Google Scholar 

  • Heilbrun, A. B. (1964). Social learning theory, social desirability, and the MMPI. Psychological Bulletin, 61, 377–387.

    PubMed  Google Scholar 

  • Institut für Test- und Begabungsforschung (Hrsg.). (1988). Test für medizinische Studiengänge (aktualisierte Originalversion 2). Herausgegeben im Auftrag der Kultusminister der Länder der BRD (2. Aufl.). Göttingen: Hogrefe.

    Google Scholar 

  • Jöreskog, K. G. & Sörbom, D. (1996). LISREL 8 User’s Reference Guide. Chicago: Scientific Software International.

    Google Scholar 

  • Kendall, M. G. (1962). Rank Correlation Methods. London, UK: Griffin.

    Google Scholar 

  • Kubinger, K. D. (1997). Zur Renaissance der objektiven Persönlichkeitstests sensu R. B. Cattell. In H. Mandl (Hrsg.), Bericht über den 40. Kongreß der Deutschen Gesellschaft für Psychologie in München 1996 (S. 755–761). Göttingen: Hogrefe.

    Google Scholar 

  • Kubinger, K. D. (2001). Zur Qualitätssicherung psychologischer Tests – Am Beispiel des AID 2. Psychologie in Österreich, 21, 82–85.

    Google Scholar 

  • Kubinger, K. D. (2003). Gütekriterien. In K. D. Kubinger & R. S. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik. (S. 195–204). Weinheim: Beltz PVU.

    Google Scholar 

  • Lazarsfeld, P. F. & Henry, N. W. (1968). Latent structure analysis. Boston, MA: Houghton Mifflin.

    Google Scholar 

  • Lienert, G. A. & Raatz, U. (1998). Testaufbau und Testanalyse. (6. Aufl.). Weinheim: Psychologie Verlags Union.

    Google Scholar 

  • Liepmann, D., Beauducel, A., Brocke, B. & Amthauer, R. (2007). I-S-T 2000R Intelligenz-Struktur-Test 2000 R (2. Aufl.). Göttingen: Hogrefe.

    Google Scholar 

  • Lord, F. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.

    Google Scholar 

  • Messick, S. (1989). Validity. In R. L. Linn (Ed.), Educational measurement (pp. 13–103). New York, NY: American Council on Education and Macmillan.

    Google Scholar 

  • Michel, L. & Conrad, W. (1982). Testtheoretische Grundlagen psychometrischer Tests. In K.-J. Groffmann & L. Michel (Hrsg.), Enzyklopädie der Psychologie (Bd. 6, S. 19–70). Göttingen: Hogrefe.

    Google Scholar 

  • McDonald, R. P. (1999). Test Theory: A Unified Treatment. New York, NY: Psychology Press.

    Google Scholar 

  • Moosbrugger, H. & Goldhammer, F. (2007). Frankfurter Adaptiver Konzentrationsleistungs-Test (FAKT II): Grundlegend neu bearbeitete und neu normierte 2. Auflage des FAKT von Moosbrugger und Heyden (1997). Göttingen: Hogrefe.

    Google Scholar 

  • Moosbrugger, H. & Hartig, J. (2003). Klassische Testtheorie. In K. Kubinger und R. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik (S. 408–415). Weinheim: Psychologie Verlags Union.

    Google Scholar 

  • Moosbrugger, H. & Kelava, A. (Hrsg.). (2012). Testtheorie und Fragebogenkonstruktion (2. Aufl.). Berlin, Heidelberg: Springer.

    Google Scholar 

  • Moosbrugger, H. & Oehlschlägel, J. (2011). Frankfurter Aufmerksamkeits-Inventar 2 (FAIR-2). Bern, Göttingen: Huber.

    Google Scholar 

  • Moosbrugger, H. & Rauch, W. (2010). Grundkenntnisse über Verfahren der Eignungsbeurteilung. In K. Westhoff, C. Hagemeister, M. Kersting, F. Lang, H. Moosbrugger, G. Reimann, G. Stemmler (Hrsg.), Grundwissen für die berufsbezogene Eignungsbeurteilung nach DIN 33430 (3. Aufl., S. 146–148). Lengerich: Pabst.

    Google Scholar 

  • Ortner, T. M., Proyer, R. T. & Kubinger, K. D. (Hrsg.). (2006). Theorie und Praxis Objektiver Persönlichkeitstests. Bern, Stuttgart, Hans Huber.

    Google Scholar 

  • Raykov, T. & Marcoulides, G. A. (2011). Psychometric Theory. New York, NY: Routledge.

    Google Scholar 

  • Reiß, S. & Sarris, V. (2012). Experimentelle Psychologie. München: Pearson.

    Google Scholar 

  • Revelle, W. & Condon, D. M. (2018). Reliability. In P. Irwing, T. Booth & D. Hughes (Eds.), The Wiley Blackwell Handbook of Psychometric Testing (pp. 709–749). Chichester, West Sussex, UK: Blackwell Publishing Ltd.

    Google Scholar 

  • Revelle, W. & Zinbarg, R. E. (2009). Coefficients alpha, beta, omega, and the glb: Comments on Sijtsma. Psychometrika, 74, 145–154.

    Google Scholar 

  • Rosenthal, R. & Rosnow, R. L. (1969). The volunteer subject. In R. Rosenthal & R. L. Rosnow (Eds.), Artifact in behavioral research (pp. 59–118). New York, NY: Academic Press.

    Google Scholar 

  • Roskam, E. E. (1996). Latent-Trait-Modelle. In E. Erdfelder, R. Mausfeld, Th. Meiser & G. Rudinger (Hrsg.), Handbuch Quantitative Methoden (S. 431–458). Weinheim: Psychologie Verlags Union.

    Google Scholar 

  • Rost, J. (1996). Lehrbuch Testtheorie, Testkonstruktion. Bern: Huber.

    Google Scholar 

  • Steyer, R. (1987). Konsistenz und Spezifität: Definition zweier zentraler Begriffe der Differentiellen Psychologie und ein einfaches Modell zu ihrer Identifikation. Zeitschrift für Differentielle und Diagnostische Psychologie, 8, 245–258.

    Google Scholar 

  • Steyer, R. & Eid, M. (2001). Messen und Testen (2. Aufl.). Berlin, Heidelberg: Springer.

    Google Scholar 

  • Steyer, R., Mayer, A., Geiser, C. & Cole, D. A. (2015). A theory of states and traits-revised. Annual Review of Clinical Psychology, 11, 71–98.

    PubMed  Google Scholar 

  • Stumpf, H. (1996). Klassische Testtheorie. In: E. Erdfelder, R. Mansfeld, T. Meiser & G. Rudinger (Hrsg.), Handbuch Quantitative Methoden (S. 411–430). Weinheim: Beltz PVU.

    Google Scholar 

  • Süß, H.-M. (2003). Culture fair. In K. D. Kubinger & R. S. Jäger (Hrsg.), Schlüsselbegriffe der Psychologischen Diagnostik (S. 82–86). Weinheim: Beltz.

    Google Scholar 

  • Tent, L. & Stelzl, I. (1993). Pädagogisch-psychologische Diagnostik. Band 1: Theoretische und methodische Grundlagen. Göttingen: Hogrefe.

    Google Scholar 

  • Testkuratorium (der Föderation deutscher Psychologenverbände). (1986). Mitteilung. Diagnostica, 32, 358–360.

    Google Scholar 

  • Trost, G. (1994). Test für medizinische Studiengänge (TMS): Studien zur Evaluation (18. Arbeitsbericht). Bonn: ITB.

    Google Scholar 

  • Viswesvaran, C. & Ones, D. S. (1999). Meta-analysis of fakability estimates: Implications for personality measurement. Educational and Psychological Measurement, 59, 197–210.

    Google Scholar 

  • Westhoff, K., Hagemeister, C., Kersting, M., Lang, F., Moosbrugger, H., Reimann, G. & Stemmler, G. (Hrsg.). (2010). Grundwissen für die berufsbezogene Eignungsbeurteilung nach DIN 33430 (3. Aufl.). Lengerich: Pabst.

    Google Scholar 

  • Wirtz, M. & Caspar, F. (2002). Beurteilerübereinstimmung und Beurteilerreliabilität. Methoden zur Bestimmung und Verbesserung der Zuverlässigkeit von Einschätzungen mittels Kategoriensystemen und Ratingskalen. Göttingen: Hogrefe.

    Google Scholar 

  • Zinbarg, R. E., Revelle, W., Yovel, I. & Li, W. (2005). Cronbach’s α, Revelle’s β, and McDonald’s ωH: Their relations with each other and two alternative conceptualizations of reliability. Psychometrika, 70, 1–11.

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Helfried Moosbrugger .

Editor information

Editors and Affiliations

Rights and permissions

Reprints and permissions

Copyright information

© 2020 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Moosbrugger, H., Kelava, A. (2020). Qualitätsanforderungen an Tests und Fragebogen („Gütekriterien“). In: Moosbrugger, H., Kelava, A. (eds) Testtheorie und Fragebogenkonstruktion. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61532-4_2

Download citation

  • DOI: https://doi.org/10.1007/978-3-662-61532-4_2

  • Published:

  • Publisher Name: Springer, Berlin, Heidelberg

  • Print ISBN: 978-3-662-61531-7

  • Online ISBN: 978-3-662-61532-4

  • eBook Packages: Psychology (German Language)

Publish with us

Policies and ethics