Sportwissenschaft

, Volume 42, Issue 2, pp 126–136

Fehlende Werte in sportwissenschaftlichen Untersuchungen

Eine anwendungsorientierte Einführung in die multiple Imputation mit SPSS
  • Darko Jekauc
  • Manuel Völkle
  • Lena Lämmle
  • Alexander Woll
Hauptbeiträge

DOI: 10.1007/s12662-012-0249-5

Cite this article as:
Jekauc, D., Völkle, M., Lämmle, L. et al. Sportwiss (2012) 42: 126. doi:10.1007/s12662-012-0249-5

Zusammenfassung

Fehlende Werte sind in der empirischen Forschung ein ernstzunehmendes Problem, das gerade in sportwissenschaftlichen Studien oft vernachlässigt wird. Häufig eingesetzte Verfahren wie Regressionsmethode, fallweiser und paarweiser Ausschluss und Mittelwertsersetzungen stellen aus methodischer Sicht keine befriedigende Lösung dar. Neuere Verfahren wie Maximum-Likelihood-Schätzungen (ML) und multiple Imputation (MI) finden nach wie vor zu selten Anwendung. Ziel des vorliegenden Artikels ist es, dem entgegenzuwirken. Basierend auf der statistischen Theorie fehlender Werte nach Rubin (1976) werden verschiedene Verfahren zum Umgang mit fehlenden Werten vorgestellt und kritisch diskutiert. Im Fokus steht dabei das Verfahren der multiplen Imputation (MI). Seit der Implementierung von MI in SPSS Version 17 (SPSS 2009) steht dem routinemäßigen Einsatz durch eine breite Anwenderschaft nichts mehr im Wege. Illustriert wird der Einsatz von MI im letzten Teil des Artikels anhand einer empirischen Studie mit einem für sportwissenschaftliche Untersuchungen typischen Ausfallprozess. Vorteile des MI, aber auch Grenzen und Schwierigkeiten bei der Umsetzung werden anhand dieses Beispiels diskutiert.

Schlüsselwörter

Fehlende Daten SPSS Multiple Imputation Maximum Likelihood Predictive Mean Matching 

Missing values in sport scientific studies

A practical guide to multiple imputation with SPSS

Abstract

Missing values are a serious statistical problem in empirical studies which tends not to be considered in sport scientific studies. The methods usually applied such as listwise and pairwise deletion, mean and regression imputation do not constitute satisfactory solutions. New methods such as Maximum Likelihood Estimation (ML) and Multiple Imputation (MI) have not yet been widely implemented. The aim of this article is to change this situation. For this purpose, this article provides an overview of the missing data theory stated by Rubin (1976). Based on this approach, different methods for dealing with the problem of missing data will be presented and discussed. Special emphasis is put on new methods, in particular MI. In the past, the application of MI required special software. Since the implementation of MI in SPSS 17 (SPSS 2009) there is no obstacle for a routine usage of this method to handle missing data problems. The implementation of MI will be illustrated with an empirical study with a missing data mechanism typical for sport scientific studies. Using this example, advantages of MI as well as current limitations and practical difficulties will be discussed.

Keywords

Missing data SPSS Multiple imputation Maximum likelihood Predictive mean matching 

Copyright information

© Springer-Verlag 2012

Authors and Affiliations

  • Darko Jekauc
    • 1
  • Manuel Völkle
    • 2
  • Lena Lämmle
    • 3
  • Alexander Woll
    • 1
  1. 1.Institut für SportwissenschaftUniversität KonstanzKonstanzDeutschland
  2. 2.Max Planck Institute for Human Development BerlinBerlinDeutschland
  3. 3.Technische Universität MünchenMünchenDeutschland

Personalised recommendations