Zusammenfassung
In ersten Auswertungsschritten werden häufig zunächst einzelne Variablen getrennt voneinander univariat analysiert. Es wird dargestellt, wie die Ergebnisse von vielen Einzelbeobachtungen so reduziert werden können, dass man einen realistischen und unverfälschten Eindruck über die befragten Eigenschaften erhält. Hierzu wird sowohl in die adäquaten grafischen Darstellungsmöglichkeiten und Häufigkeitstabellen sowie in die univariaten Parameter (Lage- und Streuungsparameter, Schiefe, Kurtosis) und in verschiedene Konzentrationsmaße eingeführt. Die Einführung erfolgt zunächst in einer intuitiven Herangehensweise, bevor eine Formel abgeleitet bzw. angegeben wird. Zum Abschluss wird gezeigt, wie sich die Kennzahlen leicht mit Hilfe des Computers (Excel, SPSS oder Stata) berechnen lassen. Die Inhalte werden in Übungsaufgaben vertieft.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
An dieser Stelle sei angemerkt, dass der Studierende bei seinen Bewertungen eine bestimmte Verteilungsform der Noten unterstellt. Ein Durchschnitt von 3,0 kommt nämlich genauso zustande, wenn alle Studierenden eine 3,0 schreiben, wie wenn 50 Prozent der Studierenden eine 1,0 und die anderen 50 Prozent eine 5,0 schreiben. Qualitativ macht es aber einen deutlichen Unterschied. Es reicht eigentlich nicht, allein den Durchschnitt zu betrachten.
- 2.
Die relative Häufigkeit (f(xi)) entspricht der absoluten Häufigkeit (h(xi)) im Verhältnis zu allen gültigen und ungültigen Beobachtungen (N = Ngültig + Nungültig): (f(xi) = h(xi)/N).
- 3.
Die gültigen Prozentwerte (gf(xi)) entsprechen der absoluten Häufigkeit (h(xi)) im Verhältnis zu allen gültigen Beobachtungen (Ngültig): (gf(xi) = h(xi)/Ngültig).
- 4.
Die Säule weiblich besteht aus fünf Einheiten und die Säule männlich nur aus einer.
- 5.
Für die i-te Klasse gilt: xi < X ≤ xi+1 mit i ∈ {1, 2, …, k}.
- 6.
Die Notenskala wird hier kardinalskaliert angenommen. Dies unterstellt, dass die Leistungsdifferenz zwischen einer eins und zwei identisch mit der Leistungsdifferenz zwischen einer Vier und Fünf wäre. Da dies in der Praxis wohl eher nicht zutrifft, müssten Schulnoten streng genommen als ordinalskaliert angesehen werden.
- 7.
(30 Minuten ∙ 2 km/h + 20 Minuten ∙ 3 km/h + 15 Minuten ∙ 4 km/h)/65 Minuten = 2,77 km/h.
- 8.
Der Wert für die letzte Klassenmitte ergibt sich dabei folgendermaßen: Die halbe Breite der Klasse entspricht: (101 − 61) / 2 = 20. Daraus berechnet sich die Klassenmitte mit 61 + 20 = 81 Jahren.
- 9.
Dies gilt strenggenommen nur für den Fall, dass der Median zwischen zwei Realisationen liegt also bei einer geraden Anzahl an Beobachtungen. Fällt der Median genau auf eine Beobachtung – also im Fall einer ungeraden Anzahl an Beobachtungen – sind 50 Prozent von (n − 1) Beobachtungen kleiner und 50 Prozent von (n − 1) Beobachtungen größer als der Median.
- 10.
Die Daten liegen als Datei mit dem Namen „Salatoel“ unter www.springer-gabler.de vor.
- 11.
In der deutschsprachigen SPSS Version lautet die Befehlsfolge Analysieren → Deskriptive Statistiken → Häufigkeiten …
- 12.
In der deutschsprachigen SPSS Version sollte die Funktion Häufigkeitstabellen anzeigen deaktiviert werden.
- 13.
In der deutschsprachigen SPSS Version lautet die Befehlsfolge Analysieren → Deskriptive Statistiken → Deskriptive Statistik …
- 14.
Für Excel 2010 ist dieser über die Schaltflächenkombination Datei → Optionen → Add-ins → Gehe zu erreichbar.
Literatur
Bamberg G, Bauer F, Krapp M (2012) Statistik, 13. Aufl. Oldenbourg, München
Krämer W (2005) So lügt man mit Statistik, 7. Aufl. Piper, München, Zürich
Krämer W (2008) Statistik verstehen. Eine Gebrauchsanweisung, 8. Aufl. Piper, München, Zürich
Schwarze J (2008) Aufgabensammlung zur Statistik, 6. Aufl. Neue Wirtschafts-Briefe nwb, Hamm
Swoboda H (1971) Exakte Geheimnisse: Knauers Buch der modernen Statistik. Knauer, München, Zürich
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2015 Springer Fachmedien Wiesbaden
About this chapter
Cite this chapter
Cleff, T. (2015). Vom Datensatz zur Information. In: Deskriptive Statistik und Explorative Datenanalyse. Gabler Verlag, Wiesbaden. https://doi.org/10.1007/978-3-8349-4748-2_3
Download citation
DOI: https://doi.org/10.1007/978-3-8349-4748-2_3
Published:
Publisher Name: Gabler Verlag, Wiesbaden
Print ISBN: 978-3-8349-4747-5
Online ISBN: 978-3-8349-4748-2
eBook Packages: Life Science and Basic Disciplines (German Language)