Zusammenfassung
Resampling-Verfahren kommen für eine Vielzahl von Tests in Frage, können hier aber nur in Grundzügen vorgestellt werden. Ausgangspunkt ist die gesuchte Verteilung einer Teststatistik \(\hat{\theta }\) – etwa eines Schätzers \(\hat{\theta }\) für einen theoretischen Parameter \(\theta \). Diese Verteilung kann aus verschiedenen Gründen unbekannt sein: So sind etwa die in parametrischen Tests gemachten Annahmen, unter denen ihre Teststatistik eine bekannte Verteilung aufweist, nicht immer zu rechtfertigen. In vielen klassischen nonparametrischen Verfahren ist die Verteilung der Teststatistik zwar im Prinzip exakt zu ermitteln, praktisch aber der Rechenaufwand dafür zu hoch.
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
\(\theta \) ist ein Funktional der theoretischen Verteilungsfunktion F der ursprünglichen Zufallsvariable, bildet also F auf eine Zahl ab. Analog ist \(\hat{\theta }\) dasselbe Funktional der empirischen kumulativen Häufigkeitsverteilung \(\hat{F}_{n}\) der Basisstichprobe vom Umfang n und \(\hat{\theta }^{\star }\) dasselbe Funktional der empirischen kumulativen Häufigkeitsverteilung \(\hat{F}_{n}^{\star }\) in einer Replikation.
- 2.
Die Indizes sind hier trotz der 999 Replikationen nicht ganzzahlig (25 und 975), da die dem \(BC_{a}\)-Intervall zugrundeliegende Korrektur über die Verschiebung der Intervallgrenzen funktioniert. Vergleiche etwa das Perzentil-Intervall für \(\theta _{1}\) aus boot.ci(bsRegr, conf=0.95, type="perc", index=1)$percent.
- 3.
Der p-Wert kann bei Monte-Carlo-Approximationen zur höheren Genauigkeit nach Hinzufügen eines zusätzlichen extremeren Falles gebildet werden: Ist \(n_{R}\) die Anzahl der generierten resamples und \(n^{\star }\) die Anzahl der Fälle, bei denen \(\hat{\theta }^{\star }\) mindestens so extrem wie \(\hat{\theta }\) ist, setzt man \(p = \frac{n^{\star } + 1}{n_{R} + 1}\). Auf diese Weise wird vermieden, dass der p-Wert exakt 0 werden kann.
- 4.
Formal muss das Kriterium der Austauschbarkeit erfüllt sein Good (2004).
- 5.
Auch das Paketpermute (Simpson 2019) bietet flexible Möglichkeiten, um Permutationstests für verschiedenen Untersuchungs-Designs umzusetzen.
- 6.
Eine weitere Alternative ist der van der Waerden-Test, für den die an \(n+1\) normierten Ränge durch die zugehörigen Quantile aus der Standardnormalverteilung ersetzt werden. Dieser Test lässt sich mit normal_test() aus dem Paket coin umsetzen.
- 7.
Für deren Wahl s. vignette("coin_implementation").
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2020 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature
About this chapter
Cite this chapter
Wollschläger, D. (2020). Resampling-Verfahren. In: Grundlagen der Datenanalyse mit R. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61736-6_11
Download citation
DOI: https://doi.org/10.1007/978-3-662-61736-6_11
Published:
Publisher Name: Springer Spektrum, Berlin, Heidelberg
Print ISBN: 978-3-662-61735-9
Online ISBN: 978-3-662-61736-6
eBook Packages: Life Science and Basic Disciplines (German Language)