Resampling-Verfahren

Wollschläger, Daniel

doi:10.1007/978-3-662-61736-6_11

Daniel Wollschläger⁴

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

7424 Accesses

Zusammenfassung

Resampling-Verfahren kommen für eine Vielzahl von Tests in Frage, können hier aber nur in Grundzügen vorgestellt werden. Ausgangspunkt ist die gesuchte Verteilung einer Teststatistik $\hat{\theta }$ – etwa eines Schätzers $\hat{\theta }$ für einen theoretischen Parameter $\theta $. Diese Verteilung kann aus verschiedenen Gründen unbekannt sein: So sind etwa die in parametrischen Tests gemachten Annahmen, unter denen ihre Teststatistik eine bekannte Verteilung aufweist, nicht immer zu rechtfertigen. In vielen klassischen nonparametrischen Verfahren ist die Verteilung der Teststatistik zwar im Prinzip exakt zu ermitteln, praktisch aber der Rechenaufwand dafür zu hoch.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 44.99; Price excludes VAT (USA)

Softcover Book: USD 59.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

1.
$\theta $ ist ein Funktional der theoretischen Verteilungsfunktion F der ursprünglichen Zufallsvariable, bildet also F auf eine Zahl ab. Analog ist $\hat{\theta }$ dasselbe Funktional der empirischen kumulativen Häufigkeitsverteilung $\hat{F}_{n}$ der Basisstichprobe vom Umfang n und $\hat{\theta }^{\star }$ dasselbe Funktional der empirischen kumulativen Häufigkeitsverteilung $\hat{F}_{n}^{\star }$ in einer Replikation.
2.
Die Indizes sind hier trotz der 999 Replikationen nicht ganzzahlig (25 und 975), da die dem $BC_{a}$-Intervall zugrundeliegende Korrektur über die Verschiebung der Intervallgrenzen funktioniert. Vergleiche etwa das Perzentil-Intervall für $\theta _{1}$ aus boot.ci(bsRegr, conf=0.95, type="perc", index=1)$percent.
3.
Der p-Wert kann bei Monte-Carlo-Approximationen zur höheren Genauigkeit nach Hinzufügen eines zusätzlichen extremeren Falles gebildet werden: Ist $n_{R}$ die Anzahl der generierten resamples und $n^{\star }$ die Anzahl der Fälle, bei denen $\hat{\theta }^{\star }$ mindestens so extrem wie $\hat{\theta }$ ist, setzt man $p = \frac{n^{\star } + 1}{n_{R} + 1}$. Auf diese Weise wird vermieden, dass der p-Wert exakt 0 werden kann.
4.
Formal muss das Kriterium der Austauschbarkeit erfüllt sein Good (2004).
5.
Auch das Paketpermute (Simpson 2019) bietet flexible Möglichkeiten, um Permutationstests für verschiedenen Untersuchungs-Designs umzusetzen.
6.
Eine weitere Alternative ist der van der Waerden-Test, für den die an $n+1$ normierten Ränge durch die zugehörigen Quantile aus der Standardnormalverteilung ersetzt werden. Dieser Test lässt sich mit normal_test() aus dem Paket coin umsetzen.
7.
Für deren Wahl s. vignette("coin_implementation").

Author information

Authors and Affiliations

Institut für Medizinische Biometrie, Epidemiologie und Informatik (IMBEI), Universitätsmedizin der Johannes Gutenberg-Universität Mainz, Mainz, Deutschland
Daniel Wollschläger

Authors

Daniel Wollschläger
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Daniel Wollschläger .

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Wollschläger, D. (2020). Resampling-Verfahren. In: Grundlagen der Datenanalyse mit R. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61736-6_11

Download citation

DOI: https://doi.org/10.1007/978-3-662-61736-6_11
Published: 03 November 2020
Publisher Name: Springer Spektrum, Berlin, Heidelberg
Print ISBN: 978-3-662-61735-9
Online ISBN: 978-3-662-61736-6
eBook Packages: Life Science and Basic Disciplines (German Language)

Publish with us

Policies and ethics