Skip to main content

Klassische nonparametrische Methoden

  • Chapter
  • First Online:
Grundlagen der Datenanalyse mit R

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 7465 Accesses

Zusammenfassung

Wenn inferenzstatistische Tests zur Datenauswertung herangezogen werden sollen, aber davon ausgegangen werden muss, dass strenge Anforderungen an die Art und Qualität der erhobenen Daten nicht erfüllt sind, kommen viele konventionelle Verfahren womöglich nicht in Betracht.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 44.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Auf Rangdaten basierende Tests machen häufig die Voraussetzung, dass die Ränge eindeutig bestimmbar sind, also keine gleichen Werte (Bindungen, ties) auftauchen. Für den Fall, dass dennoch Bindungen vorhanden sind, existieren unterschiedliche Strategien, wobei die von R-Funktionen gewählte häufig in der zugehörigen Hilfe erwähnt wird.

  2. 2.

    Das Intervall ist jenes nach Clopper-Pearson. Für die Berechnung u. a. nach Wilson, Agresti-Coull und Jeffreys vgl. BinomCI() aus dem Paket DescTools.

  3. 3.

    Vergleiche hierfür RunsTest() aus dem DescTools Paket.

  4. 4.

    Bei zwei Zufallsvariablen X und Y ist Y dann stochastisch größer als X, wenn die Verteilungsfunktion von Y an jeder Stelle unter der von X liegt. Besitzen X und Y etwa Verteilungen derselben Form, ist dies der Fall, wenn die Dichte- bzw. Wahrscheinlichkeitsfunktion von Y eine nach rechts verschobene Version der von X darstellt.

  5. 5.

    Dieser Test ist auch bei quantitativen Variablen durchführbar, wobei zunächst eine Einteilung der Werte in disjunkte Klassen vorzunehmen ist. Die getestete \(\text {H}_{0}\) ist dann in dem Sinne schwächer, dass alle Verteilungen äquivalent sind, die zu gleichen Klassenwahrscheinlichkeiten führen.

  6. 6.

    Die Klassenbildung führt dazu, dass statt der Verträglichkeit mit einer bestimmten Verteilung die schwächere \(\text {H}_{0}\) einer Verträglichkeit mit allen Verteilungen getestet wird, die zu denselben erwarteten Häufigkeiten führen.

  7. 7.

    Für eine korrekte Testkonstruktion wäre eigentlich eine feste Klasseneinteilung mit gruppierter Maximum-Likelihood- oder Minimum-\(\chi ^{2}\)-Schätzung von \(\mu \) und \(\sigma \) notwendig, die in Abschn. 16.4 demonstriert wird.

  8. 8.

    Dieser Test ist auch bei quantitativen Variablen durchführbar, wobei zunächst eine Einteilung der Werte in disjunkte Klassen vorzunehmen ist. Die getestete \(\text {H}_{0}\) ist dann in dem Sinne schwächer, dass nur die Unabhängigkeit bzgl. der vorgenommenen Klasseneinteilung getestet wird.

  9. 9.

    Dieser Test ist auch bei quantitativen Variablen durchführbar, wobei zunächst eine Einteilung der Werte in disjunkte Klassen vorzunehmen ist. Die getestete \(\text {H}_{0}\) ist dann in dem Sinne schwächer, dass nur die Gleichheit der Verteilungen bzgl. der vorgenommenen Klasseneinteilung getestet wird.

  10. 10.

    Die \(\text {H}_{0}\) ist äquivalent zur Hypothese, dass das wahre odds ratio der Kontingenztafel beider Variablen gleich 1 ist (Abschn. 10.2.6). Der Test lässt sich auf Variablen mit mehr als zwei Stufen verallgemeinern, vgl. ?fisher.test.

  11. 11.

    Das Paket riskyr (Neth et al. 2019) stellt eine Vielzahl von Auswertungsfunktionen und Diagrammen zur Analyse sowie zum besseren Verständnis von Konfusionsmatrizen bereit.

  12. 12.

    Für die polychorische und polyseriale Korrelation s. Abschn. 2.7.8, Fußnote 29.

  13. 13.

    Die Berechnung des zugehörigen p-Wertes ist nur über eine intern definierte Funktion möglich, die Verteilungsfunktion der Teststatistik ist nicht direkt als R-Funktion vorhanden.

  14. 14.

    Der zugehörige Signifikanztest ist äquivalent zum Friedman-Test (Abschn. 10.5.7), wobei den ratern die Beobachtungsobjekte bzw. Blöcke entsprechen und den Objekten die unterschiedlichen Bedingungen.

  15. 15.

    Die ICC ist kein nonparametrisches Verfahren, soll aber als Maß der Inter-Rater-Reliabilität dennoch hier aufgeführt werden.

  16. 16.

    Für die zugehörigen parametrischen Tests und den Fall mit mehr als zwei Gruppen s. Abschn. 7.1.

  17. 17.

    Vorauszusetzen ist, dass die Verteilung in beiden Stichproben denselben theoretischen Median hat. Bei Zweifeln daran können die Daten zuvor gruppenweise zentriert werden, indem man von jedem Wert den Gruppenmedian abzieht.

  18. 18.

    Bei Variablen mit symmetrischer Verteilung und eindeutig bestimmtem Median ist dieser gleich dem Erwartungswert, sofern letzterer existiert.

  19. 19.

    Auch andere Vorgehensweisen werden diskutiert, insbesondere wenn es viele Werte gleich \(m_{0}\) gibt. So können im Fall geradzahlig vieler Werte gleich \(m_{0}\) die Hälfte dieser Werte als \(< m_{0}\), die andere Hälfte als \(> m_{0}\) codiert werden. Im Fall ungeradzahlig vieler Werte gleich \(m_{0}\) wird ein Wert eliminiert und dann wie für geradzahlig viele Werte beschrieben verfahren.

  20. 20.

    Ohne Annahme gleicher Verteilungsform beziehen sich Null- und Alternativhypothese auf die Wahrscheinlichkeit dafür, dass eine zufällige Beobachtung aus der ersten Gruppe größer bzw. kleiner als eine zufällig gezogene Beobachtung aus der zweiten Gruppe ist.

  21. 21.

    Im gewählten Beispiel sind die Ränge nicht eindeutig, es treten also Bindungen auf. Für diesen Fall gibt rank() in der Voreinstellung mittlere Ränge aus, was vom Vorgehen in kruskal.test() abweicht. Die manuell berechnete Teststatistik und der p-Wert stimmen deshalb nicht exakt mit jenen aus kruskal.test() überein.

  22. 22.

    Im gewählten Beispiel sind die Ränge im zweiten Block nicht eindeutig, es treten also Bindungen auf. Deshalb wird die Teststatistik S in friedman.test() weiter korrigiert und stimmt nicht exakt mit der hier berechneten überein.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Wollschläger .

Rights and permissions

Reprints and permissions

Copyright information

© 2020 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Wollschläger, D. (2020). Klassische nonparametrische Methoden. In: Grundlagen der Datenanalyse mit R. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61736-6_10

Download citation

Publish with us

Policies and ethics