Skip to main content

t-Tests und Varianzanalysen

  • Chapter
  • First Online:
Grundlagen der Datenanalyse mit R

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 7500 Accesses

Zusammenfassung

Häufig bestehen in empirischen Untersuchungen Hypothesen über Erwartungswerte von Variablen. Viele der für solche Hypothesen geeigneten Tests gehen davon aus, dass bestimmte Annahmen über die Verteilungen der Variablen erfüllt sind, dass etwa in allen Bedingungen Normalverteilungen mit derselben Varianz vorliegen.

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 44.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 59.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Als Alternative für den Fall nicht normalverteilter Variablen existieren die nonparametrischen Tests nach Mood bzw. Ansari-Bradley (Abschn. 10.4).

  2. 2.

    Diese Variante wird auch als Brown-Forsythe-Test bezeichnet. Mit leveneTest(..., center=mean) können alternativ die Differenzen zum jeweiligen Gruppenmittelwert gewählt werden.

  3. 3.

    Das Paket MBESS enthält eigene Funktionen, um viele der hier verwendeten Effektstärken inkl. eines Vertrauensintervalls zu berechnen. Für die in den manuellen Berechnungen verwendeten Formeln s. Eid et al. (2017).

  4. 4.

    Hier und im Folgenden wird für varianzanalytische Versuchspläne die Notation von Kirk (2013) übernommen.

  5. 5.

    Da aov() letztlich lm() aufruft, lassen sich auf diese Liste dieselben Funktionen zur Extraktion weiterer Informationen anwenden (Abschn. 6.2).

  6. 6.

    Für alternative Verfahren, die robuster gegenüber der Verletzung bestimmter Voraussetzungen sind, oder weniger Voraussetzungen machen, s. Abschn. 6.6.1, 10.5.6 und 11.1.5.

  7. 7.

    Für weitere vgl. ?PostHocTest nach Laden des Pakets DescTools.

  8. 8.

    Bei Verwendung von reshape() werden sowohl die Blockzugehörigkeit als auch der Messzeitpunkt als numerischer Vektor codiert. Beide Variablen sind deshalb manuell in Faktoren umzuwandeln.

  9. 9.

    Ausgeschrieben lautet der Term . Dies sind die beiden Effekte, deren Quadratsummen sich zur Quadratsumme innerhalb der Gruppen addieren – also zur Quadratsumme der Residuen einer CR-p ANOVA, die keinen Effekt von berücksichtigt (anova(lm(DV ~ IV, data=dfRBpL))).

  10. 10.

    Dies ist bei nur zwei Gruppen immer der Fall.

  11. 11.

    Bei der multivariaten Formulierung des Modells wird intern aufgrund der generischen anova() Funktion automatisch anova.mlm() verwendet, ohne dass dies explizit angegeben werden muss (Abschn. 17.3.6). Ohne das Argument test="Spherical" wird multivariat getestet (Abschn. 12.6.4).

  12. 12.

    Aufwendiger gestaltete und sehr flexibel anpassbare Visualisierungen bietet das Paket emmeans (Lenth 2020). Nach seiner Installation zeigt vignette("interactions", package="emmeans") Beispiele. Das Paket eignet sich auch für komplexere Modelle und bietet die Möglichkeit Kontraste zu testen.

  13. 13.

    Die hier verwendete Terminologie von Typen von Quadratsummen wurde ursprünglich mit dem Programm SAS eingeführt und bezeichnet letztlich unterschiedliche Hypothesen in varianzanalytischen Designs mit mehreren Faktoren.

  14. 14.

    Die genannte Äquivalenz von Modellvergleichen und Hypothesen über ungewichtete Randerwartungswerte setzt voraus, dass ein passendes Codierschema für kategoriale Variablen verwendet wird, z. B. die Effektcodierung (Venables 2018; Abschn. 12.9.2).

  15. 15.

    Proportional ungleiche Zellbesetzungen liegen vor, wenn \(\frac{n_{jk}}{n_{jk'}} = \frac{n_{j'k}}{n_{j'k'}}\) sowie \(\frac{n_{jk}}{n_{j'k}} = \frac{n_{jk'}}{n_{j'k'}}\) für alle \(j, j', k, k'\) gilt.

  16. 16.

    Für weitere vgl. ?PostHocTest aus dem Paket DescTools.

  17. 17.

    Der Term lautet , wenn er ausgeschrieben wird. Dies sind die vier Effekte, deren Quadratsummen sich zur Quadratsumme innerhalb der Zellen addieren – also zur Quadratsumme der Residuen einer CRF-pq ANOVA, die keinen Effekt von berücksichtigt (anova(lm(DV ~ IV1*IV2, data=dfRBFpqL))).

  18. 18.

    Ausgeschrieben lautet der Term . Dies sind die beiden Effekte, deren Quadratsummen sich zur Quadratsumme innerhalb der Zellen addieren – also zur Quadratsumme der Residuen einer CRF-pq ANOVA, die keinen Effekt von berücksichtigt: anova(lm(DV ~ IVbtw*IVwth, data=dfSPFpqL)).

  19. 19.

    Da keine Interaktion von Treatment-Variable und Kovariate berücksichtigt wird, sind die Quadratsummen vom Typ II und III hier identisch.

  20. 20.

    Die absolute Höhe der Gruppe der y-Achsenabschnitte lässt sich aus den Daten nicht unabhängig schätzen, während ihre Abstände untereinander eindeutig bestimmt sind. Die in [Maxwell et al. 2017, Kap. 9] gezeigte Lösung fixiert den y-Achsenabschnitt der WL Gruppe auf 0 und berichtet die übrigen als Differenz dazu.

  21. 21.

    Für zwei unabhängige Stichproben mit Gruppengrößen \(n_{1}\) und \(n_{2}\), Streuung \(\sigma \) und Erwartungswerten \(\mu _{1}\) und \(\mu _{2}\) unter \(\text {H}_{1}\) ist \(\delta = \sqrt{\frac{n_{1} \, n_{2}}{n_{1}+n_{2}}} \, \frac{\mu _{2}-\mu _{1}}{\sigma }\). Für zwei abhängige Stichproben des jeweiligen Umfangs n mit theoretischen Streuungen \(\sigma _{1}\) und \(\sigma _{2}\) sowie der theoretischen Korrelation \(\rho \) ist \(\delta = \sqrt{n} \, \frac{\mu _{2}-\mu _{1}}{\sqrt{\sigma _{1}^{2} + \sigma _{2}^{2} + 2 \, \rho \, \sigma _{1} \, \sigma _{2}}}\).

  22. 22.

    Die Funktionen sind nicht vektorisiert, akzeptieren für jedes Argument also nur jeweils einen Wert.

  23. 23.

    Für unterschiedliche Gruppengrößen \(n_{1}\) und \(n_{2}\) lassen sich annähernd richtige Ergebnisse erzielen, wenn 2*((n1*n2)/(n1+n2)) für das Argument n übergeben wird, wodurch die Berechnung des Nonzentralitätsparameters \(\delta \) als sqrt(n/2) * (delta/sd) korrekt ist. Statt mit der richtigen Zahl der Freiheitsgrade \(n_{1}+n_{2}-2\) rechnet power.t.test() dann aber mit \(4 \, \frac{n_{1} \, n_{2}}{n_{1}+n_{2}} - 2\). Der so entstehende Fehler wächst zwar mit der Differenz von \(n_{1}\) und \(n_{2}\), bleibt jedoch absolut gesehen gering.

  24. 24.

    Enthält der Vektor muJ die Erwartungswerte der Gruppen unter \(\text {H}_{1}\), muss wegen der in power.anova.test() verwendeten Formel für den Nonzentralitätsparameter \(\lambda \) die korrigierte Varianz der Erwartungswerte, also var(muJ), für das Argument between.var übergeben werden.

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Wollschläger .

Rights and permissions

Reprints and permissions

Copyright information

© 2020 Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature

About this chapter

Check for updates. Verify currency and authenticity via CrossMark

Cite this chapter

Wollschläger, D. (2020). t-Tests und Varianzanalysen. In: Grundlagen der Datenanalyse mit R. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-61736-6_7

Download citation

Publish with us

Policies and ethics