Skip to main content

Standardfehler, Ranglisten und Modelle

  • Chapter
  • First Online:
Angewandte Datenanalyse

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

  • 7797 Accesses

Zusammenfassung

Nicht direkt messbare Grössen werden oft aus verschiedenen Gruppen berechnet. So will man aus einer Stichprobe die durchschnittlichen Raten der Neuerkrankungen an Lungenkrebs in verschiedenen Regionen kennen. Eine Ingenieurin will die Haftkraft von Klebeetiketten (eine Grösse, die wegen Messunsicherheiten und variierender Kovariablen nicht direkt bestimmbar ist) aus drei Produktionsorten oder -arten vergleichen. Es ist verbreitet und praktisch, solche Vergleiche mit der Laplace-Approximation und dem Standardfehler durchzuführen. Was dies ist und worauf man hierbei achten sollte, wird in diesem Kapitel beschrieben. Oft sind Gruppen ähnlich oder gleich strukturiert. Diese Information lässt sich in die statistischen Modelle einbauen. Damit lassen sich nicht direkt messbare Grössen der verschiedenen Gruppen sehr effizient vergleichen. Dies zeigt der letzte Abschnitt in diesem Kapitel.

Zusammenfassung

Nicht direkt messbare Grössen werden oft aus verschiedenen Gruppen berechnet. So will man aus einer Stichprobe die durchschnittlichen Raten der Neuerkrankungen an Lungenkrebs in verschiedenen Regionen kennen. Eine Ingenieurin will die Haftkraft von Klebeetiketten (eine Grösse, die wegen Messunsicherheiten und variierender Kovariablen nicht direkt bestimmbar ist) aus drei Produktionsorten oder -arten vergleichen. Es ist verbreitet und praktisch, solche Vergleiche mit der Laplace-Approximation und dem Standardfehler durchzuführen. Was dies ist und worauf man hierbei achten sollte, wird in diesem Kapitel beschrieben. Oft sind Gruppen ähnlich oder gleich strukturiert. Diese Information lässt sich in die statistischen Modelle einbauen. Damit lassen sich nicht direkt messbare Grössen der verschiedenen Gruppen sehr effizient vergleichen. Dies zeigt der letzte Abschnitt in diesem Kapitel.

Nachdem sie indessen ungefähr eine halbe Stunde lang gelaufen und wieder ganz trocken geworden waren, rief der Brachvogel plötzlich: „Ende des Wettlaufs!“, und alle drängten sich, noch ganz ausser Atem, um ihn und fragten: „Aber wer ist Sieger?“Dies konnte der Brachvogel nicht ohne tieferes Nachdenken beantworten, und so sass er längere Zeit hindurch da und legte den Zeigefinger an die Stirn (eine Haltung, in der ihr gewöhnlich Goethe auf den Titelbildern sitzen seht), während ringsum alles schwieg und wartete. Endlich sagte der Brachvogel: „Alle sind Sieger, und jeder muss einen Preis bekommen.“Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 30)

Nachdem sie indessen ungefähr eine halbe Stunde lang gelaufen und wieder ganz trocken geworden waren, rief der Brachvogel plötzlich: „Ende des Wettlaufs!“, und alle drängten sich, noch ganz ausser Atem, um ihn und fragten: „Aber wer ist Sieger?“

Dies konnte der Brachvogel nicht ohne tieferes Nachdenken beantworten, und so sass er längere Zeit hindurch da und legte den Zeigefinger an die Stirn (eine Haltung, in der ihr gewöhnlich Goethe auf den Titelbildern sitzen seht), während ringsum alles schwieg und wartete. Endlich sagte der Brachvogel: „Alle sind Sieger, und jeder muss einen Preis bekommen.“

Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 30)

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Chapter
USD 29.95
Price excludes VAT (USA)
  • Available as PDF
  • Read on any device
  • Instant download
  • Own it forever
eBook
USD 29.99
Price excludes VAT (USA)
  • Available as EPUB and PDF
  • Read on any device
  • Instant download
  • Own it forever
Softcover Book
USD 39.99
Price excludes VAT (USA)
  • Compact, lightweight edition
  • Dispatched in 3 to 5 business days
  • Free shipping worldwide - see info

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

  1. 1.

    Man zeigt das Folgende:

    1. (1)

      Der Modus der A posteriori-Verteilung ist konsistent. Dies bedeutet: er schätzt die nicht direkt messbare Grösse immer besser, wenn die Anzahl Messungen zunimmt.

    2. (2)

      Die A posteriori-Verteilung konzentriert sich bei unabhängigen Messungen immer stärker um den Modus, wenn die A priori-Verteilung vernünftig gewählt ist.

    3. (3)

      Die Methode von Laplace approximiert die A posteriori-Verteilung gut, wenn der Modus nicht am Rand der Verteilung liegt.

    Die Details dazu – und interessante Gegenbeispiele – findet man in [3] in Anhang B.

  2. 2.

    Ist das Datenmodell die Exponentialverteilung mit Parameter μ, so lautet die A posteriori-Verteilung des Parameters

    $$\text{pdf}(\mu\;|\;\text{Daten, Vorinformation})\> \propto\;{\mu^{-n}}\cdot\exp(-n\cdot\overline{x}/\mu)\cdot\text{pdf}(\mu\;|\;\text{Vorinformation})$$

    Dabei ist \(\overline{x}\) das arithmetische Mittel der Daten und n ist die Anzahl Messungen. Ist die Likelihood dominant, so ist der Modus μ0 der Verteilung \(\overline{x}\). Die beobachtete Information lautet

    $$I(\mu)=-\frac{n}{\mu^{2}}+2\cdot\frac{n\cdot\overline{x}}{\mu^{3}}$$

    Setzt man hier den Modus μ0 ein, erhält man \(I(\mu_{0})={n}/{\overline{x}^{2}}\). Deshalb ist der Standardfehler \(\text{SE}(\text{exp})={\overline{x}}/{\sqrt{n}}\). Dies ergibt die Formel (9.1).

  3. 3.

    Ein Beispiel, bei der die δ-Methode schlecht ist, findet man in [7] auf den Seiten 74–77.

  4. 4.

    Man findet ähnliche und andere Rechnungen in den meisten Büchern, die sich mit Wahrscheinlichkeitsmodellen befassen. Präziser kann man sogar sagen: Sind zwei Grössen X und Y normalverteilt, so sind auch die Summe S = X + Y und die Differenz D = X − Y normalverteilt. Die Moden sind \(X_{0}+Y_{0}\) und \(X_{0}-Y_{0}\). Die Varianz \((\delta S)^{2}\) von S und D ist, falls X und Y unabhängig sind, gleich \((\delta X)^{2}+(\delta Y)^{2}\). Um dies zu zeigen, braucht man die gemeinsame Verteilung \(\text{pdf}(X,Y)\) von X und Y. Sind X und Y unabhängig, so ist nach der Multiplikationsregel

    $$\text{pdf}(X,Y)=\text{pdf}(X)\cdot\text{pdf}(Y)\propto\exp\left\{-0{,}5\cdot\chi^{2}\right\}\qquad\text{mit}\quad\chi^{2}=\left(\frac{X-X_{0}}{\delta X}\right)^{2}+\left(\frac{Y-Y_{0}}{\delta Y}\right)^{2}$$

    Die Wahrscheinlichkeit, dass \(S=S_{0}\pm\delta S\) ist, ist gleich dem Volumen unter der Fläche des Graphen der Dichtefunktion \(\text{pdf}(X,Y)\), beschränkt durch \(X+Y=S_{0}\pm\delta S\). Man erhält ein Integral, das sich mit der Substitution S = X + Y, T = Y und algebraischen Tricks durch die Dichte der Normalverteilung ausdrücken lässt.

  5. 5.

    Man nennt den durchschnittlichen Wert von \(\Delta X\cdot\Delta Y\) auch die Kovarianz (engl. Covariance) der gemeinsamen Verteilung von X und Y. Man hat allgemein für S = X + Y:

    $$(\delta S)^{2}=(\delta X)^{2}+(\delta Y)^{2}+2\cdot\text{Cov}(X,Y)$$
  6. 6.

    Ist P = X ⋅ Y, so erhält man aus \(\ln P=\ln X+\ln Y\) die erwähnte Formel. Nach der Transformationsformel ist \(\ln X\approx\ln X_{0}\pm\delta X/X_{0}\). Somit folgt

    $$\delta\ln P\approx\sqrt{\left(\frac{\delta X}{X_{0}}\right)^{2}+\left(\frac{\delta Y}{Y_{0}}\right)^{2}}$$
  7. 7.

    Siehe dazu auch die Strukturfunktion (9.3).

  8. 8.

    Die wahrscheinlichsten Werte für den Hyperparameter b ist \(b_{0}=26{,}5\) g. Die durchschnittlichen Fischmassen der Becken streuen also in einem Bereich mit Breite \(2\cdot 26{,}5\,\text{g}=53\) g.

Literatur

  1. C. Daniel, Applications of Statistics to Industrial Experimentation (John Wiley & Sons, New York, 1976)

    Book  MATH  Google Scholar 

  2. D. Freedman, R. Pisani, R. Purves, Statistics, 4. Aufl. (W. W. Norton & Company, 2007)

    MATH  Google Scholar 

  3. A. Gelman, J.B. Carlin, H.S. Stern, D.B. Rubin, Bayesian Data Analysis (Chapman & Hall, 2004)

    MATH  Google Scholar 

  4. H. Hotelling, Some problems in weighing and other experimental techniques. Am Math Stat 15, 297–306 (1944)

    Article  MathSciNet  MATH  Google Scholar 

  5. R. McElrath, Statistical Rethinking, a Bayesian Course with Examples in R and Stan (Chapman & Hall, 2016)

    Google Scholar 

  6. F. Oser, H. Biedermann, M. Kopp, S. Steinmann, C. Brühwiler, S. Krattenmacher, TEDS-M: Erste Ergebnisse für die Lehrerausbildung in der Deutschschweiz, Medienmitteilung, 15. Apr. 2010

    Google Scholar 

  7. D.S. Sivia, J. Skilling, Data Analysis, a Bayesian Tutorial, 2. Aufl. (Oxford Science Publications, 2010)

    MATH  Google Scholar 

  8. H. Wainer, Picturing the Uncertain World, How to Understand, Communicate, and Control Uncertainty through Graphical Display (Princeton University Press, 2009)

    MATH  Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Daniel Bättig Prof. Dr. .

Rights and permissions

Reprints and permissions

Copyright information

© 2017 Springer-Verlag GmbH Deutschland

About this chapter

Cite this chapter

Bättig, D. (2017). Standardfehler, Ranglisten und Modelle. In: Angewandte Datenanalyse. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-54220-0_14

Download citation

Publish with us

Policies and ethics