Standardfehler, Ranglisten und Modelle

Bättig, Daniel

doi:10.1007/978-3-662-54220-0_14

Daniel Bättig Prof. Dr.⁴

Part of the book series: Statistik und ihre Anwendungen ((STATIST))

7797 Accesses

Zusammenfassung

Nicht direkt messbare Grössen werden oft aus verschiedenen Gruppen berechnet. So will man aus einer Stichprobe die durchschnittlichen Raten der Neuerkrankungen an Lungenkrebs in verschiedenen Regionen kennen. Eine Ingenieurin will die Haftkraft von Klebeetiketten (eine Grösse, die wegen Messunsicherheiten und variierender Kovariablen nicht direkt bestimmbar ist) aus drei Produktionsorten oder -arten vergleichen. Es ist verbreitet und praktisch, solche Vergleiche mit der Laplace-Approximation und dem Standardfehler durchzuführen. Was dies ist und worauf man hierbei achten sollte, wird in diesem Kapitel beschrieben. Oft sind Gruppen ähnlich oder gleich strukturiert. Diese Information lässt sich in die statistischen Modelle einbauen. Damit lassen sich nicht direkt messbare Grössen der verschiedenen Gruppen sehr effizient vergleichen. Dies zeigt der letzte Abschnitt in diesem Kapitel.

Zusammenfassung

Nicht direkt messbare Grössen werden oft aus verschiedenen Gruppen berechnet. So will man aus einer Stichprobe die durchschnittlichen Raten der Neuerkrankungen an Lungenkrebs in verschiedenen Regionen kennen. Eine Ingenieurin will die Haftkraft von Klebeetiketten (eine Grösse, die wegen Messunsicherheiten und variierender Kovariablen nicht direkt bestimmbar ist) aus drei Produktionsorten oder -arten vergleichen. Es ist verbreitet und praktisch, solche Vergleiche mit der Laplace-Approximation und dem Standardfehler durchzuführen. Was dies ist und worauf man hierbei achten sollte, wird in diesem Kapitel beschrieben. Oft sind Gruppen ähnlich oder gleich strukturiert. Diese Information lässt sich in die statistischen Modelle einbauen. Damit lassen sich nicht direkt messbare Grössen der verschiedenen Gruppen sehr effizient vergleichen. Dies zeigt der letzte Abschnitt in diesem Kapitel.

Nachdem sie indessen ungefähr eine halbe Stunde lang gelaufen und wieder ganz trocken geworden waren, rief der Brachvogel plötzlich: „Ende des Wettlaufs!“, und alle drängten sich, noch ganz ausser Atem, um ihn und fragten: „Aber wer ist Sieger?“Dies konnte der Brachvogel nicht ohne tieferes Nachdenken beantworten, und so sass er längere Zeit hindurch da und legte den Zeigefinger an die Stirn (eine Haltung, in der ihr gewöhnlich Goethe auf den Titelbildern sitzen seht), während ringsum alles schwieg und wartete. Endlich sagte der Brachvogel: „Alle sind Sieger, und jeder muss einen Preis bekommen.“Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 30)

Nachdem sie indessen ungefähr eine halbe Stunde lang gelaufen und wieder ganz trocken geworden waren, rief der Brachvogel plötzlich: „Ende des Wettlaufs!“, und alle drängten sich, noch ganz ausser Atem, um ihn und fragten: „Aber wer ist Sieger?“

Dies konnte der Brachvogel nicht ohne tieferes Nachdenken beantworten, und so sass er längere Zeit hindurch da und legte den Zeigefinger an die Stirn (eine Haltung, in der ihr gewöhnlich Goethe auf den Titelbildern sitzen seht), während ringsum alles schwieg und wartete. Endlich sagte der Brachvogel: „Alle sind Sieger, und jeder muss einen Preis bekommen.“

Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 30)

This is a preview of subscription content, log in via an institution to check access.

Access this chapter

Log in via an institution

Chapter: USD 29.95; Price excludes VAT (USA)

eBook: USD 29.99; Price excludes VAT (USA)

Softcover Book: USD 39.99; Price excludes VAT (USA)

Tax calculation will be finalised at checkout

Purchases are for personal use only

Institutional subscriptions

Notes

1.
Man zeigt das Folgende:
1. (1)
  Der Modus der A posteriori-Verteilung ist konsistent. Dies bedeutet: er schätzt die nicht direkt messbare Grösse immer besser, wenn die Anzahl Messungen zunimmt.
2. (2)
  Die A posteriori-Verteilung konzentriert sich bei unabhängigen Messungen immer stärker um den Modus, wenn die A priori-Verteilung vernünftig gewählt ist.
3. (3)
  Die Methode von Laplace approximiert die A posteriori-Verteilung gut, wenn der Modus nicht am Rand der Verteilung liegt.
Die Details dazu – und interessante Gegenbeispiele – findet man in [3] in Anhang B.
2.
Ist das Datenmodell die Exponentialverteilung mit Parameter μ, so lautet die A posteriori-Verteilung des Parameters
$$\text{pdf}(\mu\;|\;\text{Daten, Vorinformation})\> \propto\;{\mu^{-n}}\cdot\exp(-n\cdot\overline{x}/\mu)\cdot\text{pdf}(\mu\;|\;\text{Vorinformation})$$
Dabei ist $\overline{x}$ das arithmetische Mittel der Daten und n ist die Anzahl Messungen. Ist die Likelihood dominant, so ist der Modus μ₀ der Verteilung $\overline{x}$. Die beobachtete Information lautet
$$I(\mu)=-\frac{n}{\mu^{2}}+2\cdot\frac{n\cdot\overline{x}}{\mu^{3}}$$
Setzt man hier den Modus μ₀ ein, erhält man $I(\mu_{0})={n}/{\overline{x}^{2}}$. Deshalb ist der Standardfehler $\text{SE}(\text{exp})={\overline{x}}/{\sqrt{n}}$. Dies ergibt die Formel (9.1).
3.
Ein Beispiel, bei der die δ-Methode schlecht ist, findet man in [7] auf den Seiten 74–77.
4.
Man findet ähnliche und andere Rechnungen in den meisten Büchern, die sich mit Wahrscheinlichkeitsmodellen befassen. Präziser kann man sogar sagen: Sind zwei Grössen X und Y normalverteilt, so sind auch die Summe S = X + Y und die Differenz D = X − Y normalverteilt. Die Moden sind $X_{0}+Y_{0}$ und $X_{0}-Y_{0}$. Die Varianz $(\delta S)^{2}$ von S und D ist, falls X und Y unabhängig sind, gleich $(\delta X)^{2}+(\delta Y)^{2}$. Um dies zu zeigen, braucht man die gemeinsame Verteilung $\text{pdf}(X,Y)$ von X und Y. Sind X und Y unabhängig, so ist nach der Multiplikationsregel
$$\text{pdf}(X,Y)=\text{pdf}(X)\cdot\text{pdf}(Y)\propto\exp\left\{-0{,}5\cdot\chi^{2}\right\}\qquad\text{mit}\quad\chi^{2}=\left(\frac{X-X_{0}}{\delta X}\right)^{2}+\left(\frac{Y-Y_{0}}{\delta Y}\right)^{2}$$
Die Wahrscheinlichkeit, dass $S=S_{0}\pm\delta S$ ist, ist gleich dem Volumen unter der Fläche des Graphen der Dichtefunktion $\text{pdf}(X,Y)$, beschränkt durch $X+Y=S_{0}\pm\delta S$. Man erhält ein Integral, das sich mit der Substitution S = X + Y, T = Y und algebraischen Tricks durch die Dichte der Normalverteilung ausdrücken lässt.
5.
Man nennt den durchschnittlichen Wert von $\Delta X\cdot\Delta Y$ auch die Kovarianz (engl. Covariance) der gemeinsamen Verteilung von X und Y. Man hat allgemein für S = X + Y:
$$(\delta S)^{2}=(\delta X)^{2}+(\delta Y)^{2}+2\cdot\text{Cov}(X,Y)$$
6.
Ist P = X ⋅ Y, so erhält man aus $\ln P=\ln X+\ln Y$ die erwähnte Formel. Nach der Transformationsformel ist $\ln X\approx\ln X_{0}\pm\delta X/X_{0}$. Somit folgt
$$\delta\ln P\approx\sqrt{\left(\frac{\delta X}{X_{0}}\right)^{2}+\left(\frac{\delta Y}{Y_{0}}\right)^{2}}$$
7.
Siehe dazu auch die Strukturfunktion (9.3).
8.
Die wahrscheinlichsten Werte für den Hyperparameter b ist $b_{0}=26{,}5$ g. Die durchschnittlichen Fischmassen der Becken streuen also in einem Bereich mit Breite $2\cdot 26{,}5\,\text{g}=53$ g.

Literatur

C. Daniel, Applications of Statistics to Industrial Experimentation (John Wiley & Sons, New York, 1976)
Book MATH Google Scholar
D. Freedman, R. Pisani, R. Purves, Statistics, 4. Aufl. (W. W. Norton & Company, 2007)
MATH Google Scholar
A. Gelman, J.B. Carlin, H.S. Stern, D.B. Rubin, Bayesian Data Analysis (Chapman & Hall, 2004)
MATH Google Scholar
H. Hotelling, Some problems in weighing and other experimental techniques. Am Math Stat 15, 297–306 (1944)
Article MathSciNet MATH Google Scholar
R. McElrath, Statistical Rethinking, a Bayesian Course with Examples in R and Stan (Chapman & Hall, 2016)
Google Scholar
F. Oser, H. Biedermann, M. Kopp, S. Steinmann, C. Brühwiler, S. Krattenmacher, TEDS-M: Erste Ergebnisse für die Lehrerausbildung in der Deutschschweiz, Medienmitteilung, 15. Apr. 2010
Google Scholar
D.S. Sivia, J. Skilling, Data Analysis, a Bayesian Tutorial, 2. Aufl. (Oxford Science Publications, 2010)
MATH Google Scholar
H. Wainer, Picturing the Uncertain World, How to Understand, Communicate, and Control Uncertainty through Graphical Display (Princeton University Press, 2009)
MATH Google Scholar

Download references

Author information

Authors and Affiliations

Institut für Risiko- und Extremwertanalyse, Berner Fachhochschule, Burgdorf, Schweiz
Daniel Bättig Prof. Dr.

Authors

Daniel Bättig Prof. Dr.
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Daniel Bättig Prof. Dr. .

Rights and permissions

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Bättig, D. (2017). Standardfehler, Ranglisten und Modelle. In: Angewandte Datenanalyse. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-54220-0_14

Download citation

DOI: https://doi.org/10.1007/978-3-662-54220-0_14
Published: 19 May 2017
Publisher Name: Springer Spektrum, Berlin, Heidelberg
Print ISBN: 978-3-662-54219-4
Online ISBN: 978-3-662-54220-0
eBook Packages: Life Science and Basic Disciplines (German Language)

Publish with us

Policies and ethics

Standardfehler, Ranglisten und Modelle

Zusammenfassung

Zusammenfassung

Access this chapter

Notes

Literatur

Author information

Authors and Affiliations

Corresponding author

Rights and permissions

Copyright information

About this chapter

Cite this chapter

Download citation

Share this chapter

Publish with us

Search

Navigation