Zusammenfassung
Nicht direkt messbare Grössen werden oft aus verschiedenen Gruppen berechnet. So will man aus einer Stichprobe die durchschnittlichen Raten der Neuerkrankungen an Lungenkrebs in verschiedenen Regionen kennen. Eine Ingenieurin will die Haftkraft von Klebeetiketten (eine Grösse, die wegen Messunsicherheiten und variierender Kovariablen nicht direkt bestimmbar ist) aus drei Produktionsorten oder -arten vergleichen. Es ist verbreitet und praktisch, solche Vergleiche mit der Laplace-Approximation und dem Standardfehler durchzuführen. Was dies ist und worauf man hierbei achten sollte, wird in diesem Kapitel beschrieben. Oft sind Gruppen ähnlich oder gleich strukturiert. Diese Information lässt sich in die statistischen Modelle einbauen. Damit lassen sich nicht direkt messbare Grössen der verschiedenen Gruppen sehr effizient vergleichen. Dies zeigt der letzte Abschnitt in diesem Kapitel.
Zusammenfassung
Nicht direkt messbare Grössen werden oft aus verschiedenen Gruppen berechnet. So will man aus einer Stichprobe die durchschnittlichen Raten der Neuerkrankungen an Lungenkrebs in verschiedenen Regionen kennen. Eine Ingenieurin will die Haftkraft von Klebeetiketten (eine Grösse, die wegen Messunsicherheiten und variierender Kovariablen nicht direkt bestimmbar ist) aus drei Produktionsorten oder -arten vergleichen. Es ist verbreitet und praktisch, solche Vergleiche mit der Laplace-Approximation und dem Standardfehler durchzuführen. Was dies ist und worauf man hierbei achten sollte, wird in diesem Kapitel beschrieben. Oft sind Gruppen ähnlich oder gleich strukturiert. Diese Information lässt sich in die statistischen Modelle einbauen. Damit lassen sich nicht direkt messbare Grössen der verschiedenen Gruppen sehr effizient vergleichen. Dies zeigt der letzte Abschnitt in diesem Kapitel.
Nachdem sie indessen ungefähr eine halbe Stunde lang gelaufen und wieder ganz trocken geworden waren, rief der Brachvogel plötzlich: „Ende des Wettlaufs!“, und alle drängten sich, noch ganz ausser Atem, um ihn und fragten: „Aber wer ist Sieger?“Dies konnte der Brachvogel nicht ohne tieferes Nachdenken beantworten, und so sass er längere Zeit hindurch da und legte den Zeigefinger an die Stirn (eine Haltung, in der ihr gewöhnlich Goethe auf den Titelbildern sitzen seht), während ringsum alles schwieg und wartete. Endlich sagte der Brachvogel: „Alle sind Sieger, und jeder muss einen Preis bekommen.“Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 30)
Nachdem sie indessen ungefähr eine halbe Stunde lang gelaufen und wieder ganz trocken geworden waren, rief der Brachvogel plötzlich: „Ende des Wettlaufs!“, und alle drängten sich, noch ganz ausser Atem, um ihn und fragten: „Aber wer ist Sieger?“
Dies konnte der Brachvogel nicht ohne tieferes Nachdenken beantworten, und so sass er längere Zeit hindurch da und legte den Zeigefinger an die Stirn (eine Haltung, in der ihr gewöhnlich Goethe auf den Titelbildern sitzen seht), während ringsum alles schwieg und wartete. Endlich sagte der Brachvogel: „Alle sind Sieger, und jeder muss einen Preis bekommen.“
Lewis Carroll, Alice im Wunderland (Insel Taschenbuch, 1973, S. 30)
Access this chapter
Tax calculation will be finalised at checkout
Purchases are for personal use only
Notes
- 1.
Man zeigt das Folgende:
-
(1)
Der Modus der A posteriori-Verteilung ist konsistent. Dies bedeutet: er schätzt die nicht direkt messbare Grösse immer besser, wenn die Anzahl Messungen zunimmt.
-
(2)
Die A posteriori-Verteilung konzentriert sich bei unabhängigen Messungen immer stärker um den Modus, wenn die A priori-Verteilung vernünftig gewählt ist.
-
(3)
Die Methode von Laplace approximiert die A posteriori-Verteilung gut, wenn der Modus nicht am Rand der Verteilung liegt.
Die Details dazu – und interessante Gegenbeispiele – findet man in [3] in Anhang B.
-
(1)
- 2.
Ist das Datenmodell die Exponentialverteilung mit Parameter μ, so lautet die A posteriori-Verteilung des Parameters
$$\text{pdf}(\mu\;|\;\text{Daten, Vorinformation})\> \propto\;{\mu^{-n}}\cdot\exp(-n\cdot\overline{x}/\mu)\cdot\text{pdf}(\mu\;|\;\text{Vorinformation})$$Dabei ist \(\overline{x}\) das arithmetische Mittel der Daten und n ist die Anzahl Messungen. Ist die Likelihood dominant, so ist der Modus μ0 der Verteilung \(\overline{x}\). Die beobachtete Information lautet
$$I(\mu)=-\frac{n}{\mu^{2}}+2\cdot\frac{n\cdot\overline{x}}{\mu^{3}}$$Setzt man hier den Modus μ0 ein, erhält man \(I(\mu_{0})={n}/{\overline{x}^{2}}\). Deshalb ist der Standardfehler \(\text{SE}(\text{exp})={\overline{x}}/{\sqrt{n}}\). Dies ergibt die Formel (9.1).
- 3.
Ein Beispiel, bei der die δ-Methode schlecht ist, findet man in [7] auf den Seiten 74–77.
- 4.
Man findet ähnliche und andere Rechnungen in den meisten Büchern, die sich mit Wahrscheinlichkeitsmodellen befassen. Präziser kann man sogar sagen: Sind zwei Grössen X und Y normalverteilt, so sind auch die Summe S = X + Y und die Differenz D = X − Y normalverteilt. Die Moden sind \(X_{0}+Y_{0}\) und \(X_{0}-Y_{0}\). Die Varianz \((\delta S)^{2}\) von S und D ist, falls X und Y unabhängig sind, gleich \((\delta X)^{2}+(\delta Y)^{2}\). Um dies zu zeigen, braucht man die gemeinsame Verteilung \(\text{pdf}(X,Y)\) von X und Y. Sind X und Y unabhängig, so ist nach der Multiplikationsregel
$$\text{pdf}(X,Y)=\text{pdf}(X)\cdot\text{pdf}(Y)\propto\exp\left\{-0{,}5\cdot\chi^{2}\right\}\qquad\text{mit}\quad\chi^{2}=\left(\frac{X-X_{0}}{\delta X}\right)^{2}+\left(\frac{Y-Y_{0}}{\delta Y}\right)^{2}$$Die Wahrscheinlichkeit, dass \(S=S_{0}\pm\delta S\) ist, ist gleich dem Volumen unter der Fläche des Graphen der Dichtefunktion \(\text{pdf}(X,Y)\), beschränkt durch \(X+Y=S_{0}\pm\delta S\). Man erhält ein Integral, das sich mit der Substitution S = X + Y, T = Y und algebraischen Tricks durch die Dichte der Normalverteilung ausdrücken lässt.
- 5.
Man nennt den durchschnittlichen Wert von \(\Delta X\cdot\Delta Y\) auch die Kovarianz (engl. Covariance) der gemeinsamen Verteilung von X und Y. Man hat allgemein für S = X + Y:
$$(\delta S)^{2}=(\delta X)^{2}+(\delta Y)^{2}+2\cdot\text{Cov}(X,Y)$$ - 6.
Ist P = X ⋅ Y, so erhält man aus \(\ln P=\ln X+\ln Y\) die erwähnte Formel. Nach der Transformationsformel ist \(\ln X\approx\ln X_{0}\pm\delta X/X_{0}\). Somit folgt
$$\delta\ln P\approx\sqrt{\left(\frac{\delta X}{X_{0}}\right)^{2}+\left(\frac{\delta Y}{Y_{0}}\right)^{2}}$$ - 7.
Siehe dazu auch die Strukturfunktion (9.3).
- 8.
Die wahrscheinlichsten Werte für den Hyperparameter b ist \(b_{0}=26{,}5\) g. Die durchschnittlichen Fischmassen der Becken streuen also in einem Bereich mit Breite \(2\cdot 26{,}5\,\text{g}=53\) g.
Literatur
C. Daniel, Applications of Statistics to Industrial Experimentation (John Wiley & Sons, New York, 1976)
D. Freedman, R. Pisani, R. Purves, Statistics, 4. Aufl. (W. W. Norton & Company, 2007)
A. Gelman, J.B. Carlin, H.S. Stern, D.B. Rubin, Bayesian Data Analysis (Chapman & Hall, 2004)
H. Hotelling, Some problems in weighing and other experimental techniques. Am Math Stat 15, 297–306 (1944)
R. McElrath, Statistical Rethinking, a Bayesian Course with Examples in R and Stan (Chapman & Hall, 2016)
F. Oser, H. Biedermann, M. Kopp, S. Steinmann, C. Brühwiler, S. Krattenmacher, TEDS-M: Erste Ergebnisse für die Lehrerausbildung in der Deutschschweiz, Medienmitteilung, 15. Apr. 2010
D.S. Sivia, J. Skilling, Data Analysis, a Bayesian Tutorial, 2. Aufl. (Oxford Science Publications, 2010)
H. Wainer, Picturing the Uncertain World, How to Understand, Communicate, and Control Uncertainty through Graphical Display (Princeton University Press, 2009)
Author information
Authors and Affiliations
Corresponding author
Rights and permissions
Copyright information
© 2017 Springer-Verlag GmbH Deutschland
About this chapter
Cite this chapter
Bättig, D. (2017). Standardfehler, Ranglisten und Modelle. In: Angewandte Datenanalyse. Statistik und ihre Anwendungen. Springer Spektrum, Berlin, Heidelberg. https://doi.org/10.1007/978-3-662-54220-0_14
Download citation
DOI: https://doi.org/10.1007/978-3-662-54220-0_14
Published:
Publisher Name: Springer Spektrum, Berlin, Heidelberg
Print ISBN: 978-3-662-54219-4
Online ISBN: 978-3-662-54220-0
eBook Packages: Life Science and Basic Disciplines (German Language)