Varianzschätzung von Nettoveränderungen mit dem Mikrozensus ab 2012

Schimpl-Neimanns, Bernhard

doi:10.1007/s11943-019-00240-0

Varianzschätzung von Nettoveränderungen mit dem Mikrozensus ab 2012

Variance estimation of net changes with the German Microcensus since 2012

Originalveröffentlichung
Open access
Published: 20 March 2019

Volume 13, pages 73–85, (2019)
Cite this article

Download PDF

You have full access to this open access article

AStA Wirtschafts- und Sozialstatistisches Archiv Aims and scope Submit manuscript

Varianzschätzung von Nettoveränderungen mit dem Mikrozensus ab 2012

Download PDF

Bernhard Schimpl-Neimanns¹

2481 Accesses
3 Citations
1 Altmetric
Explore all metrics

Zusammenfassung

In diesem Aufsatz wird die Varianzschätzung von Nettoveränderungen am Beispiel ausgewählter Indikatoren des Mikrozensus untersucht. Auf der Grundlage von Scientific-Use-Files des Mikrozensus als große replikative Mehrthemenumfrage werden häufig zeitliche Veränderungen von Indikatoren berichtet. Durch die partielle Rotation von Erhebungseinheiten reduziert sich die Varianz von Nettoveränderungen. Dieser methodische Vorteil kann seit der Bereitstellung längsschnittkonsistenter Ordnungsnummern in den Daten ab 2012 genutzt werden. Hierfür wird das von Berger und Priam (2016) vorgeschlagene Verfahren verwendet. Damit ist es nun für die Wissenschaft möglich, die hohe Präzision der Schätzergebnisse von Nettoveränderungen effizient auszuschöpfen.

Abstract

This article examines the variance estimation of net changes using selected indicators of the Microcensus as an example. Based on the scientific use files of the Microcensus, which is a large replicative multi-topic survey, temporal changes of indicators are often reported. The partial rotation of survey units reduces the variance of net changes. This methodological advantage can be used since the provision of longitudinally consistent identification numbers in the data from 2012. The procedure proposed by Berger and Priam (2016) will be applied for this purpose. This makes it possible for the scientific community to make efficient use of the high precision of the estimation results of net changes.

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

1 Einleitung

Aufgrund des großen Stichprobenumfangs und des jährlichen Erhebungszyklus bietet der Mikrozensus (MZ) für die Forschung einige Vorteile für Analysen des sozialen und wirtschaftlichen Wandels. Für Vergleiche von Merkmalsveränderungen von Indikatoren oder Merkmalswerten auf aggregierter Ebene zwischen Zeitpunkten (Nettoveränderungen) in der Form von Trendstudien oder der Analyse replikativer Surveys stehen der Wissenschaft Scientific-Use-Files (SUF) als 70 %-Substichproben des MZ zur Verfügung. Mit der Bereitstellung längsschnittkonsistenter Ordnungsnummern ab dem SUF des MZ 2012 ist es möglich geworden, bei der Schätzung der Varianz der Nettoveränderung die durch die partielle Rotation der Primäreinheiten entstehende Kovarianz der Indikatoren im Zeitverlauf zu schätzen. Der Beitrag beschreibt die neuen Analysemöglichkeiten am Beispiel ausgewählter Indikatoren und wendet das von Berger und Priam (2016) vorgeschlagene Verfahren an. Zugleich wird gezeigt, welche Fehler entstehen, wenn eine nicht zutreffende statistische Unabhängigkeit der Teilstichproben angenommen wird.

Der Beitrag ist wie folgt aufgebaut. Zunächst werden das Erhebungsdesign des Mikrozensus und die Ziehung der Substichprobe des SUF zusammenfassend beschrieben (Abschn. 2). Im dritten Abschnitt wird zuerst skizziert, wie designbasierte Schätzungen für Querschnittsdaten bei gebundener Hochrechnung mittels Regressionsschätzung nach dem Linearisierungsansatz vorgenommen werden können. Anschließend wird die Varianzschätzung für Nettoveränderungen vorgestellt. Beispielhafte Analysen folgen im Abschn. 4. Der Beitrag schließt mit einer Zusammenfassung.

2 Datenbeschreibung

Der MZ wird jährlich als geschichtete einstufige Klumpenstichprobe mit einem Auswahlsatz von 1 % erhoben. Eine partielle Rotation der Erhebungseinheiten unterstützt möglichst präzise Schätzungen sowohl für jeden Erhebungszeitpunkt als auch für Vergleiche zwischen Zeitpunkten. Die Auswahlbezirke und die darin wohnenden Haushalte und Personen verbleiben vier Jahre lang in der Befragung und bilden ein sogenanntes Rotationsviertel. Jährlich wird ein Viertel der Auswahlbezirke ausgetauscht (siehe Abb. 1). Populationsveränderungen, die beispielsweise durch Fort- und Zuzüge, Geburten und Sterbefälle entstehen, werden dadurch automatisch erfasst. Betrachtet man zwei aufeinanderfolgende Jahre, sind 75 % der Auswahlbezirke in beiden Stichproben vertreten.

Eine grundlegende Voraussetzung für die Zusammenführung von Beobachtungs- und Stichprobeneinheiten sind zeitlich konsistente Identifikatoren (Ordnungsnummern). Des Weiteren ist in Bezug auf die Substichprobenziehung ausschlaggebend, dass die partielle Rotation auf der Ebene der Auswahlbezirke stattfindet. Mit der Umstellung der Ziehung von 70 %-Substichproben des SUF von der Haushalts- auf die Auswahlbezirksebene innerhalb eines Rotationsviertels und mit der Bereitstellung längsschnittkonsistenter Ordnungsnummern können die Eigenschaft eines Rotationspanels ab dem SUF des MZ 2012 genutzt werden.^{Footnote 1} Der MZ ab 2016 basiert auf einer neuen Stichprobe und ab 2020 werden neben der EU-Arbeitskräfteerhebung weitere Haushaltsstatistiken in den MZ integriert (Bihler und Zimmermann 2016), sodass sich die hier beschriebenen Möglichkeiten auf die Daten 2012 bis 2015 beziehen.

Die Ziehung der Substichprobe orientiert sich eng am Stichprobenplan des MZ (siehe zur Kurzbeschreibung der Stichprobeneigenschaften Tab. 5 im Anhang). Informationen zur Klumpung liegen mit der Auswahlbezirksnummer vor. In Verbindung mit dem Stichprobenumfang des vollen MZ von 1 % der Auswahleinheiten wird als Ziehungswahrscheinlichkeit eines Auswahlbezirks des SUF aus der Menge aller Primäreinheiten in der Population 0,7 % angenommen.

In Bezug auf die bei der Schätzung von Querschnittsergebnissen verwendeten Schichtungsmerkmale ist zu beachten, dass das Berichtsquartal nicht die bei der Auswahl vorgesehenen, sondern die Quartale der realisierten Interviews enthält. Infolge teilweise verspäteter Antworten kann das Berichtsquartal in einem Auswahlbezirk variieren. Enthält die Schichtdefinition das Berichtsquartal, kann es bei der Analyse von Nettoveränderungen zu Schichtwechseln kommen. Laut Stichprobendesign gibt es keine unterjährige Rotation und unter Verwendung des Quartals gemäß Auswahlplan wären Schichtwechsel ausgeschlossen (Afentakis und Bihler 2005, S. 1040; Statistisches Bundesamt 2013, S. 13). Tendenziell erhöhen Schichtwechsel die Varianz der Nettoveränderung. Ich schlage deshalb vor, bei der Schätzung von Nettoveränderungen für Jahresdurchschnitte auf das Berichtsquartal zur Abgrenzung von Schichten zu verzichten.^{Footnote 2} Verwendet man zur Schichtabgrenzung das Bundesland und die Gebäudegrößenklasse (ohne Differenzierung nach dem Aktualisierungsjahr bei Neubauschichten) ergeben sich 79 Gruppen.

Die Hochrechnungsfaktoren rechnen auf 1000 der Population nach den Ergebnissen der laufenden Bevölkerungsfortschreibung mit dem Stand der Aktualisierung durch den Zensus 2011 hoch. Aufgrund der Auskunftspflicht ist der Anteil ausgefallener Haushalte sehr klein. Im MZ erfolgt die Kompensation der Ausfälle im Rahmen der Hochrechnung und Anpassung an bekannte Populationsverteilungen mittels verallgemeinerter Regressionsschätzung (siehe für Details Afentakis und Bihler 2005). Im Unterschied zum SUF bis 2011 sind nicht die Hochrechnungsfaktoren des MZ enthalten, sondern poststratifizierte Gewichtungsvariablen, die eine verbesserte Anpassung an die veröffentlichten Ergebnisse gewährleisten sollen. Zu diesem Zweck wurden die MZ-Hochrechnungsfaktoren mit einem „Soll-durch-Ist“-Faktor multipliziert, der pro Anpassungsklasse das Verhältnis der Soll-Zahlen des MZ zu den Ist-Zahlen der Substichprobe bildet. Gewichtet wurde jeweils mit den Original Hochrechnungsfaktoren des MZ.

3 Methode

Für designbasierte Varianzschätzungen mit MZ-Querschnittsdaten liegen bereits Beschreibungen und Beispiele vor (Afentakis und Bihler 2005; Rendtel und Schimpl-Neimanns 2001; Schimpl-Neimanns 2011). Die folgende Darstellung kann deshalb kurz gehalten werden.

Obwohl die Auswahl der Primäreinheiten des SUF ab 2012 als Ergebnis eines 2‑phasigen Ziehungsverfahrens betrachtet werden kann, genügt aufgrund des kleinen Auswahlsatzes des MZ die Annahme einer einstufigen Auswahl (Särndal et al. 1997, S. 139 ff.).

Bei abhängigen Stichproben ist die Varianz der Differenz eines Schätzers $\hat{\Updelta }=\hat{\uptheta }_{2}-\hat{\uptheta }_{1}$ allgemein $V\left(\hat{\Updelta }\right)=V\left(\hat{\theta }_{1}\right)+V\left(\hat{\theta }_{2}\right)-2\,Cov\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)$. Je höher die Überlappung der Stichproben und je höher die jährlichen Indikatoren positiv korrelieren, desto geringer ist die Varianz der geschätzten Veränderung im Vergleich zu unabhängigen Stichproben.^{Footnote 3} Im Folgenden werden zunächst die Schätzung für Querschnittsdaten und anschließend die Schätzung für Nettoveränderungen dargestellt.

3.1 Designbasierte Schätzung für Querschnittsdaten

Häufig geht es bei Nettoveränderungen um die Schätzung der Differenz von Verhältniswerten zu verschiedenen Zeitpunkten. Dies trifft auch für die unten ausgewählten Indikatoren zu, sodass sich die folgende Darstellung darauf beschränkt.

$$\hat{\theta }= \frac{\hat{Y}}{\hat{Z}}=\frac{\sum _{h=1}^{L}\sum _{i=1}^{n_{h}}\sum _{j=1}^{m_{hi}}w_{{hij}} y_{{hij}}}{\sum _{h=1}^{L}\sum _{i=1}^{n_{h}}\sum _{j=1}^{m_{hi}}w_{{hij}} z_{{hij}}}$$

(1)

Ausgangspunkt für die Schätzung eines Indikators sei eine jährliche Stichprobe ($s$) mit Angaben zu den Merkmalen $y_{\mathrm{\it hij}}$ im Zähler und $z_{\mathrm{\it hij}}$ im Nenner für jede j-te Elementareinheit (Person) im i-ten Auswahlbezirk der Schicht $h$. Die Angaben sind jeweils mit dem Anpassungsgewicht $w_{\mathrm{\it hij}}$ gewichtet.

Im Allgemeinen können mit der Anpassungsgewichtung mit den Veröffentlichungen der Statistischen Ämter konsistente Ergebnisse erzielt werden. Die Gewichtung führt aber zu einer größeren Variabilität unabhängig vom Stichprobenplan. Es wird deshalb eine Regressionsschätzung vorgenommen. Die Verwendung von Anpassungsgewichten kann näherungsweise als Regressionsschätzung interpretiert werden (Särndal et al. 1997, S. 264 ff., S. 294 ff.). Dabei wird angenommen, dass die bei der Poststratifikation verwendeten Anpassungs- bzw. Hilfsmerkmale ($x$) einen statistischen Einfluss auf die interessierende Variable haben, der durch eine lineare Regression modelliert werden kann. Es wird die approximierte linearisierte Variable $\upsilon _{\mathrm{\it hij}}=\left(y_{\mathrm{\it hij}}-\hat{R}z_{\mathrm{\it hij}}\right)/\hat{Z}$ des Verhältniswertes als interessierende Variable in der Regression eingesetzt (Särndal et al. 1997, S. 176 ff., 294 ff.; Deville 1999, S. 198). Die mit dem Korrekturfaktor gewichteten Residuen $u_{\mathrm{\it hij}}=g_{\mathrm{\it hij}} \left(\upsilon _{\mathrm{\it hij}}-\boldsymbol{x}_{\mathrm{\it hij}}^{'}\hat{\mathbf{B}}\right)$ bilden die Hilfsvariablen für die Schätzung der Varianz. Da die Anpassungsgewichte in den Daten bereits vorliegen, kann der Korrekturfaktor als Verhältnis von Anpassungs- und Designgewicht direkt ermittelt werden. Aufgrund der Linearisierung des Verhältniswertes kann die Varianz nur approximativ (AV) geschätzt werden. Sie ist asymptotisch erwartungstreu.

$$\mathrm{AV}\left(\hat{\theta }\right)=\sum _{h=1}^{L}n_{h}/\left(n_{h}-1\right)\sum _{i=1}^{n_{h}}\left(u_{hi}-\overline{u}_{h}\right)^{2}$$

(2)

mit

h :: Schicht h = 1, …, L
i :: Primäreinh. Auswahlbez., PSU $i=1,\ldots , n_{h}$
j :: Sekundäreinheit Person $j=1,\ldots ,m_{hi}$
$y_{\mathrm{\it hij}}, z_{\mathrm{\it hij}}$ :: Analysevariablen
$w_{\mathrm{\it hij}}$ :: End‑/Anpassungsgewicht
$f_{h}=0,007$ :: Auswahlsatz
$d_{\mathrm{\it hij}}=N_{h}/n_{h}=1/f_{h}$ :: Designgewicht
$g_{\mathrm{\it hij}}=w_{\mathrm{\it hij}}/d_{\mathrm{\it hij}}$ :: Korrekturfaktor
$u_{hi}=\sum _{j=1}^{m_{hi}}{d_{\mathrm{\it hij}}} u_{\mathrm{\it hij}}$ :: PSU-Gesamtwert
$\overline{u}_{h}=1/n_{h}\sum _{i=1}^{n_{h}}u_{hi}$ :: Mittelwert der PSU-Gesamtwerte

Die Schätzung für geschichtete einstufige Klumpenstichproben (2) entspricht im Wesentlichen den bisherigen Anwendungen für Querschnittsdaten des SUF mit zwei Abweichungen. Zur Vermeidung von Schichtwechseln wird bei der Schichtabgrenzung auf das Berichtsquartal verzichtet. Außerdem wird analog zur Schätzung der Kovarianz (siehe Abschn. 3.2) von einer einfachen Zufallsstichprobe der Auswahlbezirke ausgegangen.

3.2 Schätzungen für Nettoveränderungen

Frühere Ansätze (Kish 1965, S. 457–468; Statistisches Bundesamt 1960, S. 115) verwendeten für die Schätzung der Kovarianz die in beiden Stichproben vorhandenen Einheiten. Dies setzt bei Flächenstichproben voraus, dass sich räumlich mobile und nicht mobile Einheiten in ihren Eigenschaften nicht unterscheiden. Dagegen nutzt der Ansatz von Berger und Priam (2016) die gesamten Daten der Stichproben auf der Ebene der Auswahlbezirke. Es werden außerdem keine Informationen über Inklusionswahrscheinlichkeiten zweiter Ordnung benötigt, die für anonymisierte Daten in der Regel unbekannt sind. Die Schätzung der Kovarianz erfolgt auf der Basis der Kovarianz der Residuen einer multivariaten Regression mit Informationen zum Stichprobendesign. Das Verfahren wird bei Schätzungen mit Daten der Europäischen Gemeinschaftsstatistik über Einkommen und Lebensbedingungen (EU-SILC) eingesetzt und hat sich beim schwedischen Labour Force Survey bewährt. Einige Annahmen und Einschränkungen sind jedoch zu beachten (Berger und Priam 2016, S. 252; S. 267; Berger 2004).

Im Hinblick auf den kleinen Auswahlsatz des SUF dürfte die Annahme einer einfachen Zufallsstichprobe der Auswahlbezirke und somit vernachlässigbarer Endlichkeitskorrektur unproblematisch sein. Mit der Abgrenzung der Schicht mittels Bundesland und Gebäudegrößenklasse liegt keine zu stark differenzierte Schichtung vor. Des Weiteren ist durch das Rotationsdesign des MZ sichergestellt, dass der Umfang der überlappenden Stichproben nicht zufällig ist. Die Annahme eines Stichprobendesigns mit hoher Entropie trifft auf den MZ zu. Für das SUF sind wegen der Substichprobenziehung Einschränkungen anzunehmen.

Die abhängigen Variablen der multivariaten Regression sind die auf der Ebene der Auswahlbezirke ($i$) summierten Residuen der Regression der linearisierten Variablen auf die Hilfsmerkmale der designbasierten Schätzungen für die Querschnittsdaten zum Zeitpunkt $t$ und die jeweiligen Subpopulationen: $\hat{\tau }_{1i}=\sum _{i\in s_{1}}u_{ij}$, $\hat{\tau }_{2i}=\sum _{i\in s_{2}}u_{ij}$. Falls ein Auswahlbezirk zu einem Zeitpunkt nicht vertreten ist, werden die Werte der abhängigen Variablen auf 0 gesetzt.

Die Kovariaten sind vollständige Interaktionen der Informationen zum Stichprobendesign und Rotationsdesign, d. h. der Schichtung und der Erhebungszeitpunkte. Dabei ist $z_{h1i}=1$, falls der i-te Auswahlbezirk zum Zeitpunkt $t=1$ zur h-ten Schicht gehört, und sonst 0. Analog gilt $z_{h2i}=1$ für den Zeitpunkt $t=2.$ Das Modell enthält keine Regressionskonstante (Berger und Priam 2016, S. 255):

$$\left(\begin{array}{c} \hat{\tau }_{1i}\\ \hat{\tau }_{2i} \end{array}\right)=\left(\begin{array}{c} \beta _{1}^{\left(1\right)} z_{h1i}+\beta _{2}^{\left(1\right)} z_{h2i}+\beta _{12}^{\left(1\right)} z_{h1i} z_{h2i} \\ \beta _{1}^{\left(2\right)} z_{h1i}+\beta _{2}^{\left(2\right)} z_{h2i}+\beta _{12}^{\left(2\right)} z_{h1i} z_{h2i} \end{array}\right)+\left(\begin{array}{c} \varepsilon _{1i}\\ \varepsilon _{2i} \end{array}\right)$$

(3)

Die Korrelation der Residuen der multivariaten Regression $\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)$ wird als Schätzung der Korrelation der Schätzer der Querschnittsdaten verwendet. Die Korrelation der Residuen bezieht sich auf die Annahme einer einfachen Zufallsstichprobe ohne Hochrechnung. Gesucht ist aber die designbasierte Varianz mit Hochrechnung. Hierfür werden in $V\left(\hat{\Updelta }\right)$ die für die Querschnittsdaten vorliegenden designbasierten Standardfehler $V\left(\hat{\theta }_{t}\right)$ und die Korrelationen $\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)$ aus der Kovarianzmatrix der Residuen eingesetzt. Allgemein besteht zwischen Korrelation und Kovarianz die Beziehung $\rho \left(\hat{\theta }_{1},\hat{\theta }_{2}\right)=Cov\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)/\left(V\left(\hat{\theta }_{1}\right)^{-1/2}\,V\left(\hat{\theta }_{1}\right)^{-1/2}\right)$. Die designbasierte Kovarianz $V\left(\hat{\theta }_{2},\hat{\theta }_{1}\right)$ ergibt sich somit durch die Multiplikation der Korrelation $\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)$ mit den designbasierten Standardfehlern von $V\left(\hat{\theta }_{1}\right)$ und $V\left(\hat{\theta }_{2}\right)$. Die Varianz der Differenz eines Schätzers $\hat{\Updelta }=\hat{\uptheta }_{2}-\hat{\uptheta }_{1}$ ist

$$V\left(\hat{\Updelta }\right)=V\left(\hat{\theta }_{2}\right)+V\left(\hat{\theta }_{1}\right)-2\sqrt{V\left(\hat{\theta }_{2}\right)}\sqrt{V\left(\hat{\theta }_{1}\right)}\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right).$$

(4)

4 Ergebnisse

Am Beispiel von 4 Indikatoren werden im Folgenden Nettoveränderungen für die MZ-Erhebungen 2012 und 2013 geschätzt. Es wird untersucht, ob Veränderungen der Indikatoren als zufällige Schwankungen der Stichproben oder statistisch signifikant zu bewerten sind. Die Beispiele greifen in der Wissenschaft wie auch in der Öffentlichkeit thematisierte Fragen auf. Sie orientieren sich an der Sozialberichterstattung der amtlichen Statistik. Dort finden sich zahlreiche Beispiele einer nach Subpopulationen differenzierten Sozialberichterstattung unter anderem in den sogenannten Langen Reihen der Fachserien des Statistischen Bundesamtes, auf den Webseiten zur Sozialberichterstattung der Statistischen Ämter des Bundes und der Länder (2017) oder im Armuts- und Reichtumsbericht der Bundesregierung (BMAS 2017). Vergleichbare Ergebnisse zu Standardabweichungen oder Konfidenzintervallen für die hier betrachteten Indikatoren liegen leider nicht vor.

Der Indikator Erwerbstätigenquote für 60- bis 64-Jährige ist definiert als Anteil der Erwerbstätigen im Alter von 60 bis 64 Jahren an der gleichaltrigen Bevölkerung. Die Erwerbstätigenquote für diese Altersgruppe knüpft an die Themen der Erhöhung des effektiven Renteneintrittsalters und des alterungsbedingten Arbeitskräftemangels an. Die Erwerbstätigenquote für 20- bis 64-Jährige ist ein Leitindikator der Europa 2020-Strategie der Europäischen Kommission (2018).

Die Befristungsquote erfasst den Anteil befristeter Arbeitsverträge. Befristete Beschäftigungen zählen zu den atypischen Beschäftigungen. Sie haben in den letzten Dekaden im Vergleich zu sogenannten Normalarbeitsverhältnissen insgesamt zugenommen (BMAS 2017, S. 79 ff.). Bei guter Konjunktur sind Befristungen jedoch tendenziell rückläufig. In Anlehnung an die Abgrenzung des Statistischen Bundesamtes (2017, S. 40) werden nur abhängig Beschäftigte ab 25 Jahren betrachtet.

Die Teilzeitquote bezieht sich auf abhängig Beschäftigte in Teilzeitarbeit im Alter von 15 bis 64 Jahren unter allen gleichaltrigen abhängig Beschäftigten. Aus Sicht der Erwerbstätigen wird häufig Teilzeitarbeit gewählt, um Aufgaben in den Bereichen Familie und Beruf besser vereinbaren zu können. Insgesamt haben Teilzeitbeschäftigungen im Zeitverlauf zugenommen. Im MZ 2013 wurde die Zuordnung der Selbsteinschätzung der Befragten zur Voll- oder Teilzeittätigkeit geändert. Um vergleichbare Ergebnisse zu gewährleisten, wurde Teilzeitarbeit für 1 bis einschließlich 31 normalerweise geleisteten Wochenarbeitsstunden definiert.

Der Leitindikator der Strategie Europa 2020 Frühzeitige Schul- und Ausbildungsabgänger zeigt den Anteil von 18- bis 24-Jährigen, die höchstens einen Haupt- oder Realschulabschluss haben, zum Zeitpunkt der Befragung keine schulische oder berufliche Ausbildung absolvieren oder an Weiterbildungsmaßnahmen teilnehmen, an der gleichaltrigen Bevölkerung. Der Indikator beschreibt damit eine Gruppe, die auf dem Arbeitsmarkt mit überdurchschnittlichen Schwierigkeiten konfrontiert ist. Das Europa-2020-Ziel von höchstens 10 % wurde 2013 in Deutschland erstmals erreicht.

Die folgenden Tabellen enthalten sowohl für die Querschnittsdaten als auch die Nettoveränderungen die mit den oben dargestellten Verfahren geschätzten Quoten, designbasierte Standardfehler sowie 95 %-Konfidenzintervalle. In der jeweils letzten Zeile werden Schätzungen unter Annahme der statistischen Unabhängigkeit der Teilstichproben berichtet, die bisher aufgrund fehlender längsschnittkonsistenter Ordnungsnummern getroffen werden musste. Der Vergleich mit den Ergebnissen für Nettoveränderungen unter Berücksichtigung der Kovarianz zeigt, welche Überschätzungen der Standardfehler bzw. der Konfidenzintervalle entstehen, wenn die Kovarianz nicht berücksichtigt wird.

Von 2012 bis 2013 ist die Erwerbstätigenquote für 60- bis 64-Jährige um 3 Prozentpunkte gestiegen (Tab. 1). Der Standardfehler beträgt 0,24 % und das dazugehörige 95 %-Konfidenzintervall 2,5 bis 3,5 %. Es enthält nicht den Wert null, sodass die Veränderung als statistisch signifikant gilt. Dieser Schluss würde auch ohne Berücksichtigung der Kovarianz gezogen, wenngleich mit einem um 35 Prozentpunkte höheren Standardfehler als bei korrekter Berücksichtigung der Kovarianz der Schätzer.

Tab. 1 Erwerbstätigenquote für 60- bis 64-Jährige: Jahresdurchschnitte, Nettoveränderung und Standardfehler

Full size table

In ähnlicher Weise trifft dies auch auf den Anstieg der Teilzeitquote um 0,5 Prozentpunkte (Tab. 2) und den Rückgang des Anteils früher Schulabgänger um 0,5 Prozentpunkte (Tab. 3) zu. Allerdings beträgt in Tab. 3 die Überschätzung des Standardfehlers bei Annahme statistischer Unabhängigkeit rund 24 Prozentpunkte im Vergleich zur Berücksichtigung der Kovarianz.

Tab. 2 Teilzeitquote für abhängig Beschäftigte im Alter von 15 bis 64 Jahren: Jahresdurchschnitte, Nettoveränderung und Standardfehler

Full size table

Tab. 3 Anteil früher Schulabgänger im Alter von 18 bis 24 Jahren: Jahresdurchschnitte, Nettoveränderung und Standardfehler

Full size table

Im Unterschied dazu zeigt sich beim Rückgang der Befristungsquote um 0,2 Prozentpunkte (Tab. 4) ohne Berücksichtigung der Kovarianz keine statistisch signifikante Veränderung; das 95 %-Konfidenzintervall enthält den Wert null. Dagegen wird bei Berücksichtigung der Kovarianz eine signifikante Veränderung festgestellt. Wie dieses Beispiel zeigt, kann die nicht zutreffende Annahme statistischer Unabhängigkeit durchaus zu anderen Ergebnissen als die korrekte Varianzschätzung führen.

Tab. 4 Befristungsquote für abhängig Beschäftigte ab 25 Jahren: Jahresdurchschnitte, Nettoveränderung und Standardfehler

Full size table

5 Schluss

Mit den ab dem MZ 2012 zur Verfügung stehenden Daten können Forscher nach der Umstellung der Substichprobenziehung und mit der Bereitstellung längsschnittkonsistenter Ordnungsnummern designbasierte Varianzschätzungen von Nettoveränderungen vornehmen. Gegenüber den bisherigen Schätzungen für Querschnittsdaten ist für die Varianzschätzung von Nettoveränderungen nach dem Verfahren von Berger und Priam (2016) kein großer Mehraufwand erforderlich.

Am Beispiel von 4 Indikatoren zeigten sich erhebliche Unterschiede, ob die durch die partielle Rotation entstehende Kovarianz der Schätzungen statistisch angemessen berücksichtigt wird oder nicht. Nimmt man fälschlicherweise statistische Unabhängigkeit der Stichproben an, ist der Standardfehler der Nettoveränderung um 20 bis 35 Prozentpunkte größer als bei Berücksichtigung der Kovarianz der Schätzer. Zudem zeigte sich, dass die Annahme statistischer Unabhängigkeit durchaus zu anderen Einschätzungen der statistischen Signifikanz führen kann. Zusammenfassend kann deshalb festgehalten werden, dass die ab 2012 geschaffenen Möglichkeiten es der Wissenschaft erlauben, die hohe Präzision der Schätzergebnisse von Nettoveränderungen effizient auszuschöpfen.

Notes

Siehe zu Möglichkeiten der Längsschnitt- und Panelauswertung Herberger (1973); Koller und Herberger (1960); Linke (1969); Statistisches Bundesamt o.J.; Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder (2018); Herter-Eschweiler und Schimpl-Neimanns (2018).
In dieser Hinsicht wäre eine Bereitstellung des nach dem Stichprobenplan vorgesehenen Quartals im SUF wünschenswert.
Manchmal werden Daten verschiedener Zeitpunkte kumuliert, um die Fallzahlen von kleinen Teilpopulationen zu erhöhen. Bei der Schätzung von Summen $\left(\hat{\Sigma }= \hat{\theta }_{1}+ \hat{\theta }_{2}\right)$ ist die Varianz: $\mathrm{Var}\left(\hat{\Sigma }\right)=V\left(\hat{\theta }_{1}\right)+V\left(\hat{\theta }_{2}\right)+2\,Cov\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)$. Im Unterschied zu unabhängigen Stichproben vergrößert die Korrelation den Stichprobenfehler.

Literatur

Afentakis A, Bihler W (2005) Das Hochrechnungsverfahren beim unterjährigen Mikrozensus ab 2005. Wirtsch Stat 10:1039–1048
Google Scholar
Berger YG (2004) Variance estimation for measures of change in probability sampling. Can J Stat 32(4):451–467
Article MathSciNet MATH Google Scholar
Berger YG, Priam R (2016) A simple variance estimator of change for rotating repeated surveys: An application to the European union statistics on income and living conditions household surveys. J Royal Stat Soc Ser A 179:251–272
Article MathSciNet Google Scholar
Bihler W, Zimmermann D (2016) Die neue Mikrozensusstichprobe ab 2016. https://www.destatis.de/DE/Publikationen/WirtschaftStatistik/2016/06/DieNeueMikrozensusstichprobe_062016.pdf?__blob=publicationFile. Zugegriffen: 12. Dez. 2018
Google Scholar
Bundesministerium für Arbeit und Soziales (2017) Lebenslagen in Deutschland. Der Fünfte Armuts- und Reichtumsbericht der Bundesregierung. http://www.armuts-und-reichtumsbericht.de/SharedDocs/Downloads/Berichte/5-arb-langfassung.pdf?__blob=publicationFile&v=6. Zugegriffen: 12. Dez. 2018
Google Scholar
Deville JC (1999) Variance estimation for complex statistics and estimators: Linearization and residual techniques. Surv Methodol 25(2):193–203
Google Scholar
Europäische Kommission (2018) Leitindikatoren: Scoreboard. http://ec.europa.eu/eurostat/de/web/europe-2020-indicators/europe-2020-strategy/headline-indicators-scoreboard. Zugegriffen: 12. Dez. 2018
Google Scholar
Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder (2018) Datenangebot | Mikrozensus-Panel. https://www.forschungsdatenzentrum.de/de/haushalte/mikrozensus-panel. Zugegriffen: 12. Dez. 2018
Google Scholar
Herberger L (1973) Praktische Erfahrungen mit Verlaufsstatistiken. All Stat Arch 57:54–76
Google Scholar
Herter-Eschweiler R, Schimpl-Neimanns B (2018) Möglichkeiten der Verknüpfung von Mikrozensus-Querschnitterhebungen ab 2012 zu Panels. https://www.gesis.org/missy/files/documents/MZ/panelbildung_suf2012.pdf. Zugegriffen: 12. Dez. 2018
Google Scholar
Kish L (1965) Survey sampling. Wiley, New York
MATH Google Scholar
Koller S, Herberger L (1960) Der Mikrozensus. All Stat Arch 44(3):205–254
Google Scholar
Linke W (1969) Umschichtung der Erwerbsbevölkerung. Ergebnisse der Mikrozensusbefragungen 1966 und 1967. Wirtsch Stat 9:505–508
Google Scholar
Rendtel U, Schimpl-Neimanns B (2001) Die Berechnung der Varianz von Populationsschätzern im Scientific Use File des Mikrozensus ab 1996. https://www.gesis.org/fileadmin/upload/forschung/publikationen/zeitschriften/zuma_nachrichten/zn_48.pdf. Zugegriffen: 12. Dez. 2018
Google Scholar
Särndal CE, Swensson B, Wretman J (1997) Model assisted survey sampling, 4. Aufl. Springer, New York
MATH Google Scholar
Schimpl-Neimanns B (2011) Schätzung des Stichprobenfehlers in Mikrozensus Scientific Use Files ab 2005. AStA Wirtsch Sozialstat Arch 5(1):19–38. https://doi.org/10.1007/s11943-011-0092-4
Article Google Scholar
Statistische Ämter des Bundes und der Länder (2017) Sozialberichterstattung der amtlichen Statistik. http://www.amtliche-sozialberichterstattung.de. Zugegriffen: 12. Dez. 2018
Google Scholar
Statistisches Bundesamt (Hrsg) (1960) Stichproben in der Amtlichen Statistik. Kohlhammer, Stuttgart, Mainz
Google Scholar
Statistisches Bundesamt (2012) Mikrozensus: Haushaltszahlen ab 2005. https://www.destatis.de/DE/Methoden/MikrozensusHaushaltszahlen.pdf?__blob=publicationFile. Zugegriffen: 12. Dez. 2018
Google Scholar
Statistisches Bundesamt (2013) Qualitätsbericht Mikrozensus 2012. https://www.destatis.de/DE/Publikationen/Qualitaetsberichte/Bevoelkerung/Mikrozensus2012.pdf?__blob=publicationFile. Zugegriffen: 12. Dez. 2018
Google Scholar
Statistisches Bundesamt (2017) Qualität der Arbeit. https://www.destatis.de/DE/Publikationen/Thematisch/Arbeitsmarkt/Erwerbstaetige/BroschuereQualitaetArbeit0010015179004.pdf?__blob=publicationFile. Zugegriffen: 12. Dez. 2018
Google Scholar
Statistisches Bundesamt (o. J.) Webseite Wissenschaftsforum – Methodenverbund „Aufbereitung und Bereitstellung des Mikrozensus als Panelstichprobe“. https://www.destatis.de/DE/Methoden/Methodenpapiere/Mikrozensus/Mikrozensus.html. Zugegriffen: 12. Dez. 2018
Statistisches Bundesamt, GESIS (2016) Wichtige Informationen zur Nutzung des Mikrozensus Scientific Use Files 2012. http://www.gesis.org/missy/files/documents/MZ/readme/readme_suf2012.pdf. Zugegriffen: 12. Dez. 2018
Google Scholar

Download references

Danksagung

Den Herausgebern und anonymen Gutachtern danke ich für konstruktive und wichtige Änderungsvorschläge. Für Anmerkungen zu einer früheren Version des Manuskripts danke ich Wolf Bihler, Robert Herter-Eschweiler, Heike Wirth und Stefan Zins.

Author information

Authors and Affiliations

GESIS – Leibniz-Institut für Sozialwissenschaften, B2, 1, 68159, Mannheim, Deutschland
Bernhard Schimpl-Neimanns

Authors

Bernhard Schimpl-Neimanns
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Bernhard Schimpl-Neimanns.

Additional information

Hinweis des Verlags

Der Verlag bleibt in Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutsadressen neutral.

Anhang

Tab. 5 Kurzbeschreibung des Mikrozensus und der Mikrozensus Scientific-Use-Files ab 2012

Full size table

Rights and permissions

Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.

Reprints and permissions

About this article

Cite this article

Schimpl-Neimanns, B. Varianzschätzung von Nettoveränderungen mit dem Mikrozensus ab 2012. AStA Wirtsch Sozialstat Arch 13, 73–85 (2019). https://doi.org/10.1007/s11943-019-00240-0

Download citation

Received: 11 July 2018
Accepted: 11 March 2019
Published: 20 March 2019
Issue Date: 06 April 2019
DOI: https://doi.org/10.1007/s11943-019-00240-0

Schlüsselwörter

Keywords

Use our pre-submission checklist

Avoid common mistakes on your manuscript.

Varianzschätzung von Nettoveränderungen mit dem Mikrozensus ab 2012

Zusammenfassung

Abstract

1 Einleitung

2 Datenbeschreibung

3 Methode

3.1 Designbasierte Schätzung für Querschnittsdaten

3.2 Schätzungen für Nettoveränderungen

4 Ergebnisse

5 Schluss

Notes

Literatur

Danksagung

Author information

Authors and Affiliations

Corresponding author

Additional information

Hinweis des Verlags

Anhang

Anhang

Rights and permissions

About this article

Cite this article

Share this article

Schlüsselwörter

Keywords

Search

Navigation