1 Einleitung

Aufgrund des großen Stichprobenumfangs und des jährlichen Erhebungszyklus bietet der Mikrozensus (MZ) für die Forschung einige Vorteile für Analysen des sozialen und wirtschaftlichen Wandels. Für Vergleiche von Merkmalsveränderungen von Indikatoren oder Merkmalswerten auf aggregierter Ebene zwischen Zeitpunkten (Nettoveränderungen) in der Form von Trendstudien oder der Analyse replikativer Surveys stehen der Wissenschaft Scientific-Use-Files (SUF) als 70 %-Substichproben des MZ zur Verfügung. Mit der Bereitstellung längsschnittkonsistenter Ordnungsnummern ab dem SUF des MZ 2012 ist es möglich geworden, bei der Schätzung der Varianz der Nettoveränderung die durch die partielle Rotation der Primäreinheiten entstehende Kovarianz der Indikatoren im Zeitverlauf zu schätzen. Der Beitrag beschreibt die neuen Analysemöglichkeiten am Beispiel ausgewählter Indikatoren und wendet das von Berger und Priam (2016) vorgeschlagene Verfahren an. Zugleich wird gezeigt, welche Fehler entstehen, wenn eine nicht zutreffende statistische Unabhängigkeit der Teilstichproben angenommen wird.

Der Beitrag ist wie folgt aufgebaut. Zunächst werden das Erhebungsdesign des Mikrozensus und die Ziehung der Substichprobe des SUF zusammenfassend beschrieben (Abschn. 2). Im dritten Abschnitt wird zuerst skizziert, wie designbasierte Schätzungen für Querschnittsdaten bei gebundener Hochrechnung mittels Regressionsschätzung nach dem Linearisierungsansatz vorgenommen werden können. Anschließend wird die Varianzschätzung für Nettoveränderungen vorgestellt. Beispielhafte Analysen folgen im Abschn. 4. Der Beitrag schließt mit einer Zusammenfassung.

2 Datenbeschreibung

Der MZ wird jährlich als geschichtete einstufige Klumpenstichprobe mit einem Auswahlsatz von 1 % erhoben. Eine partielle Rotation der Erhebungseinheiten unterstützt möglichst präzise Schätzungen sowohl für jeden Erhebungszeitpunkt als auch für Vergleiche zwischen Zeitpunkten. Die Auswahlbezirke und die darin wohnenden Haushalte und Personen verbleiben vier Jahre lang in der Befragung und bilden ein sogenanntes Rotationsviertel. Jährlich wird ein Viertel der Auswahlbezirke ausgetauscht (siehe Abb. 1). Populationsveränderungen, die beispielsweise durch Fort- und Zuzüge, Geburten und Sterbefälle entstehen, werden dadurch automatisch erfasst. Betrachtet man zwei aufeinanderfolgende Jahre, sind 75 % der Auswahlbezirke in beiden Stichproben vertreten.

Abb. 1
figure 1

Rotation im Mikrozensus (Quelle: Herter-Eschweiler und Schimpl-Neimanns 2018, S. 2)

Eine grundlegende Voraussetzung für die Zusammenführung von Beobachtungs- und Stichprobeneinheiten sind zeitlich konsistente Identifikatoren (Ordnungsnummern). Des Weiteren ist in Bezug auf die Substichprobenziehung ausschlaggebend, dass die partielle Rotation auf der Ebene der Auswahlbezirke stattfindet. Mit der Umstellung der Ziehung von 70 %-Substichproben des SUF von der Haushalts- auf die Auswahlbezirksebene innerhalb eines Rotationsviertels und mit der Bereitstellung längsschnittkonsistenter Ordnungsnummern können die Eigenschaft eines Rotationspanels ab dem SUF des MZ 2012 genutzt werden.Footnote 1 Der MZ ab 2016 basiert auf einer neuen Stichprobe und ab 2020 werden neben der EU-Arbeitskräfteerhebung weitere Haushaltsstatistiken in den MZ integriert (Bihler und Zimmermann 2016), sodass sich die hier beschriebenen Möglichkeiten auf die Daten 2012 bis 2015 beziehen.

Die Ziehung der Substichprobe orientiert sich eng am Stichprobenplan des MZ (siehe zur Kurzbeschreibung der Stichprobeneigenschaften Tab. 5 im Anhang). Informationen zur Klumpung liegen mit der Auswahlbezirksnummer vor. In Verbindung mit dem Stichprobenumfang des vollen MZ von 1 % der Auswahleinheiten wird als Ziehungswahrscheinlichkeit eines Auswahlbezirks des SUF aus der Menge aller Primäreinheiten in der Population 0,7 % angenommen.

In Bezug auf die bei der Schätzung von Querschnittsergebnissen verwendeten Schichtungsmerkmale ist zu beachten, dass das Berichtsquartal nicht die bei der Auswahl vorgesehenen, sondern die Quartale der realisierten Interviews enthält. Infolge teilweise verspäteter Antworten kann das Berichtsquartal in einem Auswahlbezirk variieren. Enthält die Schichtdefinition das Berichtsquartal, kann es bei der Analyse von Nettoveränderungen zu Schichtwechseln kommen. Laut Stichprobendesign gibt es keine unterjährige Rotation und unter Verwendung des Quartals gemäß Auswahlplan wären Schichtwechsel ausgeschlossen (Afentakis und Bihler 2005, S. 1040; Statistisches Bundesamt 2013, S. 13). Tendenziell erhöhen Schichtwechsel die Varianz der Nettoveränderung. Ich schlage deshalb vor, bei der Schätzung von Nettoveränderungen für Jahresdurchschnitte auf das Berichtsquartal zur Abgrenzung von Schichten zu verzichten.Footnote 2 Verwendet man zur Schichtabgrenzung das Bundesland und die Gebäudegrößenklasse (ohne Differenzierung nach dem Aktualisierungsjahr bei Neubauschichten) ergeben sich 79 Gruppen.

Die Hochrechnungsfaktoren rechnen auf 1000 der Population nach den Ergebnissen der laufenden Bevölkerungsfortschreibung mit dem Stand der Aktualisierung durch den Zensus 2011 hoch. Aufgrund der Auskunftspflicht ist der Anteil ausgefallener Haushalte sehr klein. Im MZ erfolgt die Kompensation der Ausfälle im Rahmen der Hochrechnung und Anpassung an bekannte Populationsverteilungen mittels verallgemeinerter Regressionsschätzung (siehe für Details Afentakis und Bihler 2005). Im Unterschied zum SUF bis 2011 sind nicht die Hochrechnungsfaktoren des MZ enthalten, sondern poststratifizierte Gewichtungsvariablen, die eine verbesserte Anpassung an die veröffentlichten Ergebnisse gewährleisten sollen. Zu diesem Zweck wurden die MZ-Hochrechnungsfaktoren mit einem „Soll-durch-Ist“-Faktor multipliziert, der pro Anpassungsklasse das Verhältnis der Soll-Zahlen des MZ zu den Ist-Zahlen der Substichprobe bildet. Gewichtet wurde jeweils mit den Original Hochrechnungsfaktoren des MZ.

3 Methode

Für designbasierte Varianzschätzungen mit MZ-Querschnittsdaten liegen bereits Beschreibungen und Beispiele vor (Afentakis und Bihler 2005; Rendtel und Schimpl-Neimanns 2001; Schimpl-Neimanns 2011). Die folgende Darstellung kann deshalb kurz gehalten werden.

Obwohl die Auswahl der Primäreinheiten des SUF ab 2012 als Ergebnis eines 2‑phasigen Ziehungsverfahrens betrachtet werden kann, genügt aufgrund des kleinen Auswahlsatzes des MZ die Annahme einer einstufigen Auswahl (Särndal et al. 1997, S. 139 ff.).

Bei abhängigen Stichproben ist die Varianz der Differenz eines Schätzers \(\hat{\Updelta }=\hat{\uptheta }_{2}-\hat{\uptheta }_{1}\) allgemein \(V\left(\hat{\Updelta }\right)=V\left(\hat{\theta }_{1}\right)+V\left(\hat{\theta }_{2}\right)-2\,Cov\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)\). Je höher die Überlappung der Stichproben und je höher die jährlichen Indikatoren positiv korrelieren, desto geringer ist die Varianz der geschätzten Veränderung im Vergleich zu unabhängigen Stichproben.Footnote 3 Im Folgenden werden zunächst die Schätzung für Querschnittsdaten und anschließend die Schätzung für Nettoveränderungen dargestellt.

3.1 Designbasierte Schätzung für Querschnittsdaten

Häufig geht es bei Nettoveränderungen um die Schätzung der Differenz von Verhältniswerten zu verschiedenen Zeitpunkten. Dies trifft auch für die unten ausgewählten Indikatoren zu, sodass sich die folgende Darstellung darauf beschränkt.

$$\hat{\theta }= \frac{\hat{Y}}{\hat{Z}}=\frac{\sum _{h=1}^{L}\sum _{i=1}^{n_{h}}\sum _{j=1}^{m_{hi}}w_{{hij}} y_{{hij}}}{\sum _{h=1}^{L}\sum _{i=1}^{n_{h}}\sum _{j=1}^{m_{hi}}w_{{hij}} z_{{hij}}}$$
(1)

Ausgangspunkt für die Schätzung eines Indikators sei eine jährliche Stichprobe (\(s\)) mit Angaben zu den Merkmalen \(y_{\mathrm{\it hij}}\) im Zähler und \(z_{\mathrm{\it hij}}\) im Nenner für jede j-te Elementareinheit (Person) im i-ten Auswahlbezirk der Schicht \(h\). Die Angaben sind jeweils mit dem Anpassungsgewicht \(w_{\mathrm{\it hij}}\) gewichtet.

Im Allgemeinen können mit der Anpassungsgewichtung mit den Veröffentlichungen der Statistischen Ämter konsistente Ergebnisse erzielt werden. Die Gewichtung führt aber zu einer größeren Variabilität unabhängig vom Stichprobenplan. Es wird deshalb eine Regressionsschätzung vorgenommen. Die Verwendung von Anpassungsgewichten kann näherungsweise als Regressionsschätzung interpretiert werden (Särndal et al. 1997, S. 264 ff., S. 294 ff.). Dabei wird angenommen, dass die bei der Poststratifikation verwendeten Anpassungs- bzw. Hilfsmerkmale (\(x\)) einen statistischen Einfluss auf die interessierende Variable haben, der durch eine lineare Regression modelliert werden kann. Es wird die approximierte linearisierte Variable \(\upsilon _{\mathrm{\it hij}}=\left(y_{\mathrm{\it hij}}-\hat{R}z_{\mathrm{\it hij}}\right)/\hat{Z}\) des Verhältniswertes als interessierende Variable in der Regression eingesetzt (Särndal et al. 1997, S. 176 ff., 294 ff.; Deville 1999, S. 198). Die mit dem Korrekturfaktor gewichteten Residuen \(u_{\mathrm{\it hij}}=g_{\mathrm{\it hij}} \left(\upsilon _{\mathrm{\it hij}}-\boldsymbol{x}_{\mathrm{\it hij}}^{'}\hat{\mathbf{B}}\right)\) bilden die Hilfsvariablen für die Schätzung der Varianz. Da die Anpassungsgewichte in den Daten bereits vorliegen, kann der Korrekturfaktor als Verhältnis von Anpassungs- und Designgewicht direkt ermittelt werden. Aufgrund der Linearisierung des Verhältniswertes kann die Varianz nur approximativ (AV) geschätzt werden. Sie ist asymptotisch erwartungstreu.

$$\mathrm{AV}\left(\hat{\theta }\right)=\sum _{h=1}^{L}n_{h}/\left(n_{h}-1\right)\sum _{i=1}^{n_{h}}\left(u_{hi}-\overline{u}_{h}\right)^{2}$$
(2)

mit

h :

Schicht h = 1, …, L

i :

Primäreinh. Auswahlbez., PSU \(i=1,\ldots , n_{h}\)

j :

Sekundäreinheit Person \(j=1,\ldots ,m_{hi}\)

\(y_{\mathrm{\it hij}}, z_{\mathrm{\it hij}}\) :

Analysevariablen

\(w_{\mathrm{\it hij}}\) :

End‑/Anpassungsgewicht

\(f_{h}=0,007\) :

Auswahlsatz

\(d_{\mathrm{\it hij}}=N_{h}/n_{h}=1/f_{h}\) :

Designgewicht

\(g_{\mathrm{\it hij}}=w_{\mathrm{\it hij}}/d_{\mathrm{\it hij}}\) :

Korrekturfaktor

\(u_{hi}=\sum _{j=1}^{m_{hi}}{d_{\mathrm{\it hij}}} u_{\mathrm{\it hij}}\) :

PSU-Gesamtwert

\(\overline{u}_{h}=1/n_{h}\sum _{i=1}^{n_{h}}u_{hi}\) :

Mittelwert der PSU-Gesamtwerte

Die Schätzung für geschichtete einstufige Klumpenstichproben (2) entspricht im Wesentlichen den bisherigen Anwendungen für Querschnittsdaten des SUF mit zwei Abweichungen. Zur Vermeidung von Schichtwechseln wird bei der Schichtabgrenzung auf das Berichtsquartal verzichtet. Außerdem wird analog zur Schätzung der Kovarianz (siehe Abschn. 3.2) von einer einfachen Zufallsstichprobe der Auswahlbezirke ausgegangen.

3.2 Schätzungen für Nettoveränderungen

Frühere Ansätze (Kish 1965, S. 457–468; Statistisches Bundesamt 1960, S. 115) verwendeten für die Schätzung der Kovarianz die in beiden Stichproben vorhandenen Einheiten. Dies setzt bei Flächenstichproben voraus, dass sich räumlich mobile und nicht mobile Einheiten in ihren Eigenschaften nicht unterscheiden. Dagegen nutzt der Ansatz von Berger und Priam (2016) die gesamten Daten der Stichproben auf der Ebene der Auswahlbezirke. Es werden außerdem keine Informationen über Inklusionswahrscheinlichkeiten zweiter Ordnung benötigt, die für anonymisierte Daten in der Regel unbekannt sind. Die Schätzung der Kovarianz erfolgt auf der Basis der Kovarianz der Residuen einer multivariaten Regression mit Informationen zum Stichprobendesign. Das Verfahren wird bei Schätzungen mit Daten der Europäischen Gemeinschaftsstatistik über Einkommen und Lebensbedingungen (EU-SILC) eingesetzt und hat sich beim schwedischen Labour Force Survey bewährt. Einige Annahmen und Einschränkungen sind jedoch zu beachten (Berger und Priam 2016, S. 252; S. 267; Berger 2004).

Im Hinblick auf den kleinen Auswahlsatz des SUF dürfte die Annahme einer einfachen Zufallsstichprobe der Auswahlbezirke und somit vernachlässigbarer Endlichkeitskorrektur unproblematisch sein. Mit der Abgrenzung der Schicht mittels Bundesland und Gebäudegrößenklasse liegt keine zu stark differenzierte Schichtung vor. Des Weiteren ist durch das Rotationsdesign des MZ sichergestellt, dass der Umfang der überlappenden Stichproben nicht zufällig ist. Die Annahme eines Stichprobendesigns mit hoher Entropie trifft auf den MZ zu. Für das SUF sind wegen der Substichprobenziehung Einschränkungen anzunehmen.

Die abhängigen Variablen der multivariaten Regression sind die auf der Ebene der Auswahlbezirke (\(i\)) summierten Residuen der Regression der linearisierten Variablen auf die Hilfsmerkmale der designbasierten Schätzungen für die Querschnittsdaten zum Zeitpunkt \(t\) und die jeweiligen Subpopulationen: \(\hat{\tau }_{1i}=\sum _{i\in s_{1}}u_{ij}\), \(\hat{\tau }_{2i}=\sum _{i\in s_{2}}u_{ij}\). Falls ein Auswahlbezirk zu einem Zeitpunkt nicht vertreten ist, werden die Werte der abhängigen Variablen auf 0 gesetzt.

Die Kovariaten sind vollständige Interaktionen der Informationen zum Stichprobendesign und Rotationsdesign, d. h. der Schichtung und der Erhebungszeitpunkte. Dabei ist \(z_{h1i}=1\), falls der i-te Auswahlbezirk zum Zeitpunkt \(t=1\) zur h-ten Schicht gehört, und sonst 0. Analog gilt \(z_{h2i}=1\) für den Zeitpunkt \(t=2.\) Das Modell enthält keine Regressionskonstante (Berger und Priam 2016, S. 255):

$$\left(\begin{array}{c} \hat{\tau }_{1i}\\ \hat{\tau }_{2i} \end{array}\right)=\left(\begin{array}{c} \beta _{1}^{\left(1\right)} z_{h1i}+\beta _{2}^{\left(1\right)} z_{h2i}+\beta _{12}^{\left(1\right)} z_{h1i} z_{h2i} \\ \beta _{1}^{\left(2\right)} z_{h1i}+\beta _{2}^{\left(2\right)} z_{h2i}+\beta _{12}^{\left(2\right)} z_{h1i} z_{h2i} \end{array}\right)+\left(\begin{array}{c} \varepsilon _{1i}\\ \varepsilon _{2i} \end{array}\right)$$
(3)

Die Korrelation der Residuen der multivariaten Regression \(\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)\) wird als Schätzung der Korrelation der Schätzer der Querschnittsdaten verwendet. Die Korrelation der Residuen bezieht sich auf die Annahme einer einfachen Zufallsstichprobe ohne Hochrechnung. Gesucht ist aber die designbasierte Varianz mit Hochrechnung. Hierfür werden in \(V\left(\hat{\Updelta }\right)\) die für die Querschnittsdaten vorliegenden designbasierten Standardfehler \(V\left(\hat{\theta }_{t}\right)\) und die Korrelationen \(\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)\) aus der Kovarianzmatrix der Residuen eingesetzt. Allgemein besteht zwischen Korrelation und Kovarianz die Beziehung \(\rho \left(\hat{\theta }_{1},\hat{\theta }_{2}\right)=Cov\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)/\left(V\left(\hat{\theta }_{1}\right)^{-1/2}\,V\left(\hat{\theta }_{1}\right)^{-1/2}\right)\). Die designbasierte Kovarianz \(V\left(\hat{\theta }_{2},\hat{\theta }_{1}\right)\) ergibt sich somit durch die Multiplikation der Korrelation \(\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right)\) mit den designbasierten Standardfehlern von \(V\left(\hat{\theta }_{1}\right)\) und \(V\left(\hat{\theta }_{2}\right)\). Die Varianz der Differenz eines Schätzers \(\hat{\Updelta }=\hat{\uptheta }_{2}-\hat{\uptheta }_{1}\) ist

$$V\left(\hat{\Updelta }\right)=V\left(\hat{\theta }_{2}\right)+V\left(\hat{\theta }_{1}\right)-2\sqrt{V\left(\hat{\theta }_{2}\right)}\sqrt{V\left(\hat{\theta }_{1}\right)}\rho _{\hat{\Upsigma }}\left(\hat{\theta }_{1},\hat{\theta }_{2}\right).$$
(4)

4 Ergebnisse

Am Beispiel von 4 Indikatoren werden im Folgenden Nettoveränderungen für die MZ-Erhebungen 2012 und 2013 geschätzt. Es wird untersucht, ob Veränderungen der Indikatoren als zufällige Schwankungen der Stichproben oder statistisch signifikant zu bewerten sind. Die Beispiele greifen in der Wissenschaft wie auch in der Öffentlichkeit thematisierte Fragen auf. Sie orientieren sich an der Sozialberichterstattung der amtlichen Statistik. Dort finden sich zahlreiche Beispiele einer nach Subpopulationen differenzierten Sozialberichterstattung unter anderem in den sogenannten Langen Reihen der Fachserien des Statistischen Bundesamtes, auf den Webseiten zur Sozialberichterstattung der Statistischen Ämter des Bundes und der Länder (2017) oder im Armuts- und Reichtumsbericht der Bundesregierung (BMAS 2017). Vergleichbare Ergebnisse zu Standardabweichungen oder Konfidenzintervallen für die hier betrachteten Indikatoren liegen leider nicht vor.

Der Indikator Erwerbstätigenquote für 60- bis 64-Jährige ist definiert als Anteil der Erwerbstätigen im Alter von 60 bis 64 Jahren an der gleichaltrigen Bevölkerung. Die Erwerbstätigenquote für diese Altersgruppe knüpft an die Themen der Erhöhung des effektiven Renteneintrittsalters und des alterungsbedingten Arbeitskräftemangels an. Die Erwerbstätigenquote für 20- bis 64-Jährige ist ein Leitindikator der Europa 2020-Strategie der Europäischen Kommission (2018).

Die Befristungsquote erfasst den Anteil befristeter Arbeitsverträge. Befristete Beschäftigungen zählen zu den atypischen Beschäftigungen. Sie haben in den letzten Dekaden im Vergleich zu sogenannten Normalarbeitsverhältnissen insgesamt zugenommen (BMAS 2017, S. 79 ff.). Bei guter Konjunktur sind Befristungen jedoch tendenziell rückläufig. In Anlehnung an die Abgrenzung des Statistischen Bundesamtes (2017, S. 40) werden nur abhängig Beschäftigte ab 25 Jahren betrachtet.

Die Teilzeitquote bezieht sich auf abhängig Beschäftigte in Teilzeitarbeit im Alter von 15 bis 64 Jahren unter allen gleichaltrigen abhängig Beschäftigten. Aus Sicht der Erwerbstätigen wird häufig Teilzeitarbeit gewählt, um Aufgaben in den Bereichen Familie und Beruf besser vereinbaren zu können. Insgesamt haben Teilzeitbeschäftigungen im Zeitverlauf zugenommen. Im MZ 2013 wurde die Zuordnung der Selbsteinschätzung der Befragten zur Voll- oder Teilzeittätigkeit geändert. Um vergleichbare Ergebnisse zu gewährleisten, wurde Teilzeitarbeit für 1 bis einschließlich 31 normalerweise geleisteten Wochenarbeitsstunden definiert.

Der Leitindikator der Strategie Europa 2020 Frühzeitige Schul- und Ausbildungsabgänger zeigt den Anteil von 18- bis 24-Jährigen, die höchstens einen Haupt- oder Realschulabschluss haben, zum Zeitpunkt der Befragung keine schulische oder berufliche Ausbildung absolvieren oder an Weiterbildungsmaßnahmen teilnehmen, an der gleichaltrigen Bevölkerung. Der Indikator beschreibt damit eine Gruppe, die auf dem Arbeitsmarkt mit überdurchschnittlichen Schwierigkeiten konfrontiert ist. Das Europa-2020-Ziel von höchstens 10 % wurde 2013 in Deutschland erstmals erreicht.

Die folgenden Tabellen enthalten sowohl für die Querschnittsdaten als auch die Nettoveränderungen die mit den oben dargestellten Verfahren geschätzten Quoten, designbasierte Standardfehler sowie 95 %-Konfidenzintervalle. In der jeweils letzten Zeile werden Schätzungen unter Annahme der statistischen Unabhängigkeit der Teilstichproben berichtet, die bisher aufgrund fehlender längsschnittkonsistenter Ordnungsnummern getroffen werden musste. Der Vergleich mit den Ergebnissen für Nettoveränderungen unter Berücksichtigung der Kovarianz zeigt, welche Überschätzungen der Standardfehler bzw. der Konfidenzintervalle entstehen, wenn die Kovarianz nicht berücksichtigt wird.

Von 2012 bis 2013 ist die Erwerbstätigenquote für 60- bis 64-Jährige um 3 Prozentpunkte gestiegen (Tab. 1). Der Standardfehler beträgt 0,24 % und das dazugehörige 95 %-Konfidenzintervall 2,5 bis 3,5 %. Es enthält nicht den Wert null, sodass die Veränderung als statistisch signifikant gilt. Dieser Schluss würde auch ohne Berücksichtigung der Kovarianz gezogen, wenngleich mit einem um 35 Prozentpunkte höheren Standardfehler als bei korrekter Berücksichtigung der Kovarianz der Schätzer.

Tab. 1 Erwerbstätigenquote für 60- bis 64-Jährige: Jahresdurchschnitte, Nettoveränderung und Standardfehler

In ähnlicher Weise trifft dies auch auf den Anstieg der Teilzeitquote um 0,5 Prozentpunkte (Tab. 2) und den Rückgang des Anteils früher Schulabgänger um 0,5 Prozentpunkte (Tab. 3) zu. Allerdings beträgt in Tab. 3 die Überschätzung des Standardfehlers bei Annahme statistischer Unabhängigkeit rund 24 Prozentpunkte im Vergleich zur Berücksichtigung der Kovarianz.

Tab. 2 Teilzeitquote für abhängig Beschäftigte im Alter von 15 bis 64 Jahren: Jahresdurchschnitte, Nettoveränderung und Standardfehler
Tab. 3 Anteil früher Schulabgänger im Alter von 18 bis 24 Jahren: Jahresdurchschnitte, Nettoveränderung und Standardfehler

Im Unterschied dazu zeigt sich beim Rückgang der Befristungsquote um 0,2 Prozentpunkte (Tab. 4) ohne Berücksichtigung der Kovarianz keine statistisch signifikante Veränderung; das 95 %-Konfidenzintervall enthält den Wert null. Dagegen wird bei Berücksichtigung der Kovarianz eine signifikante Veränderung festgestellt. Wie dieses Beispiel zeigt, kann die nicht zutreffende Annahme statistischer Unabhängigkeit durchaus zu anderen Ergebnissen als die korrekte Varianzschätzung führen.

Tab. 4 Befristungsquote für abhängig Beschäftigte ab 25 Jahren: Jahresdurchschnitte, Nettoveränderung und Standardfehler

5 Schluss

Mit den ab dem MZ 2012 zur Verfügung stehenden Daten können Forscher nach der Umstellung der Substichprobenziehung und mit der Bereitstellung längsschnittkonsistenter Ordnungsnummern designbasierte Varianzschätzungen von Nettoveränderungen vornehmen. Gegenüber den bisherigen Schätzungen für Querschnittsdaten ist für die Varianzschätzung von Nettoveränderungen nach dem Verfahren von Berger und Priam (2016) kein großer Mehraufwand erforderlich.

Am Beispiel von 4 Indikatoren zeigten sich erhebliche Unterschiede, ob die durch die partielle Rotation entstehende Kovarianz der Schätzungen statistisch angemessen berücksichtigt wird oder nicht. Nimmt man fälschlicherweise statistische Unabhängigkeit der Stichproben an, ist der Standardfehler der Nettoveränderung um 20 bis 35 Prozentpunkte größer als bei Berücksichtigung der Kovarianz der Schätzer. Zudem zeigte sich, dass die Annahme statistischer Unabhängigkeit durchaus zu anderen Einschätzungen der statistischen Signifikanz führen kann. Zusammenfassend kann deshalb festgehalten werden, dass die ab 2012 geschaffenen Möglichkeiten es der Wissenschaft erlauben, die hohe Präzision der Schätzergebnisse von Nettoveränderungen effizient auszuschöpfen.