1 Einleitung

Die Ergebnisse der Volkswirtschaftlichen Gesamtrechnungen (VGR) der Länder spielen in der politischen Diskussion eine nicht zu unterschätzende Rolle. Sie sind ein zentraler Maßstab der Wirtschaftskraft von Bundesländern und Regionen, und gehen deshalb beispielsweise in diverse Rankings ein.Footnote 1 Selten problematisiert wird die Aussagekraft dieser Daten, und dies, obwohl sie auf dem Weg von der ersten Veröffentlichung bis zur endgültigen Zahl substanziellen Revisionen unterworfen sind.

So wurde im März 2016 für Nordrhein-Westfalen eine Zuwachsrate des realen Bruttoinlandsprodukts (BIP) im Jahr 2015 von Null ausgewiesen, bei einer Zunahme des deutschen BIP um 1,7 %. Dies löste in NRW eine heftige „Nullwachstumsdebatte“ aus. Heute wird eine Zunahme um 1 % ausgewiesen, bei unveränderter BIP-Rate für Deutschland. Damit liegt die Expansion in NRW zwar immer noch unter dem Bundesdurchschnitt, der Abstand erscheint aber weniger besorgniserregend. Umgekehrt wurde Zunahme des nordrhein-westfälischen BIP im Jahr 2016 von 1,8 % (veröffentlicht im März 2017) auf 1,1 % (Datenstand März 2020) nach unten revidiert. Im Gegenzug mutierte Niedersachsen, für das ursprünglich eine unterdurchschnittliche Zuwachsrate im Jahr 2016 von 1,4 % gemeldet worden war, mit einem (im März 2020 ausgewiesenen) Plus von 6,0 % zum Spitzenreiter in der Rangfolge der Bundesländer.Footnote 2 Dabei ist zu beachten, dass bevölkerungsreiche Länder wie NRW und Niedersachsen bezüglich ihrer Wirtschaftsstruktur breit aufgestellt sind, was das Ausmaß späterer Revisionen begrenzt. In kleineren Ländern und Stadtstaaten konzentriert sich die Produktion oft auf wenige Branchen, was die Daten anfälliger für Revisionen macht.

Diese Beobachtungen legen eine systematische Auseinandersetzung mit den Revisionen der VGR der Länder nahe. Diese gibt es meines Wissens bisher nicht. In den Qualitätsberichten zu den VGR der Länder findet man zwar einige Angaben zum Ausmaß der Revisionen (AK VGRdL 2020, S. 16). Diese beziehen sich allerdings allein auf das BIP und lediglich auf Durchschnitte über alle Bundesländer; Aussagen zu einzelnen Ländern findet man nicht. Auch ist mit Blick die Aussagekraft der Daten von Interesse, die entstehungsseitigen Komponenten näher zu betrachten, etwa die Bruttowertschöpfung der Wirtschaftsbereiche oder Angaben zur Beschäftigung und zur Produktivität.

Bevor auf die Revisionen im Detail eingegangen wird, ist es zunächst angebracht, kurz, und soweit es für einen Ausstehenden möglich ist, auf den Rechengang bei der Erstellung der VGR der Länder einzugehen (Abschn. 2). Dabei wird auch auf mögliche Fehlerquellen und Revisionsursachen eingegangen. Im anschließenden Abschn. 3 werden die Revisionen des BIP und seiner Komponenten dargestellt. Den Ausgangspunkt bilden die nominalen Werte, da diese auch den Ausgangspunkt der Berechnungen des Arbeitskreises VGR bilden. Zudem werden Revisionen der Deflatoren, der Beschäftigung, des Arbeitsvolumens und der Produktivität analysiert. In Abschn. 4 wird dann auf drei Wirtschaftsbereiche, nämlich das Verarbeitende Gewerbe, das Baugewerbe und die Gesamtheit der Dienstleistungsbereiche eingegangen. Abgeschlossen wird das Papier mit Überlegungen, wie man Aussagekraft und Revisionsanfälligkeit der VGR der Länder verbessern könnte (Abschn. 5).

2 Daten

2.1 Zur Erstellung der VGR der Länder

Den folgenden Ausführungen ist voranzuschicken, dass der Autor nicht an der Erstellung der VGR der Länder beteiligt ist, und insofern den Rechenprozess nur anhand der veröffentlichten Unterlagen nachvollziehen kann, insbesondere der Methodenbeschreibung (AK VGRdL 2017) und der Qualitätsberichte (AK VGRdL 2020) des Arbeitskreises.. Er hat damit keinen Einblick in zusätzliche Abstimmungsprozesse und Kontrollrechnungen, die der Arbeitskreis VGR der Länder vornimmt, um seine Berechnungen zu plausibilisieren.

Die Erstellung der VGR der Länder erfolgt seit 2008 in fünf Rechenrunden. Die ersten Angaben zur Wirtschaftsleistung der deutschen Bundesländer werden in der Regel – bei Generalrevisionen der VGR kann der Termin abweichen – Ende März des dem jeweiligen Berichtsjahr folgenden Jahres veröffentlicht.Footnote 3 Diese Daten basieren auf unvollständigen Daten, weshalb sie als erste Fortschreibung bezeichnet werden. Ein Jahr später, mit Veröffentlichung der ersten Fortschreibung für das dann neue Jahr, werden die Berechnungen für das Jahr davor revidiert. Da aber auch zu diesem Zeitpunkt noch wesentliche Basisstatistiken fehlen, wird diese zweite Veröffentlichung als zweite Fortschreibung bezeichnet. Erst ein Jahr später, also etwa 9 Quartale nach Abschluss des Berichtsjahres, liegen alle wesentlichen Basisstatistiken vor, so dass dann eine erste sog. Originärberechnung veröffentlicht werden kann.

Aber diese liefert noch keine endgültigen Werte. Dieser ersten folgen eine zweite und eine dritte Originärberechnung, mit denen zum Teil Revisionen der VGR für Deutschland insgesamt nachvollzogen werden, zum Teil weitere länderspezifische Informationen eingearbeitet werden. Im Zuge dieser Revisionen kommt es nochmals zu beträchtlichen Verschiebungen zwischen den Ländern. Das endgültige Ergebnis, also die dritte Originärberechnung, liegt erst im März des fünften Jahres nach Ende des Berichtsjahres fest. Damit ist der Revisionszyklus der VGR der Länder länger als der der gesamtdeutschen VGR, der im August des vierten Jahres nach Ende des Berichtsjahres abgeschlossen ist. Dies liegt daran, dass die VGR der Länder jeweils nur im März revidiert wird (im August jeden Jahres werden lediglich Daten zur Verwendungs- und Einkommensseite veröffentlicht), so dass die letzte Revision auf gesamtdeutscher Ebene erst ein gutes halbes Jahr später auf der Ebene der Länder nachvollzogen wird.

Die beschriebene Revisionsrunden beziehen sich auf die Entstehungsseite des BIP, die im Mittelpunkt der VGR der Länder steht, weil eine vollständige Verwendungsrechnung auf Länderebene aufgrund fehlender Angaben zu innerdeutschen „Außenhandels“-Strömen nicht kurzfristig zu erstellen ist. Die inländischen Verwendungskategorien werden erst mit zeitlichem Abstand veröffentlicht. Auf sie wird hier nicht eingegangen.

Die Entstehungsrechnung erfolgt auf der Ebene von Wirtschaftsbereichen, deren Wertschöpfung zur Bruttowertschöpfung des Landes zusammengefasst wird. Damit folgt die VGR der Länder im Prinzip einem bottom-up-Ansatz. Fehlen regionalspezifischen Daten, werden gesamtdeutsche Daten anhand geeigneter Schlüsselgrößen auf Regionen verteilt, weshalb das Vorgehen vom Arbeitskreis auch als Pseudo-bottom-up Ansatz bezeichnet wird (AK VGRdL 2017). Um zum BIP zu gelangen, werden zu der aggregierten Bruttowertschöpfung die Gütersteuern (abzüglich Gütersubventionen) hinzugezählt.Footnote 4

Den Ausgangspunkt der Berechnungen bilden generell die Produktionswerte der im jeweiligen Land ansässigen Betriebe. Diese werden im Rahmen der Kostenstrukturerhebungen ermittelt, die erst etwa 6 Quartale nach Abschluss des Jahres vorliegen. Für die Fortschreibungen werden daher die Produktionswerte auf Basis der Umsatzentwicklung geschätzt.Footnote 5 Dazu müssen zum einen Mehrbetriebsunternehmen auf die Länder aufgeschlüsselt werden. Zum anderen sind Hinzuschätzungen für im Berichtskreis der jeweiligen Erhebungen fehlende Betriebe erforderlich. Speziell im Verarbeitenden Gewerbe erfolgt dabei die regionale Aufteilung anhand der Angaben zu den Löhnen und Gehältern. Die Produktionswerte werden um Vorleistungen vermindert, um zur Wertschöpfung zu gelangen. Da die Vorleistungsquoten ebenfalls erst im Rahmen der Kostenstrukturerhebungen anfallen, liegen erst für die erste Originärberechnung jahresspezifische Angaben vor. In den beiden Fortschreibungen werden historische Vorleistungsquoten verwendet.

Bei den Dienstleistungssektoren spielen zwar auch die Umsatzerhebungen im Dienstleistungsbereich und die Umsatzsteuerstatistik eine wichtige Rolle, jedoch werden hier in größerem Umfang Arbeitsmarktstatistiken und Verdiensterhebungen einbezogen, auf deren Grundlage die arbeitsbezogene Wertschöpfungskomponente abgeleitet werden kann. Umsatzsteuerstatistiken stoßen dort an Grenzen, wo manche Erbringer von Dienstleistungen nicht umsatzsteuerpflichtig sind, wie z. B. viele öffentliche Dienstleister und Gesundheitsdienstleister. Bei Letzteren werden auch die Abrechnungsstatistiken der kassenärztlichen Bundesvereinigung als Datenquelle genutzt. Teile der Wertschöpfung entstammen modellhaften Berechnungen, so der Mietwert der selbstgenutzten Wohnung im Bereich der Wohnungsvermietung und die unterstellten Bankgebühren (FISIM) für den Bereich der Kreditinstitute und Versicherungen.

Mit Blick auf den Revisionsbedarf und die Aussagekraft der VGR der Länder muss man zwei Probleme unterscheiden. Das erste resultiert daraus, dass viele Datenquellen – so die erwähnte Kostenstrukturerhebung – erst mit zeitlichem Abstand zum Berichtsjahr anfallen. Sie werden im Laufe der Zeit eingearbeitet und sind deshalb die wesentliche Ursache für Unterschiede zwischen der ersten und der zweiten Fortschreibung sowie der Originärberechnung. Das zweite Problem ist die Aufschlüsselung von Daten auf die Länderebene. Während arbeits-bezogene Wertschöpfungskomponenten sich über die Beschäftigungsstatistiken recht trennscharf zuordnen lassen, weil die sozialversicherungspflichtige Beschäftigung differenziert nach Arbeitsort vorliegt, gibt es bei kapital-bezogenen Wertschöpfungskomponenten ein Zurechnungsproblem, das auch mit einem Mehr an Daten schwer zu lösen ist.

Alle bisher beschriebenen Berechnungen legen jeweilige Preise zugrunde, beziehen sich also auf nominale Werte. Die Deflationierung, und damit der Übergang zu den in der Öffentlichkeit stärker beachteten preisbereinigten Werten, erfolgt in einem separaten Rechenschritt. Da auch die darin verwendeten Deflatoren revidiert werden, ergeben sich Revision z. B. des preisbereinigten BIP sowohl aus Revisionen der Nominalwerte als auch aus Revisionen der Deflatoren. Da keine länderspezifischen Preisinformationen vorliegen, lehnt sich der Arbeitskreis VGR der Länder an die entsprechenden Indizes auf Bundesebene an. Dabei verwendet er die jeweils tiefste Rechenebene der Bundesstatistik, d. h. Änderungen in der branchenmäßigen Zusammensetzung der Wirtschaftsleistung im Zuge der Revisionen schlagen sich auch in Änderungen des Deflators auf übergeordneter Ebene nieder, sofern sich die relativen Preise der Branchen unterschiedlich entwickeln.

In den VGR der Länder werden auch Angaben zur Erwerbstätigkeit und zum Arbeitsvolumen ausgewiesen. Diese werden allerdings nicht vom Arbeitskreis VGR der Länder erstellt, sondern vom Arbeitskreis Erwerbstätigenrechnung der Länder. Zwar gehen – wie erwähnt – in die Berechnung der Bruttowertschöpfung einiger Sektoren auch Informationen zum Arbeitsmarkt ein. Beide Arbeitskreise stützen sich auf unterschiedliche Ausgangsdaten, weshalb Änderungen in der Erwerbstätigenrechnung nicht notwendiger Weise auf die Gesamtrechnung durchschlagen, was sich auch für Deutschland insgesamt beobachten lässt (Döhrn 2019a, S. 110). Deshalb schlagen sich Änderungen in dem einen oder in dem anderen Rechenwerk jeweils in Änderungen der Produktivität nieder, ein Umstand, der unten zur Plausibilisierung der Daten genutzt wird.

2.2 Methodische Überlegungen zur Revisionsanalyse

Grundsätzlich muss man zwei Arten von Revisionen der VGR unterscheiden: Erstens die laufenden Revisionen, in denen, wie im vorhergehenden Abschnitt beschrieben, neue Daten in das Rechenwerk eingearbeitet werden. Zweitens finden im Abstand von durchschnittlich fünf Jahren sog. Generalrevisionen statt, in denen die Methodik der VGR grundlegend überarbeitet wird und neue Datenquellen einbezogen werden (Statistisches Bundesamt 2016, S. 30). Beide Revisionen überlagern sich, sollten aber, soll eine Revisionsanalyse Ansätze für eine Weiterentwicklung der VGR liefern, unterschieden werden. Denn nur die laufenden Revisionen lassen sich durch Verbesserungen der Datenerhebung oder der Datenauswertung verringern, während die Generalrevisionen sich überwiegend an konzeptionellen Überlegungen orientieren. Bei den VGR für Deutschland insgesamt kann man aufgrund der vierteljährlichen Erscheinungsweise beide Revisionen mit Hilfe einfacher Absätze näherungsweise trennen (Döhrn 2019a). Für die VGR der Länder können hingegen unterjährige Daten nicht für eine solche Unterscheidung herangezogen werden.Footnote 6 Im Qualitätsbericht wird zwar der durchschnittliche Einfluss vergangener Generalrevisionen auf die BIP-Raten ausgewiesen (AK VGRdL 2020, S. 16). Die Zusammenstellung zeigt, dass dieser beträchtlich ist. Die Angaben beziehen sich aber zum einen auf einen Mittelwert über alle Bundesländer und geben zum anderen jeweils den Einfluss auf alle zurückliegenden Jahre an, weshalb sich die dort gemachten Angaben nicht auf einen konkreten Revisionszyklus übertragen lassen. Im Folgenden wird daher nicht zwischen laufenden Revisionen und Generalrevisionen unterschieden.

Zudem beschränken sich die folgenden Ausführungen auf einen Vergleich der Veränderungsraten gegenüber dem Vorjahr. Die sich im Laufe der Zeit ergebenden Änderungen der Niveaus der Realwerte aufgrund von Änderungen der Preisbasis, aber auch der Nominalwerte im Zuge definitorischer Änderungen im Rahmen der Generalrevisionen lassen eine Analyse der Revisionen der Niveaus nicht sinnvoll erscheinen.

2.3 Verwendete Datenbasis

Datengrundlage der folgenden Berechnungen sind die Veröffentlichungen des Arbeitskreises Volkswirtschaftliche Gesamtrechnungen der Länder. Zur Verfügung stehen Angaben für die Jahre 2000 bis 2019. Für Erwerbstätige, Arbeitsvolumen und folglich auch die Produktivität liegen allerdings für die frühen Jahres dieses Jahrtausends keine Angaben vor, so dass der Untersuchungszeitraum teilweise später beginnt. Da 2017 das letzte Jahr ist, für das die erste Originärberechnung vorliegt, endet der Untersuchungszeitraum in diesem Jahr. Dort, wo mit der dritten Originärberechnung verglichen wird, endet der Zeitraum bereits 2015.

Analysiert werden nicht nur das BIP insgesamt, sondern auch Angaben für die drei Wirtschaftsbereiche Verarbeitendes Gewerbe, Baugewerbe und Dienstleistungen. Für die Jahre vor 2006 enthalten die VGR der Länder allerdings keine Angaben zum Arbeitsmarktvariablen für das Verarbeitende Gewerbe. Hier ist der Untersuchungszeitraum daher teilweise kürzer.

Die Daten wurden soweit möglich den jeweils im März veröffentlichten Tabellen entnommen, die auf dem Rechenstand der gesamtdeutschen VGR vom August des Vorjahres bzw. von Februar des gleichen Jahres aufbauen (bis 2008 zweite Fortschreibung, danach erste Fortschreibung). Davon abgewichen werden musste in den Jahren, in denen im Zusammenhang mit der Umsetzung von Generalrevisionen die Daten verzögert oder nur unvollständig veröffentlicht wurden. Dadurch ergaben sich folgende Abweichungen:

  • Im März 2006 wurden aufgrund der Generalrevision 2005 zunächst keine Angaben für das zurückliegende Jahr 2005 veröffentlicht. Hier wurden im August 2006 veröffentlichte Werte verwendet.

  • Nach der Generalrevision 2011 publizierte der Arbeitskreis VGR der Länder im März 2012 nur Angaben für die Jahre 2008 bis 2011. Damit liegen keine Daten für die revidierten Veränderungsraten der Jahre 2007 und 2008 vor. Hier wurden die zu Jahresbeginn 2013 veröffentlichten Werte verwendet.

  • Im Jahr 2017 wurde die Erwerbstätigenrechnung revidiert, weshalb in den die VGR der Länder vom März 2017 Angaben zu Beschäftigung und Produktivität im Jahr 2016 fehlen. Angaben zu den Erwerbstätigten veröffentlichte der Arbeitskreis Erwerbstätigenrechnung der Länder im Mai 2016. Daten zum Arbeitsvolumen fehlen; um keine Datenlücken entstehen zu lassen, wurden die im März 2018 veröffentlichten Angaben für das Jahr 2016 auch für den Veröffentlichungsjahrgang 2017 verwendet.

Überall dort, wo Bruttowertschöpfung und Beschäftigungsdaten aus unterschiedlichen Veröffentlichungen stammen, wurde die Produktivität errechnet, um eine konsistente Darstellung sicherzustellen.

3 Revisionen des BIP auf Länderebene

3.1 Verzerrung und Ausmaß der Revisionen

Bezugspunkt der folgenden Analysen ist jeweils die erste Originärberechnung. Zu ihr werden sowohl die beiden Fortschreibungen als auch die beiden anschließenden Revisionen in Relation gesetzt. Außerdem wird die sich insgesamt ergebende Revision betrachtet, also die Erste Fortschreibung mit der dritten Originärberechnung verglichen. Betrachtet werden vier Revisionsmaße:

  • Die mittlere Revision (MR), berechnet als der Mittelwert aller Differenzen zwischen Revision und Vergleichsberechnung. Sie ist ein Maß der Verzerrung.

  • Die mittlere absolute Revision (MAR), berechnet als der Mittelwert aller absoluten Differenzen zwischen Revision und Vergleichsberechnung. Sie wird in Prozentpunkten angegeben und veranschaulicht das Ausmaß der Revisionen unter Zugrundelegung einer linearen Verlustfunktion.

  • Die analog berechnete mittlere quadratische Revision (MQR) impliziert hingegen eine quadratische Verlustfunktion, gewichtet also große Revisionen höher. Sind die Revisionen unverzerrt, kann die Wurzel aus der MQR als Streuung der Revisionen interpretiert und zur Berechnung von Revisionsintervallen herangezogen werden.

  • Die Noise-to-signal rate (NSR) setzt die MQR in Relation zur Varianz der Originärberechnung. Sie kann als Maß für den Informationsgehalt der jeweiligen Veröffentlichungen interpretiert werden. Ist die NSR größer als 1, ist der Informationsgehalt der vorläufigen Daten gering.

Um einen Eindruck zu vermitteln, wie weit die VGR der Ländern Revisionen der gesamtdeutschen VGR widerspiegeln, werden alle Prüfmaße auch für das in den jeweiligen Tabellen der VGR der Länder veröffentlichte Bundesergebnis angegeben.

Ausgangspunkt der Berechnungen der VGR der Länder sind die Nominalwerte; sie werden daher als erstes betrachtet. Tab. 1 zeigt, dass die Revisionen von der ersten Fortschreibung bis zur ersten Originärberechnung beträchtlich sind und die beim Bund bei weitem übersteigen. Die mittlere absolute Revision beträgt bei fünf Ländern mehr als einen Prozentpunkt. Am geringsten ist sie bei Nordrhein-Westfalen, aber auch hier ist sie stärker als beim gesamtdeutschen BIP. Tendenziell nimmt das Ausmaß der Revisionen mit der Größe der Länder ab. Dies überrascht insofern nicht, als kleine Länder stark durch einzelne Branchen oder gar Unternehmen geprägt sind. Strikt ist dieser Zusammenhang aber nicht, auch die Revisionen für Rheinland-Pfalz, Sachsen und Thüringen sind gering (Abb. 1).Footnote 7

Tab. 1 Revisionen der Jahresraten des nominalen BIP der Länder. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)
Abb. 1
figure 1

Mittlere absolute Revisiona und Höhe des BIPb. (Eigene Berechnungen: aErste Originärberechnung vs. erste Fortschreibung, 2000 bis 2016 bBIP in Euro im Jahr 2016)

Im Vergleich von zweiter Fortschreibung und erster Originärberechnung sind die Revisionsmaße nur unwesentlich kleiner als bei der ersten Fortschreibung. Dies verdeutlicht, dass die größeren Veränderungen mit der ersten Originärberechnung vorgenommen werden, weil erst dann die meisten Datenquellen eingearbeitet werden können. Die zwischen der ersten und der dritten Originärberechnung vorgenommenen Änderungen sind bei allen Ländern geringer als die der ersten Revisionsphase. Die mittlere absolute Revision liegt schwerpunktmäßig bei 0,5 Prozentpunkten; am niedrigsten ist auch hier der Wert von Rheinland-Pfalz, am größten der für Hamburg. Sie ist aber in allem Ländern größer als beim Bund.

Über den gesamten Revisionszyklus gesehen fallen die Revisionen im Durchschnitt nur unwesentlich größer, bei Niedersachsen und Rheinland-Pfalz sogar etwas geringer aus als in der ersten Phase, also bis zur Vorlage der ersten Originärberechnung. Dies zeigt, dass die im Überarbeitungsprozess vorgenommenen Revisionen nicht alle in die gleiche Richtung gehen, sondern dass in vielen Fällen die vorläufigen Raten um die endgültigen schwanken.

Die mittlere quadratische Revision ist in den meisten Ländern nur wenig größer als die mittlere absolute. Dies deutet darauf hin, dass alle Jahre in ähnlichem Maße von Revisionen betroffen sind. Die auffälligste Ausnahme ist hier Bremen, aber auch bei Niedersachsen, dem Saarland und Brandenburg treten größere Unterschiede zwischen beiden Kennziffern auf. Dies bedeutet, dass in diesen Ländern die Revisionen stark von großen Änderungen in einzelnen Jahren geprägt sind. Erfreulich ist, dass die noise to signal ratio in allen Ländern und für alle Vergleiche kleiner als eins ist. Bereits die ersten Veröffentlichungen haben danach zumindest einen gewissen Informationsgehalt bezüglich der finalen Werte.

Die mittlere Revision schließlich lässt keine signifikanten Verzerrungen erkennen. Etwa bei der Hälfte der Länder ist die als erste veröffentlichte Veränderungsrate im Durchschnitt zu hoch (d. h. MR ist negativ). Auffällig ist die Verzerrung aber nur bei Bayern und Hamburg, wo sie auf dem 90 %-Niveau signifikant von Null verschieden ist.

Tab. 2 enthält die gleichen Revisionsmaße für das reale BIP, wobei aus Platzgründen nur zwei Vergleiche dargestellt werden. Die Maße unterscheiden sich von denen beim nominalen BIP nur unwesentlich. Korreliert man länderweise die Revisionen der Zuwachsraten des nominalen und des realen BIP, so liegt der Korrelationskoeffizient zumeist über 0,9. Ausnahmen sind hier Hamburg und Mecklenburg-Vorpommern sowie – weniger ausgeprägt – Schleswig-Holstein. Die hohe Parallelität könnte man so verstehen, dass das nominale BIP bei allen Revisionsschritten mit einem wenig veränderten Preisindex deflationiert wird.

Tab. 2 Revisionen der Vorjahresraten des realen BIP der Länder 2000–2017. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)

Diese Vermutung lässt sich aber nicht bestätigen. Vielmehr sind die impliziten Deflatoren erheblichen Revisionen unterworfen (Tab. 3). Bei den großen Bundesländern Nordrhein-Westfalen, Bayern und Baden-Württemberg, deren Wirtschaftsstrukturen stärker der gesamtdeutschen ähneln, entspricht die Revision in etwa der beim gesamtdeutschen Deflator. Bei den kleineren Bundesländern sind die Revisionen erheblich größer, bei Hamburg und Mecklenburg-Vorpommern übersteigen sie über den gesamten Revisionsprozess gesehen sogar die Varianz des Deflators, d. h. die noise to signal-ratio ist größer als 1.

Tab. 3 Revisionen der Vorjahresveränderungen der BIP-Deflatoren der Länder 2000–2017. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)

Da laut Methodenbeschreibung auf der untersten Berechnungsebene gleiche Deflatoren für alle Länder verwendet werden, können sich Abweichungen der Revisionen auf Länderebene von denen für den Bund nur durch das Zusammenwirken von Unterschieden in der sektoralen Zusammensetzung der Wertschöpfung und von gegenläufigen Revisionen der sektoralen Deflatoren auf Bundesebene ergeben. Dass solche Kompositionseffekte bei kleineren Ländern aufgrund deren spezialisierten Wirtschaftsstrukturen stärker durchschlagen können als in großen, überrascht deshalb nicht.

Um die Hintergründe der Revisionen besser zu verstehen, bietet es sich an, die Änderungen beim realen BIP aufzuspalten in Revision der Zunahme des Arbeitsinput, gemessen am Arbeitsvolumen, und der Produktivität, gemessen an der realen BWS je Arbeitsstunde. Da allerdings für die Jahre vor 2005 keine Angaben zum Arbeitsvolumen vorliegen, stützen sich diese Berechnungen auf eine kurze Datenreihe. Betrachtet werden hier nur die Revisionen der ersten Originärberechnung gegenüber der ersten Fortschreibung, denn die Einbeziehung der dritten Originärberechnung würde den Untersuchungszeitraum weiter verkürzen.

Die Beiträge des Arbeitsinputs und der Produktivität zur Revision des realen BIP unterscheiden sich deutlich (Tab. 4). Die Zunahme des Arbeitsvolumens wird im Durchschnitt im Bundesgebiet insgesamt wie in den Ländern zwar abwärtsrevidiert (MR ist negativ), die durchschnittlichen Revisionen sind aber auf der Ebene der Länder im Allgemeinen nur wenig größer als beim Bund, und der Unterscheid zwischen kleinen und großen Ländern ist nicht allzu gravierend. Die Noise-to-signal-Ratio ist durchgängig deutlich kleiner als 1. Geänderte Zuwächse beim Arbeitsinput sind demnach nicht die vorwiegende Ursache für Revisionen der BWS bzw. des BIP. Zudem sind die Revisionen beim realen BIP und beim Arbeitsvolumen in den meisten Ländern und beim Bund nur schwach korreliert (Tab. 5). Eine signifikante positive Korrelation findet man nur bei Berlin und Mecklenburg-Vorpommern, während man bei Thüringen und – weniger ausgeprägt – Sachsen und Bremen sogar eine signifikante negative Korrelation findet.

Tab. 4 Revisionen der Vorjahresveränderungen von Arbeitsvolumen und Produktivität 2005–2017, Erste Originärberechnung gegenüber erster Fortschreibung. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)
Tab. 5 Korrelation der Revisionen der Veränderungsraten von BIP, Arbeitsvolumen und Produktivität 2005–2017, Erste Originärberechnung gegenüber erster Fortschreibung. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)

Deutlich anders ist das Bild bei der Produktivität. Hier sind die Revisionen deutlich ausgeprägter als die beim BIPFootnote 8. Bei der Hälfte der Länder beträgt die mittlere absolute Revision des Produktivitätswachstum mehr als einen Prozentpunkt. Bei vier Ländern ist die Noise-to signal-ratio größer als eins, und bei weiteren zwei Ländern – darunter mit Bayern eines der großen Länder – liegt sie nur sehr knapp darunter. Dies zeigt, dass Revisionen beim BIP fast vollständig auf die Produktivität durchschlagen. Die Korrelation der Revisionen beider Größen übersteigt in der Mehrzahl der Länder den Wert von 0,9; beim Bund beträgt sie nur 0,55.

3.2 Rangstabilität der Angaben

Da die VGR der Länder häufig verwendet werden, um Länder hinsichtlich ihres Wachstumstempos zu vergleichen, wird in einem weiteren Analyseschritt untersucht, wie sich die Rangfolge der Länder beim BIP-Wachstum im Zuge der verschiedenen Revisionsrunden ändert.

Ob es ein Kriterium für die Qualität der VGR der Länder ist, wenn sich die Rangfolge der Länder bezüglich der Zuwächse des BIP im Zuge der Revisionen nicht ändert, lässt sich kontrovers diskutieren. Für die Nutzer, insbesondere die Politik, ist es gleichwohl ein wichtiges Kriterium, wird doch eine im Vergleich zum Bund überdurchschnittliche Zuwachsrate gerne als Ausweis einer erfolgreichen Politik angesehen, und umgekehrt eine unterdurchschnittliche Rate als Hinweis auf Handlungsbedarf verstanden. Da hilft es wenig, wenn nach Abschluss des Revisionsprozesses nach vier Jahren, also nach einer Zeit, die oft der Dauer einer Legislaturperiode entspricht, die Öffentlichkeit erfährt, dass es anders war.

Als Maß der Rangstabilität werden hier Rangkorrelationskoeffizienten verwendet. Abb. 2 zeigt, dass die Ränge der Länder bezüglich der Zunahme des BIP gemäß der ersten Fortschreibung in den meisten Jahren wenig mit Rangfolge bei den Originärberechnungen zu tun haben. In etwa der Hälfte der betrachteten Jahre – die Ergebnisse unterscheiden sich leicht, je nachdem, ob man die erste oder die dritte Originärberechnung als Maßstab heranzieht – besteht zwischen den sich aus der Erstveröffentlichung ergebenden Rangfolgen und den später veröffentlichten kein statistisch signifikanter Zusammenhang. Der Vergleich von der dritten mit der ersten Originärberechnung fällt hingegen günstiger aus. Zwischen diesen beiden Berechnungsstufen ändert sich die Rangfolge der Länder kaum.

Abb. 2
figure 2

Ränge der Länder bezüglich der Zunahme des BIP nach unterschiedlichen Revisionsständen der VGR der Länder 2000 bis 2017, Rangkorrelationskoeffizienten. (Eigene Berechnungen)

Bei den Erwerbstätigen zeigt sich ein anderes Bild. Hier ändert sich die Rangfolge der Länder im Zuge des Revisionsprozesses nur wenig; der Rangkorrelationskoeffizient ist in allen Fällen signifikant von Null verschieden (Abb. 3). Dies ist – neben der generell geringeren Revisionsanfälligkeit – ein zweiter Hinweis, dass die Erwerbstätigkeit ein möglicherweise aussagekräftigerer Indikator der wirtschaftlichen Entwicklung von Bundesländern als das BIP ist.

Abb. 3
figure 3

Ränge der Länder bezüglich der Zunahme der Erwerbstätigkeit nach unterschiedlichen Revisionsständen der VGR der Länder 2000 bis 2016, Rangkorrelationskoeffizienten. (Eigene Berechnungen)

4 Revisionen auf der Ebene von Wirtschaftszweigen

Da die VGR der Länder ausgehend von der Ebene der Wirtschaftszweige erstellt wird, ist es von Interesse, wie weit die einzelnen Branchen zu den Revisionen auf gesamtwirtschaftlicher Ebene beitragen. Angaben zur Wertschöpfung liefert die VGR der Länder derzeit für 20 Wirtschaftszweige (Abschnitte der Wirtschaftszweigesystematik WZ 2008). Allerdings findet man nicht für alle lange Zeitreihen, zum einen weil im Zuge der Generalrevision 2011 die Wirtschaftszweigesystematik geändert wurde, zum anderen weil Angaben für manche Wirtschaftszweige mit Verzögerung anfallen. Zudem liegen Angaben zum Arbeitsvolumen ohnehin für eine geringere Zahl von Wirtschaftszweigen vor. Daher beschränken sich die folgenden Ausführungen auf das Verarbeitende Gewerbe, das Baugewerbe und die Gesamtheit der Dienstleistungssektoren.

Im Verarbeitenden Gewerbe werden die Zuwachsraten der nominalen und der realen Bruttowertschöpfung für nahezu alle Länder stärker revidiert als für den Bund (Tab. 6).Footnote 9 Gleichwohl ist die Noise to signal ratio in allen Fällen deutlich kleiner als 1, besitzt also bereits die erste Veröffentlichung einen gewissen Informationsgehalt. In der Grundtendenz gilt auch hier, dass die Revisionen bei großen Ländern geringer ausfallen als bei kleinen. Auffällig sind aber die vergleichsweise große Revision beim gemessen am BIP viertgrößten Land Niedersachsen. Hier schlägt u. a. die in der Einleitung angesprochene kräftige Revision im Jahr 2016 zu Buche.

Tab. 6 Revisionen der VGR der Länder für das Verarbeitende Gewerbe. Veränderungen gegenüber dem Vorjahr; Erste Originärberechnung gegenüber erster Fortschreibung. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)

Die Revisionen des Arbeitsvolumens sind wie in der Gesamtwirtschaft auch beim Verarbeitenden Gewerbe deutlich geringer als bei der Wertschöpfung, sowohl gemessen an MAR als auch an NSR. Dies impliziert große Revisionen der Arbeitsproduktivität; hier übersteigt die NSR in Bremen den Wert von 1, und sie liegt in Brandenburg und in Mecklenburg-Vorpommern nur knapp darunter.

Massive Zweifel an der Verlässlichkeit der ersten Fortschreibung ergibt die Revisionsanalyse beim Baugewerbe (Tab. 7). Die Revisionen sind in Relation zur Varianz der Zeitreihe beträchtlich; die NSR liegt bei der nominalen Bruttowertschöpfung in sechs, bei der realen sogar bei zehn Ländern bei Eins oder darüber. Zwar ist das Arbeitsvolumen ebenfalls revisionsanfälliger als beispielsweise im Verarbeitenden Gewerbe, sie sind aber auch hier die im Vergleich zur Wertschöpfung die verlässlichere Angabe. Die erste Veröffentlichung der Arbeitsproduktivität kann man getrost als wertlos bezeichnen, nur bei Mecklenburg-Vorpommern ist die NSR kleiner 1, bei elf Ländern übersteigt das Ausmaß der Revision die Varianz der Veränderungsraten im mehr als das Doppelte.

Tab. 7 Revisionen der VGR der Länder für das Baugewerbe. Veränderungen gegenüber dem Vorjahr; Erste Originärberechnung gegenüber erster Fortschreibung. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)

Zu beachten ist allerdings, dass beim Baugewerbe die zuerst veröffentlichten Angaben auch für den Bund weniger verlässlich sind als die für das Verarbeitende Gewerbe. Dazu trägt wahrscheinlich bei, dass die Bedeutung von Ausbauleistungen gegenüber dem Neubau zugenommen hat und das Ausbaugewerbe aufgrund seiner eher kleinbetrieblichen Struktur in den kurzfristig verfügbaren Statistiken unterrepräsentiert ist. Zudem sind durch die Dienstleistungsfreiheit in der EU viele ausländische Unternehmen auf deutschen Baustellen tätig, die teilweise durch die Maschen der Statistik fallen.

In den Dienstleistungsbereichen schließlich fallen die Revisionen in der Summe weniger ins Gewicht als im Baugewerbe, sie sind aber ausgeprägter als im Verarbeitenden Gewerbe (Tab. 8). Die NSR liegt beim nominalen und beim realen BIP in einer Reihe von Fällen über Eins. Auch hier sind die Revisionen beim Arbeitsvolumen gering, was wiederum kräftige Revisionen der Arbeitsproduktivität impliziert.

Tab. 8 Revisionen der VGR der Länder für die Dienstleistungsbereiche. Veränderungen gegenüber dem Vorjahr; Erste Originärberechnung gegenüber erster Fortschreibung. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)

Da der Dienstleistungsbereich sehr heterogen ist, auch bezüglich der Datenverfügbarkeit, wäre es aufschlussreich zu erfahren, wie sich die Revisionspraxis zwischen den Dienstleistungssektoren unterscheidet. Aufgrund der Umstellung der Wirtschaftszweigesystematik im Zuge der Generalrevision 2011 ist allerdings ein Vergleich von erster Fortschreibung und erster Originärberechnung nur für sieben Jahre möglich, und dies auch nur für drei Bereiche des Dienstleistungssektors (Tab. 9). In den Abschnitten G–J der Wirtschaftszweigesystematik findet man in diesem Zeitraum in der Summe – gemessen an MAR – im allgemeinen die höchsten, in den Abschnitten O‑T die geringsten Revisionen. Da jedoch in letztgenanntem Bereich die Varianz der Raten gering ist, ist dort die NSR höher. Bei alledem gibt es allerdings Unterschiede zwischen den Ländern.

Tab. 9 Revisionen der der realen Bruttowertschöpfung in Untergruppen des Dienstleistungssektors 2011 bis 2017; Veränderungen gegenüber dem Vorjahr; Erste Originärberechnung gegenüber erster Fortschreibung. (Quelle: Eigene Berechnungen nach Angaben des Arbeitskreises VGR der Länder)

5 Folgerungen

Die vorstehenden Ausführungen zeigen, dass die VGR der Länder erheblichen Revisionen unterliegen. Dies verringert deren Informationsgehalt bezüglich der Einschätzung der wirtschaftlichen Lage der einzelnen Länder; bei einigen Ländern geht der Informationsgehalt der zuerst veröffentlichen Werte für manche Sektoren gegen Null. Zudem zeigt die mangelnde Rangstabilität, dass die zuerst veröffentlichten Werte keine belastbaren Aussagen zur „tatsächlichen“ Wachstumsposition eines Landes im Spektrum der anderen Länder zulassen.Footnote 10

Dabei zeigt die Revisionsanalyse zwei Ansatzpunkte auf, die VGR der Länder weniger revisionsanfällig und damit aussagekräftiger zu machen. Zum einen zeigt die Analyse, dass die Revisionen beim Arbeitseinsatz (sowohl gemessen an der Zahl der Erwerbstätigen als auch am Arbeitsvolumen) deutlich geringer sind als beim BIP bzw. der Bruttowertschöpfung. Dies ist insofern plausibel, als sich der Arbeitseinsatz, anders als die kapitalbezogene Wertschöpfungskomponenten, bereits aus den kurzfristig verfügbaren Statistiken recht trennscharf nach Ländern abgrenzen lässt. Zum anderen schlägt sich das Zusammenspiel von geringen Revisionen beim Arbeitseinsatz und starken Revisionen bei BIP bzw. Wertschöpfung in äußerst kräftigen Revisionen der Arbeitsproduktivität nieder, und dies insbesondere auch auf der Ebene von Wirtschaftszweigen.

Aus diesen Beobachtungen lassen sich zwei Empfehlungen ableiten.

Erstens sollte bei der Berechnung der VGR der Länder die Arbeitsmarktseite ein größeres Gewicht besitzen. Dies empfiehlt sich auch angesichts der Tatsache, dass die Aufschlüsselung kapitalbezogener Wertschöpfungskomponenten insbesondere in großen Unternehmensverbünden angesichts der zunehmenden Komplexität der inneren Verflechtungen zunehmend schwierig wird. Dies gilt bereits für die Zuordnung der Wirtschaftsleistung multinationaler Unternehmen zu Staaten (Allafi et al. 2017), und dürfte bei der Aufschlüsselung der Kapitaleinkommen deutschlandweit tätiger Unternehmen auf Bundesländer nicht einfacher sein.

Zweitens sollten Veränderungen der Arbeitsproduktivität als Kontrollvariable zur Überprüfung der Plausibilität des Rechenwerks verwendet werden. In der Arbeitsproduktivität „prallen“ die Ergebnisse der Erwerbstätigenrechnung der Länder und der VGR der Länder aufeinander. Da es nicht unplausibel ist anzunehmen, dass in einer wettbewerblich organisierten und im internationalen Wettbewerb stehenden Volkswirtschaft alle Unternehmen einer Branche eine im Trend ähnliche Produktivitätsentwicklung aufweisen, sollten Unterschiede zwischen den Bundesländern gut begründbar sein, z. B. durch Unterschiede in der Kapazitätsauslastung oder in Unternehmenscharakteristiken. Mit Skepsis sollte man insbesondere großen Sprüngen in der Produktivität von Jahr zu Jahr begegnen.