1 Einleitung

… I do think the studies that attempt to exploit actual variation in minimum wages are considerably better than those simulations that purport to estimate the impact of minimum wages on employment without any actual data on minimum wages.

Manning (2013, S. 64)

Seit dem Inkrafttreten des Arbeitnehmerentsendegesetztes (AEntG) im Jahre 1996 können tarifvertragliche Bestimmungen per Allgemeinverbindlichkeitserklärung oder Rechtsverordnung auf alle Beschäftigten einer Branche ausgeweitet werden. Somit wurde eine rechtliche Grundlage zur Einführung von Branchenmindestlöhnen geschaffen. Während in der frühen Phase nur das Bauhaupt- und zwei Baunebengewerbe von dem Gesetz betroffen waren, wurden bis zum Jahre 2010 insgesamt 11 Branchen in das AEntG aufgenommen. Die Auswirkung des Mindestlohns auf die Beschäftigung, den Arbeitnehmerschutz und den Wettbewerb wurde im Auftrag des Bundesministeriums für Arbeit und Soziales (BMAS) und vor dem Hintergrund des §24 AEntG durch verschiedene Forschungseinrichtungen für acht Branchen untersucht. Die Ergebnisse lagen im November 2011 vor. Dieser Aufsatz liefert eine kritische Zusammenfassung und Beschreibung dieser Evaluationen der Branchenmindestlöhne, wobei der Schwerpunkt auf den ökonometrischen Kausalanalysen liegt. Angesichts der Einführung des gesetzlichen Mindestlohns in Deutschland im Jahr 2015, soll dieser Aufsatz einen Beitrag zur Diskussion einer methodisch angemessenen Evaluation von Mindestlöhnen liefern.

Trotz aller in diesem Beitrag diskutierten Detailkritik an den Evaluationsstudien zu den Branchenmindestlöhnen ist festzuhalten, dass diese ein wichtiges und erfolgreiches Beispiel für eine stärkere Evidenzbasierung der Wirtschaftspolitik in Deutschland darstellen, wie sie in der aktuellen Debatte von vielen Wirtschaftswissenschaftlern angemahnt wird (vgl. Boockmann et al. 2014; sowie zur Einordnung in die Mindestlohndebatte Manning 2013; und Fitzenberger 2009).

Tab. 1 Übersicht der Evaluationsstudien zu Branchenmindestlöhnen

Einen Überblick über die in der ersten Evaluationsrunde betrachteten Branchen und der jeweiligen Evaluationsstudien befindet sich in Tab. 1. Die Ausgangslage der betrachteten Branchen war sehr heterogen sowohl im Hinblick auf die bestehenden Marktverhältnisse als auch bezogen auf den Zeitpunkt und die konkrete Ausgestaltung der Mindestlohneinführung. Ebenso heterogen war die für Evaluationszwecke zur Verfügung stehende Datenbasis. Die Studien zu den Branchen aus dem Bauhaupt- und Baunebengewerbe (Branchentyp 1) basieren auf umfangreichen administrativen Datensätzen. Dagegen konnten die Evaluationsstudien für Branchen mit einer kurzen Laufzeit des Mindestlohns (Branchen des Typs 2 oder 3) teilweise nur auf im Rahmen der Evaluationen erhobene Befragungsdaten zurückgreifen.

Allen Studien in Tab. 1 gemein ist die Schwierigkeit der Identifikation der tatsächlich vom Mindestlohn betroffenen Beschäftigten. Für einige Branchen ergaben sich Ungenauigkeiten bei der Abgrenzung der durch die tarifvertraglichen Regelungen betroffenen Branchen, weil die in den Sekundärdaten vorliegende Wirtschaftszweigklassifikation vielfach vom Geltungsbereich der Mindestlöhne abweicht. Zudem ist für die genaue Abgrenzung der betroffenen Beschäftigten eine präzise Messung der Stundenlöhne (ohne Sonderzahlungen) notwendig. Die meisten bisher verwendeten Sekundärdaten erfassen den Stundenlohn jedoch gar nicht oder nur unpräzise.

Trotz der heterogenen Ausgangslage im Hinblick auf die Mindestlohnregelungen in den einzelnen Branchen (Niveau, Einführung und Veränderungen der Mindestlöhne) und aufgrund begrenzter Datenverfügbarkeit basieren die Kausalanalysen in der ersten Evaluationsrunde fast auschließlich auf Differenz-von-Differenzen (DvD) Ansätzen. Die Anwendung dieser Ansätze erlaubt unter bestimmten Annahmen die Schätzung der kausalen Wirkung eines Mindestlohns auf die zu untersuchenden Zielgrößen. Im Rahmen dieser Studie werden die Ergebnisse der ersten Evaluationsrunde im Hinblick auf die interne und externe Validität der ökonometrischen Schätzungen der Mindestlohnwirkungen systematisch zusammengefasst und kritisch beurteilt, um daraus konzeptionelle Lehren zu ziehen. Im Sinne einer Evidenzbasierung der Wirtschaftspolitik halten wir eine Diskussion der Qualität von Studien nach deren Erstellung für notwendig – auch um zukünftige Evaluationen zu verbessern. Dies ist im Sinne einer lernenden Evaluation sinnvoll, die zu einem kontinuierlichen Monitoring der Wirkungen der Mindestlöhne fortgeführt werden kann, wie es exemplarisch von der Low-Pay-Commission in Großbritannien durchgeführt wird (Manning 2013).

Die in unserem Aufsatz diskutierten Themen und Schlussfolgerungen sind nicht nur für die Analyse der Branchenmindestlöhne relevant. Auch im Falle des gesetzlichen Mindestlohns wird es Unterschiede in der Betroffenheit zwischen Branchen, Regionen oder Firmen geben. Spillover-Effekte werden aufgrund der insgesamt höheren Betroffenheit eine noch größere Rolle spielen und die Datenlage wird vergleichbar sein. Zukünftige Evaluationen werden also mit ähnlichen Herausforderungen konfrontiert sein, wie bei der Wirkungsanalyse der Branchenmindestlöhne. Es ist deshalb zu erwarten, dass die hier diskutierten Ansätze zur Anwendung kommen. Gleichwohl ist jede Politikmaßnahme spezifisch und es gibt kein einheitliches Analysemodell, das in gleicher Weise auf alle Maßnahmen angewendet werden kann. Ein spezifisches Ziel unseres Aufsatzes ist die Diskussion von Kriterien für die Beurteilung der Eignung eines Analysemodells. In diesem Sinne liefert unser Aufsatz einen Beitrag für die Analyse zukünftiger Fragestellungen.

Der Aufsatz geht bewusst nicht im Detail auf die umfangreichen Forschungsarbeiten ein, die im Nachgang zu den Evaluationsstudien entstanden sind (im Sonderband dieser Zeitschrift über „Minimum wages in Germany“ im Jahr 2012 und im Sonderband des German Economic Review über „Economic Effects of Minimum Wages in Germany“ im Jahr 2013 sowie exemplarisch die Studien Felder 2014, Frings et al. 2013, oder Rattenhuber 2014). Diese Studien stellen einen äußerst begrüßenswerten Mehrwert der Evaluationsstudien dar, aber sie nehmen im Regelfall weder eine kritische Einschätzung der in den Gutachten verwendeten methodischen Ansätze vor noch greifen sie die in diesem Aufsatz gemachten methodischen Vorschläge auf (die noch nicht veröffentlichte Arbeit von Felder 2014, ist hier eine Ausnahme).Footnote 1

Im Folgenden werden der in den ökonometrischen Kausalanalysen der Evaluationsstudien dominierende DvD-Ansatz und die zugrundeliegenden Annahmen erklärt. Anschließend folgen eine Systematisierung und Bewertung der vorliegenden Evaluationsergebnisse. Die Evaluationsstudien haben eine große Zahl von Ergebnisvariablen untersucht. Wir konzentrieren uns in diesem Beitrag ausschließlich auf eine konzeptionelle Einordnung der Ergebnisse für Beschäftigung und Löhne. Im Sinne einer übersichtlichen Darstellung werden die untersuchten Branchen in drei Obergruppen zusammengefasst. Diese Gruppierung berücksichtigt vorhandene Strukturähnlichkeiten zwischen den einzelnen Branchen. Abschließend fassen wir die Lehren aus der ersten Evaluationsrunde zusammen.

2 Methodische Konzepte der ersten Evaluationsrunde

Die Schätzung des kausalen Effekts des Mindestlohns auf die relevanten Zielgrößen wurde in den Evaluationsstudien, sofern es die Datenlage zuzulassen schien, mit Hilfe eines DvD-Ansatzes durchgeführt.Footnote 2 Um den kausalen Effekt einer Maßnahme/Treatment (hier: Einführung oder Veränderung von Mindestlöhnen) zu bestimmen, wird wie bei einem klassischen Experiment eine Gruppe von Betroffenen mit einer Gruppe von Nichtbetroffenen vor und nach Einführung der Maßnahme hinsichtlich einer vorher definierten Zielgröße (Ergebnisvariable) verglichen. Der Vorteil des DvD-Ansatzes besteht darin, dass Zeittrends oder strukturelle Einflüsse, die beide Vergleichsgruppen gleichermaßen betreffen, durch Differenzenbildung herausgerechnet werden.

Die Umsetzung des Verfahrens verlangt eine präzise Abgrenzung der vom Mindestlohn betroffenen Beobachtungseinheiten (Treatmentgruppe) und geeigneter nicht betroffener Kontrolleinheiten (Kontrollgruppe). Die Differenz zwischen der Veränderung der Zielgröße (z. B. Lohn oder Beschäftigung) für die Treatmentgruppe und der Veränderung für die Kontrollgruppe schätzt den kausalen Effekt der Maßnahme. Der Identifikation des kausalen Maßnahmeeffektes liegt die Annahme zugrunde, dass die beobachtete Veränderung für die Kontrollgruppe der kontrafaktischen Veränderung für die Treatmentgruppe entspricht, wenn die Maßnahme nicht durchgeführt worden wäre. Die sogenannte Annahme paralleler Trends impliziert eine Parallelität in der Entwicklung der Zielgröße zwischen Treatment- und Kontrollgruppe, wenn das Treatment nicht stattgefunden hätte. Ist die Annahme plausibel, entsteht erst durch das Treatment ein Unterschied in der Entwicklung der Zielgröße. Wenn die zeitliche Veränderung zusätzlich von Eigenschaften der Beobachtungseinheiten abhängt, dann kann ein konditionaler DvD-Schätzer zur Anwendung kommen. Hierfür werden zunächst Treatment- und Kontrollgruppe in den relevanten beobachteten Kontrollvariablen vergleichbar gemacht. Dies erfolgt zum Beispiel indem im Rahmen einer Regression die Kontrollvariablen als erklärende Variablen berücksichtigt werden oder indem durch Matching eine Kontrollgruppe bestimmt wird, die der Treatmentgruppe im Durchschnitt in den Kontrollvariablen entspricht.Footnote 3

Politikmaßnahmen wie die Mindestlohneinführung werden in diesem Ansatz als natürliches Experiment aufgefasst. Da eine Datenbasis zur kontrafaktischen Situation, d. h. einer Situation ohne Mindestlohn nicht existiert, kann die Annahme paralleler Trends nicht formal getestet werden. Werden zwei Branchen miteinander verglichen, kann eine Verletzung der Annahme aus einem makroökonomischen Schock resultieren, der die Branchen in unterschiedlicher Weise trifft. Eine Verletzung der Annahme bei Analysen auf Betriebsebene kann exemplarisch im Hinblick auf das Innovationsverhalten diskutiert werden. Wenn innovationsfreudige Betriebe im stärkeren Umfang Beschäftigte durch Maschinen ersetzen und gleichzeitig höhere Löhne zahlen, dann sind innovationsfreudigere Betriebe weniger vom Mindestlohn betroffen und weisen eine unterdurchschnittliche Beschäftigungsentwicklung auf. Für das Beispiel folgt, dass ein DvD-Ansatz die Beschäftigungseffekte des Mindestlohns zu positiv einschätzt, falls den Unterschieden im Innovationsverhalten nicht Rechnung getragen wird.

Die Plausibilität der Annahme paralleler Trends wird häufig mit Hilfe von sogenannten Placebo-Tests überprüft. Bei Placebo-Tests werden fiktive Treatments simuliert, die zu einem anderen Zeitpunkt als das echte Treatment stattfinden. Das Schätzergebnis, das unter oben vorgestellten Annahmen den kausalen Treatmenteffekt misst, wird typischerweise für einen Zeitraum vor der tatsächlichen Maßnahme (typischerweise vor der Mindestlohneinführung) berechnet. Ergeben sich dabei signifikante Effekte, obwohl das Treatment noch gar nicht stattgefunden hat, gibt dies einen Hinweis auf eine Verletzung der Annahme paralleler Trends. Da der geschätzte Effekt nicht auf das Treatment zurückgeführt werden kann, muss es andere Unterschiede zwischen der Treatment- und der Kontrollgruppe geben, die eine unterschiedliche Entwicklung in der Zielgröße verursachen. Allerdings sind in diesem Zusammenhang mögliche Antizipationseffekte zu berücksichtigen, die dazu führen können, dass bereits vorab signifikante Auswirkungen des Treatments gemessen werden können. So ist es möglich, dass die Betroffenen bereits im Vorfeld auf ein bekannt gewordenes Treatment reagieren und Anpassungen in der Zielgröße vornehmen.

Ein fundamentaler Kritikpunkt an der Annahme eines natürlichen Experimentes ergibt sich aus der Möglichkeit der Politikendogenität der branchenspezifischen Mindestlohnregelungen in Deutschland. Es ist denkbar, dass die Tarifparteien in einer Branche gerade deshalb eine Mindestlohnregelung erwirken, weil sie für diese Branche eine bestimmte Entwicklung erwarten, die von der Entwicklung in den Kontrollgruppen abweicht, auch wenn in der Vergangenheit parallele Trends beobachtet wurden. Dieser Aspekt könnte bspw. zum Zeitpunkt der Einführung des Branchenmindestlohns im Bauhauptgewerbe 1997 eine Rolle gespielt haben. Damals war absehbar, dass sich die Baukonjunktur vor allem in Ostdeutschland deutlich und nachhaltig abschwächen würde. Gleichzeitig wurde mit einer weiteren Zunahme an ausländischen Beschäftigten gerechnet (König und Möller 2008, Abschn. 2). Das mögliche Vorliegen von Politikendogenität stellt die Anwendung eines DvD-Ansatzes basierend auf einer Kontrollgruppe aus anderen Branchen in Frage, wenn für die Vergleichsbranchen nicht die gleiche negative Beschäftigungsentwicklung für die Zukunft erwartet wurde. In diesem Fall würde ein DvD-Ansatz den Beschäftigungseffekt des Mindestlohns zu negativ einschätzen.

Der Skalierung der Zielgröße kommt im Rahmen des DvD-Ansatzes eine besondere Bedeutung zu, da die Annahme paralleler Trends nicht gleichzeitig für eine lineare und eine nicht-lineare Skalierung der Zielgröße gelten kann. Bei nicht-linearen Transformationen besteht die Möglichkeit, dass die Annahme paralleler Trends nicht gleichzeitig für eine Variable vor und nach der Skalierung zutrifft. Somit hängt die Plausibilität der identifizierenden Annahme davon ab, die „richtige Skalierung“ gefunden zu haben (Lechner 2010).

Lechner (2010) diskutiert den von Athey und Imbens (2006) vorgeschlagenen Changes-in-Changes (CiC) Ansatz als alternatives, skalierungsunabhängiges und nichtparametrisches Verfahren. Dabei wird die kontrafaktische Verteilung der Zielgröße für die Treatmentgruppe nach Einführung des Mindestlohns auf Basis der Verteilung für die Kontrollgruppe zu diesem Zeitpunkt und der Differenz der Verteilungen vor Einführung des Mindestlohns geschätzt. Allerdings treten bei diesem Verfahren Umsetzungsschwierigkeiten bei diskret verteilten Zielgrößen auf (z. B. Beschäftigungsvariablen). Lechner (2010, Abschn. 3.2.5) vermutet, dass Schwierigkeiten bei der Verwendung von Kontrollvariablen („Fluch der Dimensionen“) erklären, warum der CiC-Ansatz bis heute nur selten angewandt wurde (er benennt eine frühere Version der Arbeit von Havnes und Mogstad 2015, als einzige Ausnahme neben der ursprünglichen Studie von Athey und Imbens 2006).Footnote 4

Eine weitere zentrale Annahme des DvD-Ansatzes ist die sogenannte SUTVA-Annahme (Stable Unit Treatment Value Assumption). Der Treatmentstatus einer Beobachtungseinheit darf keinen Einfluss auf die Zielgrößen der Kontrollgruppen haben. Zu Verletzungen der Annahme kommt es, wenn Spillover-Effekte in Löhnen oder Substitutions- oder Skaleneffekte in der Arbeitsnachfrage auftreten (Franz 2013).

Substitutionseffekte treten auf, wenn relativ teurer gewordene Arbeitskräfte durch Beschäftigte aus der Kontrollgruppe ersetzt werden und somit die Gesamtbeschäftigung in der Kontrollgruppe steigt. Skaleneffekte ergeben sich dadurch, dass die durch die Mindestlohnregelungen ausgelöste Erhöhung der Produktionskosten dazu führt, dass die produzierte Menge und damit die eingesetzte Beschäftigung zurückgehen. Der negative Skaleneffekt ist umso stärker, je weniger die Unternehmen dazu in der Lage sind, Lohnkostenerhöhungen auf die Absatzpreise zu überwälzen. Die Überwälzungsspielräume sind umso geringer, je preisreagibler die Nachfrage nach den produzierten Gütern ist. Substitutions- und Skaleneffekte in der Beschäftigung können wiederum indirekt eine Reaktion der Löhne für die betroffenen Beschäftigten durch Veränderung in den Knappheitsrelationen am Arbeitsmarkt auslösen.

Unter Spillover-Effekten im engeren Sinn, die nicht aus der Arbeitsnachfrage erklärt werden können, sind direkte Lohneffekte für vom Mindestlohn nicht direkt betroffene Beschäftigte aufzufassen. Diese können zum Beispiel auftreten, wenn eine betriebliche Lohndifferenzierung aus Motivationsgründen für die Beschäftigten auch nach der Mindestlohneinführung aufrechterhalten wird und daher die Löhne oberhalb des Mindestlohns steigen.

Eine Verletzung der identifizierenden Annahmen führt zu einer Verzerrung der Schätzergebnisse, die dann nicht mehr kausal interpretiert werden können. Gleichwohl argumentieren wir, dass unter plausiblen Annahmen eine Einschätzung der Richtung der Verzerrung der geschätzten Kausaleffekte vorgenommen werden kann (bspw. dominiert im Regelfall der Substitutionseffekt bei einer Kontrollgruppe aus der gleichen Branche den Skaleneffekt, siehe Fitzenberger 2009).

Im Folgenden werden die acht Studien aus der ersten Evaluationsrunde der Mindestlöhne hinsichtlich der genannten methodischen Aspekte beleuchtet und die Ergebnisse vor diesem Hintergrund kritisch bewertet.

3 Systematisierung, Darstellung und Bewertung der Evaluationsergebnisse

Für eine übersichtliche Darstellung der Bewertung werden die im Rahmen der Evaluation untersuchten Branchen in drei Branchentypen zusammengefasst (vgl. Tab. 1). Die Gruppierung berücksichtigt vorhandene Strukturähnlichkeiten zwischen den einzelnen Branchen. Die Tab. 25 geben einen systematischen Überblick der methodischen Ansätze und Ergebnisse.

3.1 Ergebnisse für Branchentyp 1

Tab. 2 Übersicht der Studien zum Branchentyp 1 – Teil 1
Tab. 3 Übersicht der Studien zum Branchentyp 1 – Teil 2

3.1.1 Kontrollgruppen

Zum Branchentyp 1 gehören vier Branchen, die traditionelle Handwerke mit Facharbeiterdominanz, hohen Qualitätsstandards und starker Regulierung umfassen. Darunter fallen das Bauhauptgewerbe, das Dachdeckerhandwerk, das Malerei- und Lackiererhandwerk sowie das Elektrohandwerk. Mindestlöhne wurden in diesen Branchen schon ab 1997 durch das AEntG eingeführt, zwischenzeitlich stark modifiziert und zeitweise in Abhängigkeit von der Branchenkonjunktur wieder ausgesetzt. Die sich hieraus ergebende Variation in den Mindestlohnregelungen, konnten die Evaluationsstudien zur Identifikation der Mindestlohneffekte nutzen.

Eine systematische Übersicht der Studien für den Branchentyp 1 befindet sich in Tab. 2 und 3. Alle vier Studien verfolgen ähnliche Kontrollgruppenansätze. Zum einen wird eine passende Kontrollbranche verwendet, die nicht einem allgemeinverbindlichen Mindestlohn unterliegt. Zum anderen werden Beschäftigte und Betriebe aus der gleichen Branche verwendet, die nicht oder nur gering durch den Mindestlohn betroffen sind.

Die Studie zum Bauhauptgewerbe nutzt zur Auswahl geeigneter Kontrollbranchen ein quantitatives Prüfverfahren. Ausschlaggebend für die Auswahl der Kontrollbranchen ist eine starke Ähnlichkeit in der Lohn- und Beschäftigungsentwicklung zwischen dem Bauhauptgewerbe und den potenziellen Vergleichsbranchen. Dabei werden jeweils für West- und Ostdeutschland vor- und nachgelagerte Branchen sowie eine baunahe und bauferne Vergleichsbranche ausgewählt. Es ist anzumerken, dass Spillover-Effekte auch bei vor- oder nachgelagerten Branchen über Input-Output-Beziehungen auftreten können, wenn auch in einem geringerem Umfang als innerhalb der direkt von der Mindestlohnregelung betroffenen Branche. Ob die ausgewählten Kontrollbranchen geeignet sind, den kausalen Effekt der Politikmaßnahme zu identifizieren hängt u. a. davon ab, ob die Annahme paralleler Trends für die jeweiligen Kontrollbranchen plausibel ist. Im Rahmen der Studie werden zahlreiche Placebo-Tests durchgeführt, um die Plausibilität der Annahme zu rechtfertigen.

Im Rahmen der Evaluation des Mindestlohns im Dachdeckerhandwerk werden drei verschiedene Kontrollbranchen ausgewählt und hinsichtlich einer Reihe von Kennzahlen zur Beschreibung der konjunkturellen Situation und des Wettbewerbs auf dem Arbeitsmarkt verglichen. Letztendlich zeigen sich zwischen dem Dachdeckerhandwerk und der Installationsbranche die meisten Ähnlichkeiten. Ein quantitatives Prüfverfahren zur Kontrollgruppenauswahl wird nicht angewandt. Die Studien zu Mindestlöhnen im Elektrohandwerk und im Maler- und Lackiererhandwerk nutzen mehrere potenzielle Kontrollgruppen. Diese werden nicht auf Basis eines quantitativen Prüfverfahrens ermittelt, sondern ihre Auswahl wird sachlogisch begründet.

Somit ist die Studie zum Bauhauptgewerbe die einzige Studie, die ein quantitatives Prüfverfahren zur Auswahl einer oder mehrerer geeigneter Kontrollgruppen nutzt. Der in der internationalen Forschungsliteratur viel beachtete synthetische Kontrollgruppenansatz (Abadie et al. 2010; 2015; Dube and Zipperer 2015) verwendet die vorhandene Variation in den Daten, um geeignete Kontrollgruppen zu finden. Bei dieser Methode basiert die Auswahl geeigneter Kontrollgruppen nicht auf sachlogischen Überlegungen, sondern die Daten bestimmen auf Basis eines geeigneten statistischen Kriteriums die ähnlichsten Kontrollgruppen durch eine entsprechende Gewichtung. Gegenüber der diskretionären Auswahl der Kontrollbranchen in den Gutachten zu den Branchenmindestlöhnen hat der synthetische Kontrollgruppenansatz den Vorteil, dass mehrere Kontrollbranchen mit entsprechender Gewichtung gepoolt werden können, um einen besseren Vergleichsmaßstab (eine bessere synthetische Kontrollgruppe) zu ermitteln.Footnote 5 Das im Bauhauptgewerbe angewandte Prüfverfahren gewichtet hingegen alle betrachteten Kontrollgruppen gleich.

Alle dem Branchentyp 1 zugehörigen Studien verwenden auch Personen innerhalb der jeweiligen Branche als Vergleichsgruppe. Während diese in den Studien zum Dachdeckerhandwerk und zum Bauhauptgewerbe aus allen Personen besteht, die bereits vor der Mindestlohneinführung bzw. Mindestlohnerhöhung mindestens zum (neuen) Mindestlohn entlohnt wurden, verwenden die Studien zum Elektro-, Maler- und Lackiererhandwerk nur Personen, die vor Einführung des Mindestlohns mindestens diesen und maximal 15 % darüber verdienten. Diese Vorgehensweise ist vor dem Hintergrund möglicher Spillover-Effekte in diesem Bereich der Lohnverteilung zu bewerten. Die gewählte Lohngrenze scheint ad hoc festgelegt worden zu sein. Hier stellt sich die Frage, ob und in welcher Weise die Ergebnisse von der Höhe der Lohngrenze abhängen.

Zudem stellt sich das Abgrenzungsproblem a fortiori, da keine Stundenlöhne beobachtet werden. In diesem eng definierten Bereich der Lohnverteilung besteht bei einer unpräzisen Beobachtung der Stundenlöhne die Gefahr einer fälschlichen Zuweisung in die Treatment- oder Kontrollgruppe. Wenn Spillover-Effekte auftreten, ist die zweite zentrale Annahme des DvD-Ansatzes verletzt, da auch die Kontrollgruppe indirekt durch die Mindestlohneinführung betroffen ist. Dies ist beispielsweise denkbar, wenn aus Motivationsgründen die betriebliche Lohnspreizung nach Einführung des Mindestlohns aufrechterhalten wird und deshalb auch über dem Mindestlohn liegende Löhne steigen. Ebenso können Substitutions- und Skaleneffekte in der Arbeitsnachfrage eine Rolle spielen.

Auf Betriebsebene werden Betriebe als Kontrollbetriebe verwendet, die über dem gültigen Mindestlohnniveau entlohnen bzw. bei denen kein mindestlohnbedingter Anstieg der Lohnkosten dokumentiert wurde. Die Evaluationsstudien zu Mindestlöhnen in der Elektrobranche und im Maler- und Lackiererhandwerk verwenden zusätzlich Beschäftigte aus Betrieben dieser Branchen, die schon vor der Mindestlohneinführung tarifgebunden waren. Neben möglichen Substitutionseffekten besteht im Rahmen dieses Ansatzes auch das Risiko der Endogenität der Tarifbindung, d. h. Betriebe, die schon vor Einführung des Mindestlohns tarifgebunden waren, können im Hinblick auf die betrachteten Zielgrößen eine Selektion von Betrieben darstellen.

3.1.2 Methoden und Daten

Alle Studien für den Branchentyp 1 können auf eine solide und umfangreiche Datenbasis zurückgreifen, die eine aussagekräftige Wirkungsanalyse möglich macht. Für das Bauhauptgewerbe und für das Dachdeckerhandwerk wurden im Rahmen der Evaluation neue administrative Daten zur Verfügung gestellt, die eine Berechnung der Stundenlöhne ermöglichen.

Grundsätzlich besteht die Möglichkeit den DvD-Ansatz zu einem DvDvD-Ansatz zu erweitern, wenn eine weitere Kontrollgruppe zur Verfügung steht. Die Studie zu Mindestlöhnen im Dachdeckerhandwerk nutzt den erweiterten DvD-Ansatz, um branchenspezifische Effekte auszuschließen und die Robustheit der Ergebnisse zu überprüfen. Dieser Ansatz unterstellt eine Parallelität in den Veränderungen der Zeittrends, eine Annahme deren Plausibilität schwieriger als für einfache DvD-Verfahren durch Placebo-Tests zu überprüfen ist. Gleichwohl wäre es hier naheliegend gewesen Placebo-Tests durchzuführen.

In der Evaluation zum Bauhauptgewerbe wird zusätzlich eine Variation des DvD-Ansatzes verwendet, die die Mindestlohneffekte als Funktion der Eingriffsintensität modelliert. Der sogenannte inkrementelle DvD-Schätzer (Dolton et al. 2010; 2012) nutzt als identifizierende Variation die z. B. regionalen Unterschiede in der Veränderung der Eingriffsintensitäten über die Zeit. Um für strukturelle Unterschiede zwischen Betroffenen und Nichtbetroffenen (z. B. Regionen) zu kontrollieren, wird die aktuelle Eingriffsintensität \(P_{jt}\) vor und nach der Mindestlohneinführung in die Schätzung aufgenommen. Der stufenweise (inkrementelle) Effekt der tatsächlichen Eingriffsintensität nach der Mindestlohneinführung wird als Interaktionseffekt von \(P_{jt}\) mit einer Jahresdummy geschätzt. Dieser kumulative Effekt wird als Effekt der Mindestlohnregelung relativ zu dem Zeitraum vor der Mindestlohneinführung interpretiert (siehe folgende Fußnote für eine formale Darstellung).Footnote 6 Der geschätzte Koeffizient des Haupteffekts von \(P_{jt}\) kontrolliert für strukturelle Unterschiede zwischen Betroffenen und Nichtbetroffenen.

Die Ausnutzung der regionale Variation der Eingriffintensitäten nach Kontrolle für strukturelle Unterschiede ist grundsätzlich sinnvoll. Allerdings sind im Rahmen dieses Ansatzes folgende Probleme zu beachten: Erstens besteht vermutlich ein Endogenitätsproblem der Veränderung der Eingriffsintensität über die Zeit, d. h. die Veränderung in der Eingriffsintensität im Zeitverlauf wird von den Mindestlohnregelungen in der Vergangenheit beeinflusst. Zweitens reflektieren die kumuliert geschätzten Effekte die Wirkungen unterschiedlicher Mindestlohnregelungen (z. B. Einführung und spätere Erhöhung) für eine sich im Zeitverlauf verändernde Treatmentgruppe. Dies stellt, wie auch Dolton et al. (2010), (2012) konstatieren, eine kausale Interpretation der inkrementellen Effekte über die Mindestlohneinführung hinaus in Frage. Wir schlagen deshalb vor eine modifizierte Version des inkrementellen DvD-Schätzers als Robustheitscheck durchzuführen. Dabei sollte die Veränderungen zwischen jeweils zwei Zeitperioden analog zu einer Standard-DvD Schätzung betrachtet werden. Wenn sich die geschätzten Mindestlohneffekte aus dem inkrementellen Design und dem Robustheitscheck signifikant unterscheiden, dann ist es notwendig die Plausibilität der impliziten Annahmen über die Selektivität der Treatmentgruppe expliziter zu diskutieren, um eine angemessene Schätzung bestimmen zu können.

3.1.3 Ergebnisse

Die Ergebnisse der Wirkungsanalysen für die Zielgrößen Beschäftigung und Lohn sind in Tab. 2 und 3 zusammengefasst. Zur Gewährleistung der internen Validität der Ergebnisse ist die Durchführung umfangreicher Placebo-Tests prinzipiell zu befürworten. Die Gefahr eines statistischen Overfittings sollte dabei diskutiert werden.

Die Studie zum Mindestlohn im Bauhauptgewerbe präsentiert zahlreiche Placebo-Tests. Für die Zielgröße Beschäftigung scheint die Annahme paralleler Trends für alle gewählten Kontrollgruppen plausibel. Das Schätzverfahren liefert keine signifikanten Beschäftigungseffekte in West- und Ostdeutschland (Möller et al. 2011, vgl. Tab. 6.4). Es ist auffällig, dass die Placebo-Tests vor allem dann gelingen (sprich parallele Trends werden nicht verworfen), wenn auch nach der Mindestlohneinführung keine signifikanten Effekte gemessen werden. Die Placebo-Experimente werden auch für die Zielgröße Lohnwachstum durchgeführt. Diese gelingen für die ausgewählten Kontrollgruppen außerhalb des Bauhauptgewerbes nie und für Kontrollgruppen innerhalb der Branche nur für Westdeutschland. Die Ergebnisse zeigen positive Effekte auf das Lohnwachstum in beiden Teilen Deutschlands für die Mindestlohneinführung im Jahre 1997.

Die Untersuchungen zur Einführung des Mindestlohns II und weiterer Erhöhungen liefern keine robusten Ergebnisse (Möller et al. 2011, vgl. S. 168ff.). Grundsätzlich sollte die Auswahl geeigneter Kontrollgruppen nicht allein durch das Gelingen von Placebo-Tests motiviert sein, da dies auch von der Skalierung der Zielgröße abhängen kann. Des Weiteren steigt mit der Anzahl an durchgeführten Tests auch die Wahrscheinlichkeit dafür, dass einer der Placebo-Tests gelingt, obwohl die Kontrollgruppe nicht geeignet sein könnte. Dann besteht die Gefahr eines statistischen Overfittings. Wir schlagen in diesem Zusammenhang vor, das quantitative Prüfverfahren in Analogie zu Kreuzvalidierungsverfahren zu gestalten. Die Güte des Modells sollte auf Basis von Prognosen außerhalb der Schätzstichprobe in Verbindung mit einer gleichzeitigen Bestrafung von einer zu hohen Flexibilität innerhalb der Schätzstichprobe berechnet werden. Wenn eine stärkere Flexibilität des Schätzansatzes bei der Wahl der Kontrollgruppe mit einem höheren Prognosefehler außerhalb der Schätzstichprobe verbunden ist, dann sollte diese Flexibilität im statistischen Sinne stärker bestraft werden (analog zur Konstruktion des angepassten Bestimmtheitsmaß für eine lineare Regression).

Während die Studie zum Mindestlohn im Dachdeckerhandwerk nur eine Vergleichsbranche verwendet, nutzen die anderen Studien mehrere Kontrollbranchen. Der Vergleich zu nur einer Kontrollbranche beschränkt die Interpretation der Ergebnisse auf einen Vergleich mit ebendieser einen Branche. Die Anwendung mehrerer Kontrollbranchen kann zu dem Problem führen, dass sich die Ergebnisse je nach Wahl der Kontrollgruppe unterscheiden. Dies zeigt sich in den Studien zum Elektrohandwerk und Maler- und Lackiererhandwerk. Zudem liefern Robustheitsanalysen und Placebo-Tests Hinweise dafür, dass die Annahme paralleler Trends in diesen Studien häufig verletzt ist (Kirchmann et al. 2011b, vgl. S. 198ff., S. 211ff.) und (Kirchmann et al. 2011a, vgl. S. 201ff., S. 211ff., S. 215ff.). Zur Erhöhung der internen Validität der Ergebnisse erachten wir weitergehende Analysen (ggf. mit synthetischen Kontrollgruppen) als notwendig. Die Auswahl der Kontrollbranche ist allerdings nur eine, aber natürliche wichtige Dimension in der Schätzung des Vergleichsmaßstabs. Während einfache Standardanwendungen des synthetischen Kontrollgruppenansatzes (Abadie et al. 2015; Dube and Zipperer 2015; Felder 2014) gewichtete Vergleichsgruppen für Aggregate (Branchen, Staaten) schätzen, untersuchen die Mindestlohngutachten ebenfalls Unterschiede in der Betroffenheit der Firmen oder Regionen in der Branche, um die Mindestlohneffekte zu schätzen. Der synthetische Kontrollgruppenansatz ist diesbezüglich zu erweitern.Footnote 7

Die Ergebnisse des inkrementellen DvD-Ansatzes in der Studie zum Bauhauptgewerbe liefern einen negativen permanenten Unterschied zwischen den Vergleichsgruppen. Die Ergebnisse für Interaktionen der Betroffenheit und Indikatorvariablen für die einzelnen Jahre zwischen 1999 bis 2001 (in diesen Jahren gab es einen Mindestlohn) sind positiv und signifikant. Laut diesen Ergebnissen führte der Mindestlohn in diesen Jahren zu positiven Beschäftigungseffekten relativ zur Periode vor Einführung des Mindestlohns. Im Hinblick auf das Lohnwachstum zeigen sich in frühen Jahren positive Effekte in West- und Ostdeutschland. Danach schwanken die Ergebnisse vor allem in Ostdeutschland (Möller et al. 2011, vgl. S. 247.). Aufgrund der in Abschn. 3.1.2 geäußerten Vorbehalte erscheinen die Ergebnisse des inkrementellen DvD-Schätzers ab dem zweiten Jahr nach Einführung des Mindestlohns als schwer interpretierbar.

Die Ergebnisse, die auf Basis eines Vergleichs mit einer Kontrollgruppe innerhalb der Branche geschätzt wurden, müssen vor dem Hintergrund möglicher Spillover- und Substitutionseffekte interpretiert werden. Die Belastbarkeit der Ergebnisse hängt maßgeblich von der Datenqualität ab, da eine unpräzise Abgrenzung der Vergleichsgruppen zu verzerrten Ergebnissen führt. Für das Elektrohandwerk ergeben sich bei einem Vergleich mit nicht betroffenen Beschäftigten innerhalb der Branche negative Beschäftigungseffekte der Mindestlohneinführung 1997 für Westdeutschland sowie der Wiedereinführung 2007 in Ostdeutschland (Kirchmann et al. 2011a, vgl. S. 199). Auch die Effekte auf die Löhne sind negativ. Für das Maler- und Lackiererhandwerk zeigen sich keine signifikanten Effekte für beide Zielgrößen (Kirchmann et al. 2011b, vgl. S. 194ff).

In den Evaluationen zum Bauhauptgewerbe und Dachdeckerhandwerk ergeben sich positive Effekte auf das Lohnwachstum. Die Analyse des Dachdeckerhandwerks kann sehr präzise Stundenlohninformationen benutzen, so dass die Abgrenzung der Vergleichsgruppe einfacher ist. In beiden Studien finden sich Hinweise für das Auftreten von Spillover-Effekten. Diese werden in der Studie zum Dachdeckerhandwerk sehr ausführlich diskutiert. Im oberen Bereich der Lohnverteilung kommt es zu negativen Lohneffekten. Insgesamt geht die Lohnspreizung in Ostdeutschland stark zurück (Aretz et al. 2011, vgl. S. 307ff).

Der Beschäftigungseffekt fällt bei einem Vergleich mit Kontrollpersonen innerhalb des Dachdeckerhandwerks negativer aus als bei einen Vergleich mit dem Installationsgewerbe. Eine Verzerrung der Ergebnisse ist hier möglich, wenn es zu indirekten positiven Auswirkungen auf die nichtbetroffenen Kontrollpersonen kommt. Es ist festzuhalten, dass eine weitergehende, substantielle Analyse dieser Aspekte sinnvoll wäre. Wenn Schätzungen der Substitutions- und Skaleneffekte in der Arbeitsnachfrage vorliegen und gleichzeitig die Spillovereffekte in den Löhnen erfasst werden, könnte die Verzerrung in den DvD-Schätzungen quantifiziert werden. Unter der Annahme, dass der Substitutionseffekt den Skaleneffekt dominiert (Fitzenberger 2009), wäre eine Aussage über die Richtung der Verzerrung möglich.

Die Branchen aus dem Bauhaupt- und Baunebengewerbe weisen mehrere Besonderheiten auf (Produktionsbedingungen, Wettbewerb, Beschäftigtenstruktur usw.) und die starke Zunahme ausländischer Arbeitnehmer in diesen Branchen war Anlass für die Einführung von Mindestlöhnen Ende der 1990er Jahre. Gleichzeitig agierten die Baubranchen unter der besonderen konjunkturellen Lage nach der Wiedervereinigung. Zum einen erfolgte Ende der 1990er Jahre ein vorhersehbarer Schrumpfungsprozess der Branche nach Ende des wiedervereinigungsbedingten Booms und zum anderen war die Zunahme der Beschäftigung ausländischer Arbeitnehmer Auslöser der Einführung von Mindestlöhnen. Die Mindestlohnregelungen wirken zudem auf die seinerzeit vor allem im Baugewerbe weit verbreitete Arbeitnehmerentsendung, die jedoch in den Gutachten nicht erfasst werden konnte (Meier and Munz 2008). Folglich ist die externe Validität der Evaluationsstudien für den Branchentyp 1 aufgrund der besonderen Situation der Baubranchen beschränkt. Zudem stellt sich angesichts des Vorhersehbarkeit des Schrumpfungsprozesses insbesondere für die Baubranchen die Frage nach einer möglichen Politikendogenität der Mindestlohnregelungen.

Zusammenfassend lässt sich für Branchentyp 1 festhalten, dass die vorgelegten Studien sorgfältige Analysen auf einer breiten Datenbasis und mit einem weiten Methodenspektrum umgesetzt haben. Allerdings fallen die Ergebnisse je nach Wahl der Kontrollgruppe unterschiedlich aus. Die Studien für das Bauhauptgewerbe und für das Dachdeckerhandwerk konnten innovative Datensätze nutzen, diese mit unterschiedlichen methodischen Ansätzen untersuchen und die Ergebnisse dahingehend diskutieren. Für das Bauhauptgewerbe und für das Dachdeckerhandwerk sind trotz Unterschieden je nach Kontrollgruppe negative Beschäftigungseffekte, vor allem bei hoher Eingriffsintensität, zu konstatieren, die allerdings angesichts teilweise sehr hoher Eingriffsintensität nicht sehr stark ausfallen. Demgegenüber finden sich keine negativen Beschäftigungseffekte im Maler- und Lackiererhandwerk und im Elektrohandwerk. Meist, aber nicht in allen Fällen finden sich positive Lohneffekte und in mehreren Fällen wirkt sich der Mindestlohn augenscheinlich auch auf die Lohnstruktur oberhalb des Mindestlohnes aus.

3.2 Ergebnisse für Branchentyp 2

Zum zweiten Branchentyp gehören die Wäschereidienstleistungen im Objektkundengeschäft und die Gebäudereinigung. Hierbei handelt es sich um zwei arbeitsintensive Branchen, in denen die Tätigkeiten vor allem einfache, standardisierte Dienstleistungen mit starkem körperlichem Einsatz umfassen. Charakteristisch für beide Branchen ist ein hoher Anteil an weiblichen Beschäftigten. Die ersten Mindestlöhne wurden ab dem Jahr 2007 eingeführt.

In Tab. 4 werden die wichtigsten Punkte der Studien systematisch zusammengefasst. Im Vergleich zu den vier Studien aus dem Bauhaupt- und Baunebengewerbe leiden die Studien zum Branchentyp 2 unter starken Problemen der Datenverfügbarkeit. Dies liegt an der relativ kurzen Zeitperiode zwischen der Einführung der Mindestlöhne und dem Zeitpunkt der Evaluation. Außerdem bestehen aufgrund der begrenzten Verfügbarkeit von Informationen zu den Wirtschaftsklassen erhebliche Abgrenzungsprobleme der vom Mindestlohn betroffenen Betriebe und Personen und damit ebenfalls erhebliche Abgrenzungsprobleme bei der Konstruktion von Vergleichsgruppen.

Tab. 4 Übersicht der Studien zum Branchentyp 2

In der Studie zum Mindestlohn im Wäschereigewerbe wurde aufgrund der unzureichenden Datenlage keine ökonometrische Wirkungsanalyse durchgeführt. Die Ergebnisse der Studie basieren daher ausschließlich auf Aussagen aus Expertengesprächen und Befragungen (Bosch et al. 2011a). Die Ergebnisse verdeutlichen, dass zum Zeitpunkt der Evaluation eine hohe Unsicherheit auf Seiten der Wäschereibetriebe über die Mindestlohnpflicht bestand. Hinzu kommt, dass ebenso ex post in administrativen Daten die genaue Abgrenzung der Branche, für die die Mindestlohnpflicht gilt, schwierig ist. Gleichwohl hätte nach unserer Einschätzung eine kausale Wirkungsanalyse, die die unvollständige Betroffenheit von Betrieben als Treatment verwendet, in Kombination mit modernen Kontrollgruppenansätzen (synthetische Kontrollgruppen unter Berücksichtigung der Heterogenität innerhalb der Branche, siehe Fußnoten 5 und 7) durchgeführt werden können, die unter Umständen belastbare Ergebnisse geliefert hätte. Der Evaluationsstudie (Bosch et al. 2011a) ist jedoch zugutezuhalten, dass eine ökonometrische Wirkungsanalyse im Falle des Mindestlohns im Wäschereigewerbe besondere Schwierigkeiten aufweist, sowohl im Hinblick auf den Zeitdruck, unter dem die Studien zu erstellen waren, als auch im Hinblick auf die besonderen Abgrenzungsprobleme der Betroffenheit durch den Mindestlohn.

In der Studie zur Gebäudereinigung (Bosch et al. 2011b) wurde trotz der beschränkten Datenverfügbarkeit ein Kontrollgruppenansatz umgesetzt. Ausgangspunkt für die Bildung der Vergleichsgruppen sind die regional unterschiedlichen Tariflohnänderungen im April 2004 sowie die Einführung der Mindestlöhne im Juli 2007 und die anschließende Erhöhung der tariflich vereinbarten Mindestlöhne ab März 2008. Zur Bildung von Kontrollgruppen außerhalb der Gebäudereinigungsbranche wurden Kunden- und Beschäftigungsstrukturen verglichen. In dieser Hinsicht weisen die branchenbezogenen Kontrollgruppen aus dem Wachgewerbe und aus der getränkegeprägten Gastronomie die größte Ähnlichkeit mit der Gebäudereinigungsbranche auf. In der Beschäftigungsstruktur gibt es vor allem bei den Arbeitszeiten und dem Geschlechteranteil Unterschiede zum Wachgewerbe. Die Kundenstruktur ist in beiden Branchen sehr ähnlich, wobei in der getränkegeprägten Gastronomie deutliche saisonale und klimabedingte Schwankungen auftreten. Eine weitere Kontrollgruppe besteht aus Reinigungskräften, die in anderen Branchen beschäftigt sind und somit vergleichbare Tätigkeiten ausüben, aber keinen Mindestlohnanspruch besitzen. Die Heterogenität der Branchen, in denen Reinigungskräfte außerhalb des Gebäudereinigerhandwerks beschäftigt sind, ist jedoch nur begrenzt kontrollierbar.

Die Ergebnisse zeigen ein uneinheitliches Bild der Tariflohnänderungen im Jahre 2004 und der Aufnahme in das AEntG und der damit verbundenen Wirksamkeit der Mindestlöhne im Juli 2007. Für die Zielgröße Beschäftigung zeigt sich keine eindeutige Mindestlohnwirkung. Die Effekte werden auf Regionalebene bestimmt und sind je nach Region positiv oder negativ und meistens insignifikant (Bosch et al. 2011b, vgl. Tab. 27 und 28). Die Einführung der Mindestlöhne führt zu signifikant negativen Effekten im Vergleich zu den erstgenannten Kontrollgruppen. Die Effekte der Mindestlohnerhöhung im Jahr 2008 erweisen sich hingegen als positiv (Bosch et al. 2011b, vgl. Tab. 29).

Die interne Validität der Ergebnisse für die Gebäudereinigungsbranche ist kritisch zu bewerten. Zur Überprüfung der Plausibilität der Annahme paralleler Trends werden zeitliche Entwicklungen der relevanten Zielgrößen für die Treatment- und Kontrollgruppe dargestellt (Bosch et al. 2011b, vgl. S. 250ff). Diese branchenspezifischen Entwicklungspfade stellen die Gültigkeit der identifizierenden Annahme infrage und sprechen somit gegen die Eignung der Kontrollgruppen. Insbesondere für die Beschäftigungsentwicklung scheint diese wichtige Annahme wenig plausibel. Es werden keine Placebo-Tests zur weiteren Plausibilitätsprüfung durchgeführt.

Die geschätzten negativen Effekte der Mindestlohneinführung im Jahre 2007 und die positiven Effekte der Erhöhung im darauffolgenden Jahr könnten auch als Hinweis auf eine Endogenität des Treatments (zur Politikendogenität siehe Abschn. 2) angesehen werden. Es ist durchaus denkbar, dass die Einführung der Mindestlöhne und die spätere Erhöhung im Hinblick auf zukünftige Beschäftigungseffekte von den Tarifparteien ausgehandelt worden sind. Diesem Problem wird durch den gewählten Evaluationsansatz nicht Rechnung getragen.

Die Wirkungsanalyse zum Mindestlohn in der Gebäudereinigung zeigt, wie wichtig eine ausführliche Analyse und Diskussion über die Eignung der gewählten Kontrollgruppen im Hinblick auf die erforderlichen Annahmen des Schätzmodells ist. Die Anwendung von Placebotests kann dazu beitragen die interne Validität der Untersuchung zu verbessern. Eine Verwendung synthetischer Kontrollgruppen aus mehreren anderen Branchen (unter Berücksichtigung der Heterogenität innerhalb der Branche, siehe Fußnoten 5 und 7) oder einer Kontrollgruppe innerhalb der Gebäudereinigungsbranche wäre sinnvoll.

Zusammenfassend lassen sich für Branchentyp 2 folgende Punkte festhalten. Für die Wäschereidienstleistungen im Objektkundengeschäft wurde leider nicht versucht, eine ökonometrische Wirkungsanalyse des Mindestlohns durchzuführen. In der ökonometrischen Wirkungsanalyse für die Gebäudereinigung wurde die Eignung des gewählten Evaluationsansatzes und der gewählten Kontrollgruppen nicht hinreichend kritisch diskutiert. Daher ist es schwierig die fehlende Robustheit der erzielten Ergebnisse angemessen einzuordnen. Beiden Gutachten ist zugutezuhalten, dass die Datenlage für eine ökonometrische Evaluation des Mindestlohns zum Zeitpunkt der Erstellung der Gutachten sehr schwierig war.

3.3 Ergebnisse für Branchentyp 3

Der dritte Branchentyp umfasst die Branchen Abfallwirtschaft und Pflege. Beide Branchen sind durch ein Nebeneinander öffentlicher und privater Anbieter gekennzeichnet. Die Qualitätssicherung der Leistungserstellung hat in diesen Branchen einen hohen Stellenwert. Mindestlöhne wurden in diesen Branchen erst im Jahr 2010 eingeführt.

Tab. 5 Übersicht der Studien zum Branchentyp 3

In beiden Studien waren amtliche Daten nicht oder nur beschränkt verfügbar. Für die Pflegebranche lagen keinerlei amtliche Daten vor, die den Zeitraum nach der Mindestlohneinführung abdeckten, so dass die Autoren eine eigene Befragung in Auftrag gaben. Hierbei wurde durch ein Befragungsunternehmen eine Online-Befragung durchgeführt, die den Zeitraum kurz vor der Mindestlohneinführung und den Zeitraum kurz danach abdeckt. Der Vorteil dieser Datengewinnung liegt in der präzisen Abfrage der Stundenlöhne und der damit verbundenen Vermeidung von Verzerrungen durch die Berechnung aus anderen Datensätzen. Des Weiteren ist eine präzise Abgrenzung der vom Mindestlohn betroffenen Einrichtungen und Personen möglich, da die Befragung nicht nur Fragen zur Lohnstruktur sondern auch zu den Einrichtungen und dem Arbeitsumfeld umfasst. Auch die Studie zum Mindestlohn in der Abfallwirtschaft ergänzt die beschränkte Datenbasis durch eigens für die Evaluation erhobene Befragungsdaten.

Kontrollgruppen aus anderen Vergleichsbranchen werden nur in der Studie zur Abfallwirtschaft verwendet. Als Kontrollgruppe außerhalb der Branche dient der Garten- und Landschaftsbau, weil diese Branche, wie die Abfallwirtschaft durch Multiproduktunternehmen gekennzeichnet ist, wie beispielsweise Dienstleistungen in der Objektbetreuung oder Hausmeistertätigkeiten. In dieser Branche gibt es eine spezifische Wettbewerbssituation, die durch ein Nebeneinander von öffentlichen und privaten Anbietern sowie durch geringe Qualifikationsanforderungen an die Beschäftigten gekennzeichnet ist. In einem umfassenden Branchenbild wird die Annahme paralleler Trends untersucht. Mögliche Verletzungen der Annahme zeigen sich vor allem in der Sektorengröße, der Umsatzentwicklung sowie der Unternehmensanzahl und deren Größe. Aus diesen Unterschieden heraus wird die Kontrollgruppe in der Evaluation ausschließlich für den Teilbereich der Abfallbeseitigung verwendet. Somit untersucht die Wirkungsanalyse den Effekt der Mindestlohneinführung auf Betriebe im Teilbereich der Abfallbeseitigung im Vergleich zu Betrieben aus dem Landschafts- und Gartenbau. Es zeigen sich keine signifikanten Beschäftigungseffekte (Egeln et al. 2011, vgl. Tab. A2).

Die externe Validität dieses Ergebnisses ist beschränkt, da es nur für den Teilbereich der Abfallbeseitigung gilt. Gerade in diesem Teilbereich der Abfallwirtschaft ist die Nachfrage vergleichsweise konstant und die Möglichkeiten Beschäftigung abzubauen oder diese zu ersetzen sind gering. Die Verwendung der weiteren Teilmärkte der Abfallwirtschaft wäre eventuell möglich gewesen, wenn die Eignung der Kontrollgruppe als Vergleichsbranche für diese Teilmärkte durch Placebo-Tests überprüft worden wäre. Außerdem hätte das Analysepotenzial unter Anwendung eines synthetischen Kontrollgruppendesigns (unter Berücksichtigung der Heterogenität innerhalb der Branche, siehe Fußnoten 5 und 7) erhöht werden können.

In beiden Studien werden Kontrollgruppen innerhalb der untersuchten Branche verwendet. Die Studie zum Mindestlohn in der Pflege wählt die Gruppe der tarifgebundenen Einrichtungen als Kontrollgruppe, da diese nicht vom Mindestlohn betroffen sind, aber dieselbe Entwicklung zu erwarten hatten, wie die vom Mindestlohn betroffene Gruppe. Substitutionseffekte im Hinblick auf andere Branchen erscheinen vernachlässigbar, weil die Pflege branchenspezifische Tätigkeiten erfordert. Arbeitsnachfrageinduzierte Substitutionseffekte zwischen Treatment- und Kontrollgruppe auf Betriebsebene sind per Definition ausgeschlossen, da die Tarifbindung eine Eigenschaft der Einrichtung und nicht der Arbeitnehmer ist. Die Arbeitnehmer aus der Kontrollgruppe (also aus Betrieben mit Tarifbindung) sind somit nicht qualifizierter oder für einen Arbeitgeber interessanter als jene in der Treatmentgruppe. Allerdings besteht die Möglichkeit der Substitution durch die Nachfrage nach Pflegeleistungen in der Kontrollgruppe, da deren Lohnkosten nicht ansteigen.

Da die Evaluation der Pflegebranche die Effekte der Mindestlohneinführung auf Betriebsebene untersucht, erfolgt die Abgrenzung der Vergleichsgruppen einzig auf Basis des Kriteriums der Tarifbindung. Die Zuordnung zur Treatment- und Kontrollgruppe ist nicht eindeutig, da eine Tarifbindung auch freiwillig angewendet worden sein kann, indem sie beispielsweise in einem individuellen Arbeitsvertrag vereinbart wurde. Es besteht weiterhin eine mögliche Endogenität der Tarifbindung selbst. Die Lohnhöhe und die freiwillige Tarifbindung können von der individuellen Leistungsfähigkeit des Betriebes abhängen. Das Branchenbild zeigt, dass die Tarifbindung vom Anbietertyp anhängig ist. Öffentlich-rechtliche sowie freigemeinnützige und kirchliche Anbieter entlohnen weitaus häufiger nach Tarif als private Träger. Die Vergleichbarkeit mit privaten Anbietern, die in stärkerem Wettbewerb stehen und die keine Tarifbindung aufweisen, ist daher fraglich. Die Interpretation der Ergebnisse sollte deshalb vor dem Hintergrund einer möglichen Endogenität der Tarifbindung erfolgen.

Insgesamt zeigen sich nur wenig signifikante Ergebnisse für den Pflegesektor. Eine Ausnahme sind negative Beschäftigungseffekte in Westdeutschland bei ambulanten Diensten. Die Effekte auf die Stundenlöhne sind im Osten stärker als im Westen und nur für Pflegehilfskräfte signifikant (Kirchmann et al. 2011c, vgl. Tab. 10.17–10.19). Die Placebo-Tests können nicht mit demselben Datensatz durchgeführt werden, da die Panelbeobachtungen nur die zwei Perioden umfassen, die für die Wirkungsanalyse verwendet werden. In der Studie werden deshalb Lohninformationen aus administrativen Individualdaten genutzt. Es werden Placebo-Tests auf Beschäftigtenebene durchgeführt, die nur bedingt mit den Ergebnissen der Wirkungsanalyse auf Betriebsebene vergleichbar sind. Eine Durchführung solcher Robustheitsanalysen ist grundsätzlich zu befürworten. In diesem Fall tragen sie jedoch nur wenig zur Bewertung der internen Validität der Ergebnisse bei.

Die Evaluation zur Abfallwirtschaft definiert Betriebe als Treatmentgruppe, die vor Mindestlohneinführung mindestens einen Arbeitnehmer unterhalb des Mindestlohns entlohnten. Als Kontrollgruppe werden die Betriebe gewählt, die keinem Mitarbeiter in Folge des Mindestlohns eine Lohnerhöhung zahlen mussten, also alle Betriebe, die ihre Mitarbeiter ausnahmslos oberhalb des Mindestlohns entlohnten. Für die Abfallwirtschaft werden mögliche Spillover-Effekte als wenig relevant angesehen, da das Beschäftigungswachstum in der Kontrollgruppe niedriger ausfällt als in der Treatmentgruppe. Substitutionseffekte sind zwischen regulär Beschäftigten und Teilzeitbeschäftigten sowie Beschäftigten des zweiten Arbeitsmarktes (1-Euro-Jobber) zu erwarten. Diese werden in der Studie deskriptiv untersucht. Der Anteil von 1‑Euro Jobbern ist sehr gering. Der Anteil von Teilzeitbeschäftigten ist in Unternehmen, die den Mindestlohn umgehen, höher (Egeln et al. 2011, vgl. Tab. 33). Aufgrund der Datenlage konnten diese Effekte nicht weitergehend untersucht werden, sollten aber in zukünftigen Analysen stärker berücksichtigt werden.

Durch die Verwendung von Befragungsdaten können beide Studien präzise Informationen über Stundenlöhne nutzen, sodass keine Verzerrungen durch die Berechnung aus anderen Datensätzen entstehen. Im Hinblick auf die externe Validität der Ergebnisse ist noch zu erwähnen, dass die verwendeten Daten nicht repräsentativ für die Grundgesamtheit sind. Ein Abgleich mit amtlichen Daten, das Durchführen von vergleichbaren Robustheitsanalysen und die Ermittlung von Effekten auf Individualebene wären ratsam, wenn in zukünftigen Evaluationen die interne und externe Validität erhöht werden sollen.

Zusammenfassend lässt sich für Branchentyp 3 positiv festhalten, dass beide Studien versucht haben auf Basis von Befragungsdaten eine belastbare ökonometrische Evaluation des Mindestlohns, trotz des kurzen Zeitraums zwischen der Einführung des Mindestlohns und der Erstellung der Gutachten, durchzuführen. Es wurden nahezu keine signifikanten Beschäftigungseffekte in beiden Branchen und kaum Lohneffekte in der Pflegebranche gefunden. Die externe Validität der erzielten ökonometrischen Ergebnisse ist als kritisch einzuschätzen. Weitergehende Untersuchungen wären im Hinblick auf die Teilzeitbeschäftigung in der Pflegebranche und auf die Abgrenzung zwischen privaten und öffentlichen Anbietern geboten.

4 Zusammenfassung und Ausblick

Dieser Aufsatz liefert einen Überblick und eine kritische Bewertung der acht Evaluationsstudien der branchenspezifischen Mindestlöhne, die das Bundesministerium für Arbeit und Soziales (BMAS) im Jahr 2011 in Auftrag gab. Der Fokus in diesem Aufsatz liegt auf der ökonometrischen Wirkungsanalyse. Trotz aller Detailkritik ist festzuhalten, dass die Evaluation der Branchenmindestlöhne im Jahr 2011 ein wichtiges und erfolgreiches Beispiel für einer stärkere Evidenzbasierung der Wirtschaftspolitik in Deutschland darstellt. Dies wird insbesondere durch einen Vergleich mit dem Stand der Diskussion zum Ende des letzten Dekade deutlich (vgl. Fitzenberger 2009 und die Beiträge im Sonderheft des ifo Schnelldiensts 2008). Manning (2013) sieht Parallelen im Stand der Diskussion in Großbritannien vor Beginn der Arbeit der Low-Pay-Commission und dem Stand der Diskussion in Deutschland vor einigen Jahren. Angesichts der Einführung des gesetzlichen Mindestlohns in Deutschland im Jahr 2015 kommt der Evaluation der Branchenmindestlöhne eine besondere Bedeutung zu.

Die kritischen Ausführungen in diesem Aufsatz illustrieren exemplarisch wichtige Herausforderungen auf dem steinigen Weg zu einer evidenzbasierten Wirtschaftspolitik. Wir beschränken uns auf die Evaluationsstudien, in der Form wie sie vom BMAS rezipiert und veröffentlicht wurden, um hieran exemplarisch eine Diskussion der Qualität der Studien, wie sie in den politischen Prozess einfließen, anzustoßen. Die Evaluationsstudien sind unter einem starken Zeitdruck entstanden und den Gutachten wurden starke Vorgaben im Hinblick auf die Herangehensweise gemacht (im Rahmen der jeweiligen Leistungsbeschreibung sowie zahlreicher weiterer Absprachen mit dem BMAS im Rahmen des Projektverlaufs). In einigen Fällen lagen nicht einmal administrative Daten für den Zeitraum nach Einführung der Mindestlöhne vor. Aus diesem Grund wurden zusätzlich Befragungsdaten erhoben. Diese Schwierigkeiten relativieren teilweise die kritischen Einschätzungen in diesem Aufsatz. Generell sollten bei anspruchsvollen Ausschreibungen dieser Art Quantität und Qualität der in Auftrag gegebenen Forschungsarbeiten in einem angemessenen Verhältnis stehen, damit Forschungsmethoden und Daten dem Stand der Forschung entsprechen.

Im Sinne einer Evidenzbasierung der Wirtschaftspolitik halten wir grundsätzlich eine kritische Diskussion der Qualität von Studien nach deren Erstellung für notwendig – auch um zukünftige Evaluationen zu verbessern – und stellen fest, dass dies viel zu selten passiert. In Sinne einer lernenden Evaluation ist eine kritische Diskussion der Evaluationsergebnisse wichtig. Dies ermöglicht auch ein kontinuierliches Monitoring der Wirkungen des Mindestlohns, wie es durch die Low-Pay-Commission in Großbritannien erfolgt und wie es auch von Seiten der Mindestlohnkommission in Deutschland in Zukunft erfolgen sollte. An dieser Stelle ist auf folgende Einschränkung hinzuweisen: Obwohl unser Aufsatz punktuell Implikationen für den politischen Prozess erwähnt, umfasst er keine umfassende Diskussion der politischen Gestaltung der Evaluation der Mindestlohnwirkungen. Obgleich wünschenswert, würde dies den Rahmen dieses Aufsatzes sprengen.

Welche konzeptionelle Lehren sind aus der ersten Evaluationsrunde zu ziehen? Erstens, aus der Systematisierung und Bewertung der Studien geht hervor, dass sich trotz ähnlicher methodischer Ansätze (fast immer werden DvD-Schätzer verwendet) ein sehr vielschichtiges Bild aus den acht Gutachten ergibt und dass die Qualität der Ergebnisse stark mit der Verfügbarkeit von administrativen Arbeitnehmer-Arbeitgeber-Daten zusammenhängt. Trotz der teilweisen Verfügbarkeit solcher Daten besteht in vielen Bereichen ein Abgrenzungsproblem im Hinblick auf die von den Mindestlohnregelungen betroffenen Beschäftigten. Fehlende Stundenlohninformationen und eine nicht eindeutig bestimmbare Branchenzugehörigkeit in den Daten sind Gründe dafür. Schließlich stellt sich auch die Frage, ob Betriebe die Branchenzugehörigkeit manipulieren können, um allfälligen Mindestlohnregelungen zu entgehen. In einigen wenigen Baubranchen konnten administrative Arbeitnehmer-Arbeitgeber-Daten bereitgestellt werden, die bisher der Wissenschaft nicht zur Verfügung standen und auf deren Basis die Stundenlöhne berechnet werden konnten. Dies ist ein Mehrwert einer lernenden Evaluation.

Zweitens ist festzuhalten, dass die Studien das Kontrollgruppendesign in unterschiedlicher Weise entwicklen. Während die Studie zum Bauhauptgewerbe ein quantitatives Prüfverfahren zur Auswahl der geeigneten Kontrollgruppen nutzt, wird diese in anderen Studien sachlogisch begründet. Weiterhin verwendet die Studie zur Pflegebranche nur eine interne Kontrollgruppe. Keine der Studien bezog sich auf den von Abadie et al. (2010) vorgeschlagenen synthetischen Kontrollgruppenansatz. Dieser Ansatz weist den Vorteil auf, dass zur Identifizierung einer geeigneten Kontrollgruppe die Variation über alle möglichen Kontrolleinheiten genutzt wird, anstatt wie zum Beispiel in der Studie zum Bauhauptgewerbe, alle möglichen Kontrollgruppen gleich zu gewichten. Allerdings wäre die Umsetzung auf die spezifische Fragestellung anzupassen, die u. a. eine angemessene Modellierung der Dynamik in den Ergebnisvariablen und der Heterogenität innerhalb der Branchen erfordert. Die Verwendung des synthetischen Kontrollgruppenansatzes zur Schätzung der Wirkungen von Mindestlöhnen verspricht neue Erkenntnisse (Dube and Zipperer 2015). Die Anwendbarkeit für die Analyse der Branchenmindestlöhne in Deutschland ist zukünftig genauer zu untersuchen (Felder 2014: Kaul et al. 2016). Die hier betrachteten Evaluationsstudien zu den Branchenmindestlöhnen verwenden zu Recht Placebo-Tests, um die Plausibilität der Annahme paralleler Trends zwischen Treatment- und Kontrollgruppen zu stützen. In Fällen der Ablehnung der Placebo-Tests werden diese meist nicht inhaltlich interpretiert und zur Verbesserung des Analyseansatzes eingesetzt. Für das Gutachten zur Gebäudereinigungsbranche ist kritisch anzumerken, dass einzelne DvD-Ergebnisse trotz Verletzung der Placebo-Tests inhaltlich interpretiert werden. Der inkrementelle DvD-Ansatz, der für das Bauhauptgewerbe zur Anwendung kommt, weist Interpretationsprobleme im Hinblick auf die Dynamik der Mindestlohnwirkungen auf, die in diesem Gutachten nicht hinreichend diskutiert werden.

Drittens kann das Changes-in-Changes (CiC) Verfahren (Athey und Imbens 2006) für stetige Zielgrößen eine sinnvolle Ergänzung zu DvD-Ansätzen darstellen, da es die Skalierungsabhängigkeit der identifizierenden Annahmen umgeht. Es ist möglich heterogene Mindestlohnwirkungen entlang der Verteilung unterschiedlich skalierter Zielgrößen zu ermitteln (vgl. Havnes und Mogstad 2015, für eine erfolgreiche Anwendung der Methode). Allerdings setzt dieses Verfahren voraus, dass die Veränderungen in der Verteilung der Zielgrößen in der Kontrollgruppe die kontrafaktischen Veränderungen entlang der Verteilung für die Treatmentgruppe ohne Treatment abbilden. Diese Variante der Annahme paralleler Trends ist im Einzelfall kritisch zu beleuchten. Für stetige Ergebnisvariablen kann das CiC-Verfahren mit Hilfe von (bedingten) Quantilsregressionen umgesetzt werden, um den Einfluss von Kovariaten zu berücksichtigen (vgl. Melly und Santangelo 2015). Umsetzungsprobleme bestehen bei diskreten Ergebnisvariablen. Es liegen nach unserem Kenntnisstand noch keine Erfahrungswerte für die Analyse von Mindestlohnwirkungen vor, so dass offen ist, ob die Methode belastbare Ergebnisse für die Analyse der Mindestlohnwirkungen liefern kann – nach unserer Einschätzung wäre es jedoch einen Versuch wert. Für alle vorgeschlagenen Ansätze gilt, wie auch für den DvD-Ansatz, dass die Plausibilität und mögliche Verletzungen der SUTVA-Annahme diskutiert werden müssen.

Unsere vierte Anmerkung bezieht sich auf die SUTVA-Annahme. In einigen Studien wurden mögliche Verletzungen der identifizierenden Annahme des DvD-Ansatzes und das mögliche Auftreten von Spillover-Effekten diskutiert. Im Regelfall wurde allerdings die Robustheit von Ergebnissen gegenüber der Wahl der Kontrollgruppe als erstrebenswertes und einzig inhaltlich interpretierbares Ergebnis angesehen. Umgekehrt können sich jedoch aus der Variation der Ergebnisse je nach Wahl der Kontrollgruppe neue Erkenntnisse ergeben, sprich diese Unterschiede können Anhaltspunkte für die ökonomische Wirkungsweise der Mindestlöhne liefern. Wenn unterschiedliche Kontrollgruppen in unterschiedlicher Weise von Spillover-Effekten betroffen sind, spiegelt sich dies in einer Variation der DvD-Schätzungen je nach Wahl der Kontrollgruppe wieder und hätte explizit in den Gutachten dahingehend untersucht werden können. Angesichts von Spillover-Effekten ist das Zusammenspiel der Ergebnisse für verschiedene Zielgrößen vor dem Hintergrund empirisch plausibler Verhaltensreaktionen (Arbeitsnachfrageelastizitäten) zu interpretieren. Darüber hinaus könnten synthetische Kontrollgruppen einen besseren Vergleichsmaßstab liefern und deren Zusammensetzung könnte durch Placebo-Tests überprüft werden. Wenn allerdings die Placebo-Tests zur Modellwahl (Wahl der Kontrollgruppe) verwendet werden, besteht die Gefahr eines statistischen Overfittings. Dem sollte durch eine weitere Überprüfung der Prognosegüte des Modells ausserhalb der Schätzstichprobe entgegengewirkt werden. Dazu sind hinreichend große Datensätze notwendig. Schließlich lassen sich Spillover-Effekte im Rahmen von strukturellen Schätzungen der Arbeitsnachfrage, des Arbeitsangebots, der Güternachfrage oder eines monopsonistischen Arbeitsmarktes explizit modellieren. Die strukturellen Modelle, die typischerweise auf stärkeren Modellierungsannahmen als die Schätzungen der Kausaleffekte beruhen, sollten so spezifiziert und kalibriert werden, dass sie die ohne weitergehende Annahmen an die Modellstruktur geschätzten Kausaleffekte replizieren.

Fünftens ist die externe Validität der Ergebnisse aufgrund der Spezifika der einzelnen Branchen und der unterschiedlichen Höhe der Mindestlöhne begrenzt. Es ist wichtig, für jede Branche einen angemessenen Evaluationsansatz zu wählen, der sich nach Branche unterscheiden kann. Zusätzlich ist es sinnvoll über die Branchen hinweg Schätzungen mit einem einheitlichen Forschungsdesign anzuwenden. Dies kann die externe Validität der einzelnen Ergebnisse erhöhen, da eventuelle Unterschiede in den Ergebnissen bei Anwendung des gleichen Forschungsdesigns auf unterschiedliche Branchen erklärt werden müssten. Es ist zwar so, dass drei Institute (IAQ, IAW, ZEW) an mehreren Gutachten beteiligt waren, aber es fand keine vergleichende Diskussion der Ergebnisse über verschiedene Branchen statt. Bspw. wäre es interessant zu wissen, ob man auch für andere Branchen negative Beschäftigungseffekte wie für das Dachdeckerhandwerk findet, wenn man für die anderen Branchen den gleichen Evaluationsansatz wie im Gutachten für das Dachdeckerhandwerk anwendet.

Sechstens ist dem bei der Schätzung der Effekte von Branchenmindestlöhnen möglichen Problem der Politikendogenität Rechnung zu tragen. Politikendogenität tritt auf, wenn ein Mindestlohn in einer Branche nur dann eingeführt wird, wenn dies von Akteurer (Tarifparteien etc.) in einer Branche angestrebt wird.

Siebtens möchten wir festhalten, dass eine reine Zeitreihenevidenz keine Kausalanalyse ersetzen kann. Dennoch liefert sie eine wichtige deskriptive Evidenz. Beispielsweise stellt Manning (2013, S. 61–62) für Großbritannien graphisch die zeitliche Entwicklung der Lohnungleichheit und der Höhe des Mindestlohns relativ zum Median dar. Manning (2013) interpretiert dies als Hinweis darauf, dass ein Mindestlohn die Ungleichheit reduziert. Die in den Evaluationsstudien geschätzten Kausaleffekte sollten stärker im Lichte der deskriptiven Zeitreihenevidenz zu den Mindestlöhnen diskutiert werden, als dies bisher der Fall war.

Lassen sich belastbare inhaltliche Lehren aus der ersten Evaluationsrunde ziehen? Die verschiedenen Evaluationsstudien liefern ein äußerst vielschichtiges Bild (siehe Tab. 25). Generell ist festzuhalten, dass mögliche negative Beschäftigungseffekte von Mindestlöhnen geringer ausfallen, als dies von Kritikern befürchtet wurde (ifo Schnelldienst 2008). Ein eindrückliches Beispiel liefert der Mindestlohn im Dachdeckergewerbe (Aretz et al. 2011). In dieser Branche liegt der Mindestlohn in Ostdeutschland über dem Median des Lohnes und es finden sich in eher geringem Umfang negative Beschäftigungseffekte. Gleichzeitig sind jedoch deutliche Anpassungsreaktionen in dieser Branche zu konstatieren. Zum einen ging die Dynamik der Beschäftigung zurück und zum anderen reduzierten sich die Lohnunterschiede im oberen Bereich der Lohnverteilung. Ein offener Punkt in den Gutachten ist die kausale Schätzung der durch den Mindestlohn ausgelösten Preisüberwälzung. Die vielschichtigen Anpassungs- und Ausweichreaktionen auf Firmenebene, die sich in verschiedenen Evaluationsstudien andeuten, und deren Bewertung sollten Themen zukünftiger Evaluationsstudien zu Mindestlöhnen in Deutschland werden.