1 Einleitung

Neuere Technologien der vermessenden Beobachtung zeichnen sich dadurch aus, dass sie Vergleich, Bewertung, Klassifikation und Vermessung in einer Operation vereinen. Diesen Technologien wird zunehmend soziologische Aufmerksamkeit zuteil (vgl. Esposito und Stark 2019; Heintz 2019). Im Fokus stehen hier beispielsweise Credit-Scores (Fourcade und Healy 2013), Finanzratingagenturen (Langohr und Langohr 2008), Restaurantführer (Karpik 2000), Weinbewertungssysteme (Chauvin 2006) oder Hochschulrankings (Espeland und Sauder 2016). Das genaue Verhältnis und Zusammenspiel der analytisch zu trennenden Dimensionen von Klassifikation, Vermessung, Vergleich und Bewertung werden dabei allerdings nicht immer systematisch herausgearbeitet. Eine Ausnahme bildet Fourcade (2016), die auf die verschiedenen Formen der „intersection“ von nominalen, kardinalen und ordinalen Klassifikationsurteilen sowie auf deren „Dis“- und „Re-Entanglements“ hinweist.

Von nicht minder großer Bedeutung ist aber die Frage, inwieweit die verschiedenen Komponenten der jeweiligen Technologien von Anfang an expliziter Zweck des Instruments sind oder inwieweit sich einzelne Komponenten als unintendierte Folge des technologischen Designs herausbilden und/oder Oberhand gewinnen. Tatsächlich eint viele der obengenannten Studien der Befund, dass die untersuchten Instrumente ursprünglich für eingeschränktere Zwecke entwickelt worden sind und erst in der weiteren Entwicklung Bewertungs‑, Vergleichs‑, Klassifikations- oder Vermessungsfunktionen aufgenommen haben.

Der Aufsatz will einen fallbezogenen Beitrag zur Aufhellung des Verhältnisses von Vermessung, Klassifikation, Vergleich und Bewertung leisten. Er tut dies am Beispiel des sogenannten Integrationsmonitorings, einem Instrument zur Quantifizierung der Integrationsfortschritte der Immigrantenbevölkerung in Deutschland. Seit ca. 15 Jahren werden derartige Integrationsstatistiken in zunehmendem Maße in Verwaltungen auf Kommunal‑, Länder- und Bundesebene eingeführt, um Integrationspolitik zu steuern. Integrationsmonitorings klassifizieren Personen mit und Personen ohne Migrationshintergrund und vergleichen diese im Hinblick auf integrationsrelevante, hauptsächlich sozioökonomische Parameter. Während drei Operationen im Prozess der Quantifizierung – Klassifikation, Vermessung, Vergleich – unproblematische und reflektierte Komponenten des Instruments und seines Gebrauchs ausmachen, stehen alle drei davon in einem problematischen Verhältnis zur (moralischen) Bewertung, das in unterschiedlichem Ausmaß durch die Integrationsbeamten reflektiert wird.

Fokus des Beitrags sind die unintendierten Bewertungen, die durch die Eigenlogik des Klassifikations‑, Vergleichs-, und Vermessungsprozesses selbst hervorgebracht werden. Es geht mit anderen Worten um die moralischen „Überschüsse“ einer vermeintlich neutralen Quantifizierung von Integrationsfortschritten. Der Fokus dieses Artikels ist folglich nicht der Gegenstand der Migration und Integration. Der Blick liegt vielmehr auf der sozialstatistischen Beobachtung von Integration und ist damit auf einer Ebene der Beobachtung zweiter Ordnung angesiedelt. Das analytische Instrumentarium schöpft entsprechend nicht aus der umfangreichen Literatur zur Soziologie der Migration und Integration (für Überblicke vgl. etwa Drouhut und Nee 2019; Kalter 2009). Der Untersuchung wird auch kein analytischer Begriff von Integration zugrunde gelegt. Vielmehr widmet sich der Beitrag den Wirkungen, die sich mit der sozialstatistischen Vermessung dessen verbinden, was die Akteure selbst (nicht zuletzt: infolge der Vermessung) als „Integration“ wahrnehmen. Der Frage, inwieweit das „wirklich“ Integration ist oder nicht, wird sich hier also bewusst enthalten.

Der Beitrag mobilisiert dabei Einsichten aus der Akteur-Netzwerk-Theorie, indem er die autonomen Wirkpotenziale und „Affordanzen“ (Gibson 1979) von soziotechnischen Infrastrukturen oder „intellektuellen Technologien“ (Latour 2005, S. 76) wie den Integrationsstatistiken betont. Damit liefert er einerseits einen Beitrag zur neueren Soziologie der Moral, die entgegen der Parsonschen Tradition die Vielfalt und Varianz moralischer Perspektiven und deren plurale Produktionsstätten in den Blick nimmt (Hitlin und Vaisey 2010, 2013); hier sind nicht zuletzt die moralischen Implikationen sozialpolitischer Leitunterscheidungen und Handlungsprogramme ein relevanter Gegenstand (Steensland 2006, 2010). Andererseits führt er aber auch eine mittlerweile breite Literatur zur statistischen Konstruktion von Ethnizität weiter (Bowker und Star 1999; Kertzer und Arel 2002; Mora 2014; Nobles 2000; Paschel 2013). Ein jüngerer Beitrag hat hier am Beispiel von Personen mit Migrationshintergrund in Deutschland geltend gemacht, dass auch ethnisch neutral formulierte statistische Kategorien eine Rolle in der Ethnisierung und Stigmatisierung von sozialen Gruppen spielen können (Elrick und Schwartzman 2015). Die Autoren führen dies auf die Trägheit von Deutungsmustern aus der Ära der Gastarbeiterpolitik und damit auf Faktoren außerhalb der Statistik zurück. Der vorliegende Artikel relativiert diesen Befund, indem er zeigt, dass solche Deutungssuggestionen den statistischen Konventionen selbst inhärent sind. Er leistet damit auch „Brückenarbeit“ (Rodríguez-Muñiz 2016) zwischen den noch weitgehend unverbundenen Literaturen der Science and Technology Studies und der Ethnic and Racial Studies.

Ich gehe wie folgt vor. Zunächst skizziere ich den Fall des Integrationsmonitorings in Deutschland sowie die Daten und Methoden, die seiner Untersuchung zugrunde liegen. Die darauffolgenden drei Teile zeigen, wie die Operationen der Klassifikation, des Vergleichs und der operationalisierenden Vermessung jeweils im Zusammenspiel mit kognitionspsychologischen und institutionellen Rahmenfaktoren moralische Bedeutungsüberschüsse entfalten. In einem ersten Teil argumentiere ich, dass es sich bei der Klassifikation von Personen mit und ohne Migrationshintergrund um eine markierte Unterscheidung handelt; solche Markierungen neigen generell dazu, moralische Konnotationen auf sich zu ziehen. In einem zweiten Teil beleuchte ich drei Kontexte, die moralische Affordanzen an statistischen Vergleichsinstrumenten zur Geltung bringen: den Produktionskontext des statistischen Ressorts, den Produktionskontext der politischen Steuerung sowie den Auslegungskontext eines „Zeitgeistes“ metrischer Rangvergleiche. Der dritte Teil schließlich arbeitet die moralischen Konnotationen der spezifischen Kompilation von Indikatoren heraus, die Integration vermessen soll; der Fokus liegt also auf dem zentralen Prozess der Operationalisierung im Kontext des Vermessens. Hier mache ich deutlich, dass es sich bei Integration um einen „dichten“ Begriff handelt, bei dem bewertende und deskriptive Dimensionen untrennbar miteinander verwoben sind. Der statistischen Technik der Operationalisierung inhärieren somit unvermeidliche moralische Implikationen.

2 Das Integrationsmonitoring in Deutschland

„Integrationsmonitoringsysteme“ sind im Laufe der letzten fünfzehn Jahre in Deutschland auf der kommunalen, Länder- und Bundesebene zunehmend implementiert worden. Es handelt sich um regelmäßig publizierte Kompilationen von statistischen Indikatoren, die die „Integrationsfortschritte“ der Bevölkerung mit Migrationshintergrund vermessen sollen. Die Initiative ging von der kommunalen Ebene aus, wo ab 2003 in einigen Pionierstädten die Gründung von Integrationsämtern mit der Implementation solcher statistischen Beobachtungsinstrumente einherging. Im Nationalen Integrationsplan von 2007 finden sich dann Selbstverpflichtungen des Bundes, der Länder und der Kommunen, die Einrichtung von Integrationsmonitoringsystemen oder einer Berichterstattung mit „Integrationsindikatoren“ voranzutreiben. Die Länderebene kam 2008 mit der Gründung der „Länderoffenen Arbeitsgruppe ‚Indikatorenentwicklung und Monitoring‘ der Konferenz der für Integration zuständigen Ministerinnen und Minister/Senatorinnen und Senatoren der Länder“ dieser Verpflichtung nach. Diese Gruppe entwickelte einen Indikatorenkatalog (IntMK) und publiziert regelmäßig entsprechende „Integrationsdaten“ für die deutschen Bundesländer. Einige darunter haben darüber hinaus eigene Integrationsmonitorings lanciert, die mit einem erweiterten Set an Integrationsindikatoren arbeiten.

Auf der Bundesebene zog man 2009 mit der Publikation eines Integrationsindikatorenberichts nach, der von der Beauftragten für Migration, Flüchtlinge und Integration in Kooperation mit dem Wissenschaftszentrum Berlin (WZB) herausgegeben wurde. Ein zweiter Bericht folgte 2011. De facto ist dieses Amt seit seiner Gründung 1978 mit der Beobachtung der Integration der ausländischen Bevölkerung befasst und kam dieser Aufgabe auch vorher schon in Publikationen nach, die mit entsprechenden statistischen Indikatoren arbeiten. Das Integrationsmonitoring ist somit schwer von der regelmäßigen Berichterstattung der Beauftragten zu isolieren. Einige Indikatoren waren auch schon vorher Bestandteil der Integrationsberichte und einige der neuen Indikatoren sind seither in diese allgemeine Berichterstattung aufgenommen worden. Im März 2021 hat das Bundesmonitoring mit der Publikation „Erster Bericht zum indikatorengestützten Integrationsmonitoring” erneut an Fahrt aufgenommen.

Deutschland ist innerhalb der EU nicht das einzige Land, das mit derartigen sozialstatistischen Beobachtungsinstrumenten die Integrationsfortschritte seiner Migrantenbevölkerung vermisst (siehe Bijl und Verweij 2012). Tatsächlich hat die EU-Kommission eigene Empfehlungen für die Implementation solcher Monitoringsysteme herausgegeben (Huddleston et al. 2013; Swedish Presidency of the EU 2009). Selbst in den USA nimmt die Einrichtung solcher Systeme auf der kommunalen Ebene Fahrt auf; so hat New York City 2018 seinen ersten Bericht „State of Our Immigrant City“ publiziert, der sich eng an den Integrationsberichten europäischer Bürokratien orientiert (NYC Mayor’s Office of Immigrant Affairs 2018). Gleichwohl ist Deutschland hier im internationalen Vergleich weit fortgeschritten und kann, insbesondere auf der kommunalen Ebene, mittlerweile auf einen relativ langen Erfahrungszusammenhang mit solchen Berichterstattungen zurückblicken. Es bildet in diesem Sinne einen „critical case“ (Yin 2014, S. 51) für die vertiefende Untersuchung einiger der Dynamiken und Konsequenzen, die aus der Einrichtung solcher Monitorings in wohlfahrtsstaatlichen Behörden hervorgehen. Die hier vorgelegten Ergebnisse sind somit auch über den deutschen Kontext hinaus relevant.

Das Integrationsmonitoring in Deutschland operiert mit der Unterscheidung von Personen mit und Personen ohne Migrationshintergrund. Die offizielle Definition des statistischen Bundesamtes, der inzwischen auch die Pionierkommunen folgen, schreibt einer Person einen Migrationshintergrund zu, „wenn sie selbst oder mindestens ein Elternteil nicht mit deutscher Staatsangehörigkeit geboren wurde. Im Einzelnen umfasst diese Definition zugewanderte und nicht zugewanderte Ausländerinnen und Ausländer, zugewanderte und nicht zugewanderte Eingebürgerte, (Spät‑)Aussiedlerinnen und (Spät‑)Aussiedler sowie die als Deutsche geborenen Nachkommen dieser Gruppen.“Footnote 1 „Integration“ wird generell in zweierlei Vorgehensweisen gemessen. Hinsichtlich eines sozialstatistischen Parameters werden die Bevölkerungssegmente der Personen mit und ohne Migrationshintergrund (im Bund, Land oder der Kommune) verglichen. Ein Abstand der Ersteren zu den Letzteren gilt als „Integrationsdefizit“. Die zweite Variante betrachtet dieselben Daten von der Warte eines institutionellen Sektors, nimmt folglich die Population innerhalb dieses Sektors als Basis und vergleicht nun den Anteil der Personen mit Migrationshintergrund mit deren Anteil an der Gesamtpopulation. Je nach Sektor gilt dann Über- oder Unterrepräsentation als Integrationsdefizit.

Die Daten und Parameter für die Berichte entstammen je nach Regierungsebene unterschiedlichen Quellen. Auf der Bundes- und Länderebene bilden der Mikrozensus und zum Teil das Sozio-oekonomische Panel eine wichtige Ressource. Auf der kommunalen Ebene kommen Einwohnermelderegister und andere amtliche Statistiken zum Einsatz. Grundsätzlich werden auch Surveys und Datensätze, die ursprünglich zu anderen Zwecken erhoben wurden, auf geeignete Indikatoren abgesucht. Man liest in diesem Sinne, wie mir eine Mitarbeiterin des Stabs der Bundesbeauftragten mitteilte, andere Erhebungen „gegen den Strich“. Auf der Länder- und Kommunalebene operiert man zum Teil mit mehrdimensionalen Integrationsbegriffen, etwa der Unterscheidung von struktureller, kultureller, sozialer und identifikatorischer Dimension nach Friedrich Heckmann (z. B. Heckmann 1997). Diese dienen allerdings nur einer groben Systematisierung von Indikatoren, die offensichtlich ohne strikte Kontrollen durch operationale Definitionen kompiliert werden. Das explizite Leitverständnis von Integration, das solchen Zusammenstellungen in der Regel zugrunde liegt, ist die „Angleichung von Lebenschancen“, wobei man sich zum Teil ausdrücklich gegen Imperative der kulturellen Assimilation und Identitätsaufgabe verwehrt.

3 Daten und Methoden

Die vorliegende Studie untersucht die statistische Integrationsbeobachtung auf allen drei Regierungsebenen als eingebettete Einheiten im breiteren Fall des deutschen Integrationsmonitorings (zu diesem „embedded single-case design“ vgl. Yin 2014; auch Gerring 2004). Ein Schwerpunkt liegt auf der Kommunalebene, und hier auf einer der Pionierkommunen in der Einrichtung des Integrationsmonitorings, eine größere Stadt mit einem hohen Anteil an Personen mit Migrationshintergrund (hier anonymisiert als „Stadthausen“). Auf der Länderebene liegt der Fokus auf einem Flächenland unter den alten Bundesländern, das Stadthausen umfasst und hier unter dem Alias „Westlanden“ referenziert wird. Es hat ebenfalls eine vergleichsweise lange Erfahrung mit einem Integrationsmonitoring aufzuweisen und verankert das Integrationsthema fest in seinem Ministerialapparat. Westlanden ist Teil der „Länderoffenen Arbeitsgruppe ‚Indikatorenentwicklung und Monitoring‘ der Konferenz der für Integration zuständigen Ministerinnen und Minister/Senatorinnen und Senatoren der Länder“, erweitert deren Kernset an Indikatoren in seinem eigenen Integrationsmonitoring (IntMK) aber beträchtlich. Westlanden unterhält zudem Förderprogramme, die die Einrichtung von Integrationsmonitorings in sämtlichen Kommunen und Landkreisen in Westlanden vorantreiben. Die nähere Untersuchung eines dieser Programme lieferte somit zusätzliche Daten auf der Kommunalebene, insbesondere von zwei weiteren Großstädten sowie von zwei Landkreisen mit jeweils mehreren zugehörigen Gemeinden. Auf der Bundesebene untersucht die Studie die jüngere Berichterstattung und die Integrationsindikatorenberichte der Beauftragten für Migration, Flüchtlinge und Integration.

Methodisch arbeitet die Untersuchung mit einem mixed-methods-Ansatz von Dokumentanalysen, Experteninterviews und ethnografischer Beobachtung. Korpus der Dokumentanalyse waren die Integrations- und Monitoringberichte der drei Untersuchungseinheiten, Broschüren, Projektkonzepte und -evaluationen, Richtlinien für Förderprogramme, Sitzungsprotokolle und politische Anträge in Integrationsausschüssen. Der Blick galt den impliziten Ontologien des Sozialen und der Dramaturgie des Integrationsproblems, die insbesondere durch die statistischen Indikatoren nahegelegt werden.

Die Dokumentenanalyse wird flankiert von 25 leitfadenbasierten Experteninterviews sowie 14 informellen Interviews mit Verwaltungsbeamten, Politikern und Projektmitarbeitern auf den unterschiedlichen Regierungsebenen, durchgeführt zwischen Juni und Dezember 2017. Die Leitfadeninterviews dauerten zwischen 60 bis 120 min. Gegenstand des Leitfadens war die Auswahl und Zusammenstellung der Integrationsindikatoren, deren Rolle in der Integrationsarbeit und im Entwurf von Integrationsprojekten sowie Reaktionen und Veränderungen infolge der Einführung der statistischen Integrationsbeobachtung. Die Selektion der Interviewpartner folgte einer Schneeball-Auswahl: Die erste Kontaktaufnahme erfolgte in der Regel mit den Hauptverantwortlichen für das Integrationsmonitoring und setzte sich dann in der Kontaktierung weiterer Personen fort, die im Interview erwähnt wurden. Es wurde versucht, eine etwaige Heterogenität in den Blickpunkten auf das Integrationsmonitoring zu berücksichtigen.

Zusätzlich wurden ethnografische Beobachtungen von Arbeits- und Steuerungsgruppen, interkommunalen Netzwerktreffen, öffentlichen Integrationskonferenzen und politischen Ausschusssitzungen durchgeführt. Diese Beobachtungen warfen ein zusätzliches Licht auf die Frage, wie Statistiken und die damit verbundenen Vorstellungen von Integration und Gesellschaft den Diskurs über öffentliche Integrationsarbeit bestimmen.

Die Dokumente, Transkripte der Interviews und Feldnotizen wurden mit atlas.ti in Orientierung an Prinzipien der Grounded Theory ausgewertet (vgl. Charmaz 2006). Die Triangulation der Verfahren diente dazu, die Schwachstellen der einzelnen Methoden zu kompensieren und den Fall von vielfältigen Perspektiven zu beleuchten.

4 Klassifikation und Bewertung: Die Markierung des Anomalen

Das Herz des Integrationsmonitorings ist die klassifizierende Unterscheidung von Personen mit und Personen ohne Migrationshintergrund. Sie ersetzt die Unterscheidung von Deutschen und Ausländern, die infolge der Reform des Staatsangehörigkeitsrechts von 2000 die Möglichkeiten der statistischen Beobachtung stark eingeschränkt hatte.Footnote 2 Im Zuge der erweiterten Möglichkeiten der Einbürgerung wurden Migranten auf deutschem Staatsgebiet früher statistisch „unsichtbar“. Die Klassifikation „Migrationshintergrund“ ermöglicht demgegenüber eine sozialstatistische Beobachtung von Migranten bis zur dritten Generation.

Zu den Personen mit Migrationshintergrund gehören Personen mit unterschiedlichen Migrationsbiografien. Das Spektrum reicht von Neuzugewanderten bis hin zu Deutschen mit einem und nur einem Elternteil, der in Deutschland mit ausländischer Staatsbürgerschaft geboren wurde, weil dessen Eltern etwa aus einem EU-Nachbarland stammten. Die Kategorie steht damit nicht nur quer zu der Differenz von deutscher und ausländischer Staatsbürgerschaft, sondern umfasst hinsichtlich sprachlicher, ethnischer und kultureller Gemeinschaften Abstammungslinien mit ebenso minimalen wie maximalen Abständen zum „Deutschen“ (in diesen drei alltagsüblichen Konnotationen). Das Bewusstsein für den eigenen Migrationshintergrund im Sinne dieser Definition ist innerhalb dieser Kategorie entsprechend unterschiedlich ausgeprägt.Footnote 3

Die Unterscheidung anhand von Migrationshintergrund ist eine streng nominale. Sie folgt keiner Logik der Hierarchisierung. Inwieweit lassen sich bei der Differenzierung also evaluative Überschüsse und damit gleichwohl eine Tendenz zum „Kippen“ ins Ordinale ausmachen?

Hier lassen sich jüngere Vorstöße aus der Soziologie der Rasse, Ethnizität und Nationalität heranziehen, die kognitionspsychologische Einsichten für ihre soziologischen Fragestellungen mobilisieren (vgl. Brekhus et al. 2010; Brubaker et al. 2004). Von besonderer Relevanz für den vorliegenden Zusammenhang sind die rezenten Anleihen an einer linguistischen Theorie der Markiertheit (Brekhus 1996, 1998; Zerubavel 2018). Die Sprachwissenschaftler Nikolai S. Trubetzkoy und Roman O. Jakobson entwickelten den Begriff anlässlich der Beobachtung, dass in einem Phonempaar generell ein Part aktiv durch ein Merkmal hervorgehoben ist, wohingegen der Gegenpart passiv durch die Abwesenheit dieses Merkmals charakterisiert ist (vgl. Brekhus 1998, S. 35). Brekhus (1996) macht diese Beobachtung mit seinem Konzept der „sozialen Markiertheit“ soziologisch fruchtbar. Er bezeichnet damit das Phänomen, dass soziale Akteure ihre Aufmerksamkeit auf eine Seite einer Unterscheidung lenken, während sie die andere Seite als „epistemologisch unproblematisch“ ignorieren (Brekhus 1996, S. 500).

Tatsächlich sind die meisten unserer in gesellschaftlicher Hinsicht signifikanten Differenzierungen in diesem Sinne der Markiertheit vs. Unmarkiertheit organisiert. In westlichen Kulturen etwa gilt der Mann im Allgemeinen als die unmarkierte Seite der binären Geschlechterdifferenz, die Frau hingegen als markierte (dazu auch Luhmann 1988). Deutlich wird dies etwa dadurch, dass Termini, die für eine geschlechtlich gemischte Gesamtpopulation einstehen, typischerweise im Maskulinum stehen (etwa die „Studenten-Population“) und damit erst im Zuge einer aktiven Sprachpolitik gebrochen wird (etwa mit der Bezeichnung der „Studierendenpopulation“ oder gar „Studentinnenpopulation“ im geschlechtlich nichtdeterminierenden Sinne). Man hat es hier mit hierarchischen Oppositionen im Sinne Dumonts (1980) zu tun, bei denen die unmarkierte Seite der Unterscheidung einerseits in einem spezifischen Sinne in Opposition zu ihrer markierten Seite tritt, diese im generischen Sinne aber andererseits zugleich umfasst (sodass beispielsweise im Englischen wie Französischen ein und dasselbe Wort sowohl den „Mann“ als auch den „Menschen“ denotiert).

Es ist offensichtlich, dass es sich bei der Unterscheidung von Personen mit und ohne Migrationshintergrund um einen Fall von Markiertheit handelt. Tatsächlich ist das markierende Merkmal in der Bezeichnung klar benannt: Bei Personen mit Migrationshintergrund handelt es sich um den bemerkenswerten Fall, der sich von der unauffälligen Reflexionskategorie der Personen ohne dieses Merkmal entsprechend abhebt.

Als eine asymmetrische Unterscheidung ist die zunächst harmlos anmutende Differenzierung von Personen mit und ohne Migrationshintergrund somit nicht frei von evaluativen Überschüssen. Semiotische Markierung ist nicht zuletzt Mechanismus wie Resultat einer Konstruktion von sozialer Normalität und Abweichung. Dies ist eng verbunden mit Abweichung im statistischen Sinne, geht darin aber, wie der Fall der Geschlechterdifferenz zeigt, nicht vollständig auf. Die mit Markierungen verbundene Aufmerksamkeitssteuerung versieht die markierte Seite allzu leicht mit Konnotationen des Problematischen, während die unmarkierte Seite sich mit dem Gewicht des Normativen ausgestattet sieht. Beide Seiten sind damit im unterschiedlichen Ausmaß mit Legitimität besetzt. Die Unterscheidung lädt sich moralisch auf: „In sharp contrast to its statistical counterpart, the cultural notion of normality adds a pronouncedly evaluative dimension to the way we conceptualize it“ (Zerubavel 2018, S. 35 f.).

Die moralische Dimension von Markiertheit wird insbesondere dort evident, wo Markierungen eine trinäre Struktur aufweisen, also die beiden Extremtypen eines Spektrums sozial markierte Entitäten bilden, während die dazwischenliegenden Ausprägungstypen unmarkiert und damit nicht weiter bemerkenswert sind (Brekhus 1996, S. 502 f.; Zerubavel 2018, S. 40 ff.). Nicht selten liegt hier für den unmarkierten Mitteltypus gar eine semantische Fehlanzeige vor: So kennen wir die Heiligen und die Sünder, die Helden und die Feiglinge, die Keuschen und die Promiskuitiven; bei den moralisch Unauffälligen hingegen greifen wir begrifflich ins Leere (Brekhus 1996, S. 502 f.; Zerubavel 2018, S. 41).

Die politischen Implikationen von Markierung werden deutlich genug in den Komposita, mit denen ethnische Abweichungen in den USA indiziert werden. Während „Asian Americans“ und „African Americans“ geläufige Formen der Selbst- und Fremdidentifikation darstellen, fehlt die entsprechende Referenzkategorie des „European American“. Das Generikum „American“ steht hier wiederum ebenso für die Allgemeinheit der amerikanischen Staatsbürger wie für den spezifischeren Fall der weißen Amerikaner europäischer Abstammungslinien ein. Und in ganz ähnlichem Sinne droht auch die Klasse der Personen ohne Migrationshintergrund semantisch mit den „Deutschen“ im Allgemeinen zu verschwimmen, obgleich die Unterscheidung doch quer zur Kategorie der Staatsangehörigkeit konstruiert ist (dazu auch Will 2016, 2019).

Die Markierung von Migrationshintergrund im Rahmen einer darauf gründenden nominalen Klassifikation konstruiert und akzentuiert somit eine abweichende Identität. Die zunächst auf der Hand liegende statistische Deviation reichert sich im Zuge dieses begrifflichen Manövers mit den normativen Konnotationen von Devianz an – dies gerade auch in Anbetracht der Tatsache, dass in manchen urbanen Regionen Personen mit Migrationshintergrund die statistische Mehrheit, also gerade nicht den rein numerisch abweichenden Fall bilden. Es ist dies also als eine Deutungssuggestion im Sinne einer „Affordanz“ (Gibson 1979) zu sehen, die in der hier verwandten Technik der Kategorienbildung selbst begründet liegt.

Dieser moralische Bedeutungshorizont von Normalität und Abweichung ist den Integrationsbeamten wohlbewusst. So klagte ein Stadthausener Beamter im Diskussionskreis eines interkommunalen Netzwerktreffens, dass die Kategorie „Migrationshintergrund“ stets Personen suggeriere, die „noch zu integrieren“ seien. Dies zementiere ihm zufolge eine ausgrenzende „Wir-Ihr-Differenz“. Die Verantwortlichen für das Integrationsmonitoring reflektieren folglich, dass sie, mit Goffman (1963) gesprochen, „beschädigte Identitäten“ produzieren. Die Markierung „Migrationshintergrund“ wird zum Stigma, das die darunter Subsumierten invalidiert, sie ungeachtet ihrer Staatsangehörigkeit zu nicht vollgültigen Einwohnern deklariert. Das geht auch aus einer Anekdote hervor, in der mir eine Integrationsbeamtin von einem Migranten erzählte, der sie während einer Einbürgerungszeremonie fragte, wann er eigentlich seinen Migrationshintergrund loswerde und die Antwort dazu gleich selbst lieferte: „Eigentlich nie, oder?“

Die durch diese Klassifikation produzierte Salienz des Status Migrationshintergrund unterläuft damit ironischerweise die Integrationsbemühungen der Beamten, insofern sie symbolisch exkludiert und problematisiert, wo es gerade zu inkludieren und normalisieren gilt (dazu auch Schinkel 2013 für den Fall der Niederlande). Diese Produktion eines abweichenden „Masterstatus“ (Hughes 1945), der alle weiteren Rollen überschattet, wird nicht zuletzt durch die so Klassifizierten selbst bedauert. So berichtete mir eine Projektmitarbeiterin mit eigenem Migrationshintergrund:

Ich bin Migrantin, bin als Erwachsene aus einem anderen Land gekommen … Ich kann daran nichts ändern, [es] ist ein Fakt. Aber wenn ich in den Bus einsteige, ist das für mich relevant? Will ich in jedem Moment meines Lebens daran erinnert werden, dass ich Migrantin [bin]? Was ist das für ein Merkmal, das aus mir als Mensch etwas anderes macht?

Eine weitere Projektarbeiterin mit Migrationshintergrund lamentierte in analoger Weise während eines interkommunalen Netzwerktreffens eines Länderprojekts, sie erfahre ein „Drängen“ in die Rolle der Person mit Migrationshintergrund, sie werde darauf reduziert, obgleich sie etwa von ihrer ausländischen Großmutter kulturell völlig entfremdet sei.

Markierte Kategorien haben zudem kognitive Effekte, die diesen Prozess des „Othering“ noch zusätzlich verstärken. Die markierte Klasse neigt dazu, prototypisch durch ihren Extremtypus repräsentiert zu werden. Brekhus (1996) spricht von einem Mechanismus des „mental coloring“: Die gesamte Kategorie wird kognitiv durch ihr auffälligstes Mitglied „eingefärbt“. Differenzen innerhalb einer Klasse werden dabei minimiert, Differenzen zur Komplementärklasse hingegen maximiert (s. a. Brubaker et al. 2004; Hogg und Abrams 1988; Messick und Mackie 1989, S. 55; Tajfel 1959, 1969). Im Falle der Kategorie Migrationshintergrund bedingt dies zum einen eine Exotisierung und Ethnisierung des Attributs. Der Stereotyp einer Person mit Migrationshintergrund wird somit kognitiv mit maximal abweichenden Phänotypen, Kleidercodes und Weltbildern ausgestattet. Nicht zuletzt darin dürfte eine implizite Muslimisierung der Personen mit Migrationshintergrund im öffentlichen Diskurs ihre Ursache haben, die, wie eine Integrationsbeamtin aus Westlanden konzedierte, selbst innerhalb der Verwaltung immer wieder zu beobachten sei (dazu Allievi 2005). Angesichts des zwanzigprozentigen Anteils der Personen mit Migrationshintergrund an der Gesamtbevölkerung bei gerade einmal 4,4 % praktizierenden Muslimen in Deutschland (Forschungsgruppe Weltanschauungen in Deutschland 2017) sind solche Assoziationen bemerkenswert. Die weitverbreitete Kampagne in Deutschland, die Vielfalt als „bunt“ charakterisiert und damit die Inklusion markierter Kategorien wie Migranten, Frauen und Homosexueller fördern will, gibt ein zusätzliches Zeugnis davon ab, inwieweit derartige Klassifikationen mit sichtbarer Abweichung verbunden werden.

Zum anderen folgen auch Kompetenzzuschreibungen solchen Tendenzen, Kontraste zwischen Personen mit und ohne Migrationshintergrund zu übertreiben und Differenzen innerhalb beider Kategorien zu untertreiben. Die Invalidierung von Personen mit Migrationshintergrund ist auch in diesem Zusammenhang eine mögliche Konsequenz. Eine Integrationsbeamtin der Landesverwaltung berichtete mir von der Einführung eines Sprachscreenings bei der Einschulung, anhand dessen Kinder entweder direkt in die erste Klasse oder zunächst in die Vorschule eingegliedert werden. Ursprünglich allein für Migrantenkinder konzipiert, legte das Instrument ihr zufolge auch unter Kindern ohne Migrationshintergrund wider Erwarten zum Teil erhebliche Defizite offen, sodass es nun unterschiedslos bei allen Kindern durchgeführt wird. Auch im Rahmen eines landesweiten Programms der „interkulturellen Öffnung“, welches Personen mit Migrationshintergrund unter anderem den Zugang zu kommunalen Verwaltungsdiensten erleichtern soll, berichteten Projektmitarbeiter immer wieder davon, wie zu ihrer Überraschung auch Personen ohne Migrationshintergrund die Einführung von amtlichen Leitsystemen, von „einfacher Sprache“ in Behördendokumenten oder von niederschwelligen Angeboten begrüßten. Hinter solchen Überraschungen deuten sich die unterschiedlichen Modi der Generalisierung hinsichtlich markierter und unmarkierter Kategorien an: Während die Charakteristika eines Mitglieds einer markierten Klasse auf die gesamte Kategorie generalisiert werden, aber nicht darüber hinaus, werden Charakteristika von Mitgliedern der unmarkierten Klasse entweder individualisiert oder kategorienübergreifend universalisiert (Brekhus 1998, S. 36; Zerubavel 2018, S. 51).Footnote 4 So neigt man innerhalb der Verwaltung dazu, weit verbreitete Probleme mit undurchdringbaren Bürokratien als spezifische Probleme von Migranten zu konstruieren und ist dann verblüfft, wenn sich bei entsprechenden Gegenmaßnahmen herausstellt, dass ähnliche Schwierigkeiten auch bei Nichtmigranten keine Einzelfälle sind.

Nicht zuletzt aus diesem Grunde werden Differenzen, die auf vergleichsweise weniger markierten sozioökonomischen Unterschieden beruhen, voreilig als Ausdruck des weitaus salienteren Merkmals Migrationshintergrund gewertet. Evaluative Hierarchien von Statusgefällen heften sich damit allzu leicht an die eigentlich nominale Klassifikation des Migrationshintergrundes an. Der klassifikatorisch markierte und damit implizit ethnisierte Migrationshintergrund ist in diesem Zusammenhang „leichter zu denken als Klasse“ (Brubaker et al. 2004, S. 46). Hinter Marxens „falschem Bewusstsein“ mag sich so weniger ein ideologischer als vielmehr ein kognitionspsychologischer Effekt verbergen. Der evaluative Überschuss, der solchen markierten Klassifikationen entspringt, kann dann auch bei wohlmeinenden Fürsprechern eine implizite Abwertung zufolge haben, die sich etwa in Tendenzen zur Infantilisierung offenbart. Ein Indiz dafür liefert ein Integrationsbericht aus Stadthausen, der über die Ergebnisse eines Workshops für Migrantinnen zur Vermeidung von Unfällen im eigenen Haushalt berichtet. Die Workshopteilnehmerinnen hätten den Rückmeldungen zufolge die Informationen sehr interessant gefunden, „aber nicht neu“.

5 Vergleich und Bewertung: Defizite als Defizienz

Das Integrationsmonitoring arbeitet in erster Linie mit Vergleichen zwischen Personen mit und Personen ohne Migrationshintergrund hinsichtlich sozialstatistischer Parameter. Diskrepanzen zwischen beiden Segmenten zeigen hier einen Bedarf für integrationspolitische Maßnahmen an, die einen statistischen Aufschluss der Personen ohne Migrationshintergrund zu den Personen mit Migrationshintergrund herbeiführen können. Die Zusammenstellung solcher Indikatoren hat den unintendierten Nebeneffekt, die Bevölkerungsgruppe mit Migrationshintergrund in ein insgesamt eher negatives Licht zu stellen.Footnote 5 Auch darüber sind sich die Verwaltungsbeamten selbst völlig im Klaren. Wie ein Verantwortlicher in Stadthausen kommentierte, „SGB II, Schulabbrecher, alles negativ behaftet“. So gibt es immer wieder Versuche seitens der Konstrukteure des Monitorings, solche evaluativen Überschüsse durch Indikatoren auszubalancieren, die den Migrationshintergrund eher positiv beleuchten. Allerdings stellen die Beamten selbst fest: „Schwächen zu messen ist grundsätzlich leichter als Stärken“, wie es der Stadthausener Abteilungsleiter formulierte. So sei diese einseitige „Defizitorientierung“, wie es selbstkritisch heißt, auch von außen immer wieder bemängelt und auf positive Beispiele der Integration aufmerksam gemacht worden. Allerdings verschwänden solche Erfolgsgeschichten den verantwortlichen Statistikern zufolge in der Regel im statistischen Mittel oder seien über die Indikatorik erst gar nicht zu erfassen. Zwar bekennen sich die verschiedenen Integrationsabteilungen inzwischen explizit zu einer „Ressourcenorientierung“, die gerade auch die „Bereicherungen“ durch Migranten unterstreichen will. Dies geschieht allerdings stärker auf der Ebene eines parallel zu den Statistiken laufenden Neben- oder gar Gegendiskurses (dazu Petzke 2021). Der Überschuss einer negativen Bewertung im Zuge des statistischen Vergleichs ist durch die Statistik selbst indes kaum einzufangen. Tatsächlich befürchten einige Integrationsbeamte dann auch, dass die von ihnen publizierten Daten politisch instrumentalisiert werden könnten. So bekannte einer von ihnen auf einem interkommunalen Netzwerktreffen von Integrationsbeamten, er warte immer noch darauf, dass jemand aus dem rechten Sektor ihnen das irgendwann „um die Ohren haut“.

Die einhellig negative Einfärbung der Kategorie Migrationshintergrund durch den statistischen Vergleich wird durch mindestens dreierlei Faktoren gestützt, die ich im Folgenden erläutern will. Sie liegen in den Eigenlogiken des statistischen Ressorts; in der politischen Logik der Integrationssteuerung; und schließlich in dem kulturellen Bedeutungshorizont metrischer Vergleiche.

5.1 Die Eigenlogik des statistischen Ressorts

Wie oben erläutert, folgt die Zusammenstellung der Indikatoren im Integrationsmonitoring keiner strikten operationalen Definition. Vielmehr ist die jeweilige Kompilation das Resultat eines eher induktiven Prozesses; „man orientiert sich an dem, was da ist“, wie es die Hauptverantwortliche für die statistische und wissenschaftliche Gestaltung des Monitors in Westlanden formulierte. Etwaige inhaltliche Restriktionen liegen dabei nicht vor. Auch auf Bundesebene sind es vor allem rein statistische Erwägungen, die die Auswahl bestimmen, etwa ob sich mit den Indikatoren Zeitreihen bilden lassen. In Stadthausen hat man sich zwar bewusst gegen Kriminalitätsstatistiken entschieden. Auch war man zunächst hinsichtlich Daten zu Transferzahlungen und Hartz-IV-Empfängern zögerlich, bis man sah, dass andere Gemeinden solche Zahlen durchaus publizierten. Gleichwohl war mein Eindruck im Gespräch mit dem verantwortlichen Statistiker, dass die bloße Tatsache der Verfügbarkeit eines Indikators mögliche Bedenken leicht überstrahlte. So wurde ein Indikator zur Fertilitätsrate der Frauen in den jeweiligen Bevölkerungssegmenten erst dann nicht mehr fortgesetzt, als dessen Bedeutung für Integration von Akteuren aus dem Umfeld des Integrationsamtes infrage gestellt wurde. Und im Interview merkte der Statistiker beim Durchgang durch das Monitoring gelegentlich an, dass es in Bezug auf den jeweiligen Indikator bislang „keine Proteste“ gab. Aus statistischer Perspektive scheint folglich das Kriterium der Messbarkeit ein Eigenrecht zu haben, dem sich inhaltliche Erwägungen unterordnen. Auch Surveys, die zu ganz anderen Zwecken von der Stadt durchgeführt wurden, etwa zur Mediennutzung, werden auf potenziell verwendbare Items abgesucht. Die Indikatorenkataloge expandieren somit recht unkontrolliert.

Die Monitore stützen sich insbesondere auf der kommunalen Ebene stark auf die amtliche Statistik, da SOEP, ALLBUS und Mikrozensus hier nicht aussagekräftig sind. Entsprechend haben die Indikatoren insgesamt betrachtet einen starken Akzent auf sozialstrukturellen Daten, etwa Arbeitslosigkeit, Bildung, Wohnsituation etc. Auch auf den anderen Regierungsebenen sind solche „harten“ Daten in ungleich höherem Maße disponibel.Footnote 6 Angesichts der Tatsache, dass Personen mit Migrationshintergrund häufiger als Personen ohne Migrationshintergrund aus niedrigeren Soziallagen stammen, überrascht es folglich nicht, dass entsprechende Vergleiche auf diesen Dimensionen die erstere Gruppe als durchweg defizitär daherkommen lassen.

Integrationsbeamte hadern durchaus mit dieser negativen „Stereotypisierung“, die sich im Zuge solcher Vergleiche unweigerlich einstellt. Sowohl in Stadthausen als auch Westlanden finden sich gar Stimmen, die deutlich ihre Skepsis gegenüber dem Monitoringunterfangen zum Ausdruck brachten. Auf der Seite der Statistiker war demgegenüber jedoch eher ein wissenschaftliches Detachement zu spüren, das sich von den moralischen oder praxisbezogenen Folgen solcher Vergleichsstatistiken eher unberührt zeigte. So teilte mir eine Integrationsbeamtin aus Westlanden mit, dass sie ihre Sorge hinsichtlich der Kategorien und Indikatoren des Öfteren der Forschungsstelle vermittelt habe. Dort sehe man zwar das Problem, aber eher auf einer „akademischen Ebene“ und verweise auf die eingeschränkten Möglichkeiten der Datenlage. Seien die Daten erst einmal aus deren Händen, so die Wahrnehmung der Integrationsbeamtin, gelte die Einstellung: „Macht damit, was ihr wollt.“

Von statistischer Seite ist man folglich davon getrieben, was man messen kann, nicht was man messen sollte. Angesichts der Dominanz sozioökonomischer Parameter in den verfügbaren Daten setzt man damit ein Mosaik zusammen, das die Person mit Migrationshintergrund als eine Entität porträtiert, die im Vergleich mit der Person ohne Migrationshintergrund in jeglicher Hinsicht defizient ist.

5.2 Die politische Logik der Integrationssteuerung

Neben den statistischen Eigendynamiken tragen auch politische Logiken zu solchen negativen Bedeutungsüberschüssen bei. So ist das Monitoring in einer Gesamtperspektive der wohlfahrtsstaatlichen Intervention eingebettet. Das allein begründet bereits einen naheliegenden Bias gegenüber Indikatoren, die einen politischen „Handlungsbedarf“, wie es unter den Beamten heißt, anzeigen. Eine Fußnote im Westlandener Integrationsmonitoring gibt davon ein beredtes Zeugnis. Die Autoren führen eine Rechtfertigung dafür an, warum ein von der länderoffenen Arbeitsgruppe empfohlener Indikator für den Durchimpfungsgrad unter Kindern mit und ohne Migrationshintergrund nicht ins eigene Monitoring aufgenommen wurde. Dieser Indikator habe eine eingeschränkte Aussagekraft, so heißt es dort, weil Kinder mit Migrationshintergrund tatsächlich einen höheren Durchimpfungsgrad aufwiesen. Im Interview bestätigte mir die Hauptverantwortliche für das Monitoring, dass der Indikator bei umgekehrten Verhältnissen durchaus von Interesse gewesen wäre.

Diese Präferenz für Indikatoren, die Handlungsperspektiven eröffnen, zeigt sich ebenso deutlich in den Integrationsindikatorenberichten auf der Bundesebene. Letztere verstehen sich auch als eine „Erprobung“ von Indikatoren auf ihre generelle Eignung für das Integrationsmonitoring. Entsprechend finden sich dort ausführliche Diskussionen der Parameter, die schließlich in eine Empfehlung münden, ob diese jeweils in der Zukunft weiterzuführen sind. Aufschlussreich ist dabei die Diskussion des Indikators „Quote der regelmäßigen Raucherinnen und Raucher“. Die Autoren zeigen hier anhand multivariater Verfahren auf, dass bei gleichem sozialstrukturellen Hintergrund Personen mit Migrationshintergrund tatsächlich weniger rauchen als Personen ohne Migrationshintergrund. Dies führt zu der Beurteilung: „Der Indikator wird als nicht aussagekräftig erachtet. Zudem wäre nach Erkenntnissen aus der weiterführenden Analyse eine Angleichung der Raucherquoten von Personen mit Migrationshintergrund an die Gesamtbevölkerung kein Fortschritt, sondern eine Verschlechterung. Eine Streichung wird daher empfohlen“ (Beauftragte für Migration, Flüchtlinge und Integration 2009, S. 119). Hierbei ist zu beachten, dass die Berücksichtigung von Kontrollvariablen den Zusammenhang von Migrationshintergrund nicht etwa verschwinden lassen, sondern ihn vielmehr umkehren: So haben Personen mit Migrationshintergrund ein „signifikant geringeres ‚Risiko‘“ (Beauftragte für Migration, Flüchtlinge und Integration 2009, S. 119) zu rauchen als Personen ohne Migrationshintergrund. Allem Anschein nach herrscht ein implizites Einverständnis darüber, dass Vorteile von Personen mit Migrationshintergrund gegenüber Personen ohne Migrationshintergrund keine integrationspolitische Bedeutung haben und damit Indikatoren, die solche Vorteile aufzeigen, keine relevanten Informationen für ein Integrationsmonitoring liefern.

Diese Präferenz für negative Diskrepanzen aus der Sicht der Personen mit Migrationshintergrund wird seitens der gewählten Politiker noch weiter verstärkt. Trotz aller Bedenken schätzen Integrationsbeamte den Integrationsmonitor nicht zuletzt deshalb, weil er gegenüber Politikern mit Haushaltshoheit eine überzeugende Kraft in Budgetverhandlungen entfaltet. Wie eine Beamtin aus Stadthausen erläuterte,

ist [es] viel leichter auch bestimmte Projekte, z. B. im politischen Raum, einfach anzustoßen und durchzubringen, weil man eine Argumentationsgrundlage schwarz auf weiß hat. Das macht es leichter …, wenn ich sagen kann, also im Monitoring ist ganz klar zu sehen, der Besuch der Kindergartenkinder mit Migrationshintergrund, die Quote ist unheimlich niedrig, wir müssen was dafür tun.

Solche Disparitäten signalisieren den Politikern den beschworenen Handlungsbedarf und legitimieren damit die Ressourcenausstattung der Integrationsabteilungen. Das allein liefert einen erheblichen Anreiz dafür, solche negativen Abstände zwischen Personen mit und ohne Migrationshintergrund in der Indikatorik herauszustellen. Hinweise auf diese Dynamik fanden sich auch auf der komplementären Seite der politischen Vertreter. Auf Nachfrage, nach welchen Kriterien typischerweise über die Freigabe von Fördermitteln entschieden wird, nannte mir ein Mitglied des Ausschusses für Integration das Vorhandensein einer „spezifischen Problemstellung“, was für ihn so viel bedeutete wie „wenn man offensichtlich irgendwo ein Defizit sieht“.

Politische Handlungslogiken beeinflussen den Akzent auf Vergleiche mit eher negativen Konnotationen auch in indirekter Weise. Eine der Verantwortlichen für das Integrationsmonitoring auf der Bundesebene berichtete, dass der Schwerpunkt nicht zuletzt deshalb auf strukturellen Parametern liegt, weil hier die Bundesregierung auch tatsächlich Zuständigkeit und Handlungsspielräume hat. Allerdings sind es genau diese sozialstrukturellen Parameter, die Personen mit Migrationshintergrund eher in ein schlechtes Licht rücken, da in diesem Segment Personen niedriger sozialer Herkunft überproportional vertreten sind. Ein politisches System, dessen Aufmerksamkeit hin zu ebenso objektivierbaren wie politisch bearbeitbaren Problemen gravitiert, weist damit eine inhärente Tendenz zu einer vereinseitigenden Defizitperspektive auf Migrationshintergrund auf.

5.3 Der kulturelle Bedeutungshorizont metrischer Vergleiche

Bewertungen in der Form von Ratings oder Rankings haben in den letzten dreißig Jahren eine rasante Proliferation erfahren und sind mittlerweile nahezu ubiquitär (Espeland und Sauder 2007, S. 1 f.; Esposito und Stark 2019, S. 3 f.; Heintz 2019, S. 50). Es handelt sich dabei um Vergleiche, die „das Vergleichskriterium … als Qualitäts- oder Leistungsindikator interpretieren und die Vergleichseinheiten entlang dieses Maßstabes in eine Wertungsfolge bringen“ (Heintz 2019, S. 53). Solche Evaluationsformate finden sich mittlerweile in jeglicher gesellschaftlicher Lebensordnung, sei es in der Wissenschaft in der Form von Hochschulrankings, Impact-Factors oder wissenschaftlicher Auszeichnungen; in der Gastronomie und dem weiteren Dienstleistungssektor in der Form von Restaurantführern, Bewertungsplattformen oder Warentests; in der Kunst mit ihren Bestsellerlisten, Hitparaden oder Kultur- und Literaturpreisen; und in der Weltpolitik in der Form der vielfältigen Länderindizes, die Dimensionen wie Wohlstand, Kindersterblichkeit oder Achtung von Menschenrechten quantifizieren. Man kann hier also von einer „Ausweitung des Bewertungshorizonts in der Gegenwartsgesellschaft“ (Vormbusch 2019) oder von einem „Zeitalter … eines Superlativs: gut – besser – am besten“ (Heintz 2019) sprechen.

Eine solche Allgegenwart der Bewertungen lässt auf eine parallel verlaufende kulturelle Modellierung von entsprechenden Subjektivitäten schließen. In ihrer historischen Studie zu Quantifizierungspraktiken in Nordamerika spricht Patricia Cline Cohen (1982) in diesem Sinne von einer wachsenden und durchschlagenden „numeracy“ unter der Bevölkerung, d. h. der Ausprägung und Verbreitung von Lese- und Schreibkompetenzen im Medium der Quantifizierung. In analoger Weise schlage ich vor, im Hinblick auf das in den letzten Dekaden ausgreifende Bewertungsparadigma von einem Pendant der „evaluacy“ auszugehen: einer Kompetenz, aber auch Disposition, Vergleiche mit evaluativen Bedeutungen auszustatten oder auf solche hin abzusuchen.

Angesichts solcher Dispositionen ist zu erwarten, dass evaluative Konnotationen auch in einen rein sachlichen Vergleich „hineingelesen“ werden. Kulturellen Objekten, zu denen die in den Integrationsmonitoren verwendeten Formate statistischer Vergleiche gehören, ist eine Multivokalität eigen (Griswold 1987; McDonnell 2010). Sie bieten Affordanzen für verschiedene, wenn auch nicht beliebige Verwendungen und Lesarten, die sich über ein Spektrum vom Intendierten bis hin zum Unintendierten erstrecken (McDonnell 2010, S. 1807). Die aus dem Umgang mit diesen Objekten hervorgehenden Bedeutungen resultieren damit aus den dem Gegenstand inhärierenden Ambiguitäten und Konnotationen auf der einen Seite und subjektiven Auslegungshorizonten und inkorporierten Praxismustern auf der anderen Seite. „Those experiencing the cultural object – along with their presuppositions, their perceptive conventions, their cognitive categories, their concerns, their ideas, their ‚doxa‘...and their ‚schema‘ [...] – interact with the symbolic and formal properties of the object to produce meaning, the meaning for them, there, then“ (Griswold 1987, S. 1081).

Rein sachliche Vergleiche können solche evaluativen Auslegungen durchaus entmutigen, indem sie die Daten in der Präsentation gegensinnig ordnen. So lässt sich Ländervergleichen (etwa hinsichtlich des Bruttoinlandsprodukts) eine alphabetisierte Darstellung unterlegen, statt eine in der Vergleichsdimension auf- oder absteigende Rangordnung (vgl. Heintz 2019, S. 53 f.). Diese Möglichkeit besteht bei dem lediglich zweistelligen Vergleich zwischen den Bevölkerungssegmenten mit und ohne Migrationshintergrund allerdings nicht. Die Suggestion von Leistungs- oder Rangvergleichen und damit von Unter- bzw. Überlegenheit lässt sich im Integrationsmonitoring somit kaum vermeiden. Erschwerend kommt hinzu, dass die Indikatorik überwiegend auf statusrelevante Variablen wie Bildung, Wohnsituation etc. zurückgreift.

Tatsächlich fallen auch die Integrationsbeamten, die für solche unintendierten Konnotationen durchaus sensibel sind, selbst gelegentlich solchen habituell gesteuerten „Einspurungen“ in evaluative Auslegungskonventionen zum Opfer. Ein Abteilungsleiter eines Integrationsamtes in einer unweit von Stadthausen gelegenen Großstadt berichtete mir entsprechend von seinen diskurshygienischen Bemühungen innerhalb der Behörde, die sich einschleichenden evaluativ-moralischen Momente in der offiziellen Interpretation der Daten zu neutralisieren:

Ich achte immer sehr da drauf – auch bei meinen Mitarbeitern – dass wir dann dies Vokabular ordentlich verwenden, dass wir nicht von schlecht oder gut und sowas sprechen, sondern von hoch und niedrig, ja, und sowas. Dass man da sich nicht verfängt, ja, so dann auch so in vorschnellen Bewertungen von Sachverhalten. Also dass, was weiß ich was, wenn Leute sagen: das ist ein guter Wert, oder ein schlechter Wert oder sonst was … Dann streich ich das immer raus und sag: Nein, das ist kein guter, das ist ein hoher Wert oder ein niedriger Wert. Und ob der gut oder schlecht ist, das ist dann nochmal eine weitere Frage … Dass man eben diese Bereitschaft, das immer in so Bewertungsraster gleich einzubauen, ein bisschen verringert, und ein bisschen vorsichtig ist.

Die eigentlich rein sachlich angelegten Vergleiche zwischen Personen mit und ohne Migrationshintergrund produzieren damit durch das Zusammenspiel statistischer und politischer Eigenlogiken und kultureller Bedeutungs- und Auslegungshorizonte einen Sinnüberschuss, der evaluative und moralische Konnotationen nahelegt.

6 Operationalisierung und Bewertung: Integration als dichter Begriff

Das Integrationsmonitoring operationalisiert Integration in seinen Vermessungen durch eine recht lose Zusammenstellung verfügbarer Indikatoren aus den Quellen der amtlichen Statistik, des SOEP, des Mikrozensus, unabhängiger Surveys usw. Entsprechend der unterschiedlichen Quellenlage auf den verschiedenen Regierungsebenen, aber auch aufgrund unterschiedlicher personeller Kapazitäten in der Betreuung und Entwicklung des Monitors, weisen die Indikatorenkataloge in Umfang und Inhalt unter den verschiedenen Integrationsämtern zum Teil deutliche Differenzen auf. Allen Monitoren ist jedoch gemein, dass die Indikatorik – im Sinne des ausdrücklichen Ziels einer Angleichung der Lebenschancen – „Lebenslagen“ abbildet. Damit sind aber unweigerlich Aspekte der „Lebensführung“ im Sinne Webers und folglich „ethische“ Gesichtspunkte berührt.

Tatsächlich lässt sich die Verwicklung von Werturteilen und Fakten bei der Operationalisierung des Begriffs der Integration nicht vermeiden. Man hat gute Gründe zu behaupten, dass es sich bei Letzterem um ein „thick concept“ im Sinne Bernard Williams’ (1985) handelt.Footnote 7 Williams grenzt dichte Begriffe von dünnen Begriffen („thin concepts“) ab. Während letztere ein Vokabular für rein evaluative Urteile bilden (z. B. „gut“ vs. „böse“), sind bei dichten Begriffen deskriptive und evaluative Elemente untrennbar miteinander verwoben. Zu solchen Begriffen zählen etwa Grausamkeit, Großherzigkeit, Mut, Feigheit, (Un‑)Dankbarkeit oder Ausbeutung. Die Anwendung dieser zweifelsohne wertenden Begriffe impliziert immer zugleich beschreibende Aspekte. Der richtige Gebrauch dieser Begriffe setzt also das Vorhandensein bestimmter objektiver Tatsachen voraus, etwa die willentliche Zufügung von Leid, die Erduldung eines eigenen Nachteils zugunsten anderer, eine Herausforderung, der man sich trotz persönlicher Risiken stellt oder nicht stellt, eine Gabe, auf die (k)eine Gegengabe folgt, oder die Inanspruchnahme der Früchte fremder Arbeit ohne angemessene Kompensation. Wo solche Weltverhältnisse fehlen, macht der Begriff keinen Sinn, ist inapplikabel. (So kann man nicht oder nicht ohne Weiteres sagen, dass es ausbeuterisch ist, sich aus Angst einer Herausforderung nicht zu stellen.) Dabei laufen in der Anwendung solcher dichten Begriffe nicht einfach zwei Operationen parallel, die sich analytisch in eine deskriptive Aussage über einen Sachverhalt einerseits und dessen normative Bewertung andererseits trennen ließen. Es lässt sich etwa das in deskriptiver Hinsicht grausame Element an einer Handlung nicht isolieren, ohne wiederum das Wort „grausam“ oder zumindest ein Synonym mit analogen normativen Implikationen zu verwenden (Putnam 2002, S. 38).

Auch bei dem Begriff der „Integration“ fließen unabhängig von dessen konkreter Operationalisierung normative und deskriptive Elemente im Sinne einer „Dichte“ ineinander. Hinter der Unterscheidung von „integrierten“ oder „unintegrierten“ Zuständen von Individuen oder Bevölkerungssegmenten liegt zum einen ein evaluatives Gefälle. Ein Begriff von Integration, bei der Integration einer Desintegration nicht vorzuziehen wäre, würde sich außerhalb des öffentlichen Integrationsdiskurses bewegen und ein anderes Sprachspiel bedienen.Footnote 8 Zum anderen verbindet sich mit dem Konzept aber auch eine deskriptive Aussage über die Welt und das Verhältnis, das „Integrierte“ zu ihr haben. Jegliche Operationalisierungen von Integration sind damit nicht von normativen Implikationen freizuhalten, sie spinnen gewissermaßen den deskriptiven Faden, der sich mit dem positiven Wert der Integration im Stoff eines dichten Begriffs verwebt. Die Sein/Sollen-Differenz kollabiert damit schon in der Konzeptionalisierung des Integrationsmonitors. Tatsächlich lässt sich die gesamte institutionelle Architektonik, die hinter dem Integrationsdiskurs und -unterfangen steht, mit Andrew Abbott (2016, S. 258) als ein „congealed value“ oder „geronnener Wert“ verstehen. Dieser Begriff verleitet auch Abbott (2016, S. 258) dazu, die Differenz von Werturteil und objektiver Erkenntnis zu verwerfen:

Weber’s position [of value freedom] is indefensible, for two reasons. The first and most important is that … the social process itself consists mainly of things that are congealed values. ‚Juvenile delinquency‘ may sound like a scientific term, and of course it may be specifiable in terms of various particular offenses at any given place and time. We can create a scale of empirical items defining a ‚measure‘ of juvenile delinquency. But we know perfectly well that including some things in that category while omitting others is a value process, not a scientific one.

Mit Boltanski und Thevenot (2007) ließe sich auch sagen, dass die Konstrukteure des Integrationsmonitorings unwillkürlich an der Ausarbeitung einer Ökonomie der Wertigkeit oder einem Rechtfertigungsregime arbeiten, mit jeweils eigenen Vorstellungen von Größe und Nichtgröße, von Äquivalenzprinzipien und Rangfolgen oder von Größe verleihenden Aktivitäten. Die Wahl der Indikatorik hat nolens volens unmittelbare Folgen für die Ausgestaltung von Wertigkeitsordnungen; sie ist uno acto sowohl kognitives als auch normatives Urteil. Die Tatsache, dass man zu gewissen Indikatoren statt zu anderen greift, gibt dem Indikator unmittelbar eine ethische Relevanz. Man bemisst mit der so entstehenden Konfiguration an Indikatoren, worauf es ankommt, was „zählt“, wenn man von einem „integrierten“ Leben, und das heißt: von einem „guten“ Leben, reden will. Normative Implikationen entstehen damit also nicht allein durch die jeweiligen Mittelwerte für die Personen ohne Migrationshintergrund, die als zu erreichende „Norm“ für die Personen mit Migrationshintergrund gelten. Sie entstehen in viel fundamentalerer Hinsicht dadurch, dass man manche Dimensionen überhaupt als „wert“ erachtet, in das Monitoring aufgenommen zu werden.

Mit einer derartigen Erhebung von Lebenslagen sind dann aber zugleich implizite Werturteile über Lebensführungen getroffen. Das Koordinatensystem privilegiert ein Modell des guten Lebens, dem es auf dieselben Dinge ankommt wie dem Monitoring (oder den Integrationsbeamten). Alternative Lebensführungen, die möglicherweise nach völlig anderen Dimensionierungen verlangen, die sich also einem anderen Koordinatensystem verpflichtet fühlen, als dem durch die tatsächlich verwendete Indikatorik aufgespannten, werden so invisibilisiert oder kommen im Raster des Monitorings nur noch als negative Abweichungen vom Mittel in den Blick. Die Kompilation der Indikatoren, wie immer sie auch ausfallen mag, hat somit den unintendierten Nebeneffekt, ein spezifisches Modell der „richtigen“ Lebensführung zu propagieren. Es liegt somit im Wesen der Operationalisierung dichter Begriffe, zugleich deskriptiven und normativen Sinn zu entfalten.

7 Schluss

Der vorliegende Beitrag erhellt das Zusammenspiel von Klassifikation, Vergleich, Vermessung und Bewertung. Im Speziellen interessiert er sich dafür, wie die einzelnen Operationen des Klassifizierens, des Vergleichens und Operationalisierens dazu neigen, sich mit evaluativen Momenten aufzuladen und damit unintendierte Bewertungsüberschüsse zu produzieren. Am Beispiel des deutschen Integrationsmonitorings wurde aufgezeigt, wie erstens die Klassifikation von Personen mit Migrationshintergrund als eine „markierte“ Differenz einer Problematisierung des Anomalen gleichkommt; zweitens der Vergleich von Personen mit und ohne Migrationshintergrund Abweichungen in Mängel und evaluative Rangfolgen transformiert; drittens der Begriff der Integration per se deskriptive und evaluative Momente vereint und Operationalisierungen im Zuge seiner Vermessung damit unwillkürlich den Charakter von Wertentscheidungen darüber erhalten, was ein gutes – weil integriertes – Leben konstituiert.

Der Beitrag liefert damit zugleich drei weitere Beiträge. Er führt erstens die Literatur der Science and Technology Studies weiter, indem er auf die Affordanzen und Sinnmomente hinweist, die in den Soziotechnologien der Klassifikation, des statistischen Vergleichs und der empirischen Operationalisierung angelegt sind, aber auch, indem er die kognitionspsychologischen und institutionellen Eigenlogiken herausarbeitet, die solche Affordanzen begünstigen. Damit richtet er sich zugleich an die Literatur zur statistischen Konstruktion von Ethnizitäten und relativiert hier einen jüngeren Befund, der statistische Eigenlogiken exkulpiert und stattdessen auf nationale Repertoires und „policy legacies“ verweist (Elrick und Schwartzman 2015). Und schließlich baut der Beitrag jüngere Ansätze zur Soziologie der Moral aus, indem er zeigt, wie solche Technologien selbst Quelle und Relaisstation moralischer Bewertungen sein können. Er folgt damit auch einem Aufruf, den moralischen Deutungsmustern und -manövern nachzugehen, die sich hinter sozialpolitischen Maßnahmen verbergen (Steensland 2010), weitet dabei aber zugleich den Blick auf die technischen Infrastrukturen aus, die an der Ausgestaltung und Suggestion solcher Deutungsmuster partizipieren.