1 Einleitung

Globally, women’s participation in single or lower houses of national parliament reached 23.4 per cent in 2017, just 10 percentage points higher than in 2000.

In 2013, about 1.25 million people died from road traffic injuries, the leading cause of death among males between 15 and 29 years of age.

In 2016, only 28 per cent of people with severe disabilities collected disability benefits.

(UN Doc. E/2017/66* 2017: Goal 5, No. 9, S. 8; Goal 3, No. 7, S. 6; Goal 1, No. 5, S. 3).

Diese numerischen Informationen finden sich in einem Zwischenbericht zu den Sustainable Development Goals (SDGs)Footnote 1 der Vereinten Nationen (UN). Weltweit aggregierte Zahlen über die Zusammensetzung von Parlamenten, Verkehrstote sowie Transferempfängerinnen oder -empfängerFootnote 2 sind hier nach Geschlecht, Alter und Behinderungsstatus aufgeschlüsselt. Genau darin liegt eine der Besonderheiten der SDGs: Es werden nicht nur quantitative Daten zu den jeweiligen Entwicklungsindikatoren, sondern auch zu verschiedenen Personenmerkmalen erhoben. Unter dem Motto „Leaving No One Behind and Counting the Uncounted“ (Min 2019, S. 2) sollen sogenannte „vulnerable Personengruppen“, wie z. B. Frauen, Personen bestimmter ethnischer Herkunft sowie Menschen mit Behinderungen, in die Datenerhebung inkludiert werden, um den jeweiligen Stand der Entwicklung dann entsprechend aufschlüsseln zu können (OHCHR 2018).Footnote 3

Im Fall der Zusammensetzung von Parlamenten wird offenbar die Geschlechterverteilung als relevant beobachtet und in Form des Frauenanteils „gemessen“. Die hier angegebene Zahl von 23,4 % unterstellt nicht nur eine prinzipielle Vergleichbarkeit der politischen Volksvertretungen weltweit, sondern auch die Existenz einer globalen Personenkategorie: die der Frauen. Frauen aus aller Welt werden damit aufgrund ihrer geteilten Geschlechtszugehörigkeit als kategorial ähnlich behandelt, auch wenn sich ihre Lebenswirklichkeiten aufgrund von wirtschaftlicher Position, Religion oder Gesundheitszustand radikal unterscheiden (vgl. Bennani und Müller 2018). Dabei erwecken diese Zahlen den Eindruck, als seien sie nur die objektive Beschreibung einer Wirklichkeit jenseits der Zahl. Demgegenüber lautet eine der Kernannahmen der Quantifizierungsforschung, dass statistische Daten mittels ihrer selektiven Konstruktionen erst dazu beitragen, diese Wirklichkeit zu erzeugen (vgl. etwa Desrosières 2015; Espeland und Stevens 2008; Heintz 2021). Kulturelle Differenzierungen von Menschen sind also keineswegs fraglos gegebene Objekte, die nur darauf warten, gezählt zu werden, sondern verweisen vor allem im Fall von globalen Personenkategorien auf höchst voraussetzungs- und folgenreiche soziale Herstellungsleistungen (vgl. Heintz 2017; Bennani 2017; Müller 2020). Daher stellt sich die Frage, wie diese globalen Zahlen zu bestimmten Personenkategorien überhaupt zustande kommen oder wie diese Kategorien zählbar gemacht werden und letztlich eine Zahl mit globalem Geltungsanspruch entsteht. Mit dieser Frage legen wir den Fokus auf die kontingenten Prozesse der Herstellung numerischer Daten zu globalen Personenkategorien. Wir gehen davon aus, dass es sich bei der zahlenförmigen Darstellung globaler Personenkategorien um sozial ausgesprochen voraussetzungsvolle Konstruktionsleistungen handelt, die das Ergebnis zahlreicher, eng miteinander verknüpfter Praktiken sind (vgl. auch Supik und Spielhaus 2019b). Die einzelnen Schritte dieses Herstellungsprozesses rekonstruieren wir im Folgenden anhand ausgewählter Beispiele wie „Geschlecht“, „Alter“, „Ethnizität“, „Genderidentität“, „sexuelle Orientierung“ und „Behinderung“ und beziehen uns vor allem auf Dokumente aus dem Umfeld internationaler Organisationen. Mithilfe kontrastierender Fallbeispiele arbeiten wir Gemeinsamkeiten und Unterschiede bei der Quantifizierung der verschiedenen Personenkategorien heraus und verweisen damit gleichzeitig auf die Kontingenz dieser Prozesse.

Wir beginnen unsere Analyse mit einigen grundlegenden Überlegungen zur Bedeutung von zahlenförmigem Wissen und Statistiken für die Konstruktion von Personenkategorien im Allgemeinen und für globale Personenkategorien im Besonderen (Abschn. 2). Vor diesem Hintergrund systematisieren wir die Schritte der Zahlenerzeugung und illustrieren sie anhand verschiedener Beispiele aus internationalen Statistiken (Abschn. 3). Die Darstellung orientiert sich am chronologischen Ablauf der Produktion der Zahlen und bezieht sich zunächst auf die umfangreichen Vorbereitungen, die der Erzeugung von Zahlen vorgelagert ist: die notwendigen Konventionalisierungen und Entscheidungen über Definitionen, Indikatoren, Variablen, ihre Ausprägungen und das Messniveau (Abschn. 3.1). Daran anschließend fokussieren wir die Zahlenerzeugung im engeren Sinne. Wie wird aus heterogenen Einzelbeobachtungen ein Aggregat (Abschn. 3.2)? In einem abschließenden Fazit greifen wir die zentralen Ergebnisse auf und arbeiten theoretische Anschlüsse heraus (Abschn. 4).

2 Zur Quantifizierung von (globalen) Personenkategorien

Amtliche Statistiken, die auf nationalen Volkszählungen oder Zensuserhebungen basieren, sind zentrale Formate gesellschaftlicher Selbstbeobachtung (Brückweh 2015). „How many are we?“ und „‚[w]ho are we?‘ in terms of age, sex, education, labour force status, occupation and other crucial characteristics“ sind dabei zentrale Fragen, die im Zentrum um die Bemühungen stehen, ein „numerisches Profil“ von Nationen und der Welt zu erstellen (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 15). Es geht also nicht nur darum, die (Welt‑)Bevölkerung als Ganze zu vermessen, sondern auch deren personale Differenzierung auf der Grundlage eines Sets vorgegebener Unterscheidungen zu ergründen (zur Differenz zwischen Statistiken und digitalen Beobachtungsformaten vgl. Heintz 2021). Die Herstellung von Bevölkerungsstatistiken ist nicht mehr nur Angelegenheit der nationalen Statistikämter, sondern geschieht spätestens seit der zweiten Hälfte des 20. Jahrhunderts zunehmend unter der Anleitung des Statistical Office der Vereinten Nationen. So werden die Daten entlang internationaler Vorgaben und Standards von den nationalen Statistikämtern der UN-Mitgliedstaaten gesammelt und dann von den UN-Statistikern zusammengeführt (Ward 2004; Heintz 2012, S. 18 ff.). Spätestens seit den 1970er-Jahren gewinnen nichtstaatliche Produzenten von Daten auf nationaler, regionaler und internationaler Ebene an Bedeutung, etwa Nichtregierungsorganisationen, Expertengremien oder internationale Regierungsorganisationen. Diese fokussieren häufig einzelne Personenkategorien in ausführlichen Surveys, um detailliertere Einblicke in die Lebenslagen dieser Menschen zu generieren. Legitimiert werden diese Quantifizierungsbemühungen mit dem Verweis auf evidenzbasierte Politik sowie dem Menschenrechts- oder Antidiskriminierungsdiskurs, in dem es mittlerweile nicht mehr nur um Gleichheit, sondern auch um die Anerkennung kategorialer Differenz geht (OHCHR 2018). Für soziale Bewegungen ist statistische Vermessung vor diesem Hintergrund auch eine politische Ressource (vgl. Didier 2018): Nach dem Motto „[w]hat is counted counts“ kämpfen z. B. panethnische Gruppierungen wie Latinos (Rodríguez-Muñiz 2017) oder Hispanics (Mora 2014), aber auch „Menschen mit Behinderungen“ mehr oder weniger erfolgreich für ihre statistische „Sichtbarmachung“.Footnote 4

Während es aus dieser realistischen Perspektive vor allem darum geht, politisch nutzbares, zahlenförmiges Wissen über vermeintlich präexistente Personenkategorien zu generieren, gehen wir davon aus, dass Personenkategorien durch ihre zahlenförmige Darstellung nicht nur sichtbar, sondern durch diese (mit-)erzeugt, reproduziert und verdinglicht werden: „Numbers help make up people, or … they help build and make visible new statistical communities“ (Mennicken und Espeland 2019, S. 231; vgl. auch Hacking 1986, 2006). Mit dieser Annahme schließen wir an Arbeiten aus dem Umfeld der Quantifizierungssoziologie und an wissenssoziologische Analysen zur Erzeugung von statistischen Kategoriensystemen an, die Statistiken nicht als Datenquelle, sondern als Untersuchungsgegenstand betrachten (vgl. Espeland und Stevens 2008; Vanderstraeten 2006; für einen Überblick auch Diaz-Bone und Didier 2016). Im Folgenden systematisieren wir einige Kernannahmen, die den Rahmen für unsere Analyse bilden, und geben Einblicke in die verwendeten Daten und Methoden.

2.1 Bevölkerungsstatistiken als kontingente Beobachtungssysteme

Als quantifizierte „Beobachtungssysteme“ (Heintz 2021) vollbringen statistische Beschreibungen spezifische Ordnungsleistungen. Durch die Sortierung von Menschen in diskrete Kategorien werden Ähnlichkeiten zwischen den kategorisierten Einheiten betont und innerkategoriale Unterschiede ausgeblendet (Zerubavel 1996). Ganz in diesem Sinne beschreibt Desrosières (2005) statistische Kategorien als „Äquivalenzkonventionen“ – d. h. als das Ergebnis einer Vereinbarung über Kriterien und Verfahren, durch die die soziale Zugehörigkeit eines Einzelnen in eine abstrakte Klasse transformiert wird, deren Mitglieder als vergleichbar gelten. Espeland und Stevens (2008, S. 412) betonen, dass Unterschiedliches durch die Übersetzung in eine geteilte Metrik kommensurabel gemacht wird: „Measures create and reproduce social boundaries, replacing murky variations with clear distinctions between categories of people and things“. Indem Abstufungen und Grauzonen unsichtbar werden, treten Differenzen zwischen Kategorien in den Vordergrund. Diese Differenzen bleiben jedoch immer in ein relationales Gefüge eingelassen.

Dass statistische Beobachtungssysteme keine reinen Abbildungen naturgegebener Unterscheidungen, sondern kontingente Repräsentationen sind, die sich im Zeitverlauf wandeln, wurde in zahlreichen empirischen Studien gezeigt (z. B. für Ethnizität vgl. Lee 1993; Loveman 2014). Die zugrundeliegenden Konventionen sind also zeitlich, aber auch räumlich auf bestimmte, meist national verfasste „Äquivalenzräume“ beschränkt (Desrosières 2005). Allerdings haben soziale Kontexte nicht nur Einfluss auf die Beschreibungspraktiken, sondern Beschreibungspraktiken wirken auch auf soziale Kontexte zurück: „Measurement intervenes in the social worlds it depicts“ (Espeland und Stevens 2008, S. 412). So verweist Hacking (1986, 2006) mit seiner These des „Making up people“ auf die Bedeutung statistischer Analysen für die Etablierung und Verbreitung von Personenkategorien. Er beschreibt die wirklichkeitsgenerierenden Effekte von Statistiken am Beispiel der zunächst von (kriminalistischen und wissenschaftlichen) Experten geschaffenen Kategorien der „Homosexuellen“ und der „Autisten“. Demnach beeinflussen die mit den Kategorien verbundenen Beschreibungen die Subjektpositionen der kategorisierten Personen und können letztlich in einer Art „looping effect“ auch wieder auf die Kategorien selbst zurückwirken und diese verändern (Hacking 2006). Das bedeutet aber nicht etwa, dass es nicht auch schon vorher Menschen mit den entsprechenden Merkmalen gegeben hätte, diese wurden jedoch nicht als Angehörige einer gemeinsamen Kategorie beobachtet und haben sich selbst auch nicht als solche wahrgenommen oder gar politisch organisiert. So formierte sich z. B. die Schwulenbewegung erst in Folge des überraschenden statistischen Befunds aus dem Kinsey-Report, demzufolge rund 10 % der (weißen) Männer regelmäßig sexuelle Kontakte zu anderen Männern pflegten (Espeland und Stevens 2008, S. 413 f.).

2.2 Herstellung von Zahlen

Statistiken bilden Personenkategorien nicht nur ab, sondern tragen auf verschiedene Weise auch zu deren Etablierung, Reproduktion und Wandel bei. Die Zahlenförmigkeit der Darstellungen garantiert dabei nicht nur einen hohen Grad an Komplexitätsreduktion, sondern suggeriert auf spezifische Weise Faktizität (Heintz 2010; Vollmer 2007). Sie vermitteln den Eindruck, eine Realität abzubilden, „die außerhalb von ihnen liegt und durch sie erst sichtbar gemacht wird“ (Heintz 2010, S. 170). Tatsächlich entsprechen Daten jedoch nicht „objektiven“ Gegebenheiten, sondern werden erst im „Akt des Aufzeichnens“ (Ernst 2002, S. 159) generiert und sind damit sozusagen „epistemisch vorgeformt“ (Heintz 2012, S. 14). So ist bereits die scheinbar einfache Operation des Zählens höchst voraussetzungsvoll (Mayntz 2017) und erfordert zahlreiche Bearbeitungs- und Transformationsschritte, die wiederum auf bestimmten Vorentscheidungen und einem Vorwissen bezüglich der verwendeten Konzepte, Erhebungsmethoden und Taxonomien basieren (vgl. Robson 1992, S. 688 ff.). Am Ende stehen dann statistische Daten im Medium von Zahlen, die jedoch auch noch einmal in Form gebracht und bewertet werden müssen, um schließlich als „Informationen“ betrachtet zu werden, auf deren Basis dann z. B. politische Entscheidungen getroffen werden können (vgl. Ernst 2002).

Once quantification procedures are encoded and become routine, their products are objectified. They tend to become ‚reality‘ in an apparently irreversible way. The initial conventions are forgotten, the quantified object is naturalized (Desrosières 2015, S. 333).

Zum genauen Ablauf dieser Teilprozesse bei der Fabrikation statistischer Daten liegen bislang nur wenige detailliertere Analysen vor.Footnote 5 So hat sich z. B. die französische Konventionensoziologie um eine Rekonstruktion der „statistischen Kette“ bemüht (Desrosières und Thévenot 2002) und einige jüngere Arbeiten rücken die vielfältigen Praktiken der Herstellung statistischer Daten ins Zentrum (vgl. Holtrop 2018; die Beiträge in Supik und Spielhaus 2019a und Cakici et al. 2020).

2.3 Fallauswahl, Datenmaterial und Methode

Im Folgenden wird die Quantifizierung globaler Personenkategorien an verschiedenen Fallbeispielen vergleichend analysiert. Damit setzen wir zwei spezifische Schwerpunkte: Zum einen rücken wir den Sonderfall der Herstellung internationaler Statistiken zu Personenkategorien ins Zentrum. Zum anderen erlaubt der Vergleich unterschiedlicher Beispiele, übergreifende Trends wie auch Unterschiede zu identifizieren. Wir nehmen sowohl schon lange institutionalisierte Merkmale in den Blick („Alter“ und „Geschlecht“) als auch relativ „junge“ Kategorien, die noch nicht zum Kernrepertoire statistischer Erhebungen gehören („sexuelle Orientierung“ und „Geschlechtsidentität“). Dabei verfolgen wir nicht den Anspruch, vollständige Fallanalysen vorzulegen. Die Beispiele dienen eher als Illustrationen verschiedener Praktiken und eröffnen einen Möglichkeitsraum, innerhalb dessen sich Kontingenzen und Differenzen im Prozess der Zählbarmachung von Personenkategorien herausarbeiten lassen.

Ausgangspunkt unserer Analysen sind nicht die bereits produzierten internationalen Statistiken, sondern vielmehr die Prozesse, die dem zahlenförmigen Endprodukt vorausgehen. Diese rekonstruieren wir ausgehend von Handbüchern und Empfehlungen zur Durchführung der Datenerhebung und -verarbeitung, die von nationalen und internationalen Statistikämtern und Wissenschaftlern verfasst wurden. Darüber hinaus beziehen wir uns auch auf UN-Dokumente zu den zugrundeliegenden Konzepten und Kategorien (u. a. Resolutionen, Berichte und Working-Papers verschiedener UN-Organe). Das Datenmaterial wurde mithilfe einer computergestützten Dokumentenanalyse kodiert und ausgewertet. Jedoch haben wir die Praktiken der beteiligten Akteure nicht ethnografisch beobachtet. Insofern entspricht unsere Herangehensweise weniger einer klassischen mikrosoziologischen Perspektive. Vielmehr handelt es sich um eine wissenssoziologisch inspirierte Detailanalyse der in den untersuchten Dokumenten beschriebenen Prozesse und Praktiken, mit denen Personenkategorien zählbar gemacht werden und die schließlich zur Herstellung von Zahlen mit globalem Geltungsanspruch führen. Wie unter einem Mikroskop sollen die üblicherweise unsichtbaren einzelnen Schritte dieses Prozesses der Quantifizierung sichtbar gemacht werden. Dabei soll unsere Analyse weder als Fundamentalkritik an den Methoden der deskriptiven Statistik noch als Suche nach den besten Erhebungsinstrumenten missverstanden werden. Ziel unseres Beitrags ist es vielmehr, der Herstellung statistischer Daten zu verschiedenen Personenkategorien genauer auf den Grund zu gehen, um Gemeinsamkeiten, aber auch Unterschiede bei der Messbarmachung von Personenmerkmalen herauszuarbeiten.

3 Soziale Praktiken der Zahlenerzeugung

Quantifizierungsprozesse können in vier Phasen unterschieden werden: „preparing to count“, „counting and collecting data“, „interpreting“ und „governing with numbers“ (Supik und Spielhaus 2019b, S. 457). Im Zentrum unserer Analysen stehen die ersten beiden Teilschritte, die die Konstruktion von Kategorien und deren Operationalisierung (Abschn. 3.1) sowie die Herstellung von Zahlen im engeren Sinne betreffen (Abschn. 3.2). Für eine bessere Übersicht über die verschiedenen Fallbeispiele haben wir eine tabellenförmige Kurzbeschreibung erstellt (siehe Tab. 1).

Tab. 1 Übersicht Operationalisierung globaler Personenkategorien. (eigene Darstellung)

3.1 „Preparing to count“: Konventionen und Operationalisierung

Vor allem im Fall globaler Personenkategorien ist die Definition oder Konstruktion von Kategorien ein äußerst komplexer Prozess, da kulturelle Grenzen überwunden, Kategorien aus ihren lokalen und nationalen Kontexten herausgelöst und ihre Bezeichnungen sowie Ausprägungen übersetzt und standardisiert werden müssen. Zudem müssen standardisierte Erhebungsverfahren entwickelt werden, die global anschlussfähig sind. Während es zu den Definitionen der Personenkategorien häufig Vorgaben aus dem internationalen politischen Diskurs gibt, z. B. aus UN-Deklarationen oder Menschenrechtsverträgen, wird die Entscheidung über deren Operationalisierung eher im Kontext spezialisierter Gremien wie der UN Statistics Division oder den zahlreichen sogenannten City-Groups von Statistikern getroffen (vgl. Ward 2004).

3.1.1 Zur Definition von (globalen) Personenkategorien

Die hier behandelten Personenmerkmale, wie z. B. „Geschlecht“, „Ethnizität“ oder „Behinderung“, gelten alltagsweltlich als feststehende, naturgegebene und im Körper verankerte Merkmale von Personen. Im Unterschied zu ganz offensichtlich menschengemachten statistischen Kategorien, wie z. B. Berufsklassifikationen, wird im Fall der Personenkategorien deren Existenz häufig als selbstverständlich vorausgesetzt und der wirklichkeitsgenerierende Effekt von Statistiken nicht beachtet (vgl. Bowker und Star 1999, S. 229). Welche Personenmerkmale für die Bevölkerungsstruktur als relevant erachtet und wie sie in der amtlichen Statistik erhoben werden, ist jedoch historisch und kulturell variabel (Starr 1992). Einen guten Überblick gibt das von der UN erstmalig 1958 herausgegebene Handbuch für die Erstellung von Zensuserhebungen der Mitgliedstaaten, die Principles and Recommendations for Population and Housing Censuses (im Folgenden kurz „UN-Zensus-Handbuch“). Ziel dieser Orientierungshilfe war und ist es, im Namen des World Population Census Programme internationale Standards für die Durchführung nationaler Volkszählungen zu entwickeln und die Vergleichbarkeit der Daten zu gewährleisten (vgl. UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. III ff.; UN Doc. ST/STAT/SER.M/27 1958, S. 1). Interessanterweise galten 1958 nur wenige sogenannte „personal“ oder „cultural characteristics“ als zentral und wurden zur Erhebung im Zensus empfohlen, unter anderem „sex“, „age“, „citizenship“ und „ethnic or national characteristics“ (vgl. UN Doc. ST/STAT/SER.M/27 1958, S. 9). Im Lauf der Jahre kamen dann jedoch weitere Kategorien hinzu, wie z. B. „Religion“ (ab 1970), „Behinderung“ (ab 1997) und „Indigene Völker“ (ab 2008).

„Geschlecht“ und „Alter“ gelten laut UN (2017) als „the most basic of all demographic variables“ und zielen auf die Erfassung der „age-sex structure of population“ ab (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 199).Footnote 6 Dabei werden beide Merkmale als selbstverständlich, naturhaft und universell gegeben verstanden, sodass sie nicht über Indikatoren operationalisiert, sondern direkt abgefragt oder sogar nur „erkannt“ werden sollen (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017; vgl. Abschn. 3.2). Im Fall von Alter liefern die Statistiker immerhin noch eine Definition: „Age is the interval of time between the date of the birth and the date of the census, expressed in completed solar years“ (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 200). Dennoch scheint ein gemeinsames Verständnis, auch über kulturelle Grenzen hinweg, nicht selbstverständlich zu sein. So wird in den Erläuterungen auf „cultures where there is little awareness of individual age and no interest in it“ (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 201) verwiesen. Auch impliziert die Definition ein lineares Zeitverständnis und eine Zeitrechnung nach dem Sonnenkalender, die keineswegs universell gelten (vgl. Zerubavel 1982). Aus der Perspektive der Statistiker verweist die Erhebung des Alters dennoch vor allem auf ein technisches Problem, und es finden sich auf immerhin zwei Seiten entsprechende Empfehlungen und methodische Erläuterungen für die Erhebung und die Umrechnung in den Sonnenkalender (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 200 f.).

Geschlechtszugehörigkeit gilt als ebenso selbstverständlich, aber offenbar einfacher zu erheben, denn in den Empfehlungen der UN-Statistiker heißt es dazu nur: „The sex of every individual should be recorded on the census questionnaire …“ (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 199). Geschlechtszugehörigkeit soll also einfach „aufgezeichnet“ werden, weil sie offenbar als für alle sicht- und erkennbar vorausgesetzt wird. Entsprechend gibt es auch weder Definitionen oder Empfehlungen zur Erhebung, es wird lediglich auf die Bedeutung der Variable hingewiesen: „The disaggregation of data by sex is a fundamental requirement for gender statistics“ (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017). Diese Differenzierung von Geschlecht in „sex“ (biologisches) und „gender“ (soziales Geschlecht), die aus der sozialwissenschaftlichen Geschlechterforschung der 1970er-Jahre stammt (vgl. klassisch Kessler und McKenna 1978), wird hier jedoch weder weiter erläutert noch werden Debatten zur sozialen Konstruktion der biologischen Zweigeschlechtlichkeit angesprochen. Im Gegenteil, in dem Statistik-Handbuch der UN Integrating a Gender Perspective into Statistics wird daran festgehalten, dass „biological differences between women and men … are fixed and unchangeable and do not vary across cultures or over time“ (UN Doc. ST/ESA/STAT/SER.F/111 2016, S. 2).Footnote 7 Rekurriert wird hier auf eine Reihe alltagsweltlicher Hintergrundannahmen, so z. B. die Unterstellung, dass es nur zwei Geschlechter gebe, dass die Geschlechtszugehörigkeit naturgegeben und gut erkennbar sei und dass die Geschlechterunterscheidung weltweit eine relevante Differenzierung der Bevölkerung repräsentiere (vgl. Kessler und McKenna 1978, S. 113; Garfinkel 1967, S. 116 ff.). Diese Annahmen spiegeln sich auch in den durchgehenden Vergeschlechtlichungen der gesamten Zensus-Empfehlungen der UN, in denen z. B. die Beziehungen von Familien und Haushaltsmitgliedern geschlechtsdifferenziert beschrieben werden („father“, „mother“, „husband“, „wife“) (vgl. Westbrook und Saperstein 2015, S. 549 ff.). Auf diese Weise werden implizit Vorstellungen von Heteronormativität sowie einer einheitlichen gesellschaftlichen Organisationsform in Familien als selbstverständlich angenommen und kulturunabhängig universalisiert (vgl. kritisch Morphy 2016).

Versuche, auch sexuelle Orientierungen und geschlechtliche Identitäten jenseits dieser Normen sichtbar zu machen, haben es bislang noch nicht in das UN-Zensus-Handbuch geschafft.Footnote 8 Allerdings finden sich in den sogenannten Yogyakarta Principles (2006) Definitionen von Sexueller Orientierung und Geschlechtsidentität (vgl. Tab. 1).Footnote 9 Damit wird nicht nur die Norm des gegengeschlechtlichen Begehrens infrage gestellt, sondern auch zwischen der persönlichen Erfahrung („gender identity“), dem Ausdruck von Geschlecht („expressions of gender“) und der Fremdzuschreibung aufgrund von Genitalien („sex assigned at birth“) unterschieden. Die Möglichkeit einer Nichtübereinstimmung von zugewiesenem und gefühltem Geschlecht (cis vs. trans) sowie eines Wechsels der Geschlechtskategorien (trans Mann, trans Frau) sind ebenso mitgedacht wie Kategorien jenseits des binären Spektrums. Obwohl diese Unterscheidungen in universalistische Diskurse eingebettet sind, wird ihre kulturelle Einseitigkeit kritisiert: Kategorien wie „gay“ oder auch „trans“ bildeten ein westlich-partikulares Verständnis ab, das nicht auf alle Länder und Regionen der Welt übertragbar sei (Sabsay 2013; Glick und Andrinopoulos 2019). Demnach sei die Unterstellung einer stabilen Geschlechtsidentität unzutreffend und eine Trennung von geschlechtlicher Identität und sexueller Orientierung in vielen Kulturen schlicht nicht möglich (für Südostasien vgl. Jackson 2000).

Ähnlich wie „sex“ im klassischen Sinne werden auch „ethnic or national characteristics“ bereits in den ersten Ausgaben des UN-Zensus-Handbuchs universelle Relevanz zugeschrieben. Im Gegensatz zu Geschlecht gibt es jedoch eine Definition von Ethnizität:

Ethnicity is based on a shared understanding of history and territorial origins (regional and national) of an ethnic group or community, as well as on particular cultural characteristics such as language or religion. Respondents’ understanding or views about ethnicity, awareness of their family background, the number of generations they have spent in a country, and the length of time since immigration are all possible factors affecting the reporting of ethnicity in a census. Ethnicity is multidimensional and is more a process than a static concept, and so ethnic classification should be treated with movable boundaries (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 204).

Eine geteilte Geschichte oder ein gemeinsamer Ursprung sowie kulturelle Charakteristika werden als Minimalmerkmale herausgestellt. Trotz des Verweises auf eine „ethnische Gruppe oder Gemeinschaft“ wird „Ethnizität“ hier eher als individuelles Personenmerkmal interpretiert, während es in früheren Ausgaben vor allem darum ging, Informationen über „the national and/or ethnic groups of the population“ zu generieren (UN Doc. ST/STAT/SER.M/44 1969, S. 23). Im Einklang mit der sozialwissenschaftlichen Forschung zu Ethnizität wird die Flexibilität und Variabilität kategorialer Grenzen betont (vgl. Barth 1969) und Versuche zur Vereinheitlichung der Erhebung von Ethnizität werden explizit ausgeschlossenFootnote 10: „[T]here is no single definition or classification that could be recommended that would be applicable to all countries“ (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 205). Tatsächlich unterscheiden sich nationale Praktiken der Datenerhebung nicht nur mit Blick auf die Frage, ob überhaupt Daten zu Ethnizität erhoben werden oder nicht (so z. B. im Zensus der meisten Staaten in Nord- und Südamerika sowie Ozeanien, aber nur in der Hälfte der europäischen und afrikanischen Staaten),Footnote 11 sondern auch, welches Verständnis von Ethnizität zugrunde gelegt wird, welche Kategorien unterschieden werden und auf welcher Basis die Zuordnung erfolgt (Morning 2008; Supik 2014, S. 101 ff.).

Gleiches ließe sich jedoch auch mit Blick auf ein weiteres Personenmerkmal behaupten, das seit den 1990er-Jahren zum Kanon der Kernunterscheidungen gehört: der Behinderungsstatus. Wenngleich die Kategorie der „Menschen mit Behinderung“ einen universalistischen Anspruch transportiert, unterscheidet sich die Konzeptualisierung körperlicher und mental-psychischer Differenz in verschiedenen Weltregionen zum Teil stark (vgl. Devlieger 2010); nicht alle Staaten generieren Daten zu Behinderung und auch die Erhebungsmethoden sind keinesfalls einheitlich, was sich unter anderem in unterschiedlichen Behinderungsraten widerspiegelt (UN Doc. ST/ESA/STAT/SER.Y/4 1990). Anders als im Fall der „Ethnizität“ resultiert das jedoch nicht in der Empfehlung, auf Standardisierung zu verzichten, sondern eher in einer Intensivierung der Bemühungen. Hier ist seit den 2000er-Jahren die sogenannte Washington Group on Disability StatisticsFootnote 12 federführend (Weeks 2016), auf deren Vorarbeiten auch die folgende Definition beruht:

Disability status characterizes the population into those with and those without a disability. Persons with disabilities are defined as those persons who are at greater risk than the general population for experiencing restrictions in performing specific tasks or participating in role activities. This group would include persons who experience limitations in basic activity functioning, such as walking or hearing, even if such limitations were ameliorated by the use of assistive devices, a supportive environment or plentiful resources (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 206 f.).

Indem die Funktionseinschränkungen bei der Ausübung von Aktivitäten und Rollen in den Vordergrund gerückt werden, weicht die Definition von einem älteren, stärker medizinischen Verständnis von Behinderung ab. Dieses setzte Behinderung mit bestimmten körperlichen Einschränkungen wie „Blindheit“, „Taubheit“ usw. gleich (vgl. nur Bickenbach et al. 1999, S. 1173). Auch wenn die International Classification on Functioning and Health (ICF, WHO 2001) der Weltgesundheitsorganisation ausdrücklich den Referenzrahmen für aktuelle Standardisierungsbemühungen bereitstellt, bildet die zitierte Definition das darin entwickelte bio-soziale Modell von Behinderung nur in Ansätzen ab (WHO/EIP/GPE/CAS/01.3 2002, S. 9 ff.). Dieses biosoziale Modell rückt den Fokus auf den Zusammenhang von Körpern und ihrem gesellschaftlichen Umfeld, das Partizipation erleichtern oder auch verunmöglichen kann (Imrie 2004). Zugleich modelliert es „Behinderung“ als ein Kontinuum, sodass jeder Mensch als – aktuell oder potenziell, mehr oder weniger – in seiner Funktionsfähigkeit eingeschränkt gelten kann (Bickenbach et al. 1999). Die im UN-Zensus-Handbuch vorgeschlagene Definition lässt hingegen Kontextfaktoren unberücksichtigt, indem sie den Fokus nicht auf faktische Einschränkungen legt, sondern auf potenzielle Risiken.Footnote 13 Auch die Etablierung einer binären Unterscheidung zwischen „Personen mit Behinderungen“ und „Personen ohne Behinderungen“ weicht von dem in der ICF eingeschriebenen Verständnis von Behinderung als graduelle Unterscheidung ab.

3.1.2 Operationalisierung kategorialer Zugehörigkeiten

Diese zum Teil recht abstrakten Definitionen von Personenmerkmalen bestimmen deren Konturen näher, geben jedoch kaum Hinweise darüber, wie kategoriale Mitgliedschaft bestimmt und in Zahlen erfasst werden soll.

Dazu bedarf es weiterer Entscheidungen, z. B. darüber, ob die Kategorien als direkt beobachtbar verstanden oder aber Indikatoren verwendet werden, um eine (latente) Variable „sichtbar“ zu machen. Darüber hinaus müssen die möglichen Ausprägungen des jeweils gewählten Indikatormerkmals sowie das Messniveau festgelegt werden: Sollen es nur zwei oder mehr sein (dichotome vs. polytone Variablen), sind sie exklusiv angelegt oder soll es die Möglichkeit zu Mehrfachantworten geben? Verkompliziert werden diese Entscheidungen außerdem durch die notwendige globale Reichweite der Indikatoren und Ausprägungen. So impliziert die Quantifizierung globaler Personenkategorien auch die Konstruktion eines globalen „Äquivalenzraums“Footnote 14 (Desrosières 2009), innerhalb dessen die soziale Ontologie der Weltgesellschaft sich mithilfe kulturell grenzüberschreitend vergleichbaren und anschlussfähigen Merkmalen oder Ausprägungen beschreiben und verwalten lässt.

Wir beginnen erneut mit dem Fall des Lebensalters: Gemessen wird Alter in der Regel entweder als direkte Frage nach dem Alter einer Person bei ihrem letzten Geburtstag oder aber mit dem Indikator des Geburtsdatums (Tag, Monat und Jahr), das zum aktuellen Datum in Bezug gesetzt wird. Laut UN-Zensus-Handbuch von 2017 ist die letztgenannte Methode zu bevorzugen, weil die Ergebnisse genauer seien (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 200). Da die Ausprägungen Zahlen sind, also eine klare Rangordnung zwischen ihnen besteht, sich die exakten Abstände zwischen ihnen angeben lassen und es einen absoluten Nullpunkt gibt, handelt es sich beim Lebensalter um eine sogenannte Ratioskala oder ein kontinuierliches Merkmal.

Im Unterschied dazu wird Geschlecht klassischerweise als eine dichotome Variable modelliert, die vollkommen mit genau zwei Ausprägungen („männlich“ und „weiblich“) erhoben werden kann. Damit handelt es sich um den Idealtypus eines klassischen Kategoriensystems (Bowker und Star 1999, S. 10 ff.): In den beiden Ausprägungen sind alle Fälle eingeschlossen, die Zuweisung erfolgt exklusiv und weder Mehrfachantworten noch Zwischenstufen sind vorgesehen. Das entspricht dem Messniveau einer Nominalskala, also einer Variablen, deren Ausprägungen sich zwar qualitativ voneinander unterscheiden, denen sich jedoch keine Rangfolge zuordnen lässt. Entsprechend einfach gestaltet sich die Erhebung: „Die ‚Messung‘ von Geschlecht als unabhängiger nominalskalierter, binärer Variable erschöpft sich statistisch gesehen darin, bis zwei zu zählen“ (Supik 2012, S. 152). Dabei gilt die Geschlechtszugehörigkeit als derart offensichtlich und eindeutig, dass sie im Interview nicht erfragt, sondern „by observation“ eingetragen wird – und zwar auch am Telefon (vgl. Westbrook und Saperstein 2015, S. 544; kritisch Baumann et al. 2019, S. 92 f.).

Wird allerdings ein differenzierteres Verständnis von Geschlecht zugrunde gelegt, verkomplizieren sich die Messverfahren (Magliozzi et al. 2016; Fraser 2018). Auch wenn in internationalen Statistiken ein herkömmliches Verständnis von Geschlecht dominiert (s. oben), bemühen sich in jüngerer Zeit einige Staaten darum, Geschlecht als trichotome oder polytone Variable mit mehreren Ausprägungen („third gender“, „intersex“ oder „other“) zu erheben, so z. B. in Bangladesch, Pakistan und Neuseeland (vgl. UN Doc. ESA/STAT/AC.289/Bk.2 2015; UN Doc. ECE/CES/2019/19 2019, S. 17 f.). Darüber hinaus gibt es auf nationaler und regionaler Ebene Versuche, Verfahren zur Erhebung von subjektiv gefühlter Geschlechtsidentität zu entwickeln. Eine wichtige Vorreiterrolle nehmen hier wissenschaftliche Forschungseinrichtungen wie das Williams Institute der University of California in Los Angeles ein – hier vor allem die Forschungsgruppe Gender Identity in U.S Surveillance (GenIUSS).Footnote 15

Für die Operationalisierung sexueller Orientierung haben sich drei verschiedene Indikatoren etabliert: Selbstidentifikation, Sexualverhalten und sexuelle Attraktion zu gleich- oder gegengeschlechtlichen Partnern (Park 2015, S. 10). Während die Selbstidentifikation der sexuellen Orientierung direkt abgefragt wird (mit den Ausprägungen „lesbian“, „gay“, „bisexual“), werden „sexuelle Attraktion“ sowie das tatsächliche Sexualverhalten als ordinal skaliertes Merkmal mit abgestuften Antwortmöglichkeiten behandelt (z. B. OECD 2019, S. 18 ff.). Die drei Erhebungsformen eint, dass sie einem binären Denken verhaftet bleiben: So bedarf es für die Zuordnung zu den Personenkategorien LGBT stets auch des Abgleichs mit der zuvor abgefragten Geschlechtszugehörigkeit. Es werden nur zwei Geschlechter unterstellt mit jeweils einer gleich- oder gegengeschlechtlichen sexuellen Orientierung.Footnote 16

Die quantitative Erfassung von „sexueller Orientierung“ und auch „Geschlechtsidentität“ erweist sich als besonders voraussetzungsvoll, wenn globale Daten generiert werden sollen. Hier zeigt sich, dass es vergleichsweise einfacher ist, sexuelles Verhalten weltweit abzufragen, wie z. B. im Kontext der Aids-Bekämpfung, wo sich „MSM“ („men who have sex with men“) als Kategorie mit globalem Äquivalenzraum etabliert hat (Boellstorff 2011).Footnote 17 Schwieriger wird es jedoch bei der Abbildung geschlechtlicher oder sexueller Identitäten. Diese sind nicht nur extrem dynamisch, sondern variieren je nach Land und Weltregionen stark und lassen sich nur schwerlich ineinander übersetzen (Glick und Andrinopoulos 2019, S. 13 f.).

Die Probleme der Dekontextualisierung von Geschlechtsidentität und sexueller Orientierung lassen sich besonders anschaulich anhand einer Studie des United Nations Development Programme, des Williams Institute und der lokalen NGO Blue Diamond Society (BDS) in Nepal illustrieren, in der sich die Befragten selbst anhand 22 vorgegebener Antwortoptionen hinsichtlich ihrer sexuellen Orientierung und Geschlechtsidentität identifizieren sollten.Footnote 18 In den genannten Ausprägungen vermischen sich zugewiesenes Geschlecht, Begehren, Darstellung von Geschlecht sowie die Rolle, die beim Geschlechtsakt eingenommen wird. Gleichzeitig sind die Ausprägungen untrennbar mit der regionalen Kultur und Lebenswelt verbunden und lassen sich nur schlecht von diesem sozialen Kontext ablösen. Die Kategorie „Kothi“ etwa bezeichnet Menschen, denen ein männliches Geschlecht bei Geburt zugewiesen wurde, die jedoch ein weiblich konnotiertes Repertoire an Verhaltensweisen aktualisieren und deren Begehren sich auf „männliche“ Männer richtet. Die Studie zeigte weiterhin, dass die Mehrheit der Befragten sich mit mehreren der vorgegebenen Merkmale gleichzeitig identifizierten (UNDP und The Williams Institute 2014, S. 19). Angesichts der Diversität kategorialer Ordnungen und Deutungspraktiken lässt sich der Äquivalenzraum der Kategorien also nicht ohne Weiteres ausdehnen. Andererseits wollen sowohl politische Bewegungen als auch Statistiker an etabliertes Vokabular anschließen oder Variablen und Ausprägungen standardisieren, um die Problemlagen von Menschen jenseits des heteronormativen Spektrums in Form von vergleichbaren Daten sichtbar machen zu können.

Auch bei der Erhebung von Ethnizität gibt es Probleme mit der Standardisierung der Ausprägungen, die je nach nationalem Kontext wie auch im Zeitverlauf stark variieren (vgl. Lee 1993; Morning 2008). So müssen die Befragten in den USA sich zwischen fünf Optionen von „race“ entscheiden: „White“, „Black or African American“, „American Indian or Alaska Native“, „Asian“, „Native Hawaiian or Other Pacific Islander“ (Herman 2020). Andere Länder bieten noch wesentlich längere Listen mit Auswahloptionen an (z. B. Laos mit 48 Ausprägungen; vgl. Morning 2008, S. 250). Gleichzeitig verändern sich diese Subkategorien, ihre Bedeutung verschiebt sich, sie entfallen oder neue kommen hinzu. Das illustriert z. B. die Entstehung panethnischer Kategorien wie „Latino“ (Rodríguez-Muñiz 2017) oder aktuell „MENA“ (Middle Eastern or North African) (vgl. Bozorgmehr et al. 2016). Auch im Fall der Messung von Ethnizität wird die subjektive Selbstauskunft als Messkonzept der Wahl empfohlen, während die Fremderfassung in der Interviewsituation mittlerweile vor allem aus forschungsethischen Gründen ausgeschlossen wird (Baumann et al. 2019, S. 86). Dazu heißt es im aktuellen UN-Zensus-Handbuch: „The subjective nature of the term (not to mention increasing intermarriage among various groups in some countries, for example) requires that information on ethnicity be acquired through self-declaration of a respondent and also that respondents have the option of indicating multiple ethnic affiliations“ (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 205).

Demnach wird ethnische Mitgliedschaft nicht exklusiv gedacht, sondern als Folge von „intermarriage“ offenbar sogar immer erwartbarer als Mehrfachmitgliedschaft. Die Messung von „Mixedness“ wird entweder durch die Bereitstellung entsprechender Subkategorien gewährleistet oder aber durch das Zulassen von Mehrfachantworten (Thompson 2012; vgl. Abschn. 3.2). Anders als im Fall der Geschlechtsidentität wird ethnische Mitgliedschaft jedoch alltagsweltlich als stabiles und dauerhaft in den Körper eingeschriebenes Merkmal verstanden (vgl. Brubaker 2016), was sich auch in der Formulierung der Zensusfragen widerspiegelt: „In your opinion, which of the following best describes your ancestry?“ (Bermuda), „What is your ethnic group?“ (United Kingdom) oder „To which race or ethnic group would you say … belong(s)“ (Jamaica) (Morning 2008, S. 249).

Auch Behinderung galt zunächst als in den Körper eingeschriebenes Personenmerkmal, das über vorgegebene Kategorien abgefragt wurde (zu verschiedenen Messweisen vgl. Fujiura und Rutkowski-Kmitta 2001). So enthielten nationale Zensus-Fragebögen häufig die direkte Frage nach dem Vorliegen einer „Behinderung“, die im Fall einer positiven Antwort über ein differenziertes Kategorienschema spezifiziert wurde. Demgegenüber soll bei aktuellen Versuchen der Messung nicht zuletzt aufgrund der stigmatisierenden Konnotationen davon abgesehen werden, direkt nach einer „Behinderung“ zu fragen. Im Unterschied zu den bislang diskutierten Beispielen empfiehlt das UN-Zensus-Handbuch hier ein vergleichsweise standardisiertes Vorgehen für die weltweite Erhebung (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 206 ff.): Da das zeitgenössische Konzept von Behinderung weniger auf die Erfassung von Körperzuständen als vielmehr auf die Einschränkungen von Partizipationschancen abzielt, werden alle Befragten aufgefordert, einzuschätzen, ob und wie sehr ihnen die Ausübung als relevant erachteter Tätigkeiten Schwierigkeiten bereitet. Erhoben werden sollen Funktionseinschränkungen in sechs Bereichen: (a) Walking; (b) Seeing; (c) Hearing; (d) Cognition; (e) Self-care; (f) Communication (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 208). Im Vergleich zu der in der International Classification on Functioning and Health (ICF) beschriebenen Vielfalt von Aktivitäten und Lebensbereichen handelt es sich um eine enorme Reduktion von Komplexität, die vor allem mit Problemen der interkulturellen Vergleichbarkeit und Platzbeschränkungen im Zensus begründet werden (UN Doc. ST/ESA/STAT/SER.M/67/Rev.3 2017, S. 207). Ganz in Einklang mit der Definition von Menschen mit Behinderung als „population at risk“ (siehe oben) wird die potenzielle und nicht die aktuelle Funktionseinschränkung unter Berücksichtigung von Umweltfaktoren und Hilfsmitteln abgefragt.

Letztlich wird also im Fall der Kategorie „Menschen mit Behinderungen“ wesentlich konsequenter auf eine Standardisierung der Erhebungsmethoden sowie der verwendeten Ausprägungen hingewirkt als im Fall der zuvor genannten Beispiele „Ethnizität“, „Geschlechtsidentität“ und „sexuelle Orientierung“. Da bei der Messung von „Behinderung“ nicht vorgegebene Kategorien, sondern Funktionseinschränkungen abgefragt werden, scheint Standardisierung auf geringere Hürden zu stoßen. Zugleich wird die internationale Vergleichbarkeit von Daten als explizites Ziel formuliert, dem alternative Ziele wie eine detailgenaue Modellierung der Konzepte oder die Abbildung globaler Vielfalt untergeordnet werden.

3.2 Die Herstellung der Zahl: Vom Kreuzchen zu aggregierten Häufigkeiten

Bislang haben wir eine Reihe von Entscheidungen rekonstruiert, die der Herstellung globaler Zahlen vorangehen. Diese materialisieren sich in Fragebögen, die mit individuellen Einzelbeobachtungen gefüllt werden. Wie jedoch werden aus diesen Einzelantworten (globale) Zahlen zu bestimmten Personenkategorien? Ein erster Schritt ist die Zusammenführung der einzelnen Beobachtungen an einem zentralen Ort und deren Umwandlung in abstrakte, standardisierte und damit auch vergleichbare Ziffern. Diese „Datenerfassung“ („data capture“) ist ein wichtiger Schritt bei der Transformation von Einzelbeobachtungen in „Daten“. Die Antworten auf die entsprechenden Fragen werden einem Kodeplan entsprechend in numerische Kodes überführt – im Falle der nominalen Variable „Geschlecht“ etwa 0 für „männlich“ und 1 für „weiblich“. Auch wenn Fragebögen und Antwortoptionen bereits in hohem Maße standardisiert sind, resultiert dieser Vorgang in einer weiteren Abstraktion: Aus Fragesätzen werden Kürzel für einzelne Variablen, aus Antwortoptionen werden numerische Kodes (Desrosières 2016, S. 184; Thévenot 2016). Abgebildet werden diese in Form einer Datenmatrix, also einer Tabelle, die die numerisch kodierten Angaben aller Personen für alle erhobenen Variablen systematisiert (vgl. Abb. 1). In der Regel stehen die Ausprägungen eines Merkmalträgers (z. B. der befragten Person) in einer Zeile: Aus dieser Perspektive erscheint jede Person in verschiedene, vorbestimmte Merkmale dekomponiert, mit Blick auf die sie vermessen und in zahlenförmige Kodes überführt wurde. Eine Spalte wiederum beinhaltet die bei allen Merkmalsträgern beobachteten Ausprägungen einer Variablen und damit auch deren Verteilung.

Abb. 1
figure 1

Ausschnitt der Datenmatrix des ALLBUS 2014a. (Quelle: Gesis – Leibniz Institut für Sozialwissenschaften 2015. aDie „Allgemeine Bevölkerungsumfrage der Sozialwissenschaften“ ist ein nationaler Survey, der seit 1980 alle zwei Jahre erhoben wird)

Für den Prozess der Quantifizierung von Personenkategorien, die von einzelnen Fällen abstrahieren, sind genau diese Verteilungen entscheidend, da sie individuelle Fälle dekontextualisieren und in generalisierte Aggregate überführen. So werden auf dieser Basis Häufigkeitstabellen für ausgewählte Variablen wie „Geschlecht“, „Alter“ oder „Ethnizität“ erstellt, indem ausgezählt wird, wie häufig die Kodes für die jeweiligen Ausprägungen „männlich“ oder „weiblich“ resp. „White“, „Black or African American“, „American Indian or Alaska Native“, „Asian“ und „Native Hawaiian or Other Pacific Islander“ vergeben wurden. Diesen lässt sich dann beispielsweise entnehmen, dass 2018 40.843.565 Männer und 41.948.786 Frauen in Deutschland lebten. Ob diese „alt“ oder „jung“, „christlich“ oder „atheistisch“, mit oder ohne „Migrationshintergrund“ sind, ist in diesen Makrodaten nicht mehr ohne Weiteres erkennbar. Aus „Ausprägungen“ werden „Personenkategorien“, und „Männer“ sowie „Frauen“ erscheinen als eine vom Einzelfall gelöste Gesamtheit mit einer spezifischen Größe. Auf diese Weise lässt sich mit den quantifizierten Daten zu einzelnen Merkmalen eine vermeintliche Realität immer neu rekombinieren.

Dieser Effekt verstärkt sich, wenn zusätzlich zu den absoluten Häufigkeiten relative Häufigkeiten abgebildet werden, indem die Personenkategorie zu ihrem kategorialen Gegenüber oder der Gesamtbevölkerung in Bezug gesetzt wird. So transportiert die zu Anfang zitierte Aussage („Globally, women’s participation in single or lower houses of national parliament reached 23.4 per cent in 2017, just 10 percentage points higher than in 2000“) nicht nur zahlenförmige Fakten, sondern auch Verweise auf Narrative, Zielvorstellungen – etwa Gleichheit zwischen Frauen und die hier nicht markierte Vergleichsfolie der Männer – und politische Implikationen – etwa die Einleitung von politischen Maßnahmen zur Erhöhung der Frauenquote in der Politik (vgl. auch Holtrop 2018, S. 83).

Während Quantifizierung im Fall der binären, nominal skalierten Variable Geschlecht vor allem auf dem Aufsummieren der jeweiligen Ausprägungen ruht, gestaltet sich dieser Prozess in all jenen Fällen komplizierter, in denen kategoriale Mitgliedschaften nicht exklusiv gedacht sind oder kategoriale Grenzen verschwimmen. So wird bei der Erfassung von Ethnizität zwar in der Regel ebenfalls eine kategoriale Messweise gewählt, bei der aber nicht nur zwei, sondern mehr Ausprägungen angeboten und entsprechend mit Kodes versehen werden. Ergänzt man das kategoriale Spektrum um eine offene Antwortmöglichkeit, hat das Folgen für die Kodierung: Die unterschiedlichen Antworten müssen bei der Dateneingabe sinnvoll verallgemeinert und zusammengefasst werden. Letztlich werden dann aus Selbst- wieder Fremdbeschreibungen, da sich die vielfältigen Antworten ansonsten kaum abbilden ließen (vgl. Aspinall et al. 2008, S. 21).

Weitere Schwierigkeiten beim Kodieren oder der Auszählung entstehen durch Fragen mit Mehrfachantwortoptionen, die z. B. seit 2000 im US-amerikanischen Zensus bei der Erhebung von „race“ zugelassen sind (Herman 2020). Die daraus resultierende Datenmatrix ist entsprechend komplexer: Für jede Antwortmöglichkeit wird eine eigene Variable (Spalte) angelegt und die Antwortmöglichkeiten „Nein“ und „Ja“ werden jeweils mit 0 und 1 kodiert. Eine einfache Auszählung ließe aufgrund der Mehrfachnennung keine Rückschlüsse auf die Anzahl der Personen in der entsprechenden Kategorie zu. Um nach Individuen auszählen zu können, müssen die Daten umkodiert und neue Variablen erstellt werden. Rein rechnerisch wären hier 63 verschiedene „race“-Kategorien möglich, die verschiedene Kombinationen von bis zu sechs Zugehörigkeiten abbilden. Die Herausforderung besteht darin, die Anzahl der Kategorien zu begrenzen, ohne zu viele Personen in einer Residualkategorie zusammenfassen zu müssen (Herman 2020, S. 98). Um Komplexität zu reduzieren (und zu geringe Fallzahlen zu vermeiden), wählt das US-Zensus-Büro eine denkbar einfache Aufschlüsselung (vgl. Abb. 2): So werden auf der einen Seite fünf Kategorien gebildet für Personen, die sich nur einer „race“ zugehörig fühlen („White alone“, „Black or African American alone“, „American Indian and Alaska Native alone“, „Asian alone“, „Native Hawaiian or Other Pacific Islander alone“) sowie auf der anderen Seite eine Sammelkategorie mit dem Titel „Two or More Races“ für all jene Befragten, die mehr als eine Angabe gemacht haben. Welche Kombinationen verschiedener Identitäten sich dahinter verbergen und wie hoch der jeweilige Anteil ist, wird bei dieser Kategorisierung nicht sichtbar gemacht. Kategoriale Mehrfachzugehörigkeit wird zum zentralen Kennzeichen der so etablierten Personenkategorie – und nicht etwa deren genaue Zusammensetzung, womit (implizit) auch Vorstellungen von Normalität und Abweichung transportiert werden.

Abb. 2
figure 2

Ausschnitt der „United States Census Bureau Quick Facts“. (Quelle: https://www.census.gov/quickfacts/fact/table/US/AGE775219#AGE775219. Zugegriffen: 01. Okt 2020)

Auch im Bereich der Erfassung von Genderidentität und sexueller Orientierung werden Zugehörigkeiten nicht notwendigerweise exklusiv und dauerhaft gedacht und Mehrfachantworten sind gängig. In dem erwähnten Survey Surveying Nepal’s Gender and Sexual Minorities (UNDP und The Williams Institute 2014) ist es den Befragten nicht nur möglich, aus zehn Optionen drei auszuwählen, sondern es wird auch die Intensität ihrer jeweiligen Zugehörigkeiten auf einer dreistufigen ordinalen Skala abgefragt. Die Anzahl möglicher Kombinationen steigt damit auf 4060 an. Um Komplexität zu reduzieren, wurden im Unterschied zu dem vorangegangenen Beispiel nicht von vornherein neue Variablen definiert und erstellt, sondern auf der Grundlage einer latenten Klassenanalyse neue, möglichst homogene Subtypen aus dem Material generiert, für die es vorab keine Definition gab (vgl. ausführlich, UNDP und The Williams Institute 2014, S. 23 ff.). Für diese analytischen Kategorien wurden dann Häufigkeiten ermittelt. Dieses Verfahren wurde für zwei Subpopulationen getrennt durchgeführt, nämlich für Personen, die bei ihrer Geburt als „männlich“ und solche, die als „weiblich“ klassifiziert wurden. Während in dem Sample der als männlich klassifizierten Befragten sieben distinkte Subpopulationen konstruiert wurden, waren es im Fall der weiblich klassifizierten Befragten nur zwei Subpopulationen (UNDP und The Williams Institute 2014, S. 24 f.; vgl. Abb. 3).

Abb. 3
figure 3

Latente Kategorien geschlechtlicher und sexueller Identität bei männlich klassifizierten Befragten. (Quelle: UNDP und The Williams Institute 2014, S. 24, 25)

Da die Anzahl der so generierten Kategorien den Autoren für die weiteren Analysen jedoch letztlich zu umfangreich waren, wurden diese auf je zwei analytische Kategorien für beide Sample reduziert (UNDP und The Williams Institute 2014, S. 29): eine „Third Gender Group“ und eine „Gay/Bisexual Group“ sowie eine „Third Gender Group“ und eine „Lesbian/Gay Group“. Diese Reduktionsleistung steht im Gegensatz zu den Bemühungen, Identitäten möglichst detailreich abzufragen und spiegelt die Spannung zwischen Kontextsensitivität und Generalisierung und Selbst- und (analytischen) Fremdbeschreibungen.

Auch im Fall der Messung von Behinderung hat sich zunächst ein vergleichsweise komplexes Messverfahren etabliert, das graduelle Unterscheidungen abbildet. Es stellt sich jedoch die Frage, wie sich „Menschen mit Behinderungen“ überhaupt zählen lassen, wenn kategoriale Grenzen verschwimmen. Die Experten geben hier relativ genaue und auch technische Anweisungen (Washington Group on Disability Statistics 2019): Zunächst wird auf der Grundlage der Fragebögen eine Datenmatrix erstellt, die zunächst noch keine Variable „Behinderung“ enthält, sondern sechs Variablen bezogen auf verschiedene Arten von Funktionseinschränkungen (Walking, Seeing, Hearing, Cognition, Self-care, Communication; s. oben). Für diese werden jeweils Kodes von 1–9 vergeben, wobei die Kodes 1–6 das Ausmaß an Funktionseinschränkungen abbilden und die Kodes 7–9 für „7. Refused“, „8. Not ascertained“ und „9. Don’t know“ stehen (Washington Group on Disability Statistics 2019, S. 2). Es lassen sich zwar Verteilungen der Kodes für die sechs Variablen beobachten. Um jedoch zu bestimmen, ab wann eine Person als „Mensch mit Behinderung“ gezählt werden soll, bedarf es weiterer Konventionen. Den Empfehlungen der Washington Group zufolge ist das der Fall, wenn Personen in mindestens einem der abgefragten Bereiche angegeben haben, „severe difficulties“ oder „complete difficulties“ zu haben (UN Doc. ST/ESCAP/2499 2008, S. 20 f.). Rein technisch wird dazu eine neue Variable „disability status“ generiert, wobei „without disability“ mit 0 und „with disability“ mit 1 kodiert wird (ausführlich UN Doc. ST/ESCAP/2499 2008, S. 8). Auf diese Weise wird letztlich eine zunächst aufwendig erhobene gradualisierte Differenzierung von Menschen mit Funktionseinschränkungen in verschiedenen Bereichen zurückverwandelt in eine dichotome Variable.Footnote 19

4 Schluss

Ausgangspunkt unseres Beitrags war die Annahme, dass Statistiken eine wichtige Rolle bei der Objektivierung globaler Personenkategorien spielen: Sie etablieren kontingente kategoriale Grenzen als verbindlich und überführen globale Komplexität in einfache Kennzahlen. Im Folgenden werden die wichtigsten Ergebnisse unserer Analysen noch einmal systematisch zusammengefasst.

Objektivität von Zahlen und Objektivation von Personenkategorien durch Zahlen. So konnten wir im Detail zeigen, wie genau im Prozess der Herstellung statistischer Daten der Eindruck erzeugt wird, diese quantifizierten Beschreibungen seien beobachterunabhängig und objektiv. Wir haben dazu einige Ausschnitte der komplexen Transformationsprozesse näher beleuchtet, an deren Ende dann die absoluten Zahlen oder Prozentangaben in internationalen Statistiken stehen. Die Analysen zeigen, wie in jedem einzelnen dieser Schritte der Bezug zur ursprünglichen Beobachtung geringer wird und auf der Grundlage erster numerischer Kodes immer wieder weitere, komplexere Zahlen generiert werden. Ein zentraler Mechanismus zur Verdichtung und Vereinheitlichung der differenzierten Beobachtungen ist dabei die Aggregierung, d. h. die Zusammenfassung aller Personen einer bestimmten Merkmalsausprägung zu einer Zahl – und zwar vollkommen unabhängig von allen anderen genannten Merkmalen und Besonderheiten dieser Personen. Die so präsentierten Zahlen werden zunehmend mit dem Eindruck von Objektivität ausgestattet, während gleichzeitig all diese Verdichtungen und Transformationen unsichtbar gemacht werden. In den aggregierten Häufigkeiten oder Prozentzahlen, die am Ende dieses Prozesses stehen, sind sie nicht mehr erkennbar. Gleichzeitig bewirken die aggregierten Zahlen auch eine Objektivation der gezählten Personenkategorien, deren Existenz und Größe auf diese Weise zu Faktizität wird.

Gradualisierungen und Re-Kategorisierungen. Das gilt im Prinzip für jede Art der Quantifizierung von Personenkategorien. Besonders eindrücklich ist diese Transformation jedoch in den Fallbeispielen Ethnizität, Geschlechtsidentität und Behinderung. Hier wurde versucht, die Vielfalt menschlicher Körper und Identitäten durch die Entwicklung komplexer Erhebungsverfahren möglichst detailgenau abzubilden, indem das Spektrum an möglichen Antworten erweitert, Mehrfachantworten zugelassen oder die Intensität kategorialer Mitgliedschaften gradualisiert abgefragt wurde. An die Stelle der binären Logik eines „Ja“ oder „Nein“ tritt dann die Idee eines „mehr oder weniger“ und damit ein ordinales Messniveau.Footnote 20 Diese Fälle liefern damit anschauliche Beispiele für die von Barnard und Fourcade (2021) beschriebenen Verstrickungen und Transformationen verschiedener Klassifikationsprinzipien. Wenngleich durch die Erhebungsverfahren kategoriale Grenzen diffuser werden, wird im Zuge der anschließenden statistischen Berechnungen offensichtlich, dass es sich nur um „Schein-Entkategorisierungen“ (Barnard und Fourcade) handelt: Im Zuge der Aggregation der Daten werden nominale Logiken wiedereingeführt, sei es durch die Neubildung latenter Klassen oder aber durch die Einführung von Schwellenwerten. Am Ende stehen (wieder) Personenkategorien mit möglichst wenigen und exklusiven Ausprägungen, was die Suche nach gerichteten und ungerichteten Zusammenhängen letztlich erleichtern dürfte. Mit der Re-Etablierung harter kategorialer Grenzen ist eine Art der Essenzialisierung kategorialer Differenzierungen verbunden.

Auch wenn nicht zuletzt der Rückgriff auf nominale Klassifikationen den Eindruck erweckt, dass es hier lediglich um die Beschreibung von Unterschieden und nicht um deren Bewertung oder Hierarchisierung gehe, sind in dem Prozess der Herstellung statistischer Daten eine Vielzahl von Bewertungen enthalten, so z. B. wenn Menschen Schwierigkeiten bei der Ausführung von Tätigkeiten selbst beurteilen sollen oder wenn einige geschlechtliche oder ethnische Zugehörigkeiten statistisch sichtbar gemacht werden, während andere hinter Residualkategorien oder generalisierten Begriffen verschwinden.

Globalisierung und Standardisierung von Personenkategorien. Mit Blick auf die Frage nach der Etablierung globaler Äquivalenzräume hat sich gezeigt, dass Definitionen, Konzepte und Verfahren zur Erhebung sozialer Zugehörigkeiten nicht in allen Fällen gleichermaßen über nationale Grenzen hinaus standardisiert sind. So sind die Verfahren zur Erhebung von „Geschlecht“ und „Alter“ weltweit (noch) hochgradig standardisiert, und es scheint tatsächlich einen globalen Äquivalenzraum zu geben, innerhalb dessen die entsprechenden Daten regelmäßig miteinander vergleichbar sind. Auch im Fall der „Menschen mit Behinderungen“ gab es in den vergangenen 20 Jahren zumindest sehr große Bemühungen, einheitliche Erhebungsverfahren weltweit als verbindlich durchzusetzen und Vergleichbarkeit herzustellen. Anders sieht es jedoch bei „Ethnizität“ oder „race“ sowie „Geschlechtsidentität“ und „sexueller Orientierung“ aus: Auch wenn es abstrakte Definitionsversuche gibt, sind weder die Verfahren zur Erhebung von Zugehörigkeiten noch die jeweiligen Ausprägungen standardisiert. Eine entsprechende Vereinheitlichung wird im Fall „Ethnizität“ sogar explizit ausgeschlossen. Eine mögliche Ursache für die unterschiedliche Ausdehnung der Äquivalenzräume liegt darin, dass (biologische) Geschlechtszugehörigkeit und Behinderungsstatus als primär naturgegebene oder körperliche Merkmale begriffen werden. Kategorien im Themenfeld Ethnizität und Gender hingegen fungieren als Kristallisationspunkt partikularer Identitäten, die stärker in kulturelle Kontexte eingebettet und entsprechend umkämpft sind. Allerdings bleibt die globale kategoriale Ordnung in Bewegung, sodass neue Schübe der Ausweitung, möglicherweise aber auch der Fragmentierung von Äquivalenzräumen zu erwarten sind: So verweist die noch junge Kategorie der „Person of African Descent“ auf Möglichkeiten der Standardisierung ethnischer Grenzen jenseits partikularer Beschreibungsoptionen. Auch wenn „Geschlecht“ und „sexuelle Orientierung“ oder „Genderidentität“ zurzeit noch überwiegend getrennt behandelt werden, unterläuft die Institutionalisierung von LGBT-Kategorien faktisch die Unterstellung einer natürlichen, universellen binären Geschlechterordnung. Damit wird auch das etablierte, bereits standardisierte Repertoire an geschlechtsspezifischen Unterscheidungen auf die Probe gestellt.