Einleitung

Das Konzept der NAKO Gesundheitsstudie basiert auf einem biopsychosozialen Verständnis von Gesundheit und Krankheit und es berücksichtigt dementsprechend auch demografische und soziale Merkmale der Teilnehmerinnen und Teilnehmer [1]. Abgesehen davon, dass es zum Standard in epidemiologischen Studien gehört, soziodemografische und erwerbsbezogene Merkmale zu erheben, soll mit der NAKO eine Datenbasis geschaffen werden, die international wegweisende Forschung zu Themen der Sozialepidemiologie ermöglicht.

Dass soziodemografische und erwerbsbezogene Merkmale eine wichtige Rolle bei der Erklärung gesundheitlicher Phänomene spielen, ist unstrittig [2,3,4,5,6]. Alter und Geschlecht sind Kerndeterminanten der Gesundheit, Gleiches gilt für die sozioökonomische Position (üblicherweise als Trias aus Bildung, Einkommen und Beruf verstanden), die familiäre Situation und den Erwerbsstatus. Aus diesem Grund werden soziodemografische Unterschiede in vielen epidemiologischen Untersuchungen berücksichtigt. Darüber hinaus gibt es mit der Sozialepidemiologie eine eigene Forschungsrichtung in der Epidemiologie, die sich explizit mit dieser Art von Einflussfaktoren beschäftigt [7]. Beginnend mit Pionierstudien, wie der britischen Whitehall-Studie, hat diese Forschung eine enge Verbindung insbesondere zwischen der sozioökonomischen Position (folgend als SEP, Socioeconomic Position, abgekürzt) und einer Fülle von Risikofaktoren und gesundheitsrelevanten Verhaltensweisen aufdecken können und gezeigt, dass mit sinkender SEP das Morbiditäts- und Mortalitätsrisiko steigt [7,8,9,10,11,12,13].

In den vergangenen zwei Jahrzehnten hat sich in Deutschland das Bewusstsein für die Bedeutung sozialepidemiologischer Ansätze deutlich geschärft, nachdem die Forschung in der Vergangenheit vor allem durch die angelsächsischen und skandinavischen Länder geprägt war und aus Deutschland nur wenige sowie regional begrenzte Daten zur Forschung beigesteuert wurden [14, 15]. Mittlerweile gibt es hierzulande auch eine wachsende Datenbasis für entsprechende Analysen, sei es in Form von Routinedaten, Bevölkerungsumfragen der Gesundheitsberichterstattung oder verschiedenen Kohortenstudien [14,15,16]. Aus der Forschung mit diesen Datenquellen ist z. B. bekannt, dass auch in Deutschland erhebliche soziale Ungleichheiten der Gesundheit existieren [17], die sich sowohl entlang von horizontalen Unterschieden (z. B. Geschlecht) als auch von vertikalen Unterschieden (z. B. Bildung oder Einkommen) manifestieren.

Vor diesem Hintergrund ist eine intensive Erforschung der diesen Ungleichheiten zugrunde liegenden Mechanismen von hohem Interesse. Die bisher verfügbare Datenbasis unterliegt jedoch bestimmten methodischen Einschränkungen. Eine Schwierigkeit ist die oft geringe Tiefe der Differenzierung soziodemografischer Gruppen (etwa in Registerdaten). Diese ist aber notwendig, um (Hoch‑)Risikogruppen sicher zu identifizieren und konkrete Zielgruppenbeschreibungen für eine verbesserte Prävention und Versorgung zur Verfügung stellen zu können. Zusätzlich limitierend wirkt eine vergleichsweise geringe Stichprobengröße mancher Studien, die die Subgruppenbildung weiter erschwert. Zudem konnten in bisherigen Studien soziale Faktoren nur selten direkt in Zusammenhang mit biomedizinischen Indikatoren wie genetischen Informationen, Laborwerten oder bildgebender Diagnostik untersucht werden.

Diese Limitationen können durch große populationsbasierte Kohortenstudien zumindest teilweise ausgeglichen werden. Dies zeigen internationale Beispiele wie die französische CONSTANCES-Studie [18], die niederländische LifeLines-Studie [19], LifeGene aus Schweden [20], CONOR aus Norwegen [21] oder die UK Biobank aus dem Vereinigten Königreich [22]. Die NAKO Gesundheitsstudie folgt diesen Vorbildern und kann so der sozialepidemiologischen Forschung in Deutschland neue Möglichkeiten eröffnen. Die Potenziale der NAKO sind, neben ihrem Längsschnittdesign, die Realisierung einer sehr hohen Fallzahl, die Detailtiefe der Messung von Gesundheit, Krankheit und sozialen Faktoren sowie die Einbeziehung der gesamten in Deutschland lebenden Bevölkerung inklusive jüngerer Altersgruppen ab 20 Jahren [1, 23].

In diesem Beitrag sollen primär die in der NAKO eingesetzten Instrumente zur Messung soziodemografischer und erwerbsbezogener Merkmale vorgestellt werden. Hierzu werden der Prozess der Fragebogenentwicklung und die im Einzelnen ausgewählten Instrumente beschrieben. Ergänzend gibt der Beitrag einen ersten deskriptiven Einblick in die sozialstrukturelle Zusammensetzung der Kohorte und damit auch die konkrete Variablenbildung. Abschließend sollen die eingesetzten Instrumente anhand einer exemplarischen Reproduktion bekannter Zusammenhänge mit dem Body-Mass-Index (BMI) und selbst berichteter Gesundheit validiert werden. Diese Zielgrößen wurden gewählt, weil soziodemografische Unterschiede bei Untergewicht und Adipositas [24, 25] sowie schlechter selbst berichteter Gesundheit [26] in der Forschung gut belegt sind.

Material und Methoden

Fragebogen und Instrumente

Der Entwurf des Instruments zur Messung soziodemografischer Angaben einschließlich der sozioökonomischen Position und der Erwerbssituation wurde in den Jahren 2010–2012 von der interdisziplinären „Arbeitsgruppe Fragebogen“ der NAKO Gesundheitsstudie erstellt. Er orientierte sich wesentlich an den „Demographischen Standards“ (DS) des Statistischen Bundesamts in der zum Zeitpunkt der Erstellung gültigen Fassung von 2010 [27]. Diese Standards werden unter anderem beim Mikrozensus eingesetzt und können als Referenzinstrument für Befragungen in Deutschland gelten. Ausgewählt wurden insbesondere Kernvariablen (s. unten). In einzelnen Fällen wurde die Abfrage gegenüber dem Original leicht gekürzt oder im Wortlaut etwas verändert, da der Fragebogen der NAKO-Studie aus erhebungsökonomischen Gründen eine gewisse Länge und Komplexität nicht überschreiten durfte. Bei der Erstellung des ersten Entwurfs wurden die Fragen zusätzlich auf Übereinstimmung mit den Instrumenten deutscher Kohortenstudien bzw. Studien der Gesundheitsberichterstattung abgeglichen. Referenzstudien waren beispielsweise CARdiovascular Disease, Living and Ageing in Halle (CARLA), die Studie zur Gesundheit Erwachsener in Deutschland (DEGS), Gesundheit in Deutschland aktuell (GEDA), Heinz Nixdorf Recall (HNR), Kooperative Gesundheitsforschung in der Region Augsburg (KORA), LIFE-Adult des Leipziger Forschungszentrums für Zivilisationserkrankungen und der Study of Health in Pomerania (SHIP). Einzelne Fragen oder Antwortskalen wurden aus diesen Studien übernommen, wenn die entsprechende Abfrage in den DS entweder nicht vorhanden war (zum Beispiel im Falle der Erfassung von Arbeitslosigkeit) oder wenn die Abfrage in den DS zu komplex erschien. Zudem wurden wenige, meist einfache Fragen neu entwickelt.

Der auf dieser Basis erstellte Fragebogenentwurf wurde externen Expertinnen und Experten, beispielsweise des Robert Koch-Instituts und des Rats für Sozial- und Wirtschaftsdaten, zur Kommentierung vorgelegt. Die finale Fassung wurde dann als Teil des Core-Interviews implementiert, ein für alle Studienteilnehmenden obligatorisches, persönliches, computerassistiertes Interview. Die Interviewenden wurden entsprechend geschult und führten die Interviews als Zweiergespräch in eigenen Räumlichkeiten in den Erhebungszentren durch.

Tab. 1 gibt einen Überblick über die erfassten Themengebiete und verweist auf die Referenzen der eingesetzten Fragen. Durch die Abfrage der Haushaltszusammensetzung ist zudem die Ableitung des Nettoäquivalenzeinkommens [28] möglich, das zusammen mit der Bildung und der beruflichen Stellung ein zentraler Indikator der SEP ist [29]. Anzumerken ist, dass ebenfalls Angaben zum Migrationshintergrund erhoben wurden (siehe Beitrag von Wiessner et al. in diesem Themenheft). Ebenfalls ist darauf hinzuweisen, dass zusätzlich einzelne soziale und berufsbezogene Expositionen erhoben wurden (z. B. soziale Isolation, Arbeitsstress), die hier nicht Gegenstand der Betrachtung sind.

Tab. 1 Übersicht Demografie, sozioökonomische Position, Erwerbstätigkeit, soziale und berufliche Expositionen

Daten

Die folgenden Analysen beruhen auf dem Datensatz zur Halbzeit der Basiserhebung der NAKO Gesundheitsstudie. Der Datensatz enthält Informationen zu Teilnehmenden, die zwischen März 2014 und März 2017 in insgesamt 18 Studienzentren die Basisuntersuchung absolviert haben. Allgemeine Angaben zum Studiendesign, zu Ethikvotum und Datenschutz der NAKO sind an anderer Stelle zu finden [1]. Eine Beschreibung der hier verwendeten Stichprobe zur Halbzeit der Basiserhebung und eine detaillierte Beschreibung der Responseraten werden im Beitrag von Schipf et al. in diesem Themenheft präsentiert. Die dort berichtete mittlere Responserate betrug zur Halbzeit 18 %, variierte jedoch mit dem Alter.

Studienpopulation

Der Datensatz für diese Analyse beinhaltet n = 101.724 Fälle. Zur Formung der für diese Auswertungen verwendeten Studienpopulation wurden alle nicht vollständig und ordnungsgemäß abgeschlossenen Interviews von den Analysen ausgeschlossen (n = 63). Es wurden zudem weitere 10 Fälle ausgeschlossen, die bei der Altersvariable Werte außerhalb des plausiblen Wertebereichs aufwiesen. So ergab sich für die Auswertungen eine Stichprobe von n = 101.651 Fällen. Die in diese Stichprobe eingeschlossenen Personen waren zum Zeitpunkt der Untersuchung zwischen 20 und 73 Jahre alt. Alle Teilnehmenden waren in Übereinstimmung mit dem Studienprotokoll bei Stichprobenziehung maximal 69 Jahre alt.

Variablen

Die hier untersuchten Variablen umfassen Informationen zu Alter, Geschlecht, Bildung, Familienstand, Partnerschaft, Wohnsituation, Erwerbsstatus, Beruf, Body-Mass-Index (BMI) und selbst berichteter Gesundheit. Abgeleitete und zusammengefasste Variablen werden im Folgenden beschrieben.

Alter und Bildung.

Das Alter des Befragten lag als kontinuierliches Merkmal vor. In Übereinstimmung mit der Routineberichterstattung des Statistischen Bundesamtes und des Robert Koch-Instituts wurde zusätzlich eine Altersklassifizierung in 10-Jahres-Schritten vorgenommen [30, 31]. Der höchste schulische und berufliche Bildungsabschluss wurde in Übereinstimmung mit den Demographischen Standards [27] erhoben. Die Klassifizierung der Bildungsabschlüsse erfolgte anhand der hierarchischen International Standard Classification of Education von 1997 (ISCED 97; [32]). ISCED ordnet schulische und berufliche Bildungsabschlüsse in einer hierarchischen Skala, die es ermöglicht, Bildungsniveaus international vergleichbar zu machen. Die hier dargestellte ISCED-Skala enthält die folgenden sechs Abstufungen: ISCED 1 (Grundschule), ISCED 2 (Haupt- und Realschule), ISCED 3 (Haupt- und Realschule mit beruflich-betrieblicher oder beruflich-schulischer Ausbildung), ISCED 4 (Fachhochschulreife, Abitur, erweiterte Oberschule), ISCED 5 (Fachschulabschluss, Fachakademie oder (Fach‑)Hochschulabschluss), ISCED 6 (Promotion). Angemerkt sei, dass Klartextangaben zu sonstigen bzw. ausländischen Bildungsabschlüssen hier unberücksichtigt bleiben (n = 7716), da die manuelle Kategorisierung noch nicht abgeschlossen war.

Familie und Partnerschaft.

Der rechtliche Familienstand wurde in Übereinstimmung mit den Vorgaben des Statistischen Bundesamtes erhoben und nicht verändert. Um neben ehelichen auch nichteheliche Partnerschaften zu berücksichtigen, wurde der Familienstand in Kombination mit dem Partnerschaftsstatus zu einer neuen Variable abgeleitet, die angibt, ob Befragte mit einem festen (Ehe‑)Partner zusammenleben, mit dem (Ehe‑)Partner nicht zusammenleben oder keinen Partner hatten. Die Frage nach der Anzahl der insgesamt im Haushalt lebenden Personen wurde zusammengefasst in: Ein‑, Zwei‑, Drei- und Vierpersonenhaushalte sowie Haushalte mit 5 Personen und mehr.

Erwerbstätigkeit und Beruf.

Zur Bestimmung des Erwerbsstatus wurde auf das Labour-Force-Konzept der International Labour Organisation (ILO) zurückgegriffen [33]. Hier wird unterschieden zwischen Erwerbstätigen, Erwerbslosen und Nichterwerbspersonen. Zu den Erwerbstätigen zählen Arbeitnehmer, Selbstständige, mithelfende Familienangehörige, Personen in beruflicher Ausbildung, Minijobs, 450-Euro-Jobs, Ein-Euro-Jobs sowie Personen in einem temporär inaktiven Arbeitsverhältnis (Mutterschutz, Elternzeit). Erwerbslose sind Personen, die nicht erwerbstätig sind, aber für die Aufnahme einer Erwerbstätigkeit zur Verfügung stehen und aktiv nach einer Arbeit suchen. Nichterwerbspersonen sind Personen, die bereits aus dem Erwerbsleben ausgeschieden sind (Rentner) sowie Schüler und Studenten oder anderweitig dem Arbeitsmarkt nicht zur Verfügung stehende Personen. Die wöchentliche Arbeitszeit in Stunden wurde als kontinuierliches Merkmal und zur Beschreibung von Voll- und Teilzeit als kategoriale Variable verwendet (<35, ≥35 h). Eine weitere Einteilung der Berufe wird möglich, wenn die Codierung der offenen Berufsabfrage abgeschlossen ist. Für eine erste Einteilung der Berufe wurde jedoch eine Variable abgeleitet, die zwischen Selbstständigen, Arbeitnehmern und Personen in Ausbildung unterscheidet.

Body-Mass-Index (BMI) und selbst berichtete Gesundheit.

Der BMI wurde auf Basis der anthropometrischen Messung errechnet und nach Maßgabe der Klassifikation der Weltgesundheitsorganisation (WHO) kategorisiert [34, 35]. Die Messung des BMI ist ausführlich im Beitrag von Fischer et al. in diesem Themenheft beschrieben. Zur Klassifikation von Adipositas wurde eine vierstufige kategoriale Variable berechnet, die zwischen Untergewicht (BMI <18,5 kg/m2), Normalgewicht (18,5–24,9 kg/m2), Präadipositas (25–29,9 kg/m2) und Adipositas (≥30 kg/m2) unterscheidet. Der selbst berichtete allgemeine Gesundheitszustand wurde durch die Frage: „Wie würden Sie Ihren Gesundheitszustand im Allgemeinen beschreiben?“, gemessen. Dabei wurden die Antworten „weniger gut“ und „schlecht“ zusammengefasst sowie die Antworten „ausgezeichnet“, „sehr gut“ und „gut“.

Statistische Analysen

In einem ersten Schritt wurde die Verteilung soziodemografischer und erwerbsbezogener Merkmale in der NAKO-Teilpopulation stratifiziert nach Geschlecht und Studienzentrum beschrieben. Absolute sowie relative Häufigkeiten wurden zur Deskription von kategorialen Merkmalen verwendet und Mittelwerte (MW), Standardabweichungen (SD) sowie Mediane und Interquartilsabstände (IQR) zur Beschreibung von kontinuierlichen Merkmalen. Um die Messung soziodemografischer und erwerbsbezogener Merkmale hinsichtlich ihrer Validität zu beurteilen, wurden exemplarisch Zusammenhänge mit dem BMI und selbst berichteter Gesundheit analysiert. Hierfür wurde die Häufigkeit von Untergewicht, Adipositas und schlechter selbst berichteter Gesundheit nach Geschlecht, Alter, Bildung, Familienstand, Partnerschaft, Erwerbsstatus, Umfang der Erwerbstätigkeit und Berufsstand deskriptiv dargestellt. Abschließend wurde exemplarisch der Zusammenhang zwischen Bildung und den Gesundheitsvariablen adjustiert für Alter und Studienzentrum, getrennt für Männer und Frauen, mithilfe von Marginsplots dargestellt. Alle Analysen wurden mit Stata 15.1 MP durchgeführt (StataCorp LLC, College Station, TX, USA).

Ergebnisse

Beschreibung der Studienpopulation

Tab. 2 beschreibt die Studienpopulation nach soziodemografischen und erwerbsbezogenen Merkmalen. Der Anteil an Frauen war höher als der der Männer (53,6 % vs. 46,4 %) und das mittlere Alter lag bei 52,0 Jahren (SD = 12,4). Es zeigte sich, dass Männer im Durchschnitt ein Jahr älter waren als Frauen (52,5 vs. 51,5 Jahre). 54,3 % der Teilnehmerinnen und Teilnehmer hatten einen höheren Bildungsabschluss (beispielsweise Fachschul‑, Fachhochschul- oder Hochschulausbildung inklusive Promotion). Dabei war der Anteil bei Männern höher als bei Frauen (59,6 % vs. 49,7 %). Die meisten Befragten waren verheiratet zusammenlebend (60,1 %). Der Anteil Verwitweter war bei den Frauen mehr als dreimal höher als bei den Männern (5,2 % vs. 1,5 %). 19,8 % der Studienteilnehmenden lebten in einem Einpersonenhaushalt. Auch hier war der Anteil bei den Frauen höher (21,4 % vs. 17,9 %). In der Studienpopulation waren des Weiteren 72,0 % der Befragten zum Zeitpunkt der Untersuchung erwerbstätig, 3,4 % erwerbslos und 24,6 % waren Nichterwerbspersonen. Ohne Nichterwerbspersonen lag der Anteil an Erwerbslosen bei 4,5 %. Unter den Erwerbstätigen betrug die durchschnittliche wöchentliche Arbeitszeit 34,1 h (SD = 12,6). Frauen waren erwartungsgemäß häufiger in Teilzeit beschäftigt als Männer (49,4 % vs. 17,3 %) und häufiger nichterwerbstätig. Die Mehrheit der Befragten war aktuell oder zuletzt in einem Angestelltenverhältnis beschäftigt (86,3 %), 13,2 % waren selbstständig und – bedingt durch die Altersgrenze von 20 Jahren – nur 0,5 % in Ausbildung.

Tab. 2 Beschreibung der Teilnehmenden zur Halbzeit der NAKO-Basiserhebung nach soziodemografischen und erwerbsbezogenen Merkmalen

Abb. 1 zeigt die Verteilung ausgewählter Merkmale in den einzelnen Studienzentren. Generell variierten sozialstrukturelle Merkmale zwischen den Standorten. So lag der Frauenanteil zwischen 50,8 % (Münster) und 57,2 % (Bremen). Das mittlere Alter reichte von 48,3 Jahren (Bremen) bis 54,8 Jahre (Berlin Süd). Der Anteil an Teilnehmenden mit einem hohen Bildungsabschluss war am geringsten in Augsburg (41,9 %) und am höchsten in den Berliner Studienzentren (jeweils >63 %). Der Anteil zusammenlebender Verheirateter lag zwischen 47,1 % (Berlin Mitte) und 71,3 % (Augsburg). Die Zahl der Einpersonenhaushalte war erwartungsgemäß in Regionen höher, die einen geringeren Anteil zusammenlebend Verheirateter aufwiesen. Die Erwerbslosenquote lag zwischen 2,0 % in Regensburg und 6,7 % in Essen.

Abb. 1
figure 1

Häufigkeiten und Lagemaße soziodemografischer und erwerbsbezogener Merkmale nach Studienzentrum. (Anteil Verheirateter umfasst nur zusammenlebende Ehepartner. Die Prozentanteile der Erwerbslosen beziehen sich auf Erwerbspersonen (Erwerbstätige und Erwerbslose ohne Nichterwerbspersonen wie Schüler, Studenten oder Rentner). (Fach-)Hochschulabschlüsse schließen auch Fachschulabschlüsse mit ein.)

Soziodemografie und Gesundheit: exemplarische Analysen zu BMI und selbst berichteter Gesundheit

Die Verteilung der exemplarisch untersuchten gesundheitsbezogenen Merkmale ist im Online-Zusatzmaterial (Tab. S1) sowie in ausführlicher Form im Beitrag von Fischer et al. zur Anthropometrie in diesem Themenheft dargestellt. In der Teilstichprobe fanden wir Untergewicht bei 1 % der Probanden und Adipositas bei 22,4 %. Weiter berichteten 12,1 % der Studienteilnehmenden eine weniger gute bis schlechte allgemeine Gesundheit.

Tab. 3 zeigt die Häufigkeit gesundheitsbezogener Merkmale nach ausgewählten Faktoren. Generell fanden wir einen sozialen Gradienten mit höheren Anteilen an Adipositas und schlechter selbst berichteter Gesundheit unter Teilnehmenden mit niedriger Bildung sowie bei erwerbslosen Personen. Dagegen waren Vollzeitbeschäftigung sowie berufliche Selbstständigkeit mit einer besseren Gesundheit assoziiert. Eine (Ehe‑)Partnerschaft war zudem mit einer geringeren Häufigkeit von Übergewicht und Adipositas assoziiert. Partnerlose berichteten zudem häufiger von einer schlechten oder weniger guten Gesundheit. Dies kann teilweise durch ein höheres Durchschnittsalter bei Partnerlosen erklärt werden.

Tab. 3 Häufigkeit von Untergewicht, Adipositas und schlechter/weniger guter selbst berichteter Gesundheit nach ausgewählten soziodemografischen und erwerbsbezogenen Merkmalen

Abb. 2 zeigt die Häufigkeit der vier Gesundheitsvariablen entlang der sechs hierarchischen Bildungsstufen adjustiert für Alter und Studienzentrum. Wie zu erkennen ist, war für Männer und Frauen geringe Bildung mit einer höheren Häufigkeit von Adipositas und schlechter allgemeiner Gesundheit assoziiert. Dagegen fanden wir einen umgekehrten Bildungsgradienten für Untergewicht bei Frauen mit erhöhten Anteilen von Untergewicht bei Frauen mit höherer Bildung. Insgesamt fanden wir die erwarteten Zusammenhänge zwischen soziodemografischen und gesundheitsbezogenen Variablen.

Abb. 2
figure 2

Adjustierte Häufigkeiten von Untergewicht, Adipositas und schlechter selbst berichteter Gesundheit nach Bildungsstufe. (Adjustiert für Alter und Studienzentrum. Relative Häufigkeiten und 95 % Konfidenzintervalle. (Fach-)Hochschulabschlüsse schließen auch Fachschulabschlüsse mit ein.)

Diskussion

Die NAKO Gesundheitsstudie erhebt eine Reihe relevanter soziodemografischer Variablen, die sowohl als Kontrollvariablen für allgemeine Analysen als auch für spezifische sozialepidemiologische Forschung auf international konkurrenzfähigem Niveau verwendet werden sollen. Neben einer technischen Darstellung der zu diesem Zweck verwendeten Instrumente wurde in diesem Beitrag – zunächst theoretisch-methodisch – bewertet, ob dieser Anspruch eingelöst werden kann.

Die eingesetzten Instrumente zur Messung soziodemografischer Merkmale in der NAKO umfassen Geschlecht, Alter, Familienstand, Partnerschaft, Anzahl leiblicher Kinder, Wohnsituation, Haushaltsgröße (Zahl der Personen gesamt und 14 Jahre oder älter), Einkommen sowie die Abfrage des höchsten schulischen und beruflichen Ausbildungsabschlusses. Die Erfassung erfolgte weitgehend in Übereinstimmung mit den vom Statistischen Bundesamt herausgegebenen Demographischen Standards [27] und erlaubt somit direkte Vergleiche mit dem Mikrozensus sowie mit anderen Gesundheitsstudien in Deutschland wie DEGS, CARLA, GEDA, HNR, CORA, Life-Adult und SHIP [36, 37]. Zudem ermöglicht die Erfassung der schulischen und beruflichen Bildungsabschlüsse die Ableitung der hierarchischen, international vergleichbaren ISCED-Skala [32]. Nach erfolgter Codierung der offenen Berufsabfrage wird in Zukunft auch die Bestimmung der beruflichen Stellung nach Standards wie dem Erikson-Goldthorpe-Portocarero-Schema (EGP) möglich sein [38]. Ebenso ist durch die Abfrage der Haushaltszusammensetzung die Ableitung des haushaltsgewichteten Nettoäquivalenzeinkommens gegeben [28]. Letztendlich sind mit Bildung, Einkommen und beruflicher Stellung die wichtigsten Indikatoren zur Bestimmung der sozioökonomischen Position abgedeckt.

In der NAKO wurden zudem weitere Informationen zur Erwerbstätigkeit erfasst. Dazu zählen der Erwerbsstatus nach international vergleichbarem Labour-Force-Konzept [33], der Umfang der Wochenarbeitsstunden und der aktuelle bzw. zuletzt ausgeübte Beruf. Weiter existieren Module, die detailliertere Informationen zu Rente und Erwerbslosigkeit sowie zu Bildung und Beruf des Partners und der Eltern erfassen. Hierdurch bietet die NAKO auch Potenzial für die Lebenslaufepidemiologie, die sich mit Gesundheit und Krankheit in Abhängigkeit von Faktoren wie der Erwerbsbiografie oder sozialer Mobilität befasst [39].

Insgesamt ist die NAKO hinsichtlich der Erhebung soziodemografischer Merkmale nicht nur mit den bereits erwähnten Gesundheitsstudien aus Deutschland, sondern auch mit internationalen Studien ähnlichen Aufbaus wie CONSTANCES [18], LifeLines [19], CONOR [21], LifeGene [20] und der UK Biobank [22] vergleichbar. Einschränkend ist jedoch anzumerken, dass die Abfrage der Merkmale im persönlichen Interview eine Begrenzung der Fragenanzahl nötig machte, um die zeitliche Belastung der Befragten in Grenzen zu halten. Daher ist die Tiefe der Abfrage an manchen Stellen geringer als in den Vorlagen der Demographischen Standards (z. B. fehlen eine Abfrage des Wirtschaftszweigs der aktuellen oder letzten beruflichen Tätigkeit und eine genaue Abfrage der Haushaltszusammensetzung).

Um neben der qualitativen Einordnung auch einen ersten quantitativen Eindruck von der NAKO zu erhalten, wurden Analysen mit dem Datensatz zur Halbzeit der Datenerhebung durchgeführt. Bei der Beschreibung der sozialstrukturellen Zusammensetzung der NAKO fanden wir weitgehend die erwarteten Verteilungen. So war beispielsweise der Anteil von Einpersonenhaushalten in Studienzentren mit urbaner Lage höher als bei weniger urbaner Lage. Ein Vergleich der Studienzentren zeigte zudem eine höhere Quote an Erwerbslosen in ostdeutschen Gebieten im Vergleich zu westdeutschen Standorten. Ein weiteres Beispiel ist, dass bei den Frauen ein höherer Anteil an Verwitweten, Nichterwerbstätigen und Teilzeitbeschäftigten zu verzeichnen war. Diese Verteilungen spiegeln bekannte regionale bzw. soziodemografische Verteilungsmuster in Deutschland wider, was als Hinweis für die Validität der Messung gewertet werden kann [30, 40, 41]. Eine systematische Prüfung der soziodemografischen Repräsentativität der Stichprobe im Vergleich zur Grundgesamtheit der in Deutschland lebenden Bevölkerung wird zu einem späteren Zeitpunkt erfolgen, sobald die Basiserhebung abgeschlossen ist und somit die Gesamtstichprobe verfügbar ist. Erste testweise Vergleiche des Datensatzes zur Halbzeit der Basiserhebung mit dem Mikrozensus deuten auf einen tendenziell höheren Anteil an Frauen, Höhergebildeten und Älteren in der NAKO hin [30]. Da bekannt ist, dass entsprechende soziodemografische Merkmale mit einer höheren Teilnahmebereitschaft an Gesundheitsstudien einhergehen, sollte das Ausmaß möglicher Stichprobenverzerrungen mit Vorliegen des vollständigen Datensatzes untersucht werden [42]. Eine ausführlichere Diskussion hierzu findet sich im Beitrag von Schipf et al. in diesem Themenheft.

Abschließend wurden Analysen zur Kriteriumsvalidität durchgeführt und exemplarische Untersuchungen hinsichtlich des Zusammenhangs soziodemografischer Merkmale mit der Häufigkeit von Untergewicht, Adipositas und selbst berichteter Gesundheit angestellt. Wir fanden ausgeprägte Alters- und Bildungsgradienten und konnten somit bereits bekannte Gesundheitszusammenhänge mit den Daten der NAKO replizieren [24,25,26]. Dies spricht für eine inhaltliche Validität der in der NAKO erhobenen soziodemografischen und erwerbsbezogenen Instrumente.

Als Fazit bleibt festzuhalten, dass mit der NAKO eine neue Ressource für die sozialepidemiologische Forschung in Deutschland entsteht. Hinsichtlich der Messung soziodemografischer und erwerbsbezogener Faktoren kann eine Detailtiefe attestiert werden, die Vergleiche mit wichtigen nationalen und internationalen bevölkerungsbasierten Kohortenstudien und die Anwendung zentraler Konzepte der Ungleichheitsforschung erlaubt. Durch die Verknüpfung dieser Konzepte mit klinischen Parametern wie Laborwerten, Bildgebungsverfahren, Körperfunktionstests und inzidenten Erkrankungen im Follow-up hat die NAKO das Potenzial, wegweisende Forschung zu ermöglichen.