Skip to main content
Log in

Datenzugang in Deutschland: Der Paradigmenwechsel hat bereits stattgefunden

  • Kommentar
  • Published:
AStA Wirtschafts- und Sozialstatistisches Archiv Aims and scope Submit manuscript

The Original Article was published on 07 November 2014

This is a preview of subscription content, log in via an institution to check access.

Access this article

Price excludes VAT (USA)
Tax calculation will be finalised during checkout.

Instant access to the full article PDF.

Abb. 1
Abb. 2

Notes

  1. Auf Grund der Heterogenität der FDZ-Landschaft wird hier eine tiefer gehende Definition einzelner FDZs als bei Ulrich Rendtel verwendet. Seine Aussagen beziehen sich nahezu nur auf die Forschungsdatenzentren der Statistischen Ämter des Bundes und der Länder (www.forschungsdatenzentrum.de). Auch muss man nicht unbedingt seiner Definition von amtlicher Statistik zustimmen(vgl. hierzu auch http://wirtschaftslexikon.gabler.de/Archiv/959/amtliche-statistik-v8.html).

  2. Der Datenzugang beim Nationalen Bildungspanel über RemoteNEPS (u.a. mit einem biometrischen Authentifizierungssystem) ist beispielsweise einzigartig in Deutschland (https://www.neps-data.de/de-de/datenzentrum/datenzugang/remoteneps.aspx).

  3. Ausnahme stellen Schulungen einzelner FDZ zum jeweiligen Datenangebot und die Workshop-Reihe datalab@uni-bielefeld (datalab2011@uni-bielefeld, datalab2012@uni-bielefeld und datalab2013@uni-bielefeld) dar. Datalab@uni-bielefeld zeichnete sich dadurch aus, dass mehrere Datenanbieter gemeinsam ihre Daten interessierten Forscherinnen und Forschern darstellen konnten. Leider – so mein Wissensstand – sind für diese Veranstaltung keine Gelder mehr vorhanden.

  4. In vielen anderen Ländern müssen die Kosten nicht zu 100 Prozent von den Datenanbietern getragen werden. Dies vergisst Ulrich Rendtel in seinem (selektiven) Blick in andere europäische Länder zu erwähnen.

  5. Ich möchte hier nicht missverstanden werden: Natürlich hat ein Datenzugang für Externe auch immer einen positiven Effekt beim Datenproduzenten, z.B. bei der Verbesserung der Datenqualität, Marketing-Aspekte bei der Verwendung von wissenschaftlichen Ergebnissen für die eigene tägliche Praxis. Dieser Nutzen rechtfertigt jedoch nicht die alleinige Kostenübernahe auf Seiten der Datenproduzenten, obwohl beispielsweise die Bundesagentur für Arbeit wie auch die Deutsche Rentenversicherung momentan die vollen Kosten des Datenzugangs übernehmen.

  6. Leider sind in dem folgenden Zitat von Ulrich Rendtel diverse Ungenauigkeiten enthalten, denen mit kurzen Statements entgegnet werden muss:

    „In diesen Fällen müssen die Wissenschaftler auf die kontrollierte Datenfernverarbeitung ausweichen oder aber als Gastwissenschaftler das FDZ aufsuchen. Allerdings dürfen sie nur dann den Output einsehen, wenn er dem weitaus schärferen Kriterium der absoluten Anonymität entspricht. Die Wissenschaftler werden also wie jeder andere Nutzer behandelt und verlieren bei diesem Datenzugang ihr Wissenschaftsprivileg. Hält man sich den geringen Anteil der Scientific Use Files am Datenangebot vor Augen, so ist diese Regelung ein herber Verlust für das Auswertungsinteresse der Wissenschaft. Da diese Regelung durch das BStatG nicht zwingend vorgegeben ist, wäre schon einiges gewonnen, wenn man in Rahmen der kontrollierten Datenfernverarbeitung die Kontrolle von absolut anonym auf faktisch anonym reduziert.“ (Ulrich Rendtel)

    Entgegnung:

    Im Gastaufenthalt darf jeder beliebige Output am Bildschirm angesehen werden. Erst wenn der Output das FDZ der BA im IAB verlassen soll, wird dieser geprüft und absolut anonymisiert.

    1. Die Wissenschaftlerinnen und Wissenschaftler werden nicht, wie jeder anderer Nutzer behandelt, da die anderen Nutzerinnen und Nutzer überhaupt nicht an das Privileg einer Auswertung kommen.

    2. Ein Output, der das FDZ der BA im IAB verlässt, kann potentiell von jedem angesehen werden. Daher ist dieser Output auf absolute Anonymität zu prüfen.

    3. Nach Ulrich Rendtel soll die Auswertung eines verfremden Scientific Use File besser sein als die Analyse an den fast unveränderten Daten mit anschließender Outputkontrolle. Nach meinen Erfahrungen ist es besser, wenn die Analyse mit einem möglichst nicht verfremdeten Datensatz durchgeführt wird, da eine Beurteilung der Qualität des Outputs besser ist. Da die Anonymisierung eines Outputs meist in der Aggregation bzw. im Weglassen von Werten besteht, kann – auch durch den Vergleich des Outputs vor und nach der Anonymisierung – der „Schaden“ der Anonymisierung besser beurteilt werden. Dies gilt umso mehr, wenn multivariate Analysen durchgeführt werden. Hier kann der Output meist ohne Änderungen weitergegeben werden, Daher ist die Nutzung der Originaldaten mit anschließender Outputkontrolle der Nutzung eines Scientific Use Files vorzuziehen.

    4. Wie soll ein faktisch anonymer Output aussehen? Die Fallzahlen für die Erreichung der absoluten Anonymität in einem Output sind meist auch vergleichsweise niedrig. Daher klafft meist keine große Lücke zwischen dem gewünschten und dem anonymisierten Output (außer man hat ein Interesse anEinzelfallanalysen).

  7. Die Zugangsarten Campus Files oder Public Use Files werden hier nicht weiter betrachtet. Sie sind in der Regel stärker anonymisierte Scientific Use Files, weil sie dem Kriterium „absolute Anonymität“ genügen müssen.

  8. Die Schalterstelle war sehr erfolgreich: In den ersten zwei Jahren konnten mehr als 250 Anfragen von fast 100 Wissenschaftlerinnen und Wissenschaftlern bearbeitet werden (Kölling 2001).

  9. Nachfolgender Text zu den Nutzungszahlen (inkl. der beiden Abbildungen) ist aus Bender et al. (2014b).

  10. Ein Projekt kann mehrere Personen umfassen, über mehrere Jahre laufen und mehrere Datensätze sowie Zugangswege kombinieren.

  11. Trotz der vielen Gastaufenthalte wurden in 2013 beispielsweise 1875 Outputs aus der Datenfernverarbeitung datenschutzrechtlich im FDZ der BA im IAB geprüft. In der Regel geht der geprüfte Output am gleichen oder am nächsten Tag an die Nutzerinnen oder Nutzer (vgl. Bender et al. 2014b).

  12. http://www.oecd.org/std/microdata-access-final-report-OECD-2014.pdf

  13. http://www.dwbproject.org/export/sites/default/about/public_deliveraples/d4_1_current_sc_in_europe_report_full.pdf.

  14. Big Data wird über die Datenkomplexität definiert, die sich durch ein hohes Datenvolumen (volume), eine hohe Datenrate (velocity), einer hohen Datenheterogenität (variety)) und unbestimmter Datenqualität (veracity) charakterisieren lässt.

  15. Eine Diskussion darüber, ob die Regeln von Müller et al. (1991) zur Erstellung von Scientific Use Files vor dem Hintergrund eines stetig wachsenden, immer detaillierten und immer leichter zugänglich werdenden Zusatzwissens noch gelten können, erscheint mir überfällig. Vielleicht sind auch deshalb die Zugangswege „Datenfernverarbeitung“ und „Gastaufenthalte“ zu präferieren. Hier spielt ein mögliches Zusatzwissen nur eine untergeordnete Rolle, weil es für eine mögliche Deanonymisierung nicht direkt eingesetzt werden kann.

  16. Diese Link lohnt sich alleine deshalb zu öffnen, um die Millionenbeträge, die England momentan für den Zugang zu diesen Daten investiert, mit denen in Deutschland zu vergleichen.

  17. Dies führt beispielsweise zu Informationsanfragen aus dem Ausland (hier Indien): http://www.thehindubusinessline.com/opinion/the-importance-of-labour-statistics/article6475770.ece#comments.

  18. Hier sei auf die Tagung von Hella von Unger und Jasmin Siri (beide LMU) hingewiesen: http://www.qualitative-sozialforschung.soziologie.uni-muenchen.de/tagung/programm-11_09_14.html.

Literatur

  • Bender S, Burghardt A, Schiller D (2014a) International access to administrative data for Germany and Europe. In: Dusa A, Nelle D, Stock G, Wagner G (Hrsg) Facing the future. European research infrastructures for the humanities and social sciences. Scivero, Berlin, S 75–86

    Google Scholar 

  • Bender S, Heining J (2011) The Research-Data-Centre in Research-Data-Centre approach: a first step towards decentralised international data sharing. IASSIST Quarterly 35(3):10–16

    Google Scholar 

  • Bender S, Schmucker A, Dietrich I, Gunselmann I, Müller D, Seth S, Zakrocki V (2014b) FDZ-Jahresbericht 2011–2013. (FDZ-Methodenreport, 08/2014 (de), Nürnberg, 23 S

  • Brandt M (2012) European data access comes true: decentralised and remote access to confidential data in the ESS (ESSnet DARA). In: PSD’12 Proceedings of the 2012 international conference on Privacy in Statistical Databases. Springer Verlag, Heidelberg, S 286–294

    Google Scholar 

  • Hochfellner D, Müller D, Schmucker A (im Erscheinen) Privacy in confidential administrative micro data: Implementing Statistical disclosure control in a secure computing environment. J Empir Res Hum Res Ethics ERHRE http://jre.sagepub.com/content/early/2014/09/29/1556264614552799.full.pdf

  • Hören T (2014) Big Data und Recht. C H Beck, München

    Google Scholar 

  • Kölling A (2000) The IAB-Establishment Panel. Schmollers Jahrbuch. Zeitschrift für Wirtschafts- und Sozialwissenschaften 120(2):291–300

    Google Scholar 

  • Kölling A (2001) Ein „Schalter“ für die Forschung * Daten des IAB-Betriebspanels stehen externen Forschern seit 1999 zur Verfügung. (09/2001), IAB-Werkstattbericht, Nürnberg, 5 S

    Google Scholar 

  • Kommission zur Verbesserung der informationellen Infrastruktur zwischen Wissenschaft und Statistik (KVI) (2001) Wege zu einer besseren informationellen Infrastruktur. Nomos Verlagsgesellschaft, Baden-Baden

    Google Scholar 

  • Lane J, Heus P, Mulcahy T (2008) Data access in a cyber world: Making use of cyberinfrastructure. Trans Data Priv 1:2–16

    MathSciNet  Google Scholar 

  • Lane J, Stodden V, Bender S, Nissenbaum H (Hrsg) (2014) Privacy, big data, and the public good * frameworks for engagement. Cambridge University Press, Cambridge

    Book  Google Scholar 

  • Müller W, Blien U, Knoche P, Wirth H et al (1991) Die faktische Anonymität von Mikrodaten, Bd. 19 der Schriftenreihe Forum der Bundesstatistik, herausgegeben vom Statistischen Bundesamt. Metzler-Poeschel, Stuttgart

    Google Scholar 

  • Ritchie F (2008) Secure access to confidential microdata: Four years of the Virtual Microdata Laboratory. Econ Labour Market Rev 2(5):29–34

    Article  Google Scholar 

  • Schiller D, Welpton R (im Erscheinen): Distributing access to data, not data – providing remote access to European microdata. IASSIST Quarterly

  • Wagner J (1994) Nutzung von Betriebsdaten der amtlichen Statistik für wissenschaftliche Untersuchungen – Ein Modellprojekt. Allgemeines Statistisches Archiv 78(4):434–440

    Google Scholar 

Download references

Author information

Authors and Affiliations

Authors

Corresponding author

Correspondence to Stefan Bender.

Additional information

Dies ist eine persönliche Stellungnahme und hat somit weder etwas mit dem Forschungsdatenzentrum der Bundesagentur für Arbeit im Institut für Arbeitsmarkt- und Berufsforschung noch mit dem Rat für Sozial- und Wirtschaftsdaten zu tun. Ich bedanke mich bei meinen Mitarbeiterinnen und Mitarbeitern, die mir in den letzten Jahren viel beigebracht haben. Vieles konnte ich für meine persönliche Stellungnahme verwenden. Dank auch an Joachim Wagner für die schnelle Zusendung einer wichtigen Literaturquelle.Viele Anmerkungen von Ulrich Rendtel beziehen sich auf das Bundesstatistikgesetz. Da ich hier keine Experte bin, findet sich in meiner Stellungnahme dazu leider nichts.

Rights and permissions

Reprints and permissions

About this article

Check for updates. Verify currency and authenticity via CrossMark

Cite this article

Bender, S. Datenzugang in Deutschland: Der Paradigmenwechsel hat bereits stattgefunden. AStA Wirtsch Sozialstat Arch 8, 237–248 (2014). https://doi.org/10.1007/s11943-014-0158-1

Download citation

  • Published:

  • Issue Date:

  • DOI: https://doi.org/10.1007/s11943-014-0158-1

Navigation