Big Data und Wissen

Lünich, Marco

doi:10.1007/978-3-658-36368-0_4

Marco Lünich²

4613 Accesses

Zusammenfassung

Wie erörtert, sollen Daten die Wirklichkeit nicht nur vermeintlich objektiv, realitätsgetreu und folglich wahrheitsgemäß abbilden, sondern auf den Daten basierende Einsichten sollen und werden im Rahmen einer vorrangig ökonomischen Verwertungslogik in der postindustriellen Gesellschaft genutzt. Die besondere Bedeutung der Erzeugung, Verteilung und Verwertung von Wissen auf Datengrundlage spielt dabei auch direkt auf Vorstellungen an, die mit dem Konzept der Wissensgesellschaft verbunden sind und in den vergangenen Jahrzehnten vielfach in der Öffentlichkeit diskutiert wurden (Kübler, 2009).

You have full access to this open access chapter, Download chapter PDF

Wie erörtert, sollen Daten die Wirklichkeit nicht nur vermeintlich objektiv, realitätsgetreu und folglich wahrheitsgemäß abbilden, sondern auf den Daten basierende Einsichten sollen und werden im Rahmen einer vorrangig ökonomischen Verwertungslogik in der postindustriellen Gesellschaft genutzt.^{Footnote 1} Die besondere Bedeutung der Erzeugung, Verteilung und Verwertung von Wissen auf Datengrundlage spielt dabei auch direkt auf Vorstellungen an, die mit dem Konzept der Wissensgesellschaft verbunden sind und in den vergangenen Jahrzehnten vielfach in der Öffentlichkeit diskutiert wurden (Kübler, 2009).

Im Zuge des technischen Fortschritts entstand ein neues Verständnis der Wesensmerkmale von Gesellschaften unter dem Einfluss neuer IuK, das auf deren spezifische Auswirkungen auf Wissensordnungen und deren gesellschaftliche Bedeutung abstellt. Innovationen wie das Internet und Smartphone diffundieren dabei nach und nach über den ganzen Erdball, so dass digitale Technologien mittlerweile auch in den Schwellen- und Entwicklungsländern weite Verbreitung finden (Etzo & Collender, 2010; UNCTAD, 2017). Stand 2018 gibt es allein in Afrika mehr als 419 Millionen Nutzer*innen mobiler Breitbandverbindungen (Reed, 2017). Das einst von McLuhan (1962) vorgestellte globale Dorf nimmt damit in den Augen vieler Beobachter*innen nach und nach Gestalt an und lässt die Welt durch schnellen entgrenzten Wissensaustausch vor allem wirtschaftlich zusammenwachsen (Friedman, 2005).

Die gestiegene quantitative und qualitative Bedeutung von Informationen und Wissen wurde in diesem Zusammenhang auch von der Wissenschaft kommentiert und als Anlass genommen, Gesellschaftsentwürfe und Epochen wie das Informationszeitalter (Castells, 1996, 1997, 1998) oder die Wissensgesellschaft auszurufen (Böhme & Stehr, 1986; Kübler, 2009; Stehr, 2012). Bevor jedoch auf entsprechende globale Gesellschaftsdiagnosen eingegangen werden kann, soll nachfolgend zunächst dargelegt werden, was es mit dem Begriff des Wissens auf sich hat (siehe Abschnitt 4.1). Dabei soll Wissen immer in seiner besonderen Beziehung zu den Eigenschaften der großen digitalen Datenbestände betrachtet werden. Anschließend muss dann erörtert werden, wieso nun Wissen eine zentrale Kategorie der Gesellschaftsdiagnose der Wissensgesellschaft ist, warum diese im Zusammenhang mit den digitalen Daten eine positive Konnotation erfährt und welche kommunikative Bedeutung ein entsprechender Mythos in diesem Zusammenhang hat (siehe Abschnitt 4.2). Erst vor diesem Hintergrund kann die soziale Bedeutung des Wissens aus Quantifizierung und hierauf basierender Vergleiche in einer digitalisierten Welt demonstriert werden (siehe Kapitel 5). Auch kann erst dann die Konsequenz für die Erwartungen an digitale Daten herausgearbeitet werden, um eine Analyse der Konsequenzen gesellschaftlicher Perzeptionen von datenverarbeitender IuK vorzubereiten (siehe Kapitel 6).

4.1 Der Wissensbegriff

Wissen ist ein zentraler Begriff für die vorliegende Arbeit. Es wäre zu kurz gegriffen, sich damit zu begnügen, auf den vordergründig allgemein- und somit vermeintlich selbstverständlichen Zusammenhang von Wissen abzustellen und über diese Verkürzung direkt mit der Bedeutung des Wissensbegriffes im Rahmen der Wissensgesellschaft sowie der eigentlichen Unterscheidung von Wissens- und Glaubenssystemen fortzufahren. Es müssen zunächst die Bedingungen des Wissens erörtert werden, um nachfolgend zu zeigen, wie sich Wissen zu den digitalen Datenbeständen und auch den Bürger*innen verhält. Welches Wissen steckt in den Daten bzw. kann in ihnen stecken? Welchen Zugang haben Bürger*innen zu diesem Wissen? Dabei wird deutlich werden, dass Wissen unterschiedliche Qualitäten und somit Affordanzen besitzt. Es ist dann herauszuarbeiten, über welches Wissen denn konkret gesprochen wird, wenn über aus digitalen Daten gewonnenes Wissen gesprochen wird, und wie die oder der durchschnittliche Bürger*in auf dieses Wissen zugreift, es internalisieren und nutzen kann oder zumindest an einem solchen Prozess teilhaben kann, wenn Dritte das Wissen aus den Daten verarbeiten.

Wo fängt eine Beschäftigung mit Wissen an? Die Literatur zum Begriff des Wissens (und auch des Glaubens sowie ihrer Abgrenzung) ist nicht zu überschauen. Abhandlungen darüber, ob und wie der Mensch wissen und erkennen kann, füllen Bibliotheken und führen ideengeschichtlich zurück bis in die Antike zu Platon (2017). Die Erkenntnistheorie, auch Epistemologie genannt, ist ein Hauptgebiet der Philosophie und eine eigene Wissenschaftsdisziplin (Baumann, 2015). Da Wissen das Wesen von Wissenschaft im Kern betrifft und diese Arbeit insbesondere auf die Wissensdimension von Big Data abstellt und einer sozialwissenschaftlichen Analyse zuführt, kann und soll zwar keine ausführliche philosophische Aufarbeitung geleistet werden. Jedoch sind an dieser Stelle ein paar Setzungen sinnvoll und nötig, die deutlich machen, wie sich Wissen zur besonderen Qualität digitaler Daten verhält. Sie beschränken sich dabei auf ein Grundverständnis und stehen nachfolgend immer in konkretem Bezug zu Big Data und dem Erkenntnisinteresse der vorliegenden Arbeit.^{Footnote 2}

Wenden wir uns zunächst einer Definition von Wissen zu und erörtern, was gemeinhin gemeint ist, wenn von Wissen gesprochen wird. Ähnlich wie bei den zuvor thematisierten theoriegeladenen Konstrukten Digitalisierung oder Big Data gibt es auch für Wissen keine allgemeingültige Definition. Mal wird Wissen als eine Handlungskompetenz (von Subjekten) verstanden, mal als „auf wahre Aussagen zielende Größe“ (J. Hofmann, 2001, S. 3). Laut Ichikawa und Steup (2018) gibt es trotz weitreichender Begriffsarbeit und epistemologischer Konzeptionierungsansätze keine allgemein akzeptierte systematische Untersuchung des Wissens und seiner Bestandteile, wobei teilweise bereits die Möglichkeit solch einer Analyse verneint wird. Bei ihrer Betrachtung von Wissen stellen sie insbesondere auf propositionales Wissen und dessen Bedingungen ab:

The project of analysing knowledge is to state conditions that are individually necessary and jointly sufficient for propositional knowledge, thoroughly answering the question, what does it take to know something? By ‘propositional knowledge’, we mean knowledge of a proposition—for example, if Susan knows that Alyssa is a musician, she has knowledge of the proposition that Alyssa is a musician. (§ 2)

Dieses Verständnis propositionalen Wissens, bei dem gefragt wird, welche Bedingungen erfüllt sein müssen, damit man wissen kann, ist aufgrund seiner subjektbezogenen Perspektive auch für die vorliegende Arbeit zielführend. Wissen wird dabei in der klassischen Analyse von Wissen (KAW) auch als ein ‘justified true belief’ verstanden, den eine Person haben kann (Ichikawa & Steup, 2018). Wie nun zu erörtern sein wird, ist das im vorliegenden Forschungszusammenhang thematisierte Wissen auf Grundlage digitaler Daten an dieses Wissensverständnis anschlussfähig.

Den Ausführungen von Ichikawa und Steup zu dieser traditionellen Dreiteilung folgend, muss Wissen mithin drei notwendige und zusammenwirkend hinreichende Bedingungen erfüllen, die nachfolgend erläutert werden: (1) die Bedingungen der Wahrheit, (2) der Überzeugung und (3) der Rechtfertigung (auch: Nicht-Zufälligkeit, vgl. Baumann, 2015, S. 37–40).

4.1.1 Die Bedingung der Wahrheit

Ichikawa und Steup (2018, § 10) folgend kann man nur Dinge (nachfolgend auch als Entitäten bezeichnet)^{Footnote 3} wissen, die wahr sind. Aussagen, die falsch oder unwahr sind, können somit nicht gewusst werden. Dabei ist für die Wahrheit einer Entität jedoch nicht notwendig, dass überhaupt jemand etwas über sie wissen kann oder in der Lage ist, zu beweisen, dass sie wahr ist. Eine Wahrheit muss mithin nicht bekannt sein, aber Wissen, das bekannt ist – im Sinne einer getroffenen Feststellung von etwas vermeintlich Gewusstem – muss wahr sein.

Truth is a metaphysical, as opposed to epistemological, notion: truth is a matter of how things are, not how they can be shown to be. So when we say that only true things can be known, we’re not (yet) saying anything about how anyone can access the truth. (…) Knowledge is a kind of relationship with the truth—to know something is to have a certain kind of access to a fact. (Ichikawa & Steup, 2018, § 12, Hervorh. im Orig.)

Die Bedeutung dieser Bedingung wird also insbesondere in solchen Momenten deutlich, in denen die Voraussetzung der Wahrheit verletzt ist, also bspw. mit Bezug auf unwahre Tatsachen, wie etwa der um Mitternacht getroffenen Aussage, es sei gerade Mittagszeit. Mithin bezeichnet Baumann (2015) die Bedingung des Wissens auch als die „Unproblematischste“ (S. 36) und ihre spezifischen Rahmenbedingungen sollen an dieser Stelle nicht weiter vertieft werden.

Digitale Daten und die Bedingung der Wahrheit

Dass Wahrheit und Wahrhaftigkeit bezüglich digitaler Daten jedoch ebenfalls eine bedeutende Rolle spielen, wurde bereits mit Blick auf die zuvor besprochene Dimension der Richtigkeit der digitalen Daten deutlich (siehe Abschnitt 3.5.1). Hier besteht der Anspruch, dass, unter Annahme einer objektiven Beobachtung und eines präzisen Übersetzungsprozesses realweltlicher Tatsachen in Daten, prinzipiell Wahrheiten in diesen Daten dokumentiert sind und sich erkennen lassen. Die digitalen Daten sind somit wichtiger Bezugspunkt von Wissen, auch wenn die tatsächliche Wahrheit vermeintlicher Tatsachen in ihrer Bedingung für Wissen zwar (noch) nicht zweifelsfrei bewiesen sein muss, so doch aber zumindest mit gewisser empirischer Evidenz unterfüttert ist: “Something’s truth does not require that anyone can know or prove that it is true. Not all truths are established truths” (Ichikawa & Steup, 2018, § 12, Hervorh. im Orig.). Es kann trotz möglicher angesprochener Einschränkungen zumindest generell davon ausgegangen werden, dass sich auf Grundlage digitaler Daten Wahrheiten erkennen und wahrhaftige Aussagen tätigen lassen.

4.1.2 Die Bedingung der Überzeugung

Noch wichtiger, insbesondere mit Blick auf den vermeintlichen Erkenntnisgewinn aus digitalen Daten, ist die Bedingung der Überzeugung, die auch einen zentralen Bestandteil des in dieser Arbeit analysierten Glaubenssystems zu Big Data darstellt (Arisov et al., 2019). Nur wenn man von etwas überzeugt ist, dann kann man es auch wissen. Die Bedingung wird bei Ichikawa und Steup (2018) auch wie folgt beschrieben: “The general idea behind the belief condition is that you can only know what you believe. Failing to believe something precludes knowing it” (Ichikawa & Steup, 2018, § 13). Dabei ist Überzeugung im Rahmen des Wissens trotz der vorliegenden Umschreibung gerade nicht mit einem Glauben zu verwechseln, wie er nachfolgend im Rahmen von Glaubenssystemen thematisiert wird. Während Glaube mit Unsicherheit behaftet sein kann und somit mehr oder weniger stark ausgeprägt ist, geht es hier eher um ein starkes Für-wahr-Halten. Gemeint ist dahingehend also eine Überzeugung, die möglichst absolut ist, also keinerlei Zweifel zulässt: Eine Überzeugung zu haben bedeutet, dass eine Person annimmt, dass etwas auch tatsächlich der Fall ist (Baumann, 2015). Das heißt, dass mit der Überzeugung i. S. v. Wissen nicht lediglich eine hohe Zuversicht verbunden sein sollte, sondern eine möglichst absolute Verbindlichkeit. Es wird mit Blick auf Wissen auch von einem Full Belief oder Outright Belief gesprochen, der von unterschiedlichen abzugrenzenden Konfidenzebenen unterschieden wird: “(…) Having an outright belief is a state of being stably disposed to treat p as though it were practically certain” (Wedgwood, 2012, S. 321, Hervorh. im Orig.).

Digitale Daten und die Bedingung der Überzeugung

Es ergibt sich wie gezeigt eine besondere Qualität der Überzeugungsleistung von Wissensinhalten auf Grundlage digitaler Daten für das Wissen, da sie zumindest ihrer Beschreibung nach als Beobachtungen von Tatsachen wahre Begebenheiten realitätsgetreu abbilden können und somit in der Lage sind, Überzeugungen zu nähren, wie etwas wirklich ist. Aus der Sicht eines empirisch lernenden Subjekts können also digitale Beobachtungsdaten die Bedingung der Überzeugung von Aussagen fördern, wenn sie diese faktisch stützen. Dabei ist die Tragweite datenbasierter Überzeugung selbstredend in Abhängigkeit situativer Einflüsse zu bewerten und wird mithin immer subjektiv evaluiert. Es geht hier jedoch um das Potential der digitalen Daten für die Überzeugung von Wissenspropositionen. Dieses ist im Sinne von Wissenschaft, die ihr Wissen empirisch auf Grundlage gesammelter Daten schafft, durchaus gegeben (Chalmers, 1976).

4.1.3 Die Bedingung der Rechtfertigung

Als dritte Bedingung wird in der klassischen Analyse des Wissens die Rechtfertigung propositionalen Wissens in den Blick genommen. Die Bedingung betrifft die Herleitung und Begründung eines Wissensinhalts:

Why not say that knowledge is true belief? The standard answer is that to identify knowledge with true belief would be implausible because a belief might be true even though it is formed improperly. Suppose that William flips a coin, and confidently believes—on no particular basis—that it will land tails. If by chance the coin does land tails, then William’s belief was true; but a lucky guess such as this one is no knowledge. For William to know, his belief must in some epistemic sense be proper or appropriate: it must be justified. (Ichikawa & Steup, 2018, § 19, Hervorh. im Orig.)

Die Bedingung der Rechtfertigung wird von Baumann (2015) folglich auch als „Nicht-Zufälligkeit“ (S. 37) beschrieben: Dabei geht es nicht um die Zufälligkeit des Zustandekommens der Tatsachen, die eine Überzeugung ‚wahr machen‘, sondern die Abwesenheit von Anhaltspunkten, auf die eine Person Überzeugungen begründet. Diese Zufälligkeit von Überzeugungen kann nicht als Wissen gelten.

Digitale Daten und die Bedingung der Rechtfertigung

Wenn zum Wesen von (digitalen) Daten gehört, dass sie Überzeugungen nähren, dann müssen sie wiederum auch ebenso dazu dienen können, als Rechtfertigung von propositionalen Wissenssätzen herangezogen werden. Wie in Kapitel 3 erörtert, sind die digitalen Daten, die unter den in dieser Arbeit verwendeten Begriff von Big Data fallen, als Beobachtungsdaten zu verstehen. Sie dienen somit als die zuvor angesprochenen Anhaltspunkte von Beobachtenden, auf die sich Wissen über etwas stützen muss, und können mithin als besondere Form von Evidenz gelten, die Wissen rechtfertigt. Sie sind, unter der Voraussetzung ihrer Richtigkeit, (binär) codiert festgehaltene Beobachtungen von Tatsachen der Welt.

Die Problematik der Dynamik von Wissen

Die drei zuvor genannten Bedingungen als Startpunkt der Analyse von Wissen wurden insbesondere durch die Formulierung des Gettier-Problems (Gettier, 1963) in Frage gestellt. Gettier stellt darauf ab, dass eine gerechtfertigte wahre Meinung auch irrtümlich zustande kommen kann. Sie ist dann zwar wahr und man ist überzeugt von dieser Wahrheit. Es gibt auch gute Gründe, die die Annahme rechtfertigen, dennoch ist die Aussage aus anderen Gründen als den genannten wahr oder wird wahr. Lehrer und Paxson (1969) greifen diesen Einwand auf und schlagen hiervon ausgehend vor, Wissen als “undefeated completely justified true belief” (S. 225) zu definieren. Der Rechtfertigungsgrund dafür, eine Aussage als wahr zu betrachten, darf nicht durch eine andere wahre Aussage abgelehnt oder besiegt werden.

Diese Betrachtung von Wissen lässt somit die Möglichkeit offen, dass einmal als wahr betrachtete Wissensaussagen auch falsifiziert werden können oder angepasst werden müssen, sobald neue Erkenntnisse hinzukommen. Dass die Möglichkeit besteht, dass es in meiner Welt einen schwarzen Schwan gibt, obwohl ich noch nie einen solchen mit meinen Sinnen unmittelbar beobachtet habe, ist also eine lediglich mit Wahrscheinlichkeit behaftete Aussage. Im Sinne des kritischen Rationalismus von Popper (1935, 1973) kann daher eine Theorie auch nicht final bestätigt werden. Ihr Wert ergibt sich daraus, dass sie zwar Vorhersagen formulieren lässt, die empirisch geprüft werden können, jedoch immer die Möglichkeit offengelassen werden muss, dass die durch die Theorie formulierten Annahmen sowie die Theorie selbst falsifiziert werden können. Auch einmal etabliertes Wissen kann veralten oder überholt sein. Die Ansammlung von Beobachtungsdaten ist ein fortlaufendes Unterfangen, so dass neue Beobachtungen neue Evidenz zum Wissensbestand hinzufügen können. Wissen und Wissensbestände sind daher hoch dynamisch (Budin, 1996). Das ist insbesondere aus Sicht des wissenden Subjekts eine relevante Eigenschaft des Wissens, da nicht nur kritisch beurteilt werden muss, ob Wissensaussagen die genannten Bedingungen erfüllen, sondern auch laufend reflektiert werden müsste, ob das einmal erlernte Wissen die genannten Bedingungen noch immer erfüllt.

Auch wenn es durchaus noch weitere relevante Ansätze und Einschränkungen bezüglich der theoretischen Konzeption von Erkenntnis und Wissen sowie deren Voraussetzungen gibt, bleibt hier zunächst festzuhalten, dass unter der Annahme der genannten Bedingungen von Wissen auch das Wissen auf Grundlage von digitalen Daten voraussetzungsreich und mitunter durchaus problembehaftet sein kann und womöglich diversen Einschränkungen unterliegt. Diese Einschränkungen liegen sowohl primär auf Seiten der Beschaffenheit der digitalen Daten (bspw. bezüglich ihrer Objektivität für die Bedingung von Wahrheit) als auch auf Seiten des Wissenden (bspw. bezüglich ihrer Belastbarkeit für die Bedingung von Überzeugung). Es ist fraglich, inwieweit diese auch laufend kritisch reflektiert oder gar geprüft werden (können). Sieht man hiervon jedoch zunächst ab und erkennt das Wissenspotential an, das digitale Daten durchaus innehaben, muss weitergehend auf den zweckdienlichen Charakter von Wissen eingegangen werden.

4.1.4 Die Unterscheidung von deklarativem Wissen und prozeduralem Wissen

Es gibt daher noch eine weitere wichtige Unterscheidung, die mit Bezug auf Wissen allgemein und Wissen auf Grundlage von digitalen Daten getroffen werden muss und die für den argumentativen Aufbau dieser Arbeit eine zentrale Rolle einnimmt. Sie betrifft die Qualität von Wissen mit Blick auf seinen Verwendungszweck und die Zweckdienlichkeit der digitalen Daten. Bei den großen digitalen Datenbeständen handelt es sich zunächst einmal um meist unstrukturierte Daten, die wie in Abschnitt 3.2 erläutert aus binär codierten Sequenzen von Zustandsbeschreibungen bestehen, und folgen mithin dem Shannon’schen Informationsbegriff digitaler Daten.^{Footnote 4} Mit Blick auf die Unterscheidung in deklaratives und prozedurales Wissen wird hier deutlich, dass das vermeintlich in Informationen und Daten enthaltene Wissen ebenfalls unterschiedliche Qualitäten hinsichtlich seiner Zweckdienlichkeit besitzt (vgl. M. A. Wirtz, 2017, S. 1835). Wenn im Alltag von Wissen gesprochen wird, dann wird meist deklaratives Wissen gemeint oder auch Sach- bzw. Faktenwissen. Umschrieben wird das ganze häufig als ‚knowing what‘ und wird so u. a. in der Adaptive Control-of-Thought-Theorie von J. R. Anderson (1976, 1983) als ein zentrales Modul des menschlichen Gedächtnisses betrachtet. Die digitalen Datenbestände, die als Informationen aufbereitet sind, können auch als ein solches Fakten- oder Sachwissen bezeichnet werden. Demgegenüber steht das prozedurale Wissen, oft auch als Handlungswissen bezeichnet, welches das sogenannte ‚knowing how‘ betrifft. „Genau genommen versteht man unter prozeduralem Wissen Beschreibungen von Verfahren und Prozeduren zur Konstruktion, Verknüpfung und Anwendung von (deklarativem) Wissen. Es handelt sich beim prozeduralen Wissen folglich um die ‚Regeln‘, nach denen Datenstrukturen (also das deklarative Wissen) manipuliert werden“ (Reinmann-Rothmeier & Mandl, 2000, S. 323, Hervorh. im Orig.).

Auch mit Blick auf die digitalen Daten ist nun in deklaratives Wissen und prozedurales Wissen zu unterscheiden. Es reicht also nicht aus, deklaratives Wissen auf Grundlage von digitalen Daten anzusammeln und in Form von digitalen Daten zu dokumentieren. Das deklarative Wissen über die in den Daten erkannten Muster und Zusammenhänge muss auch verwertet werden und es muss daher gewusst werden, wie diese Verwertung konkret aussehen und durchgeführt werden kann. Ohne prozedurales Wissen, der Verwertung des deklarativen Wissens, bleibt das Wissen der Gesellschaft – ganz allgemein, jedoch hier insbesondere das Wissen aus digitalen Daten – unvollständig und ohne Konsequenz. Beide Formen müssen daher zusammengebracht und in den allgemeinen Wissensbestand oder in spezifische Wissenssysteme^{Footnote 5} integriert werden. So muss für eine erfolgreiche statistische Datenanalyse nicht nur gewusst werden, wann und warum man bspw. eine lineare Regression berechnet, sondern auch, wie man diese mit Hilfe einer Datenanalysesoftware tatsächlich durchführt. Zwar besteht, wie in Abschnitt 3.6 dokumentiert, die Hoffnung, dass vor allem die Anwendungen der KI den Zugang zu und die Organisation von Daten sowie folglich den hieraus geschöpften Erkenntnisgewinn vereinfachen und auf dieser Grundlage bessere Vorhersagen und Entscheidungen produzieren. Ihre tatsächliche praktische gesellschaftliche Implementierung ist jedoch noch nicht allzu weit fortgeschritten. Es fehlen zudem nach einer Erhebung des Verband der Elektrotechnik Elektronik und Informationstechnik (2019) in Unternehmen und Hochschulen allerorts KI-Fachkräfte^{Footnote 6} und es ist somit noch nicht ersichtlich, ob die hohen Erwartungen, die mit dem gesellschaftsweiten Einsatz von KI, vor allem auch mit Bezug auf Wissensarbeit, verbunden sind, auch tatsächlich eingelöst werden. Wissen, und hier insbesondere prozedurales Wissen, kann und soll mit Hilfe der unterschiedlichen Werkzeuge der IuK verarbeitet und verwertet werden; unabhängig, ob dies nun einen einfachen Algorithmus betrifft oder eine voraussetzungsreichere KI. Allerdings ist an der Schnittstelle Daten, Information und Wissen nach wie vor auch immer noch der Mensch gefragt, der um Beschaffenheit, Affordanzen und Verwendung der datenverarbeitenden Werkzeuge wissen muss sowie um die spezifische Qualität der zugeführten Daten. Unmittelbarer menschlicher Zugang zu deklarativen und prozeduralen Wissensbeständen ist und bleibt trotz oder gerade wegen datenverarbeitender IuK zumindest auf absehbare Zeit unerlässlich.

So muss an dieser Stelle konstatiert werden: Von der Fragilität des Wissens auf Datengrundlage einmal abgesehen, verfügt kein einzelner Mensch dieser Welt über all ihr Wissen. Weder ist er im Besitz des Wissens noch hat er dieses Wissen internalisiert. Diese Aussage scheint zunächst trivial, führt jedoch zu den für diese Arbeit viel wichtigeren Fragen: Welche Beziehung haben die Menschen zu einem nicht-internalisierten Wissen? Welche Bedeutung besitzt das Wissen für das Individuum und die Gesellschaft? Wie viel Wissen glaubt der einzelne Mensch, der derzeit in der vermeintlich digitalisierten Gesellschaft lebt, über eben jene Gesellschaft und ihre digitalen Datenbestände zu haben und welche Konsequenzen ergeben sich für ihn aus seinen diesbezüglichen Überzeugungen? Es gibt keinen sogenannten ‚Renaissance Man‘, also Menschen, die einen umfassenden Überblick über das aktuell verfügbare Wissen besitzen (Jones, 2009). Zwar werden die Bedeutung und die Vorteile von Generalisten mit breitem Wissensstand in einer spezialisierten arbeitsteilig organisierten Welt in letzter Zeit wieder vermehrt von der Forschung in den Blick genommen (Epstein, 2019; Melero & Palomeras, 2015). Dennoch bleibt es mit Blick auf den gesellschaftlichen Entstehungs- und Verwertungskontext von Wissen und dessen Dynamik unmöglich für das Individuum, sich einen umfänglichen Wissenstand zu erarbeiten und zu halten. Keine Data Scientists und schon keine einfachen Bürger*innen haben trotz durchaus vorhandener Berührungspunkte einen Überblick über die Datenbestände, die Vielfalt der Datenauswertungsmöglichkeiten und das hierdurch generierte Wissen über sich selbst und die Gesellschaft.

Dieses Wissen liegt, wenn überhaupt, in großen Forschungseinrichtungen, staatlichen Institutionen und Unternehmen vor und selbst dort nur jeweils in Fragmenten. Auch hier gibt es keine zentrale Stelle oder Einheit, von der das gesellschaftliche Wissen aggregiert und verteilt wird. Bleibt man bei der Öl-Metapher, so sind die Ölfelder und Ölfördertechnik wie auch die digitalen Datenbestände und datenanalytische Infrastrukturen auf dieser Erde ungleich verteilt. Mit dem substantiellen Unterschied, dass Daten in ihrer spezifischen Qualität noch vielseitiger sind als Öl, zeigt sich hier folglich, dass die qualitativen Unterschiede auf Seiten derer, die viele und vor allem hochwertige Daten besitzen, und derjenigen, die wenige Daten mit geringer Güte besitzen, noch stärker ausfallen. So bemerken bspw. boyd und Crawford (2012): “The current ecosystem around Big Data creates a new kind of digital divide: the Big Data rich and the Big Data poor” (S. 674). Andrejevic (2014) spricht daher bezüglich dieser Ungleichverteilung auch von einem Big Data Divide (vgl. McCarthy, 2016).

Es muss also mit Blick auf die vorhergehenden Ausführungen zunächst die Möglichkeit offengelassen werden, dass in Daten nicht automatisch Wissen steckt und dass man nur eine mehr oder minder gerechtfertigte Überzeugung daran haben kann, aus diesen Daten Wissen zu erhalten; von einem eventuellen individuellen oder gesellschaftlichen Nutzen, der sich hierauf begründet, ganz ungeachtet. Dies ist zum einen bedingt durch die zweifelhafte Qualität unstrukturierter sowie strukturierter Datensätze, zum anderen durch den weitgehend limitierten Zugang zu den großen digitalen Datenbeständen überhaupt, die im Rahmen der weltweiten Nutzung von IuK entstehen. Es bleibt die Feststellung, dass Erkenntnisproduktion und Wissensgewinn auf Grundlage von Big Data aus Sicht des Individuums folglich mit etwaiger Unsicherheit bezüglich ihrer tatsächlichen Konsequenzen für einen Erkenntnisgewinn behaftet sind und hiermit verbundene Erwartungen durchaus auch ins Leere laufen können. Die Mustererkennung in digitalen Daten ist mithin oftmals uneindeutig und aufgrund ihres primär indirekten und mittelbaren Charakters lediglich eingeschränkt belastbar.

Dort, wo jedoch weitgehend verlässliches Wissen produziert wird, das den zuvor besprochenen Kriterien genügt, wird unter den Vorzeichen der Vorhersagbarkeit zukünftiger Entwicklungen und seines Einflusses auf die Gestaltbarkeit von Natur, Umwelt und Gesellschaft durch wissensgeleitetes menschliches Handeln ein Nutzen für den Menschen in seiner sozialen Situation realisierbar. Diesem vermeintlichen Nutzen und diesbezüglich formulierten gesellschaftlichen Erwartungen im Verhältnis zu den großen digitalen Datenmengen widmet sich der nun folgende Abschnitt.

4.2 Die Wissensgesellschaft

An dieser Stelle ist nun ein grundlegendes Arbeitsverständnis für die Qualität digitaler Daten im Allgemeinen und Big Data im Speziellen sowie das Wesen von Wissen hergestellt. Dabei ist bereits durchgeklungen, inwieweit etwaige Querverbindungen bestehen zwischen den digitalen Daten einerseits und andererseits ihrem Potential für die Produktion und Speicherung sowie die individuelle und gesellschaftliche Verwertung von Wissen. Diese Verbindung zwischen digitalen Datenbeständen und Wissen in ihrem sozio-technischen Kontext muss nun auch noch einmal mit Blick auf ihre gesellschaftliche Bewertung explizit benannt werden. Es ist gerade ein zentrales Argument der vorliegenden Arbeit, dass es gesellschaftliche Diskurse über die vorliegenden Konstrukte Big Data und hier insbesondere des Wissens und seiner Nutzung sind, die die gesellschaftliche Wahrnehmung digitaler Datensammlung und -verwertung entscheidend prägen. Auch das Wissen selbst erfährt in dieser Hinsicht eine ganz besondere Behandlung. Es ist nicht das Wissen an sich und seine eigentliche Funktionsleistung bspw. im wissenschaftlichen System, sondern seine gesellschaftliche, vor allem medial vermittelte Bedeutung, die im Mittelpunkt steht. Der Wissensbegriff ist mittlerweile zu einem zentralen Baustein im gesellschaftlichen Selbstverständnis geworden, richtet sich jedoch hier in seiner Form eher auf Erwartungen und Überzeugungen von Wissen als auf dieses selbst. Dabei erreicht das Wissen eine so aufgeladene Bedeutung, dass es trotz oder vielleicht auch gerade aufgrund seiner Vielschichtigkeit zum Label einer entsprechenden Gesellschaftsdiagnose gerät, deren Fragen auf die Quantität und Qualität des Wissens und deren Konsequenzen für gesellschaftliche Ordnung und Wandel abstellen: die Wissensgesellschaft. Diese erlaubt dann aus soziologischer Sicht Antworten auf Fragen, die sich für ein besseres Verständnis der sozialen Bedeutung von großen digitalen Datenbeständen stellen.

Der Gesellschaftsentwurf der Wissensgesellschaft liefert dabei nicht nur vermeintliche Erkenntnisse über die Bedeutung von Informationen und Wissen für eine gesellschaftliche Organisationsform, also der zentralen Funktion, die dem Wissen in der Strukturierung – sprich: der physischen wie auch der kulturellen Reproduktion – von Gesellschaft zukommt (Castells, 1996, 1997, 1998; Degele, 2000). Der Entwurf hat darüber hinaus auch Eingang in den öffentlichen Diskurs jenseits von Wissenschaft und Ökonomie gefunden. In der Folge ist die Wissensgesellschaft eine vermeintlich wirkmächtige Erzählung, die die gesellschaftliche Selbstbeschreibung und Selbstreflexion prägt (Floridi, 2014; Kübler, 2009; Stehr, 2012). In dieser Erzählung formulierte Erwartungen haben, wie zu untersuchen ist, womöglich zentrale Bedeutung für soziales Handeln und müssen nun aufgezeigt werden.

Es finden sich allerdings unzählige Definitionsangebote und Konzeptionen von Wissensgesellschaft (vgl. Kübler, 2009, S. 89 ff.).^{Footnote 7} Gemeinsamer Ausgangspunkt ist dabei immer die spezielle Bedeutung, die Wissen für gesellschaftliche Transformationsprozesse zugeschrieben wird, wobei die Bedeutung von Wissen hier unterschiedlicher Natur sein kann. Denn der Wissensbegriff und seine Rolle für die Gesellschaft sind an sich erst einmal recht beliebig, kommt doch keine Gesellschaftsform gänzlich ohne Wissen aus. So sind die Feststellungen von Kübler (2009) fast schon als Anleitung zu lesen, den vielschichtigen Begriff des Wissens und seine mehrdimensionale, spezifische Qualität vor dem Hintergrund seiner sozialen Bedeutung nachvollziehbar zu erläutern, weshalb in den vorangegangenen Kapiteln zunächst verdeutlicht werden musste, wie digitale Daten Wissen herleiten können:

Da man sich kaum mehr die Mühe macht, hinreichend zu definieren, was unter den Kernbegriffen verstanden wird bzw. sich mit reichlich willkürlicher Tautologie begnügt, wie vielfach schon gezeigt worden ist und weiter zu belegen sein wird, bemerkt sie indes kaum jemand. ‚Wissen‘ ist zum eindrucksvollen, autoritätsheischenden und Fortschrittlichkeit signalisierenden Paradigma avanciert – was eigentlich für ein so altes und unspektakuläres Wort erstaunlich ist – und wird daher nicht nur reichlich wahllos und unreflektiert verwendet, es wird auch beliebig kombiniert, damit vergewaltigt, verzerrt und entleert (…). (S. 89)

Es wird hier also zum einen deutlich, dass es nicht den einen Zugang zur gesellschaftlichen Bedeutung von Wissen geben kann und der in dieser Arbeit hergeleitete einer von vielen möglichen ist. „Alle Objektivierungsversuche laufen daher substantiell fehl oder sind allenfalls partiell zutreffend“ (Kübler, 2009, S. 194). Das bedeutet zum anderen jedoch auch, dass er als diskursiv anschlussfähiges Konstrukt offenbleibt für individuelle und gesellschaftliche Erwartungen, was Wissen nun im Einzelnen für Gesellschaft bedeutet und mit Blick auf einen Glauben an Big Data zu diskutieren sein wird (siehe Abschnitt 6.2.2). In diesem Zusammenhang hat das Wissen als Gegenstand vor allem im Rahmen wissenschaftlicher Diskurse Aufmerksamkeit erfahren. Relevante Fragen gesellschaftlicher Wissens- und Forschungsbezüge werden durch Wissenschaft aufgegriffen, bearbeitet und Erkenntnisgewinne mittlerweile unter Bedingungen und Erwartungen einer zunehmenden Medialisierung und Professionalisierung in die Öffentlichkeit zurückgespielt (Eisenegger & Imhof, 2008; Marcinkowski & Kohring, 2014; M. S. Schäfer, 2007).

Mit Blick auf ein allgemeines Verständnis von Wissen und seines gesellschaftlichen Nutzens wurde hier vor allem der ökonomische Verwertungszusammenhang untersucht, wobei aufbauend auf Heidenreich (2003) vier dominante Perspektiven auf die Wissensgesellschaft unterschieden werden. Diese setzen dabei jeweils unterschiedliche Schwerpunkte der gesellschaftlichen Konsequenz von Wissen für Arbeit und Wirtschaft und leiten entsprechende Analysen an. Erstens wird hier ebenfalls auf die auch in dieser Arbeit vielbesprochenen IuK abgestellt, die der gesellschaftlichen Produktion, Verteilung und Verwertung von Wissen einen entscheidenden Schub gegeben haben. Zweitens wird Wissen „als wichtige Ursache wirtschaftlichen Wachstums – neben den klassischen Faktoren Kapital und Arbeit – eingeführt“ (Heidenreich, 2003, S. 25). Drittens stehen jene Branchen und Unternehmen im Fokus, bei denen Wissen als Ausgangspunkt für neue und ökonomisch bedeutungsvolle Dienstleistungen und Produktionsprozesse fungiert. In diesem Rahmen wird viertens auch auf die gestiegene Bedeutung von flexiblen und lernenden Organisationen, wissens- und kommunikationsintensiver Arbeit und entsprechend auf ausgebildete Wissens-Arbeitskräfte (bspw. sogenannte Data Scientists) eingegangen. An dieser eher ökonomischen Perspektive auf die Arbeitswelt lässt sich nachvollziehen, wie sich eine gesellschaftliche Transformation durch Wissen vor allem auch vor dem Hintergrund ihrer Konsequenzen für Individuum und Gesellschaften untersuchen lässt. Diesbezüglich generierte Erkenntnis unterscheidet sich zwar von aus ihr abgeleiteter erwarteter Bedeutung der Nutzung von Wissen für die Zukunft, kann sich jedoch auch durchaus gegenseitig bedingen.

Denn unter der Annahme, dass Wissen nun zentral oder womöglich gar konstitutiv für Gesellschaften heutiger Prägung ist, ist für die vorliegende Arbeit nun eben die Perspektive und das Selbstverständnis der Bevölkerung bezüglich des eigenen Status als Wissensgesellschaft von Bedeutung. Mit Blick auf die zuvor thematisierte Problematik der vermeintlichen Unschärfe bzw. und Inhaltslosigkeit des Begriffs

bleibt die ‚Wissensgesellschaft‘ als vorgeblich neue Formation oder auch nur qualitativer Status ein Mythos. (…) Im wesentlichen [sic] fungiert der Mythos dabei als projektive Parabel für kulturell und gesellschaftlich typische bzw. dominante Weltdeutungen, seien sie überhöhend, verklärend und/oder simplifizierend, freilich auch mit einem Substrat von Wahrhaftigkeit, wonach das Subjekt trotz oder gerade wegen der verwirrenden Informationsfülle immer noch strebt. (Kübler, 2009, S. 196)

Der Nachweis, dass der Mythos der Wissensgesellschaft nun tatsächlich beim Subjekt verfängt, ist hiermit jedoch noch nicht erbracht, auch wenn nach Ansicht Küblers (2009) klar ist, dass es vor allem die medial vermittelte Kommunikation ist, die an Produktion und Verbreitung von Mythen maßgeblich beteiligt ist: „Insofern gehen Medien und soziale Mythen mittlerweile in der Tat sehr enge, reziproke Beziehungen ein, potenzieren sich ständig weiter und lassen vielfach nicht mehr zwischen realer Substanz und imaginativer, projektiver Virtualität sicher unterscheiden“ (S. 197). Eine empirische Analyse, inwieweit mit der Wissensgesellschaft verknüpfte Projektionen tatsächlich in der Bevölkerung verfangen und wozu dies führen mag, scheint vor der vermeintlichen Tragweite ihrer Konsequenzen daher dringend geboten.

Die Wissensgesellschaft und der Mythos von Big Data

Die fundamentale gesellschaftliche Bedeutung des Wissens bietet dabei bildsprachlich den Nährboden, aus dem auch Erwartungen an das Potential großer digitaler Datenbestände sprießen könnten. Immerhin fügt sich das Aufkommen von Big Data durch seine besondere Beziehung zur Möglichkeit von Wissen, die zuvor dokumentiert wurde, nahtlos in die Erzählung zur Wissensgesellschaft ein. Anders als beim allgemeinen Wissensbegriff können aus der besonderen Qualität digitaler Daten abgeleitete manifeste und weitreichende Konsequenzen für die Bevölkerung beschrieben werden, wie im nachfolgenden Abschnitt zu zeigen sein wird. Das Primat digitaler Daten wird daher vor dem Hintergrund ihrer Beziehung und Funktion für Wissen betrachtet. boyd und Crawford (2012) heben diese zentrale Verbindung auch mit Blick auf den Mythos von Big Data hervor. Dieser findet seinen Ursprung im Wissensbezug der Daten: “The widespread belief that large data sets offer a higher form of intelligence and knowledge (…)” (S. 663). Während das Wissen der Wissensgesellschaft bisher vergleichsweise mühsam von Menschen erarbeitet wurde und die IuK lediglich eine eher unterstützende und vereinfachende Rolle im Entstehungs- und Verwertungszusammenhang von Wissen hatten, ist dieses Verhältnis im Begriff sich zu verkehren. Wie bereits an etlichen Stellen angeklungen ist, ist es gerade das Potential weitreichender Diffusion der IuK und ihrer Automatisierung, dass diese die Produktion und Verwertung von Wissen übernehmen und entscheidend vorantreiben soll. Das einstmals Unmögliche wird nun möglich: Der Mensch wird – folgt man der positiven Deutung dieser Entwicklung – von den Mühen der Entstehung, Aneignung und Anwendung von Wissen entlastet. Denn die höhere Form von Intelligenz und Wissen insinuiert bereits die Überlegenheit und somit den Vorrang datenbasierten Wissens.

Es schließen mithin drei Fragen an, die nun nachfolgend zu klären sind: Zuerst muss zunächst gefragt werden, in welchem sozialen Zusammenhang digitale Daten nun konkret vermeintliches Wissen bereitstellen und eine gesellschaftliche Erzählung zu datenbasiertem Wissen überhaupt wirkmächtig werden kann. Worin bestehen für Individuum und Gesellschaft Zweck und Nutzen dieser Art der Wissensgenerierung? Zweitens kann anschließend dann in der Gesamtschau der vorliegenden Ausführungen gefragt werden, welche konkrete Resonanz die Erzählung der Mythen von Wissen und digitalen Daten womöglich in der Lage ist hervorzurufen. Danach schließt sich die dritte Frage an, welche Konsequenzen die hierbei gewonnenen Überzeugungen in Situationen haben, in denen der Mensch Einschätzungen bezüglich wissensverarbeitender Anwendungen vornimmt, die auf eben jene großen digitalen Datenbestände zugreifen.

Notes

1.
Zum Begriff der post-industriellen Gesellschaft siehe D. Bell (1973) und Drucker (1993).
2.
Darüber hinaus interessierten Leser*innen seien hier die Einführungen zur Erkenntnistheorie von Baumann (2015) und die Einführung in die Wissenssoziologie von Knoblauch (2014) empfohlen.
3.
Laut Kiefer (1988) ist „der Inhalt des Wissens (…) Information über irgendetwas, (…) wobei der Begriff des ontologischen Bereichs am allgemeinsten ist, er kann für alles mögliche [sic] stehen, für Entitäten wie Zahlen, Atome, Götter, Schmetterlinge und Gedanken, um einige Beispiele zu nennen“ (S. 70).
4.
Andere Definitionen folgen einem umgekehrten Verständnis von Information und Daten. So definiert bspw. Porat (1977): “Information is data that have been organized and communicated” (S. 2).
5.
Hier ist anzumerken, dass der Begriff der Wissenssysteme an dieser Stelle zunächst allgemein als eine Ordnung von Wissen verstanden wird. In der Informatik werden unter diesem Label jedoch bereits wissensverarbeitende Computersysteme verstanden: “Computer systems that use knowledge are called knowledge-based systems, or simply knowledge systems” (Stefik, 1995, S. XV). Sofern nicht anders vermerkt ist nachfolgend die allgemeinere Bedeutung gemeint.
6.
Ein überzeugender Hinweis darauf, wie es insbesondere um das prozedurale Wissen über datenverarbeitende IuK-Anwendungen einem Hochtechnologieland wie Deutschland bestellt ist und der das hier vorliegende Argument stützt, dass die menschliche Komponente im Zusammenhang der Wissenserzeugung und -verarbeitung bezüglich digitaler Daten auf absehbare Zeit nicht unterschätzt werden sollte.
7.
Diese werden je nach analytischer Schwerpunktsetzung mal in Abgrenzung und mal in Überschneidung mit anderweitigen Paradigmen gesellschaftlichen Wandels diskutiert wie etwa der Dienstleistungsgesellschaft, der post- oder nach-industriellen Gesellschaft oder auch der Risikogesellschaft (Kübler, 2009).

Author information

Authors and Affiliations

Institut für Sozialwissenschaften, KMW I, Heinrich-Heine-Universität Düsseldorf, Düsseldorf, Nordrhein-Westfalen, Deutschland
Marco Lünich

Authors

Marco Lünich
View author publications
You can also search for this author in PubMed Google Scholar

Corresponding author

Correspondence to Marco Lünich .

Rights and permissions

Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 International Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden.

Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen.

Reprints and permissions

Copyright information

About this chapter

Cite this chapter

Lünich, M. (2022). Big Data und Wissen. In: Der Glaube an Big Data. Springer VS, Wiesbaden. https://doi.org/10.1007/978-3-658-36368-0_4

Download citation

DOI: https://doi.org/10.1007/978-3-658-36368-0_4
Published: 13 January 2022
Publisher Name: Springer VS, Wiesbaden
Print ISBN: 978-3-658-36367-3
Online ISBN: 978-3-658-36368-0
eBook Packages: Social Science and Law (German Language)

Publish with us

Policies and ethics