1 Einleitung

Digitale Plattformökosysteme haben in den letzten zwei Jahrzehnten eine große Dynamik entwickelt und vorherrschende Wettbewerbsstrukturen erheblich verändert. Im Einzelhandel konnte z. B. der Amazon Marketplace stationäre Anbieter in Bedrängnis bringen. Für Smartphones haben die als Plattformökosystem organisierten Betriebssysteme Android oder iOS zu einer so großen Vielzahl von Komplementärprodukten („Apps“) geführt, wie sie von den Plattformbetreibern Google oder Apple nie selbst hätten erschaffen werden können. Auch die Personenbeförderung und der Tourismus haben bemerkenswerte Veränderungen erfahren. Dienste wie Uber, Lyft oder Flixbus, Booking.com oder airbnb konnten vor der Covid-19-Pandemie dank ihrer Plattformenökosysteme ein beachtliches Wachstum in etablierten Märkten erzielen, obwohl sie über keine eigenen Transportmittel bzw. Unterkünfte verfügen.

In Plattformökosystemen kommt Daten eine wichtige Rolle zu (Arnaut et al. 2018). Trotz der Tatsache, dass bekannte Anbieter wie Facebook, Amazon, Apple, Google, LinkedIn oder Netflix bereits für ihre umfassenden Aktivitäten zur Sammlung und Auswertung von Daten bekannt sind, werden diese primär zum Aufbau indirekter Netzwerkeffekte genutzt (Van Alstyne et al. 2016). Die Gewohnheiten und Vorlieben von Kunden (oder Nutzern) werden in Facebook oder LinkedIn zudem an Werbetreibende (Anbieter) verkauft, die eine unentgeltliche Plattformnutzung durch zielgruppenspezifische Werbung finanzieren. Bei anderen Anbietern werden die Interaktionsprofile („click streams“) zur Stimulierung direkter Netzwerkeffekte in Form von Produktverbesserungen und Absatzsteigerungen verwendet. Bei beiden Vorgehensweisen handelt es sich um Varianten des datengestützten Lernens (Hagiu und Wright 2020), die auf eine indirekte Monetarisierung von Daten im Zusammenhang mit dem Kundenverhalten abzielen.

Plattformen, die Daten über das Verhalten und die Vorlieben von Kunden hinaus anbieten und direkt gegenüber Kunden monetarisieren, findet man bisher nur selten. Das erscheint verwunderlich, da (umfassende Mengen von) Daten unabhängig von individuellen Nutzerkontexten die Möglichkeit besitzen, andere Kontexte, wie beispielsweise die Struktur oder das Verhalten materieller Objekte (z. B. biochemischer Präparate, mechanischer Aggregate oder eingebetteter Systeme), zu erfassen. Es ist nicht ausgeschlossen, dass komplementäre Anbieter ihre Daten, die von Kunden erworben und genutzt werden können, auf einer Plattform anbieten. Ein Plattformbetreiber stellt die für die Suche und Nutzung der Daten erforderliche technische Infrastruktur zur Verfügung. In einem solchen Szenario könnten Datenplattformen zu Datenplattformökosystemen erweitert werden und eine stärker objektzentrische Bedeutung erhalten, die neue Wertschöpfungs- und Innovationspotenziale in Gestalt neuer datengetriebener Geschäftsmodelle ermöglichen.

In diesem Aufsatz möchten wir den Fragen nachgehen, welche Eigenschaften Datenplattformökosysteme aufweisen und in welchen Erscheinungsformen wir diese in der Realität antreffen können. Bevor wir diese Fragen aufgreifen, behandeln wir die konzeptuellen Grundlagen von Datenplattformen und Plattformökosystemen.

2 Konzeptuelle Grundlagen

2.1 Datenplattformen

Eine Datenplattform bezeichnet eine technische Umgebung für das Aufnehmen, Speichern, Analysieren und Präsentieren von (umfangreichen) Daten (Mijsters 2019). Diese werden in Informationssystemen, Geschäftsprozessen, Sensornetzen, dem Internet der Dinge oder anderen digitalen Infrastrukturen erzeugt (Looker Data Sciences 2020). Während es viele funktional-punktuelle Lösungen und zweckgebundene Anwendungen gibt, die eine oder mehrere der vier vorgenannten Funktionen abdecken, bietet eine Datenplattform ein durchgängiges Datenmanagement (Splunk Inc 2020). Dadurch lassen sich eine Reihe von Vorteilen erzielen, wie z. B.

  • die Zentralisierung und Standardisierung der Datenfunktionen,

  • das zentrale Management der eingesetzten Technologien,

  • ein vereinfachter Zugriff durch die Datennutzer sowie

  • eine schnellere, umfassendere und qualitativ hochwertigere Datenanalyse.

In Datenplattformen werden demnach Daten – und nicht anderweitige Produkte, Dienstleistungen oder Anwendungen – als Objekte verwaltet. Analysten gehen davon aus, dass sich das Plattformkonzept so weiter entwickeln wird, dass die verfügbaren Rechenleistungen und Kommunikationsgeschwindigkeiten die Organisation und Speicherung sehr großer Datenmengen und deren Verteilung ermöglichen (Oliveira und Lóscio 2018). Erfolgt die Verteilung unter Anwendung von Preismechanismen, können Daten bzw. Datenfunktionen entgeltlich genutzt, d. h. monetarisiert, werden (Mijsters 2019).

Plattformen basieren im Kern auf Technologien, die Entwickler nutzen, um Datenfunktionen mithilfe von Software zu realisieren, die über „application programming interfaces“ (APIs) mit der Plattform verbunden sind. Daten können im Sinne eines Ökosystems „plattformisiert“ werden, falls diese auf der Plattform austauschbar und ökonomisch derart von Bedeutung sind, dass komplementäre Anbieter beginnen, die Daten auf der Basis von APIs anzubieten und nutzbar zu machen. Anstelle von (materiellen) Produkten, Dienstleistungen und Software als Plattformobjekte werden Daten selbst zum Gegenstand der Plattform (Techopedia 2020). Das Speichern, Analysieren und Präsentieren von (umfangreichen) Daten muss nicht mehr vom Plattformbetreiber übernommen werden, sondern kann durch externe Datenanbieter erfolgen. Dieses Vorgehen würde neue datengetriebene Geschäftsmodelle ermöglichen.

2.2 Plattformökosysteme

Digitale Plattformen ermöglichen ökonomische Transaktionen und Innovationen. Zentrale Akteure sind der Plattformbetreiber, komplementäre Anbieter von Leistungen sowie Kunden, die die Angebote des Ökosystems nutzen. Der Plattformbetreiber stellt den Plattformkern und die dafür erforderliche digitale Infrastruktur zur Verfügung. Zusammen mit den komplementären Anbietern von Leistungen bildet er das sog. Plattformökosystem, das die Leistungsangebote bündelt (Tiwana et al. 2010 sowie Cusumano und Gawer 2002). Die Kunden gehen mit Anbietern Austauschbeziehungen unter Ausnutzung von Netzwerkeffekten ein (Van Alstyne et al. 2016). Direkte Netzwerkeffekte entstehen, wenn mehr Kunden ihre Erfahrungen auf der Plattform dokumentieren bzw. Anbieter ihre Leistungspalette vergrößern (Katz und Shapiro 1985). Indirekte Netzwerkeffekte entstehen, wenn mehr Kunden eine steigende Anzahl von Datenanbietern anziehen und umgekehrt (Gawer 2014). Eine Plattform umfasst alle Austauschbeziehungen zwischen dem Plattformbetreiber, komplementären Anbietern und Kunden.

Bei Booking.com, einer digitalen Plattform zur Buchung von Unterkünften, besteht die Infrastruktur aus der Website „www.booking.com“ und den Apps für mobile Endgeräte als Frontend sowie einem Reservations- und Zahlungsabwicklungssystem als Backend. Hoteliers bieten Leistungen wie Zimmer, Verpflegung, Parkplätze, Zubringerdienste, etc. über die Plattform an. Zusammen mit dem Plattformbetreiber bilden sie das Ökosystem, das die Buchung von Angeboten durch Kunden ermöglicht. Wenn diese eine Buchung tätigen, stehen sie in direktem Vertragsverhältnis mit den Anbietern. Booking.com teilt die Buchungsinformationen der Kunden den Anbietern mit und sendet im Namen des Anbieters eine Reservierungsbestätigung. Der Buchungsservice ist kostenlos. Die Anbieter zahlen im Fall einer Buchung bis zu 15 % Kommission an den Plattformbetreiber. Die Ergonomie der Website bzw. der App erleichtern den Buchungsprozess. Das umfangreiche Angebot an Unterkünften erhöht die Erfüllung von Kundenwünschen. Die Kunden sparen Transaktionskosten, die Anbieter von Unterkünften versuchen die Kommissionsgebühren durch eine höhere Auslastung ihrer Kapazitäten zu kompensieren.

Datenplattformökosysteme wären demnach solche, bei denen Daten von komplementären Anbietern über die digitale Plattform eines Betreibers zur Nutzung angeboten werden. Der Plattformbetreiber stellt hierfür eine digitale Infrastruktur zur Verfügung, die für prospektive Kunden die Suche und Auswahl nach Daten von komplementären Anbietern vereinfacht und die Nutzung von Daten vertraglich anbahnt und gegen ein Entgelt umsetzt (Gelhaar et al. 2021).

2.3 Daten in Plattformökosystemen

In der Literatur gibt es wenig Beiträge, die sich mit der (passiven) Rolle von Daten in Plattformökosystemen beschäftigen. Schreieck et al. (2016) verweisen auf die Rolle von Daten als Grenzressourcen („boundary resources“) zur Ordnung und Steuerung („governance“) in Plattformökosystemen (Star und Griesemer 1989 sowie Gawer 2014). Sie argumentieren, dass alle Plattformökosysteme durch Daten „befeuert“, d. h. katalysiert werden. Beispielsweise nutzen Google und Facebook aggregierte Nutzerdaten, um personalisierte Werbung zu verkaufen, ziehen Entwickler durch die Bereitstellung ausgewählter Datenströme über APIs an (Gawer 2014) und bauen Dienste wie Google Maps auf der Basis der Bewegungsdaten von Android-Nutzern auf (Gawer 2014).

Die zweite Rolle, die Daten in Plattformökosystemen einnehmen, kann als Aktivierungsressource oder Rohstoff für Interaktionsstimuli aufgefasst werden (Parker et al. 2016). Die Autoren benutzen diesen Begriff nicht explizit, sondern sprechen von Informationen als Werteinheiten („value units“). Damit wird nicht der Geldwert des Produkts, sondern der wahrgenommene Wert der dargebotenen Informationen ausgedrückt. Jede Interaktion mit der Plattform startet mit der Präsentation von Informationen, die einen Wert für die Nutzer darstellen. Sie werden aus den verfügbaren Daten (Suchanfrage, Benutzerprofil, Historie, etc.) gewonnen. Je mehr es dem Plattformbetreiber gelingt, den Wert der Information zu steigern, desto stärker werden Kunden als Nutzer aktiviert ihre Interaktion fortzusetzen. Daten beschreiben nutzergerecht die Eigenschaften der im Plattformökosystem angebotenen Produkte und Dienstleistungen. Ohne sie ist es unwahrscheinlich, die Kauf- und Informationsbedürfnisse von Kunden – eine Hotelbuchung oder den Kauf eines Buchs – erfolgreich abzuschließen. Der Zuschnitt und die Präsentation von Werteinheiten werden mit Hilfe von (Informations‑)Filtern ermöglicht. Diese stehen in der Form von Algorithmen in Softwarewerkzeugen zur Verfügung, deren Aufgabe es ist, den Wertbeitrag der selektierten und präsentierten Informationen zu erhöhen. Auf vielen Vermittlungsplattformen, wie z. B. dem Amazon Marketplace, versucht man beispielsweise die Eigenschaften eines Produkts mithilfe eines multikriteriellen Tabellenvergleichs darzustellen, um Nutzer auf ähnliche Produkte hinzuweisen. Schlechte Filter liefern weniger relevante Informationen, die Nutzer zur Beendigung der Interaktion mit der Plattform verleiten können.

3 Eigenschaften von Daten als monetarisierbare Objekte in Datenplattformökosystemen

Wir wenden uns nunmehr der Frage zu, welche Merkmale von Bedeutung sind, damit Daten in Plattformökosystemen angeboten, vermittelt und genutzt werden können. Dies erscheint möglich, wenn Daten modular gespeichert, ihre Qualität gesichert, das Verfügungs- und Nutzungsrecht geregelt und der resultierende Informationswert im Voraus abgeschätzt werden können (Jacobides et al. 2018; Lee et al. 2017; sowie Lee et al. 2018).

3.1 Modularität der Daten

Parker et al. (2016) und Jacobides et al. (2018) beschreiben die Modularität der Plattformgegenstände als eine wichtige Eigenschaft, die von einer digitalen Plattform erfüllt werden muss. Eine modular angeordnete Gruppe von Datenobjekten mit ähnlichen Eigenschaften kann als Datencluster bezeichnet werden (Ester und Sander 2000). Diese ordnen Daten nach dem Prinzip der Zusammengehörigkeit oder Ähnlichkeit an. Zusammengehörige Daten werden nach bestimmten inhaltlichen Kriterien in homogenen Gruppen gespeichert, sodass sie als Entitäten angeboten werden können. Die Datencluster müssen nicht vom Plattformbetreiber generiert und gespeichert werden. Aufgrund ihrer Modularität können komplementäre Datenanbieter unterschiedliche Datencluster der Plattform bereitstellen. Es ist die Aufgabe des Plattformbetreibers, komfortable und effektive Such‑, Verknüpfungs- und Präsentationsfunktionen zur Verfügung zu stellen, die es den Nutzern als Kunden ermöglichen, unterschiedliche Datencluster zu lokalisieren, zu kombinieren oder ggf. zu separieren.

3.2 Sicherung der Datenqualität

Eine weitere wichtige Eigenschaft ist die Qualität der im Datenplattformökosystem angebotenen und genutzten Daten. Unter dem Begriff der Datenqualität wird das Ausmaß der Erfüllung der Gesamtheit aller Anforderungen an Daten bzw. Datenprodukte verstanden, welches die Deckung gegebener Informationsbedarfe ermöglicht (Nohr 2001). Die Datenqualität lässt sich mithilfe unterschiedlicher Dimensionen wie Aktualität, Vollständigkeit, Nutzbarkeit, Verlässlichkeit, Relevanz und Verständlichkeit beschreiben (z. B. Cai und Zhu 2015). Auf der einen Seite wird der Plattformbetreiber die Anforderungen an die Qualität der Daten gegenüber den Anbietern so festlegen, dass die angebotenen Datencluster von Anfang an eine bestimmte Mindestqualität erfüllen. Auf der anderen Seite wird der Plattformbetreiber bestrebt sein, die Qualitätswahrnehmungen und -erfahrungen seiner Kunden systematisch zu erfassen und auf der Plattform offenzulegen. Die Anbieter erhalten dadurch Anreize, die Qualität der Daten kontinuierlich zu verbessern. Dabei wäre es auch denkbar, dass wiederum andere Komplementäranbieter Verfahren und Werkzeuge zur Verbesserung der Datenqualität anbieten, die die Kunden nutzen können. Das Datenplattformökosystem würde sich funktional differenzieren und mehr Möglichkeiten für indirekte Netzwerkeffekte zur Verfügung stellen.

3.3 Verfügungs- und Nutzungsrechte der angebotenen Daten

Die dritte Eigenschaft betrifft die Verfügungs- und Nutzungsrechte bzw. das damit verbundene geistige Eigentum (IP) von Daten. Metadaten sind in der Regel nicht IP-relevant. Ein Plattformökosystem ist in Anlehnung an Waltl (2013) IP-modular, wenn seine Datencluster getrennt gespeichert und in Bezug auf IP unterschiedlich behandelt werden. Der IP-Status ist dann innerhalb jedes Datenclusters homogen, kann sich aber zwischen den Modulen unterscheiden. Das geistige Eigentum kann formelles IP wie Lizenzverträge oder Urheberrecht umfassen, aber auch informelles IP wie die Anonymisierung der Daten zum Schutz von Personen. Die Untersuchungen von Waltl zeigen, dass die Ausprägungen IP-modularer Plattformarchitekturen größere Offenheit bei gleichzeitiger Sicherstellung der Wertaneignung ermöglichen und so die Attraktivität von Plattformen für Datenanbieter und Entwickler komplementärer Apps erhöhen können.

In pharmazeutischen Unternehmen gelten zum Beispiel Daten über die Herstellung der Arzneimittel einschließlich der Synthese und Herstellung des Wirkstoffs, der Testverfahren, der Validierung sowie der Hersteller und Lieferanten des Wirkstoffs für das Arzneimittel als vertraulich. Im Gegensatz dazu sind Daten, die die klinische und nichtklinische Entwicklung eines Arzneimittels umfassen, nicht per se vertraulich. Dementsprechend werden vor allem die in klinischen Studien enthaltenen Daten in der Regel als solche betrachtet, die offengelegt werden können. Wenn nun ein Unternehmen mit dem Gedanken spielt, nicht vertrauliche Daten zu den Arbeiten an einem Impfstoff für eine virale Erkrankung offenzulegen, bleibt ein Verwertungsrisiko. Aus Bedenken, andere Unternehmen können auf der Basis eines erworbenen Lizenzrechts zur Nutzung dieser Daten einen eigenen Impfstoff schneller zur Zulassung führen, wird ein Datenanbieter bestrebt sein, eine zu weitgehende Offenlegung seiner Daten trotz seines Urheberrechts in Plattformökosystemen zu vermeiden.

3.4 Der datenbezogene Informationswert

Die vierte Eigenschaft betrachtet den aus der Datenbeschaffung resultierenden Informationswert. Jeder Nutzer muss vor der Beschaffung eines Datenclusters abwägen, ob der damit verbundene Nutzen größer als die Kosten der damit verbundenen Information ist. Die Differenz von Informationsnutzen und Informationskosten wird als Informationswert bezeichnet (Laux et al. 2014). Da der Nutzer vor der Beschaffung der Daten den Informationsnutzen kaum zu beurteilen vermag, entsteht aus der ex-ante Betrachtung des Informationswertes ein Paradoxon, das in der Entscheidungstheorie auch als Informationsparadoxon bezeichnet wird: Den Wert der beschafften Information kann der Nutzer erst nach der Informationsbeschaffung bestimmen. Wenn er diesen Wert ex-post beurteilen kann, kennt er die betreffende Information bereits und braucht sie nicht mehr zu beschaffen. Daraus resultiert die Frage, wie der Wert von Informationen ex-ante signalisiert werden kann, sodass er beim Nutzer den Anschein weckt, dass er höher ist als die Informationskosten. Der Plattformbetreiber verfügt über mehr Informationen bezüglich der Qualität und Inhalte der Daten als der Nutzer. Folglich versucht er, diesem Signale zu senden, die dessen Unsicherheit verringern und ihn zu einer Beschaffung der Daten bewegen. Dies erfolgt durch zusätzliche Anregungen („teaser“) und Impulse („nudges“).

Dieses „Signalling“ betrifft alle Informationsgüter. Es umfasst Strategien zur Signalisierung des Informationsnutzens oder zur Reduktion der Informationskosten. Die Beeinflussung der Wahrnehmung des Informationsnutzens kann u. a. durch volumen- oder zeitbegrenzte Probenutzung des Datenclusters sowie ausführliche Metadatenbeschreibungen beeinflusst werden. Die Informationskosten können durch Fensterfunktionen („windowing“), Versionierung („versioning“) und Bündelungseffekte („bundling“) beeinflusst werden (Linde 2009). Beim „windowing“ können die Länge der Nutzungsdauer, der Nutzungszeitpunkt oder die Aktualität der Daten variiert werden (Owen und Wildman 1992). Bei der Versionierung bietet das Unternehmen sein Produkt in verschiedenen Versionen an und überlässt es dem Kunden, die für ihn passende für sich auszuwählen (Shapiro und Varian 1999). Beim „bundling“ werden zwei oder mehre Datencluster zu einem größeren zusammengefasst und als Paket oder Set zu einem attraktiven Pauschalpreis verkauft (Monroe 2003). Denkbar wäre auch eine Kombination von Datenclustern mit einem bestimmten Volumen oder Zeitraum an Datenanalysen. Bekommt der Nutzer den Eindruck, dass der Informationswert positiv ist, wird er die Beschaffung von Daten über ein dezidiertes Plattformökosystem erwägen.

4 Beispiele für Datenplattformökosysteme

Um erste Evidenz für Datenplattformökosysteme zu liefern, haben wir eine Suche im Internet gestartet. Gefundene Datenplattformen haben wir anhand von drei Eigenschaften überprüft: (a) die Plattform darf nicht nur datengetrieben sein, sie muss Plattformbetreiber und Datenlieferanten vorweisen können; (b) die Datenlieferanten bieten Datencluster und/oder Anwendungen zur Datenanalyse an; und (c) die Kunden beziehen die Daten über den Plattformbetreiber, der die Datencluster der Komplementäre auf seiner Plattform integriert.

Wir sind bei unserer Suche auf die Plattformökosysteme Datarade und Advaneo gestoßen, die wir nachfolgend näher beschreiben. Beide befinden sich am Anfang Ihres Lebenszyklus.

4.1 Datarade

Datarade ist eine Handelsplattform, die den Austausch von Datenclustern („datasets“) mit Datenlieferanten ermöglicht (Datarade 2020). Ziel ist es, den Zugang zu gewerblichen Datenclustern zu erleichtern und den Kauf und Verkauf von Daten („data sourcing“) zu ermöglichen. Das Unternehmen wurde 2018 in Berlin gegründet und ist eigenen Angaben zufolge eine schnell wachsende Handelsplattform für Daten. Sie wird mittlerweile von einer vierstelligen Zahl von Datenkäufern weltweit genutzt. Derzeit befinden sich über 300 Datenkategorien von über 2000 Datenanbietern auf der Plattform. Die Interaktion mit der Plattform erfolgt in fünf Schritten (s. Abb. 1).

Abb. 1
figure 1

Nutzung von Datarade (Datarade 2020)

Datarade kann als Transaktionsplattform eingestuft werden. Auf der Basis des Informationsbedarfs wird ein Anbieter für die gesuchten Daten (v)ermittelt. Hinweise zur Leistungs- und Zahlungsabwicklung innerhalb der Plattform sind nicht zu finden. Alternativ zur beschriebenen Suche, können Nutzer den Marktplatz auch nach Kategorien, Anbietern oder Anwendungsfällen durchstöbern. Letztere verdeutlichen, welche Analysen vom Anbieter mit den angebotenen Datenkategorien durchgeführt werden können. Dabei werden die Daten näher beschrieben, für welche Unternehmensgrößen sie geeignet sind, in welchem Format sie angeliefert, in welcher Periodizität sie aktualisiert und wie die Daten bereitgestellt werden. Ein Angebot, Beispieldaten und tiefergehende Beschreibungen sind auf Anfrage erhältlich.

Die „datasets“ sind modular aufgebaut und können im Rahmen von spezifischen Anwendungsfällen kombiniert oder dekomponiert werden. Der Umgang mit Verfügungs- und Nutzungsrechten in Datarade wird analog zum Preismodell zwischen den Vertragsparteien nach erfolgter Vermittlung bilateral gelöst. Die Einschätzung des Informationsnutzens und die Vermeidung des Informationsparadoxons werden von Seiten der Datennutzer über Beschreibungen des angebotenen Datenmaterials sowie über die Bereitstellung von Beispieldaten auf Anfrage unterstützt. Die Anbieter können anhand ihrer Datenqualität, des Datenumfangs, des Preis‑/Leistungsverhältnisses und der Qualität des Kundenservice bewertet werden. Datarade ist eine reine Transaktionsplattform. Sie fokussiert die Identifikation und Vermittlung von Datenangeboten. Im Vermittlungsfall erhält die Plattform eine Kommissionsgebühr vom Datenanbieter. Die Transaktionsabwicklung erfolgt dezentral. Maßnahmen zur Sicherstellung der Datenqualität von Seiten der Plattform sind nicht erkennbar.

4.2 Advaneo

Ein weiteres Beispiel ist der Advaneo Data Marketplace. Die ADVANEO GmbH wurde 2002 unter anderem Namen als Spin-off der RWTH Aachen gegründet. Seit 2016 ist sie im Bereich Monetarisierung, Austausch und Schaffung von Mehrwert durch Daten tätig. Ziel ist es, neue datengetriebene Geschäftsmodelle und Innovationen zu generieren (Advaneo 2020).

Kernelement ist die Entwicklung von Lösungen für das interne Datenmanagement, den sicheren Austausch von Daten in Wertschöpfungsketten und die Entwicklung von Datenmarktplätzen. Hierbei wird besonders auf Datensicherheit, Governance und Datensouveränität Wert gelegt.

Der Kern der Plattform ist der Advaneo Data Marketplace, der mittels Metadaten Datenanbieter und -nutzer in eine Austauschbeziehung bringt. Abb. 2 verdeutlicht den Ökosystemcharakter, der jener von Van Alstyne et al. (2016) ähnelt. Es handelt sich um einen Marktplatz für Daten, der den Austausch zwischen Datenanbietern und -nutzern anbahnt und abwickelt. Der Datenmarktplatz stellt einen Vermittlungsdienst („broker service“) auf der Basis eines umfassenden Datenkatalogs („repository“) zur Verfügung, mit welchem geeignete Anbieter („provider“) von Datenclustern ausfindig gemacht werden können. Die Transaktionen werden zudem über eine Verrechnungsstelle („clearing house“) abgewickelt, die als unabhängige Instanz alle Schritte des Austauschs dokumentiert (Advaneo et al. 2020). Der Vermittlungsdienst bietet umfassende Filterfunktionen (nach Datenkategorien, Ländern, Anbietern, Schlagwörtern bzw. „tags“, Datenformaten, Lizenztypen, Preisspannen und Datenvolumina). Über diese Zugänge hinaus wird die Navigation von einem auf maschinellem Lernen basierenden Empfehlungssystem für Datensätze unterstützt. Neben zwei grafischen Frontend-Lösungen bietet der Datenmarktplatz auch die Möglichkeit über APIs direkt mit der Datenbank zu kommunizieren. Aktuell können mittels APIs Datensätze über Metadaten hinzugefügt und gesucht werden.

Abb. 2
figure 2

Ökosystem des Advaneo Data Marketplace (Advaneo 2020)

Der Datenmarktplatz kommt mit den Rohdaten der Anbieter nicht direkt in Berührung. Er implementiert als eines der ersten Portale den zertifizierten IDSA-StandardFootnote 1 zum industriellen Datenaustausch (International Data Spaces Organization 2020). Der Austausch der Rohdaten erfolgt Peer-to-Peer direkt von der Datenquelle des Anbieters zum Datennutzer. Dies kann im Wesentlichen auf zwei unterschiedlichen Wegen stattfinden: Der Datenanbieter kann einen direkten Zugang zu seinen Rohdaten hinterlegen (z. B. durch einen „Downloadlink“ oder eine API) oder seine Datenquelle in seinem ADVANEO Connector eintragen, der wiederum mit einem Konnektor des Datennutzers kommuniziert und die Rohdaten im Rahmen der akzeptierten Lizenz überträgt.

Der ADVANEO Connector ist eine Anwendung, die an eine Vielzahl verschiedenster Datenquellen angeschlossen werden kann (z. B. Dateisysteme, Datenbanksysteme, Sensordatenströme, etc.). Gleichzeitig können die Konnektoren miteinander kommunizieren und Daten zueinander senden sowie voneinander empfangen. Durch die implementierte gegenseitige Authentifizierung der Konnektoren ist eine Grundlage für einen sicheren und automatisierbaren Datenaustausch zwischen zwei Parteien geschaffen. Der Datennutzer kann jedoch zudem über den Konnektor verschiedene Datenquellen von mehreren Anbietern integrieren, was die Grundlage für Innovationen in sich birgt. Jeder Datennutzer erhält Zugriff auf einen persönlichen Konnektor, den er über ein Übersichtsmenü („dashboard“) verwalten kann. Dort können eigene Datenquellen verwaltet sowie auf Datenanfragen und erhaltene Datensendungen zugegriffen werden.

Der Innovationscharakter von Advaneo wird darüber hinaus durch „datathons“ (analog zu „hackathons“) zum Ausdruck gebracht. Ein „datathon“ bezeichnet einen digitalen Wettbewerb zur Lösung datenspezifischer Probleme. Daran können sowohl Einzelpersonen als auch Teams aus Informatikern, Datenwissenschaftlern und Experten von Datenanbietern und Kunden teilnehmen, um in einem konkreten Fall Daten zu analysieren und dabei neue Schlüsse und Erkenntnisse zu gewinnen. Ein „datathon“ soll auf offene, unterhaltsame und herausfordernde Weise neue Ideen anregen.

Die angebotenen Daten stehen in modularer Form zur Verfügung. Die Belange geistigen Eigentums werden durch den unmittelbaren Datenaustausch zwischen Datenanbietern und -kunden bilateral geregelt und mit Hilfe der IDSA-Referenzarchitektur standardisiert. Der angebotene IDSA-Konnektor bietet zudem die Möglichkeit, die Daten unterschiedlicher Anbieter in der Plattform zu integrieren. Das Informationsparadoxon wird allenfalls durch die Datenbeschreibungen und optionale textuelle Bewertungen der Datensätze durch die Datennutzer abgemildert. Die Möglichkeit zur Nutzung von Beispieldaten ist ausschließlich registrierten Nutzern vorbehalten.

Advaneo kann als Transaktionsplattform bezeichnet werden, die nicht nur Datennutzer und Datenanbieter vermittelt, sondern die Datenübermittlung technisch so unterstützt, dass zwar jeder Datenaustausch bilateral stattfindet, der Konnektor aber die Integration von Daten unterschiedlicher Anbieter und damit die (Re‑) Kombination mehrerer Cluster ermöglicht. Dies schafft Innovationsgelegenheiten. Durch „datathons“ sollen zudem neue, innovative Geschäftsideen für die Datenanalyse entwickelt werden. Insofern lassen sich bei Advaneo nicht nur alle zuvor beschriebenen Merkmale eines Datenplattformökosystems verdeutlichen, sondern erste Elemente einer Innovationsplattform erkennen.

4.3 Gegenüberstellung der beiden Datenplattformökosysteme

In Tab. 1 haben wir eine Gegenüberstellung der beiden vorgestellten Plattformökosysteme anhand der eingangs eingeführten definitorischen Merkmale und Eigenschaften vorgenommen. Obwohl sich die Ökosysteme auf den ersten Blick ähneln, weisen sie einige Unterschiede auf:

  • Während Datarade ausschließlich auf professionelle Datenanbieter zielt, versucht Advaneo auch Firmen anzusprechen, die Daten als „Nebenprodukt“ erzeugen.

  • In Datarade wird der Qualität der Daten mehr Beachtung geschenkt. Anbieter werden durch den Plattformbetreiber verifiziert, die Datenqualität wird durch die Anbieter nach eigenen Kriterien ausgewiesen und selbige können anhand ihrer Datenqualität, ihres Datenumfangs, ihres Preis‑/Leistungsverhältnisses und der Qualität des Kundenservice bewertet werden.

  • In Advaneo wird neben den spezifischen Lizenzbestimmungen das Datenanbieters vorgefertigte Standardlizenzen zur Regelung der Nutzungsrechte angeboten.

  • Advaneo bietet auf seiner Plattform ein Werkzeug zur Preisermittlung. Dies dient dem Kunden als Hilfe bei der Einschätzung des Informationswerts, obwohl die Preisentscheidung alleine beim Datenanbieter liegt.

  • Advaneo erlaubt darüber hinaus mit seinen Connectoren die Integration unterschiedlicher Datenquellen bzw. mit Datathons neue Formen der Datenanalyse.

Tab. 1 Vergleich von Datarade und Advaneo

Es fällt auf, dass bedeutsame Elemente von Transaktionsplattformen, wie standardisierte Lizenzbedingungen oder eine differenzierte Bewertung der Produkt- und Anbieterqualität, rudimentär ausgeprägt sind. Die bei Informationsprodukten üblichen Mechanismen wie Windowing, Versioning oder Bundling sind ebenfalls kaum anzutreffen und bieten Gestaltungspotentiale für die Zukunft.

5 Zusammenfassung und Ausblick

In unserem Aufsatz haben wir uns mit Datenplattformökosystemen beschäftigt. Zu diesem Zweck sind wir zunächst auf technische Datenplattformen eingegangen, bevor wir den Aufbau und mögliche Typen von Plattformökosystemen im Allgemeinen behandelt haben. Anschließend wurde die Rolle von Daten in Plattformökosystemen herausgearbeitet und jene Eigenschaften thematisiert, deren Realisation für das Entstehen und Funktionieren von Datenplattformökosystemen bedeutsam sind. Abschließend konnten wir anhand der Marktplätze Datarade und Advaneo die Existenz von Datenplattformökosystemen in der Praxis verdeutlichen und inhärente Eigenschaften herausarbeiten. Wir gehen davon aus, dass Datenplattformökosysteme weitere datengetriebene Geschäftsmodelle in naher Zukunft ermöglichen werden.

Zukünftigen Forschungsbedarf sehen wir im Hinblick auf die Identifikation weiterer konstituierender Eigenschaften sowie deren Vertiefung. Bei Advaneo konnten wir erkennen, dass es erste Bestrebungen gibt, Referenzarchitekturen zu entwickeln, um rechtliche Fragen zu standardisieren. Die Untersuchung der Wechselwirkungen zwischen Datenschutz und der Skalierung von Datenplattformen ist sicherlich ein weiteres wichtiges Betätigungsfeld. Ebenfalls von Interesse sind jedwede Fragestellungen bezüglich der Gestaltung und Standardisierung von APIs zur Vereinfachung des Datenaustauschs und zur Verknüpfung unterschiedlicher Datencluster. Im weiteren Sinne betrachten APIs Merkmale der Architektur von Datenplattformökosystemen, die aufgrund ihrer großen Datenmengen ebenfalls ein lohnendes Forschungsgebiet darstellen könnte. Unsere Überlegungen zu den Informationskosten von Datennutzern werfen unweigerlich die Frage nach erfolgreichen Preisstrategien für die Datenanbieter auf. Zu untersuchen wäre auch, ob Datenplattformökosysteme davon profitieren könnten, wenn die Preismodelle zentral von der Plattform orchestriert werden, anstelle diese – wie aufgezeigt – dezentral den Datenanbietern zu überlassen. Dabei geht es nicht um die Höhe des Preises, sondern allein um die zu verwendeten Preisschemata bzw. Erlösmodelle. Ein ebenso spannendes Feld ist das Thema Datenqualität in Datenplattformökosystemen. Entweder man überlässt die Bewertung der Datenqualität alleine den Datennutzern oder der Plattformbetreiber versucht seinerseits, die Datenqualität zentral zu sichern, um sich von anderen Plattformen zu differenzieren.

Alles in allem stellen Plattformökosysteme einen Forschungsgegenstand dar, der zukünftig nicht nur weitere wichtige Forschungsfragen aufwirft, sondern eine neue Kooperationsform im Sinne der aktuellen Datenstrategie der Bundesregierung darstellt (Bundeskanzleramt 2021) und neue Möglichkeiten für datengetriebene Geschäftsmodelle eröffnet.