Von intimer Bewertung unter Anwesenden unterscheidet sich digitalisierte intime Bewertung durch die Abwesenheit eines menschlichen Publikums. Das ist offensichtlich, wenn der heimische Computer zur Partnerinnensuche verwendet wird. Aber selbst wenn Profile in der Öffentlichkeit bewertet werden, geschieht dies doch in einer exklusiven Beziehung zwischen Bewertenden und dem Bildschirm, die kommunikativ zu thematisieren für Außenstehende rechtfertigungsbedürftig wäre. Ein Großteil der Bewertungsarbeit, gerade mit mobilen Geräten, wird aber nicht unter direkter Beobachtung stattfinden, sondern zwischendurch auf dem heimischen Sofa oder auf stillen Orten.
Digitalisierte intime Bewertung steht damit in der Tradition medial vermittelter Paarbildung. Von ihrem funktionalen Äquivalent, der durch Schrift und Druck vermittelten Paarbildung über Kontaktanzeigen, unterscheidet sie sich dadurch, dass die Bewertenden, die Bewerteten und ihre Bewertungsoperationen kontinuierlich durch das vermittelnde Medium selbst beobachtet werden. Möglich wird diese Beobachtung durch die digitale Infrastruktur der Plattformen und Apps. Durchgeführt wird sie mit der Hilfe von Algorithmen oder algorithmischen Systemen (Seaver 2019b), die die Nutzerinnen der App und ihre Bewertungspraxis beobachten und auf der Grundlage algorithmisierter Vergleiche und Bewertungen auch selbst beeinflussen.
Wenn ich im Folgenden der Frage nachgehe, welche Möglichkeiten der Bewertung von Bewertungsobjekten (Kornberger et al. 2017) durch digitale Infrastrukturen auf der Dating-App Tinder ermöglicht werden, müssen deshalb zwei bewertende Typen von Identitäten fokussiert werden, „algorithmische Systeme“ (Seaver 2019b, S. 418 f.) und individuelle menschliche Identitäten.
Verborgene algorithmische Beobachtungen
Die Rekonstruktion der Rolle von Algorithmen in sozialen Zusammenhängen ist mit dem Problem konfrontiert, dass digitale Plattformen nur begrenzt auskunftsfreudig über die von ihnen verwendeten Rechenregeln sind. Begründet wird dies gewöhnlich damit, dass die Algorithmen ihre Geschäftsgrundlage darstellen und entsprechend schutzbedürftig sind (Kitchin 2017, S. 7). Unabhängig davon, ob hinter dem Schweigen der Plattformen tatsächlich ein geheimes Erfolgsrezept oder doch nur triviale Rechenregeln verborgen sind: Der Code selbst bleibt im Dunkeln. Eine Strategie, um auf dieses Problem zu reagieren, besteht darin, sich dem institutionellen Kontext zuzuwenden, in dessen Rahmen Algorithmen produziert und verwendet werden, und die Textproduktion zu den interessierenden Algorithmen zu beobachten (Kitchin 2017, S. 12).
Ich werde entsprechend in meiner Analyse Stellungnahmen und Dokumente von Tinder über ihren Algorithmus verwenden. Damit stoße ich zwar nicht zum Algorithmus „selbst“ vor – was auch immer das ist –, aber zumindest zu seiner öffentlich behaupteten und gerechtfertigten Funktionsweise. Die Frage lautet entsprechend, was der Algorithmus von Tinder leisten soll und wie die Leistungserfüllung öffentlich dargestellt wird. Neben journalistischen Quellen und der Selbstbeschreibung von Tinder nutze ich vor allem einen Patentantrag von Match Group, der Sean Rad, einer der Gründer der App, als einen der Erfinder ausweist (Rad et al. 2019).Footnote 17 Freilich werden die Rechenschritte, die von Tinder tatsächlich zur Empfehlung von Profilen genutzt werden, darin nicht im Detail offengelegt. Es wird aber der Rahmen skizziert, innerhalb dessen sie sich bewegen.
Algorithmen werden von Tinder verwendet, um Profile zu identifizieren, die in den Stapel einer Nutzerin gemischt werden sollen, und um ihre Reihenfolge festzulegen. Die algorithmisierte Vorselektion konstituiert so einen personalisierten Raum von Bewertungsobjekten, innerhalb dessen Nutzerinnen dann ihre eigenen Bewertungsurteile treffen können (s. dazu Abschn. 5.2). Sie erfüllen also ähnliche Funktionen wie die Algorithmen von Spotify oder Netflix, die ihren Nutzerinnen personalisierte Empfehlungen zu Musik und Filmen oder Serien geben und dazu den Pool der jeweils auf den Plattformen verfügbaren kulturellen Produkte sortieren und priorisieren (Unternährer 2020, S. 382) – mit dem Unterschied, dass die vorzuschlagenden Identitäten selbst eigensinnige Nutzerinnen der App sind.
Das Problem, das es durch die Algorithmen der App zu lösen gilt, wird dabei als ein Netzwerkproblem definiert: Es geht darum, Nutzerinnen zu verbinden, die einen spezifischen Bedarf an sozialen Beziehungen haben (Rad et al. 2019, S. 1). Um dieses Problem bearbeiten zu können, muss die App einerseits einen hinreichend großen Nutzerinnenpool bereithalten und andererseits jene Faktoren ausschalten, die Nutzerinnen die Verwendung der App verleiden: Präsentierte Ergebnisse dürfen nicht „irrelevant“ sein und Nutzerinnen nicht mit „large numbers of unwanted communication requests“ behelligt werden (Rad et al. 2019, S. 1). Die von den Algorithmen zu bearbeitende Aufgabe besteht also darin, herauszufinden, welche Nutzerinnen füreinander wechselseitig relevant sind, um zwischen ihnen matches und eine anschließende Kommunikation zu ermöglichen.
Zur Bearbeitung des so definierten Problems beobachtet die App die Nutzerinnen und das Geschehen auf der App. Dabei fokussiert die App drei analytisch zu unterscheidende Objekte: die Nutzerinnen als Bewertende und als Bewertete sowie ihr Bewertungsverhalten.
Wenn die Nutzerinnen von Tinder von der App als Bewertende beobachtet werden, identifiziert die App sie und vergleicht die konstruierte Identität mit anderen Nutzerinnen im Pool der vorhandenen Profile. Das Datenmaterial hierfür liefern die Nutzerinnen mit den Angaben, die sie in ihren Profilen machen, sowie über die von ihnen verknüpften sozialen Medien.Footnote 18 Bei dieser Identifizierung können demografische Variablen eine Rolle spielen, wie z. B. Alter, Bildungsstand, Ethnizität, Einkommen oder Lokalität (Rad et al. 2019, S. 6) – in der Selbstdarstellung der App wird allerdings betont, dass Ethnizität und Einkommen im Matchingalgorithmus selbst nicht verwendet werden (Tinder 2019). Zudem kann die App aber auch Algorithmen verwenden, die auf eine „deeper appreciation for the personality of entities in the system“ (Rad et al. 2019, S. 4) abzielen. Als Bezugspunkte solcher Analysen der „personality“ werden z. B. die Lesbarkeit der Profiltexte (Rad et al. 2019, S. 4), der „IQ of an entity, the grade level of writing, or how nervous the entity generally is“ (Rad et al. 2019, S. 5) oder auch in den Profiltexten verwendete „keywords that relate to things such as activities and interests“ erwähnt.
An die Identifizierung der Nutzerinnen als Bewertende können dann Vergleichsoperationen anschließen. Das Vergleichskriterium, das dabei verwendet wird, um relevante Profile für eine gegebene Nutzerin A zu identifizieren, ist das der „Ähnlichkeit“, z. B. nach dem Motto „people having similar and/or compatible character traits and values should be matched together“ (Rad et al. 2019, S. 1, Herv. T. P.). Wichtige Dimensionen der Bewertung von Relevanz anhand von Ähnlichkeit sind z. B. „Attraktivität“, „Präferenzen“ und „Aktivitäten“. Wenn Profile so auf Ähnlichkeit hin vergleichend beobachtet werden, wird ein Raum äquivalenter Profile aufgemacht; die Profile werden im Sinne von Rosch (1999, S. 191) kategorisiert. Ausgehend von der beobachteten Identität wird eine „‚Menschensorte‘“ (Hirschauer 2014, S. 174) der zu ihr „passenden“, „ähnlichen“ Identitäten erstellt, die ihr zur Bewertung vorgelegt werden.Footnote 19
Daneben werden die Nutzerinnen aber auch als Bewertete beobachtet. Hier geht es wieder darum, Identitäten für Vergleiche zu identifizieren, nur dass jetzt nicht die Bewertenden selbst Ausgangspunkt des Vergleichs sind, sondern die Profile, mit denen sie interagiert haben. Diese dienen als „seeds“ für entsprechende Vergleichsoperationen: „Seeds include, but are not limited to, profiles that user 14 has sent a message to or profiles that user 14 has expressed a preference for. Each seed is then compared to other entities to determine which entities will be included in pool 30“ (Rad et al. 2019, S. 4).Footnote 20 Der Vergleich wiederum kann über die Kalkulation eines „commonality score“ durchgeführt werden, der sich z. B. darauf beziehen kann, wie „physically similar“ die Profile sind, oder darauf, wie viele andere Nutzerinnen beide Profile positiv bewertet haben (Rad et al. 2019, S. 4). Auch hier geht es also um die Identifikation von Ähnlichkeit und damit um eine Form der Kategorisierung.
Die angesprochene Differenz zwischen der Beobachtung der Bewertenden oder der Bewerteten ist gerade aus soziologischer Perspektive wichtig. Durch die Beobachtung auch des Bewertungsobjektes besteht die Möglichkeit, dass heterophile Präferenzen der Nutzerin aufgenommen und verstärkt werden können. Wenn aktuelle Studien Anzeichen dafür finden, dass die Homophilie der Partnerinnenwahl abnimmt (Potarca 2017; Thomas 2020), dann könnte der erklärende Mechanismus für diese Entwicklung genau darin liegen, dass Dating-Apps eine inklusivere Öffentlichkeit darstellen als z. B. Bildungsinstitutionen. Dazu kommt, dass die intime Bewertungspraxis geringerer sozialer Kontrolle ausgesetzt ist, als dies bei einem Kneipenbesuch mit Freundinnen der Fall wäre, und dem Empfehlungsalgorithmus nicht nur ein Bias für ähnliche Partnerinnen eingeschrieben ist, sondern er auch heterophile Präferenzen aufgreift.
Neben den Bewertenden und den Bewerteten werden von Tinder auch ihre Bewertungen beobachtet. Im öffentlichen Diskurs hat die Verhaltensbeobachtung durch Tinder Aufmerksamkeit erregt, nachdem beschrieben wurde, dass Tinder auf der Basis von beobachteten Bewertungen ein Attraktivitätsrating der Nutzerinnen erstellt (Carr 2016; vgl. auch Erhardt 2016; Podszun 2017). Die nach dem Mathematiker Arpad E. Elo (2008, S. 20) benannten und ursprünglich zum Rating von Schachspielerinnen verwendeten Rechenregeln kalkulieren auf der Grundlage von Wettbewerbserfolg („performance ratings“) die relative Spielstärke der Wettbewerberinnen („current relative strength of the players“). Übersetzt auf das Feld des Onlinedatings bedeutet dies, dass der quantitative Wert der Begehrenswürdigkeit einer Nutzerin A auf der Grundlage der Likes und Nopes errechnet wird, die sie von anderen Nutzerinnen (B, C, D, …) erhält. Je höher der eigene Wert der A bewertenden Nutzerinnen (B, C, D, …) ist und je selektiver sie positiv bewerten, desto positiver wirkt sich ihre positive Bewertung auf den Wert von A aus. Je begehrenswerter die positiv Bewertenden sind, desto höher ist also der errechnete „desirability score“ der Bewerteten. Tinder (2019) kommentiert: „Basierend auf diesen Profileinschätzungen gab es einen ‚Score‘ – in dem Sinne, dass es in unserem System mit einem numerischen Wert angezeigt wurde, um in die anderen Aspekte unseres Algorithmus einkalkuliert zu werden.“
Mittlerweile hat Tinder selbst sich von der Verwendung eines solchen „Elo Scores“ distanziert. Zwar könne die App „nicht alle geheimen Zutaten preisgeben, mit denen wir köcheln“, die „Hauptzutaten“ bestünden aber in der aktiven Nutzung der App und der räumlichen Nähe der Nutzerinnen zueinander (Tinder 2019). Das ist plausibel, wenn man davon ausgeht, dass Tinder aktive Nutzerinnen, die sich auch relativ problemlos physisch treffen können, miteinander matchen will. Und es zeigt auch an, dass die digitale Bewertungsinfrastruktur Verhalten bei Nutzerinnen prämiert und provoziert, das sie für ihre algorithmisierte Bewertungspraxis verwenden kann. Gleichzeitig wird aber auch hervorgehoben, dass die Bewertungen von Nutzerinnen in den Selektionsalgorithmus eingehen: „Wir sind heutzutage nicht auf Elo angewiesen – aber es ist immer noch wichtig für uns, beide Seiten zu berücksichtigen, die Profile liken, um ein Match zu bilden. Unser aktuelles System passt die potenziellen Matches jedes Mal an, wenn dein Profil nach links oder rechts geswipt wird“ (ebd., Herv. T. P.). In der technischen Sprache des Patentantrags: Die App „may be capable of dynamically updating search results based on user activity“ (Rad et al. 2019, S. 1). Durch die Kalkulation von beobachteten Bewertungsurteilen ihrer Nutzerinnen wird die App selbst zu einer eigenständigen Bewerterin im oben diskutierten Sinn (vgl. Abschn. 2).
Zusammenfassend kann man festhalten, dass Tinder drei analytisch zu unterscheidende Objekte beobachtet und vergleicht: die Identität der Bewerteten auf der Suche nach ähnlichen Identitäten im Nutzerinnenpool, die Identität der Bewerteten als Anker, mit dessen Hilfe Profile gefunden werden können, die mit den Präferenzen einer Nutzerin übereinstimmen, und das Bewertungsverhalten, auf dessen Grundlage ein Attraktivitätswert kalkuliert werden kann, um Matches zwischen gleichwertigen Nutzerinnen zu ermöglichen. Wie genau auf Grundlage der Beobachtung dieser drei Objekte der Pool an Profilen, die einer Nutzerin vorgelegt werden, ausgewählt und strukturiert wird, darüber erfährt man in den öffentlich zugänglichen Dokumenten allerdings nichts. Der Algorithmus bleibt im Detail verborgen.
Möglichkeiten individueller Bewertung
Gegenüber analogen Bewertungssituationen ist die individuelle digitalisierte intime Bewertung dadurch gekennzeichnet, dass sie sowohl zeitlich als auch räumlich von der Anforderung der Kopräsenz von Bewertenden und Bewerteten entbunden wird. In vielen interaktionalen Bewertungssituationen sind Bewertungsobjekte physisch präsent, sei es als „Mensch“, der in einem Bewerbungsgespräch auf Passungsfähigkeit geprüft wird (Rivera 2012), sei es als „Objekt“, z. B. als literarisches Manuskript (Merriman 2015), in dem zur Begutachtung geblättert wird, bevor es beiseitegelegt oder zur Publikation empfohlen wird. Von dieser Bindung an Anwesenheit emanzipiert medial vermittelte Bewertung im Allgemeinen und digitalisierte Bewertung im Besonderen. An die Stelle anwesender Bewertungsobjekte tritt der Bildschirm als Interaktionspartner. Mit einem Begriff von Knorr Cetina (2009) kann man von „skopischen“ Bewertungen sprechen.Footnote 21
Gegenüber Bewertungsinteraktionen unter Bedingungen von Anwesenheit zeichnen sich skopische Bewertungssituationen digitalisierter intimer Bewertung dadurch aus, dass sie das Bewertungsgeschehen entsynchronisieren und in unterschiedliche, klar voneinander abgrenzbare Bewertungsstufen unterteilen (vgl. Abb. 2). Auf der ersten Stufe findet die oben schon angesprochene ereignishafte Bewertung der vorliegenden Profile durch die „Swipe“-Bewegung statt. In dieser Phase bewerten Nutzerinnen kontinuierlich die ihnen angezeigten Profile, indem sie ein Like- oder Nope-Urteil fällen. Im Fall eines Matches erreichen zwei Profile dann eine weitere, nun gemeinsame Bewertungsstufe. In diesem Prozess stehen den Nutzerinnen erneut all jene Informationen zur Verfügung, die über die Profile der anderen bereitgestellt werden. Am Ende dieser Bewertungsphase kann die Entscheidung stehen, per Chat mit der Person in Kontakt zu treten. In vielen Fällen resultiert das Match aber nicht in einer weiteren Kontaktaufnahme. In der textbasierten Interaktion im Chat prüfen sich die Beteiligten wechselseitig, woraufhin sie die Interaktion auslaufen lassen (indem sie nicht mehr kommunikativ aneinander anschließen – das ist der Regelfall im Onlinedating (Schulz et al. 2010, S. 496)), abbrechen (indem sie das „Match auflösen“), das Interaktionsmedium wechseln (indem sie z. B. zu einer Messenger-App wie Whatsapp, Threema oder Telegram wechseln) oder zu einer Face-to-Face-Interaktion überleiten.
Kennzeichnend für diese Bewertungspraxis ist, dass die Bewertungsobjekte in ihrem Verlauf in unterschiedliche Listen eingetragen oder aus ihnen gelöscht werden (vgl. Abb. 2). Ausgangspunkt ist der Stapel der Profile, in dem die Nutzerinnen die ihnen vorgelegten Bewertungsobjekte seriell bewerten. Kommt es zu einem Match, so wird das gematchte Profil in eine zweite Liste „Neue Matches“ übertragen. Über diese Liste ist es der Nutzerin bis zur Auflösung der Verbindung möglich, das entsprechende Profil aufzusuchen und die Person anzuschreiben oder von ihr angeschrieben zu werden. Hier können nun weitere Bewertungsprozesse anschließen, das Profil eingehender studiert und interpretiert werden. Und auch hier können die Nutzer wieder an der Bewertung des Profils arbeiten – nun mit der Möglichkeit, es mit anderen gematchten Profilen direkt zu vergleichen. Die Entscheidung, mit der Person schriftlich über die Chatfunktion der App Kontakt aufzunehmen, verschiebt das gematchte Profil schließlich in eine weitere Liste der „Nachrichten“.
Die Liste der gematchten Profile und die Liste der Chatverläufe sind strikt chronologisch geordnet. Für die Liste der Profile bedeutet das, dass gematchte Profile durch neu gematchte Profile aus dem Bildschirm verdrängt werden. Die Liste der Chatverläufe wird anhand des Neuigkeitsgrades der gesendeten oder empfangenen Nachrichten geordnet. Durch das Senden von Nachrichten können Nutzerinnen hier also Einfluss auf die Ordnung der Liste nehmen. Sie können Profile aber nicht unabhängig davon hierarchisieren oder kategorisieren, sondern lediglich aus der Liste löschen. Auch hier schiebt jeder neue kommunikative Kontakt die bestehenden Kontakte außer Sichtweite. Die Organisation des listenbasierten Bewertens in der App prämiert Neuheit und lässt ältere Profile in Vergessenheit geraten.
Die Nutzerinnen der Dating-App Tinder bewerten Profile also in einem dreistufigen Verfahren. Wenn man Bewertung, wie oben vorgeschlagen, als die Synthese von Identifizierung, Kategorisierung, Relationierung und Inwertsetzung versteht, stellt sich im Anschluss an diese Beschreibung des Bewertungsverfahrens die Frage, welche Möglichkeiten die App zur Bewertung bereitstellt.
Den Nutzerinnen der App stehen die oben diskutierten Informationen der anderen Nutzerinnenprofile als Material der Identifizierung zur Verfügung: Bilder und Profiltexte sowie (sofern angegeben) das Alter, der Beruf und die besuchte Bildungsinstitution. Aus diesen Informationen können sie individualisierte Erwartungen zu den in den je vorliegenden Profilen repräsentierten Personen bilden. Während im gesellschaftlichen Diskurs über Tinder häufig die Oberflächlichkeit der Auseinandersetzung mit anderen Personen beklagt wird, sind die von der App angebotenen Möglichkeiten der Identifizierung von Personen damit tatsächlich recht vielschichtig. Wenn auch die Anzahl der ihnen zur Verfügung stehenden Zeichen relativ beschränkt ist, bieten die Nutzerinnen doch teilweise diverses Material an, das interpretiert und zur Bewertung verarbeitet werden kann: ihre Verwendung von Emoticons, die Selbstbeschreibung der Personen und die Artikulation von Erwartungen an potenzielle Partnerinnen, die angestrebte Beziehungsform, die Verwendung von Zitaten, Witz, Humor etc. Auch durch ihre visuelle Selbstdarstellung können Nutzerinnen differenzierte Bilder von sich zeichnen: Sie stellen sich in unterschiedlichen Graden der Selbstinszenierung, von Schnappschüssen und Spiegel-Selfies bis zu offensichtlich überlegten Arrangements professionell produzierter Fotografien, dar. Die Nutzerinnen werden so in die Lage versetzt, durch Interpretation des Bild- und Textmaterials ein mehr oder weniger differenziertes Bild der Nutzerinnen zu konstruieren.
Beobachter digitalisierter intimer Bewertung können nicht davon ausgehen, dass immer klar ist, welches Objekt gerade Gegenstand der Bewertung ist oder in ihr identifiziert wird. Man muss sich z. B. fragen, ob die Profile oder die Personen hinter den Profilen bewertet werden – ein schönes Profil oder ein attraktiver Mensch. Oder ob sie selbst vielleicht gar nicht im Fokus der Bewertung stehen, sondern nur Objekte einer Nebenbewertung oder „Co-Valuation“ (Meier und Peetz 2021) sind, während die eigentliche Bewertung dem abgebildeten Jack-Russel-Terrier gilt.
Das Problem wird noch deutlicher, wenn die Frage gestellt wird, als was die Profile bewertet werden, welche Kategorien an das Bewertungsobjekt geheftet werden. Geht es um die hinter dem Profil erwartete „ganze“ Person? Wird diese als potenzielle Freundin, Liebhaberin oder Stadtführerin bewertet? Oder bezieht sich die Bewertung des Profils in diesem Moment gar nicht auf die Person, sondern auf die Gestaltung des Profils – wird sie also als Kuratorin bewertet? Die Verwendung dieser unterschiedlichen Kategorien wird auch einen Einfluss darauf haben, welche Elemente der Profile zur Identifizierung herangezogen und welche vernachlässigt werden. Welche Kategorien tatsächlich verwendet werden, muss Gegenstand weiterer Analysen werden.
Wenn in der Soziologie der Bewertung die Relationierung von Identitäten thematisiert wird, dann bezieht sich das häufig auf quantifizierende Vergleiche von Identitäten, auf deren Grundlage Urteile über die relative Wertigkeit von Identitäten gebildet werden (vgl. u. a. Brankovic et al. 2018; Espeland und Sauder 2007; Esposito und Stark 2019). Mit Blick auf diese Literatur fällt am Fall Tinder auf, dass durch die App zwar prinzipiell Vergleichsräume ausgeweitet werden – die Nutzerinnen können nahezu weltweit eine große Anzahl von Identitäten in kürzester Zeit auf ihre intime Wertigkeit hin einschätzen (Peetz 2019). Gleichzeitig werden durch die Struktur der App Vergleichsmöglichkeiten aber systematisch wieder eingeschränkt.
So liegt eine zentrale Eigenschaft von Tinder darin, dass die begutachteten Profile nach der initialen Bewertung verschwinden und selbst in der Bezahlversion nur der letzte Bewertungsakt rückgängig gemacht und damit lediglich zwei Profile direkt vergleichend bewertet werden können. Erst nach einem Match können die weiteren Bewertungsschritte intensiver vergleichend vorgehen. Vergleichsmöglichkeiten werden den Nutzerinnen der App also nicht konsequent zugänglich gemacht. Andere Dating-Apps gehen anders vor. Bei OkCupid oder Lovoo kann z. B. auf Profile, die in der Form eines Gitters präsentiert werden (vgl. Abb. 3), vergleichend zugegriffen werden.
Die Praktiken der Inwertsetzung von Nutzerinnen auf Tinder sind nicht Gegenstand dieses Artikels. Ihr Material haben sie in den Identifizierungen, Kategorisierungen und Relationierungen, die die App ermöglicht. Wie sie dies tun und wie die Fremdbewerterinnen diese Profile lesen, interpretieren und selbst narrativ inwertsetzen, welche Geschichten sie aus ihnen stricken, müsste Gegenstand weiterer Untersuchungen werden.