Computergenerierte Produktbeschreibungen in Online-Shops werden effizient erstellt und sind sprachlich kaum von menschlichen Texten zu unterscheiden. Doch kann die Textqualität der KI auch den Erfolgskriterien für Produkttexte gerecht werden? Die empirische Untersuchung zeigt die Potenziale auf, die Automatisierung auf sprachlicher und inhaltlicher Ebene zu bieten hat.

1 Einleitung und Relevanz

Die automatisierte Texterstellung kommt in verschiedenen Bereichen erfolgreich zum Einsatz, beispielsweise für Wetter‑, Finanz‑, Sportnachrichten (Gentsch 2018), Verkehrsmeldungen (Graefe et al. 2018) oder im Gesundheitswesen (Gentsch 2018). Diese Textarten eigenen sich besonders, da sie eine gleichbleibende Struktur besitzen und die Informationsvermittlung im Vordergrund steht (Gentsch 2018).

Im eCommerce bietet die Technologie große ökonomische Vorteile, denn die Produktion von Content ist zeit- und kostenaufwändig (Graefe 2016). Große Online-Shops mit einem breitem Produktportfolio stehen vor der Herausforderung, stetig für neue Produkte Inhalte für die verkaufsfördernde Präsentation zu entwickeln – und das häufig mehrsprachig. Die automatisierte Textgenerierung ist für diese Aufgabe eine effiziente Lösung (Naumann 2019).

Nach den Arbeiten von Graefe und Kollegen ist die Textgenerierung so weit entwickelt, dass computergenerierte Texte kaum von Redaktions-Texten unterschieden werden können (Graefe et al. 2018). Die Wahrnehmung von Kurznachrichten und anderen Textarten wurde hinsichtlich Glaubwürdigkeit, Lesbarkeit und Erwartungshaltung untersucht (ebd.). Aktuelle Forschungsergebnisse zur automatischen Textgenerierung von Produktbeschreibungen im eCommerce existieren bislang jedoch nicht. Da das Effizienzpotenzial dieses Anwendungsfeldes sehr hoch ist, wird diese Forschungslücke mit der empirischen Studie adressiert.

Der Neuigkeitswert des vorliegenden Beitrags liegt in der Zusammenstellung von Textmerkmalen, die bei Produktbeschreibungen wichtig sind und einer vergleichenden Analyse menschlicher und computergenerierter Produktbeschreibungen. In der Studie wurde anhand realer Produktbeschreibungen untersucht, inwieweit sich computergenerierte Produkttexte in sprachlichen und inhaltlichen Merkmalen von Redaktionstexten unterscheiden und welche Bedeutung bestimmte Textmerkmale für die Vorhersage ausgewählter, im Online Marketing relevanter Zielgrößen haben. Die Erkenntnisse stellen eine Basis für die weitere Optimierung der Qualität computergenerierter Texte dar.

2 Produktbeschreibungen im eCommerce

Texte gehören zu den wichtigsten Content-Bestandteilen eines Online-Shops (Jung und Winter 2018). Die Produktbeschreibung ist die inhaltliche Beschreibung und Erklärung des Produkts und seiner Merkmale (Steireif et al. 2019). Sie soll „beschreiben, erklären, verkaufen, den SEO-Kriterien genügen, verführen und Emotionen wecken“ (Jung und Winter 2018). Produkttexte dienen der Reichweitenerzeugung, Neukundengewinnung, Kundenbindung, dem positiven Branding und der Vertrauenssteigerung. Gute Texte steigern die Verweildauer und reduzieren Absprungraten, mittelbar beeinflussen sie die Administrations- und Callcenter-Kosten und reduzieren die Retourenquoten, während Nutzerzahlen und Conversion-Rates steigen (Pfeiffer 2016).

Die wichtigste Aufgabe ist jedoch die Informationsvermittlung, d. h. alle kaufentscheidungsrelevanten Informationen müssen enthalten sein (Kollmann 2019). Aussagekräftige Produktbeschreibungen erhöhen die Kaufwahrscheinlichkeit (Kollewe und Keukert 2014), verbessern die User Experience des Shops (Spreer 2018) und vermitteln einen Eindruck der fachlichen Expertise und Kundenfreundlichkeit (Firnkes 2014). Wichtige Produktinformationen sind: Farbe und Maße (Steireif et al. 2019), technische Details (Kollewe und Keukert 2014) und Preise (Kollmann 2019). Sicherheit und Vertrauen schaffen Informationen zum Hersteller und der Qualität (Steireif et al. 2019). Erklärungsbedürftige Details können über Verlinkungen ausgelagert werden (Kollmann 2019). Wichtige Botschaften sollen am Anfang stehen (Reiter 2019) und Zusammengehöriges sollte in einem Block vermittelt werden (Firnkes 2014). Sämtliche Informationen müssen stets aktuell sein (Naumann 2019), dabei können Trends aufgegriffen werden (Steireif et al. 2019).

Nutzerstudien belegen: gute Produktbeschreibungen sind für die Wahl des Online-Shops für 92 % der Befragten sehr bzw. eher wichtig (n = 1040, Bolz et al. 2017). Grundsätzlich müssen konkrete Vorteile und zentrale Kundennutzen vermittelt werden (Steireif et al. 2019). Produktbeschreibungen sollen kurz und prägnant gehalten und auf den Produktnutzen begrenzt werden (Steireif et al. 2019). Bildhafte Sprache, anschauliche Beispiele und assoziationsreiche Begriffe machen Produktvorteile erlebbar (Reiter 2019).

Da Lesen am Bildschirm anstrengender ist (Folten 2005) und Internetnutzer die Texte häufig nur scannen (Reiter 2019), ist es wichtig, kurze Sätze zu bilden und möglichst nur einen Gedanken pro Satz zu präsentieren (Reiter 2019).

Der Text muss inhaltlich verständlich sein (Steireif et al. 2019), es sollen eine einfache Sprache (ebd.) sowie präzise Ausdrücke und geläufige Begriffe verwendet werden (Reiter 2019). Konkrete Begriffe sind überzeugender als abstrakte und lösen mehr Assoziationen aus (Reiter 2019). Zu vermeiden sind verschachtelte Sätze (Steireif et al. 2019), Fachbegriffe, Füllwörter und Phrasen (Reiter 2019).

Texte sollen übersichtlich und sinnvoll gegliedert sein: Logische Absätze, aussagekräftige Überschriften oder Hervorhebungen. Eine klare und direkt formulierte Aufforderung (Call-to-Action, CTA) bestärkt den Nutzer in seiner Kaufabsicht (Reiter 2019).

3 Automatisierte Textgenerierung

Für Online-Händler bietet die automatisierte Texterstellung großes Potenzial (Naumann 2019), hierfür wird Natural Language Generation (NLG) eingesetzt (Carstensen 2017). Ein NLG-System bringt Informationen in eine definierte sprachliche Form und erfüllt ein kommunikatives Ziel für die Nutzer (ebd.).

Aus Unternehmensperspektive ist der Vorteil computergenerierter Texte ökonomischer Natur, eine enorme Menge an Texten kann kostengünstig und schnell erzeugt werden (Graefe 2016, S. 18). Laut uNaice, einem Anbieter automatisierter Content-Produktion, werden bis zu 500.000 Texte pro Stunde erstellt (Naumann 2019). Über eine Schnittstelle werden diese automatisch in den Shop integriert (ebd.).

Die Texterzeugung ist mehrsprachig und adaptiert für Zielgruppen maßgeschneidert möglich (Haim und Graefe 2018). Je nach Shop, Produkten oder Zielgruppen können Inhalte erzeugt werden, die einzigartig und suchmaschinenoptimiert sind (Naumann 2019). Simple Rechtschreibfehler und fehlende Informationen werden vermieden, dies verringert den Korrekturaufwand gegenüber Redakteuren erheblich (Graefe 2016). Unzählige Versionen eines Textes werden erzeugt, die sich hinsichtlich des Endgerätes (Smartphone, Desktop), des Sprachstils oder der Länge unterscheiden (Haim und Graefe 2018; Ronicke und Sadeghi o.J.).

Erkenntnisse über die Kundenpräferenzen können effizienter gewonnen und Ergebnisse schneller umgesetzt werden: Ein Beispiel sind A/B-Tests. Bei A/B-Tests werden verschiedene Varianten einer Produktbeschreibung gleich häufig im Shop ausgespielt, um die Performance der Varianten in Echtzeit zu testen. Wird die entsprechende Seite von einem User aufgerufen, erhält er durch Zufall eine der Varianten. Dadurch können die Reaktionen der User zwischen den Varianten verglichen werden (z. B. hinsichtlich Conversion, Verweildauer, Absprungrate und weiteren relevanten Größen). Durch den Einsatz der KI werden die verschiedenen Textversionen schnell in großen Mengen generiert und die Erkenntnisse zum optimalen Textkonzept im Anschluss ohne großen Aufwand auf sämtliche Texte übertragen (AX Semantics GmbH 2019).

Ein weiterer Vorteil ist die Aktualität der Texte. Gibt es z. B. neue Farb- oder Größenvarianten, werden die Produkttexte in kürzester Zeit angepasst. Die Texte sind sehr verlässlich, da Inhalt und Struktur vordefiniert sind (Naumann 2019). Großes Potenzial wird auch in personalisiertem Content gesehen (Kollmann 2019). Dabei werden in Abhängigkeit vom Nutzer oder dem Nutzertyp passende Texte und Abbildungen gezeigt, die den Vorlieben des Users entsprechen.

Kritisch zu betrachten ist die Fehleranfälligkeit der zugrundeliegenden Daten und Algorithmen. Korrekte, strukturierte Daten in maschinell lesbaren Formaten sind die wesentliche Voraussetzung für die Textgenerierung. In vielen Unternehmen müssen diese Grundvoraussetzungen erst aufgebaut werden (Graefe 2016). Des Weiteren werden sprachliche Qualität und Kreativität der Texte kritisiert (Graefe 2016).

Die Automatisierung macht die Prozesse bei der Content-Erstellung effizienter und die Conversion-Rate wächst (Ronicke und Sadeghi o.J.). Laut Anbietern von Lösungen kann bis zu 75 % der Arbeitszeit eingespart werden (uNaice o.J.). Automatisierte Lösungen sind für große Shops mit ähnlichen Produktinformationen sinnvoller als für Shops mit kleinem Sortiment sowie sehr unterschiedlichen Produktmerkmalen (Ronicke und Sadeghi o.J.). Bei letzteren wäre der Trainingsaufwand für die automatisierte Lösung zu hoch, die menschlichen Redakteure sind in diesen Fällen flexibler und effizienter.

4 Eine vergleichende empirische Analyse automatisierter und manuell getexteter Produktbeschreibungen

4.1 Fragestellungen und Studiendesign

Im Rahmen einer vergleichenden Analyse sollten manuell getextete und automatisiert generierte Produktbeschreibungen hinsichtlich relevanter Textmerkmale verglichen werden. Folgende Fragestellungen wurden untersucht:

  1. 1.

    Inwieweit unterscheiden sich manuell und automatisiert generierte Texte bezüglich verschiedener Textmerkmale voneinander?

  2. 2.

    Welchen Einfluss haben bestimmte Textmerkmale auf den Informationsgehalt und die Verständlichkeit der Texte?

Ein Vergleich der beiden Textformen ermöglicht die Beurteilung der Ähnlichkeit von manuell und automatisch generierten Texten und erlaubt eine Abschätzung, inwieweit automatisierte Texte eine qualitative Alternative zu manuellen Beschreibungen im Online-Shop darstellen können. Die Größe des Einflusses auf Faktoren wie Informationsgehalt und Verständlichkeit bildet die Basis für die Priorisierung von Textmerkmalen.

Der Untersuchungsgegenstand des Beitrags sind Produktbeschreibungen des Online-Shops Klingel.de aus der Kategorie Damen-Blusen. Abb. 1 zeigt beispielhaft eine Produktbeschreibung.

Abb. 1
figure 1

Beispiel einer Produktbeschreibung (Quelle: Klingel 2020)

Es wurde eine Stichprobe von 200 Texten gewählt, 100 Texte wurden automatisiert generiert und 100 Texte von Redakteuren erstellt. Für die Automatisierung nutzt die KLiNGEL-Gruppe die Softwarelösung AX Semantics. Die Software wird durch Machine Learning trainiert. Sie lernt durch Testdaten und ein individuelles Regelwerk, welche Inhalte vermittelt und wie diese formuliert werden sollen (Kollmann 2019).

Um einen inhaltlichen Vergleich zu ermöglichen, wurden Texte nach Kriterien ausgewählt: Die Eingrenzung auf eine Marke und Produktkategorie verhindert Verzerrungen durch produktabhängige und markenspezifische Eigenheiten. Es wurden nur Texte zu Produkten gewählt, von denen jeweils eine automatisierte und eine manuelle Version vorlag. Grundlegende Unterschiede durch eine ungleiche Informationsbasis sind daher ausgeschlossen. Außerdem wurde eine Länge von mindestens 200 Zeichen pro Text definiert. Auf Basis dieser Kriterien wurden die Texte zufällig ausgewählt. Nachfolgend ein Beispiel einer automatisch erzeugten Produktbeschreibung aus der Analyse:

„Diese Bluse von Betty Barclay ist genau das richtige Modell, wenn Sie etwas im modischem Stil und mit klassischem Rundhalsausschnitt suchen. Aus reiner Viskose hergestellt, zeichnet sie sich insbesondere durch sein weiches und geschmeidiges Tragegefühl aus. Weitere Vorteile des Stoffs: Er ist atmungsaktiv, nahezu bügelfrei und fusselt nicht. Am Armabschluss haben die langen Ärmel der Bluse einen geraden Ärmelabschluss. Unser Shop bietet Ihnen eine riesige Produktauswahl – lassen Sie sich die Bluse von Betty Barclay ganz einfach nach Hause liefern!“

Die Untersuchungsmerkmale wurden durch aktuelle Literatur aus den Themenfeldern Marketing‑/Werbetexte sowie Texten für Online-Shops entwickelt (Reiter 2019; Steireif et al. 2019; Pfeiffer 2016; Kollewe und Keukert 2014; Firnkes 2014; Folten 2005).

Die Produkttexte wurden auf quantitative (bspw. Textlänge) sowie qualitative Merkmale (bspw. Informationsgehalt) untersucht. Ebenfalls wurden textunabhängige Merkmale (bspw. Verwendung von Wortarten) verglichen und spezifische Merkmale für Produktbeschreibungen (bspw. Nutzen) untersucht. Für eine bessere Übersichtlichkeit wurden die Merkmale in die vier Bereiche allgemeine Textmerkmale, Wortarten, inhaltliche Merkmale und unterschwellige Merkmale gegliedert (Vgl. Tab. 1).

Tab. 1 Übersicht aller untersuchten Merkmale

Zur Quantifizierung der Merkmale wurde u. a. das Textanalyseprogramm Linguistic Inquiry and Word Count (LIWC) herangezogen (Pennebaker et al. 2015). Die Verständlichkeit wurde mit dem Flesch-Reading-Ease (FRE) erhoben. Die FRE-Formel ermittelt die Lesbarkeit von Texten anhand durchschnittlicher Wort- und Satzlänge (Amstad 1978).

Inhaltliche Merkmale wurden manuell ausgezählt. Das Merkmal Informationsgehalt betrifft folgende Kategorien: Produktbezeichnung, Marke, Farbeigenschaften, Muster, Material, Größen, Maße, Schnitt sowie dekorative Elemente. Als Merkmal Nutzen wurden jene Worte und Formulierungen gezählt, die ein Nutzenversprechen geben bzw. die Nutzungsvorteile erlebbar machen. Rationale Vorteile sind beispielsweise: „hautfreundlich“, „pflegeleicht“. Auch als Nutzen wurden Passagen bewertet, die eine vorteilige Passform, Bequemlichkeit, Tragekomfort, den aktuellen Modetrend oder die Einzigartigkeit des Produkts beschreiben.

4.2 Ergebnisse

Unterschiede zwischen den Textvarianten wurden statistisch auf Signifikanz getestet, um auszuschließen, dass Unterschiede nur zufallsbedingt zustande gekommen waren. Bei metrischen Merkmalen wurden hierzu t‑Tests für unabhängige Stichproben durchgeführt, bei nominalen Merkmalen wurden Chi2-Tests für Kreuztabellen (Merkmal × Textvariante) verwendet.

Im Anschluss wurden Beziehungen zwischen den Merkmalen mittels multipler linearer Regression untersucht. Die Regressionsanalyse ist ein statistisches Verfahren, das Beziehungen zwischen mehreren gemessenen Merkmalen (unabhängige Variablen) und jeweils einem weiteren gemessenen Merkmal (abhängige Variable) erfasst. Dabei wird eine Geradengleichung ermittelt, mit der sich die abhängige Variable bestmöglich auf Basis der unabhängigen Variablen erklären lässt. Sie macht Aussagen darüber, ob bestimmte Merkmale generell in Beziehung zu einer abhängigen Variablen stehen, und ermittelt zudem die Stärke des Einflusses (Backhaus et al. 2018). Im Rahmen der im Folgenden dargestellten Regressionsanalysen wurde der Einfluss zentraler allgemeiner Merkmale und Wortarten (unabhängige Variablen) auf exemplarische inhaltliche und unterschwellige Merkmale (jeweils abhängige Variable) ermittelt. Die Analyse wurde auf Basis der 200 Texte durchgeführt, automatisierte und manuell erstellte Texte wurden gemeinsam bezüglich der Bedeutung der einzelnen Merkmale analysiert.

Zentrale Ergebnisse für den Vergleich der Merkmale zwischen den beiden Textformen sind Tab. 2 zu entnehmen. Die automatisierten Texte (AT) sind durchschnittlich länger als die manuellen (MT). Die MT beinhalten durchschnittlich längere Worte (Silben/Wort) und mehr lange Worte (>12 Zeichen). Für alle allgemeinen Merkmale ist der Unterschied zwischen den beiden Textgruppen signifikant.

Tab. 2 Deskriptive Ergebnisse und Signifikanzprüfung

Die häufigste Wortart in beiden Textgruppen sind Substantive. Auffällige Unterschiede in den Mittelwerten liegen bei Adverbien, Verben, Pronomen gesamt, Personalpronomen gesamt, Personalpronomen für die zweite Person (formal) und dritte Person sowie für Präpositionen und Substantive vor.

Hinsichtlich der inhaltlichen Merkmale werden bei den AT im Schnitt 6,6 sachliche Informationen gegeben (entspricht 8 % der Textlänge), in den MT 8,0 (entspricht 17,4 % der Textlänge). In den AT werden durchschnittlich 3,3 Nutzenvorteile genannt (entspricht 4 % der Textlänge), bei den MT durchschnittlich 1,6 (entspricht 3,3 % der Textlänge). Der Unterschied in der Art der Texterstellung hinsichtlich des Informationsgehalts und Nutzens ist signifikant. In 31 % der AT ist ein Use Case (Style-Tipp oder Verwendungssituation) enthalten, während 22 % der MT einen benennen. Eine konkrete Handlungsaufforderung liegt bei den AT in 99 % und bei den MT in 5 % der Texte vor. Das Vorhandensein einer Handlungsaufforderung steht in einem Zusammenhang mit der Art der Texterstellung, das Vorhandensein eines Use Cases im Text nicht.

Bei den unterschwelligen Merkmalen wurde die Verständlichkeit mittels des FRE betrachtet. Mit einem FRE-Wert zwischen 40 und 60 werden beide Textgruppen als „durchschnittlich verständlich“ bewertet. Dennoch weisen die AT einen höheren FRE-Wert auf und sind damit insgesamt leichter verständlich und besser lesbar als die MT. In den AT sind durchschnittlich 4,8 % des Textes eine persönliche Leseransprache, während der Leser in den MT nur mit durchschnittlich 0,5 % der Worte persönlich angesprochen wird. Im Schnitt sind 5,5 % der Worte in den AT Füllwörter, während es bei MT lediglich 1,2 % sind.

Tab. 3 zeigt zentrale Ergebnisse der Vorhersage ausgewählter abhängiger Variablen auf Basis bestimmter Textmerkmale. Insbesondere der Informationsgehalt ließ sich durch sprachliche Merkmale signifikant vorhersagen. Sowohl Satz- und Wortlänge, die Anzahl der langen Sätze und langen Wörter als auch die verschiedenen Wortarten haben einen signifikanten Einfluss auf den Informationsgehalt. Des Weiteren sagen Wortarten und die Anzahl an langen Wörtern und Sätzen die Verständlichkeit vorher. Die Satz- und Wortlänge wurde an dieser Stelle aus dem Modell ausgeschlossen, da sich der errechnete Verständlichkeitsindex (FRE-Wert) aus diesen berechnet.

Tab. 3 Ergebnisse der multiplen linearen Regressionsanalysen

4.3 Interpretation

Die Studie zeigt signifikante Unterschiede bei vielen Textmerkmalen der automatischen und manuellen Texte. Obwohl der Informationsgehalt bei automatischen Texten geringer ist, besitzen sie eine signifikant bessere Verständlichkeit.

Während Pronomen den Informationsgehalt negativ beeinflussen, steigern sie die Verständlichkeit der Texte. Von der Verwendung von Substantiven, die bei den automatisierten Texten seltener sind, profitiert insbesondere der Informationsgehalt. Der Anteil an langen Wörtern beeinflusst die Verständlichkeit negativ; die bessere Verständlichkeit der automatisierten Texte dürfte auf Basis der Ergebnisse insbesondere an dem geringeren Anteil langer Wörter im Vergleich zu den manuellen Texten liegen.

Mit Blick auf die Optimierung der Texte hinsichtlich der untersuchten Kriterien Informationsgehalt und Verständlichkeit bietet es sich an, bei automatisierter Textgenerierung die identifizierten relevanten Textmerkmale entsprechend zu parametrisieren. So ließe sich der Informationsgehalt primär durch den stärkeren Einsatz von Substantiven, die Verständlichkeit durch Pronomen und reduzierten Einsatz von langen Wörtern positiv beeinflussen. Die in den AT deutlich häufiger verwendeten Personalpronomen bauen Nähe zum Kunden auf.

Gerade im Internet ist die schnelle Erfassbarkeit der Texte wichtig (Folten 2005), die durch leichte Verständlichkeit begünstigt wird. Die Text- und Satzplanung der NLG-Anwendung sind so festgelegt, dass die Ausgabetexte als „durchschnittlich verständlich“ wahrgenommen werden.

Bei AT liegen eine größere Satzlänge und ein stärkeres Vorkommen von langen Sätzen vor. Lange Sätze können höhere Komplexität bedeuten (Gottschling 2008). Im digitalen Umfeld ist die schnelle Erfassbarkeit wesentlich, User mit Scanverhalten bevorzugen eher kurze Formulierungen, weshalb die MT diesbezüglich als besser zu bewerten sind. Bei Wortlänge und dem Vorkommen von langen Wörtern schneiden die AT im Schnitt besser ab, denn kurze Wörter werden schneller erfasst und verarbeitet (Reiter 2019). Generell sollte stets geprüft werden, ob besonders lange Wörter durch Trennstriche besser lesbar sind.

Im Verhältnis zur Textlänge enthalten die MT deutlich mehr sachliche Produktinformationen. Dies ist nicht verwunderlich, da die gleichen Daten zugrunde liegen und die AT durchschnittlich länger sind. Dennoch ist auffällig, dass die MT auch unabhängig von der Textlänge mehr Informationen vermitteln. Denkbar ist, dass die Informationen im AT bewusst reduziert wurden, damit dieser nicht überladen wirkt, denn alle Informationen werden im Shop in einer separaten Auflistung präsentiert. Die Anzahl der Nutzenversprechen ist bei den AT höher als bei den MT. Mit Nutzenvorteilen, die den Bedürfnissen der Zielgruppe entsprechen, kann sich das Produkt von anderen Angeboten abheben und die Kaufentscheidung stimulieren (Esch et al. 2019). Während 99 % der AT mit einer Handlungsaufforderung enden, enthalten nur 5 % der MT einen CTA. Solche Passagen sind in der automatisierten Anwendung schnell und ohne Aufwand auf alle Texte übertragbar. Die systematische Optimierung ist bei manuellen Texten auch hinsichtlich vieler weiterer Kriterien unverhältnismäßig aufwändiger. Die systematische regelgesteuerte Einbindung von Textmerkmalen in den Algorithmus der Textsoftware ist generell von Vorteil und ermöglicht die systematische Optimierung der Texte.

4.4 Kritische Würdigung

Die Untersuchungsergebnisse basieren auf Texten des KLiNGEL-Shops in der Kategorie Damenblusen und der Softwarelösung AX Semantics mit dem konfigurierten Regelwerk von KLiNGEL, weshalb die Generalisierbarkeit in weiteren Studien geprüft werden sollte. Zudem fehlen Informationen zu den manuellen Texten, Inhalte des Briefings sowie Anzahl der Texter. Unterschiede der beiden Textgruppen können zu einem gewissen Maß auch auf das Briefing der Redakteure und die Programmierung der automatisierten Generierung zurückzuführen sein.

Bei der Auswahl der untersuchten Merkmale wurden für eine umfangreiche Analyse sowohl allgemeine als auch spezifische Kriterien für die Textart zusammengestellt. Dennoch kann das Untersuchungsdesign nicht die gesamte Bandbreite an möglichen Faktoren abdecken. Die Texte werden durch mehrere zum Teil konträre Aspekte und Zielsetzungen beeinflusst, weshalb die Merkmale nicht isoliert interpretiert und in weiteren Studien zusammen mit weiteren Merkmalen untersucht werden sollten.

Als theoretische Grundlage für die Bestimmung der inhaltlichen Merkmale wurden einschlägige Arbeiten verwendet, dennoch handelt es sich nicht um bereits validierte Untersuchungsmerkmale. Die Einordnung und Abgrenzung der inhaltlichen Merkmale könnten darüber hinaus als subjektiv betrachtet werden.

Das Analyseprogramm LIWC ist etabliert, Reliabilität und Validität wurden durch Studien bereits nachgewiesen (Pennebaker et al. 2015). Dennoch ist zu beachten, dass das Tool hauptsächlich für psychometrische Untersuchungen verwendet wird und die Anwendung für die vorliegende Textart bislang nicht dokumentiert ist. Durch Verwendung von standardisierten Analysetools zur Erhebung der Daten kann von hoher Reliabilität ausgegangen werden.

5 Fazit und Ausblick

Neben Unterschieden zwischen automatisierten und manuellen Texten bei einzelnen Textmerkmalen gibt die Studie erste Hinweise auf die Bedeutung einzelner Merkmale für Informationsgehalt und Verständlichkeit.

Für automatisierte Texte bietet sich die Chance, dass neben inhaltlichen Vorgaben auch Regelungen zu Satzlänge, Verwendung einzelner Wortarten, Verständlichkeit oder persönlichen Ansprache programmiert werden können. Damit lassen sich effizient wichtige Kriterien mit Blick auf die Wirkung der Texte steuern, was bei manuellen Texten nur in geringerem Ausmaß möglich wäre. So lassen sich bei automatisierten Texten Passagen und Bestandteile wie Handlungsaufforderungen oder Use Cases schnell, günstig und in Varianten auf sämtliche Texte im Shop zu übertragen.

Für die Variablen Informationsgehalt und Verständlichkeit konnte die Bedeutung bestimmter Textmerkmale wie lange Wörter ermittelt werden. In Folgestudien sollten diese Erkenntnisse weitergeführt werden, indem subjektive Kundenurteile zu den Texten sowie ihre Kaufbereitschaft miterhoben werden. Dadurch ließe sich ermitteln, welche Textmerkmale Kundenurteile maßgeblich beeinflussen. Diese könnte man durch Parameter bei der Erstellung automatisierter Texte entsprechend steuern.

Die große Komplexität im eCommerce kann durch automatisierte Prozesse besser beherrscht werden. Für Produktbeschreibungen bietet die automatisierte Texterstellung große Vorteile. Inwiefern die automatisiert generierten Produktbeschreibungen inhaltlich und sprachlich noch weiter optimiert werden können, sollte weiter untersucht werden. Die vorliegende Studie bietet eine Basis dafür.