Motivation

Die Untersuchung von Kostentransparenz ist aus ökonomischer Sicht besonders spannend, da sie Einblicke in das Zusammenspiel von Marktverhalten, Preiswahrnehmung und Konsumentenvertrauen ermöglicht. In klassischen Märkten gilt Information als asymmetrisch verteilt - insbesondere Kostenstrukturen bleiben für Konsument:innen meist verborgen. Wenn Unternehmen jedoch freiwillig ihre Produktionskosten offenlegen, entsteht eine neue Form der Marktkommunikation, die sowohl auf das Kaufverhalten als auch auf die Markenbindung Einfluss nehmen kann.

In diesem Projekt beschäftigen Sie sich mit der ökonomischen Wirkung unterschiedlicher Formen von Kostentransparenz, darunter produktbezogene Einzelkosten-Offenlegung im Point-of-Sale oder auch verbal vermittelte Transparenz in Kombination mit Vertrauensmessung. Ziel ist es, zu untersuchen, wie sich diese Varianten auf Zahlungsbereitschaft, Vertrauen und wahrgenommene Preisfairness auswirken.

Kern dieser Ausarbeitung ist die Frage, inwiefern Kostentransparenz eine rationale Kaufentscheidung unterstützt oder über emotionale Mechanismen - etwa durch erhöhte Markenattraktivität - wirkt. Für die Analyse greifen Sie auf ein breites Methodenrepertoire zurück, das ökonomische Modellierung mit experimenteller Verhaltensforschung verbindet, und leisten so einen Beitrag zum besseren Verständnis moderner Konsumentenentscheidungen in transparenten Märkten. Für ihre Analyse verwenden Sie die Daten der folgenden Ausarbeitung:

Mohan, B., Buell, R. W., & John, L. K. (2020). Lifting the veil: The benefits of cost transparency. Marketing Science, 39(6), 1105-1121.

Aufbau der Studie

  1. Lesen Sie sich den folgenden Text zum Hintergrund und Aufbau der Studie durch und beantworten Sie nachfolgende Fragen dazu:

Der Ausgangspunkt der betrachteten Untersuchung war ein reales Ereignis: Ein Online-Händler stellte im Dezember 2013 ein hochwertiges Lederportemonnaie zum Verkauf. Einige Wochen später wurde auf den Produktseiten eine Infografik zur Kostenzusammensetzung ergänzt, allerdings versehentlich nur bei drei von fünf Farbvarianten. Obwohl der Händler diesen Fehler nicht beabsichtigte, entstand daraus ein sogenanntes natürliches Experiment, also eine reale Vergleichssituation mit kontrollierbaren Unterschieden. Die Verkäufe konnten analysiert werden, um zu überprüfen, ob die Offenlegung der Produktionskosten einen Einfluss auf das Kaufverhalten hatte.

Dieses natürliche Experiment lieferte erste Hinweise darauf, dass Kostentransparenz wirkt - und war damit die Basis für zwei gezielte Experimente im Labor, die Sie sich in diesem Projekt genauer anschauen sollen. Beide Laborexperimente knüpfen an die reale Ausgangslage an - gehen aber unterschiedliche Forschungsfragen an:

Experiment 1: In einem realitätsnahen Online-Setting wurde untersucht, ob Konsument:innen anders entscheiden, wenn sie Informationen zu Produktionskosten sehen. Hierbei sahen die Teilnehmer:innen eine Produktseite für einen Rucksack von Everlane - entweder mit oder ohne Kostenaufstellung (vgl. Abbildung 1: Kostentransparenz Infografik im Anhang). Zusätzlich wurde ein Vergleichsprodukt von J. Crew gezeigt (ohne Hinweise zur Kostenzusammensetzung). Die Teilnehmer:innen mussten entscheiden, von welchem Anbieter sie lieber einen Gutschein erhalten würden. Das Ziel der Forscher war es zu messen, ob Konsument:innen bei mehr Transparenz auch eher kaufen, folglich sich für diesen Gutschein entscheiden.

Experiment 2: Nachdem Experiment 1 zeigte, dass es einen Effekt der Kostentransparenz gibt, stellt sich die psychologische Anschlussfrage, warum es diesen Effekt gibt und wie dieser festzumachen ist. So sahen die Teilnehmer:innen im 2. Experiment ein fiktives Produkt - eine Schokoladentafel. In der Kontrollgruppe wurden nur übliche Produktinfos gezeigt. In der Treatmentgruppe gab es zusätzlich eine detaillierte Kostenaufstellung (vgl. Abbildung 2: Design der Schokoladenverpackung ohne und mit Kostentransparenz im Anhang). Im Anschluss wurden Vertrauen in die Marke und Kaufbereitschaft durch einen Fragebogen abgefragt. So sollte herausgefunden werden, ob Vertrauen der zentrale psychologische Mechanismus für die Kaufentscheidung der Kund:innen ist.


Beantworten Sie nun folgende Fragen:

  1. Welches reale Ereignis war der Auslöser der Forschung?
  2. Welche konkrete Verhaltensfrage steht im Mittelpunkt von Experiment 1 - Was wollten die Forscher:innen direkt am Kaufverhalten testen?
  3. Welcher psychologische Faktor steht im Zentrum von Experiment 2 - und wie hängt er mit dem Kaufverhalten zusammen?

  1. Welches reale Ereignis war der Auslöser der Forschung?

    Der Auslöser war ein unbeabsichtigtes reales Ereignis bei einem Online-Händler im Dezember 2013: Auf den Produktseiten eines hochwertigen Lederportemonnaies wurde versehentlich nur bei drei von fünf Farbvarianten eine Infografik zur Kostenzusammensetzung ergänzt. Dieses Versehen ermöglichte ein natürliches Experiment, bei dem untersucht werden konnte, ob die Offenlegung der Produktionskosten einen Einfluss auf das Kaufverhalten hatte.

  2. Welche konkrete Verhaltensfrage steht im Mittelpunkt von Experiment 1 - Was wollten die Forscher:innen direkt am Kaufverhalten testen?

    In Experiment 1 wollten die Forscher:innen herausfinden, ob Konsumenten:innen bei sichtbarer Kostentransparenz eher bereit sind, ein Produkt zu kaufen. Dies wurde indirekt gemessen, indem die Teilnehmenden zwischen zwei Anbietern (Everlane mit Kostentransparenz vs. J. Crew ohne Kostentransparenz) wählen mussten, von welchem sie lieber einen Gutschein erhalten würden. Die konkrete Verhaltensfrage war also: Beeinflusst die Darstellung von Produktionskosten die Kaufentscheidung der Konsumenten:innen?

  3. Welcher psychologische Faktor steht im Zentrum von Experiment 2 - und wie hängt er mit dem Kaufverhalten zusammen?

    Im Zentrum von Experiment 2 steht der psychologische Faktor Vertrauen in die Marke. Die Forscher:innen wollten herausfinden, ob die Offenlegung der Produktionskosten das Vertrauen der Konsumenten in die Marke stärkt – und ob dieses Vertrauen die Kaufbereitschaft positiv beeinflusst. Es wurde also untersucht, ob Vertrauen als zentraler Mechanismus den positiven Effekt von Kostentransparenz auf das Kaufverhalten erklärt.


Nachdem Sie nun die grundlegende Forschungsidee und Zielsetzung der beiden Experimente kennengelernt haben, befassen wir uns im nächsten Schritt vertiefend mit Experiment 1. Ziel ist es, den genauen Aufbau, sowie das konkrete Verhalten der Teilnehmer:innen besser zu verstehen.

  1. Lesen Sie sich den folgenden Text zum Aufbau des ersten Experiments durch und beantworten Sie anschließend Fragen dazu:

Cost transparency refers to the disclosure of the costs to produce a good or provide a service. Although cost transparency is a strategy traditionally employed in the context of supplier-firm relationships, wherein the two-way sharing of cost information between parties facilitates collaboration on cost reduction measures, we investigate its effects within the context of consumer-firm relationships. Information on the costs associated with providing goods and services is rarely shared with consumers, but we provide evidence of when and why voluntarily doing so can increase consumers’ purchase interest. Specifically, building on the psychology of disclosure and trust, we posit that cost transparency, insofar as it represents an act of intimate disclosure, fosters trust. In turn, we propose that this heightened trust increases consumers’ willingness to purchase from the transparent firm. In the sections that follow, we discuss our central predictions and highlight alternative accounts. Then, we present experiments, conducted in the lab and in the field, that document the main effects of cost transparency, its underlying psychological drivers, and conditions that moderate its effects.

This first experiment explores how cost transparency influences consumer preferences in an online shopping context. The study was designed as a between-subjects randomized experiment using an incentive-compatible setup, meaning participants made real choices with the possibility of receiving a tangible reward. A total of 509 U.S.-based participants were recruited through Amazon Mechanical Turk (MTurk). Each participant was randomly assigned to one of two experimental conditions:

Participants were instructed to view both product pages and then asked which company they would prefer to receive a $50 gift card from. Their response served as the main behavioral outcome, representing a choice between the transparent vs. non-transparent retailer. To ensure accurate interpretation of the presented information, a comprehension check followed the main choice question. Participants were also asked for demographic information such as age, gender, income, and education, to allow for potential control variables in later analysis.


Beantworten Sie nun folgende Fragen:

  1. Wie viele Personen nahmen final an dem Experiment teil?
  2. Worin bestand der Unterschied zwischen der Transparenzbedingung und der Kontrollbedingung?
  3. Welche Anreizstruktur wurde verwendet, um die Entscheidung der Teilnehmenden realistisch zu gestalten?
  4. Wie unterschieden sich die beiden gezeigten Onlinehändler im Experiment?
  5. Warum wurde im Anschluss an die Entscheidungsfrage ein Verständnischeck durchgeführt?
  6. In der Beschreibung des Experiments wird von “between-subjects randomized experiment using an incentive-compatible setup” gesprochen. Was versteht man hierunter im Detail?

Hinweis: Für die Beantwortung der letzten Frage können Sie diesen Artikel (Seite 1-5) als Grundlage verwenden.


  1. Wie viele Personen nahmen final an dem Experiment teil?
    An dem Experiment nahmen 509 Personen teil.

  2. Worin bestand der Unterschied zwischen der Transparenzbedingung und der Kontrollbedingung?
    In der Transparenzbedingung sahen die Teilnehmenden eine Produktseite mit einer Kostenzusammenstellung, also Materialkosten usw. In der Kontrollbedingung wurde dieselbe Produktseite ohne jegliche Kostentransparenz gezeigt.

  3. Welche Anreizstruktur wurde verwendet, um die Entscheidung der Teilnehmenden realistisch zu gestalten?
    Es wurde ein „incentive-compatible setup“ verwendet, also wurde die Kaufentscheidung mit einer echten Belohnung verknüpft. Die Teilnehmenden wählten zwischen zwei $50-Gutscheinen (Everlane oder J. Crew), wodurch man deren realen Präferenzen sehen konnte.

  4. Wie unterschieden sich die beiden gezeigten Onlinehändler im Experiment?
    Everlane: Wurde entweder mit oder ohne Kostentransparenz gezeigt (je nach Versuchsbedingung).
    J. Crew: Wurde immer ohne Kostentransparenz gezeigt.
    Damit war Everlane der variable Faktor, J. Crew war also die konstante Vergleichsmarke ohne Transparenz.

  5. Warum wurde im Anschluss an die Entscheidungsfrage ein Verständnischeck durchgeführt?
    Um sicherzustellen, dass die Teilnehmenden die Informationen korrekt wahrgenommen und verstanden haben und ihre Entscheidung nicht auf Missverständnissen beruhte.

  6. In der Beschreibung des Experiments wird von “between-subjects randomized experiment using an incentive-compatible setup” gesprochen. Was versteht man hierunter im Detail?

    “between-subjects”:
    Jeder Teilnehmer sah nur eine Bedingung (entweder mit oder ohne Kostentransparenz). Die Gruppen wurden nicht innerhalb der gleichen Personen verglichen, sondern zwischen unterschiedlichen Personen.

    “randomized”:
    Die Auswahl der Testpersonen war zufällig, um systematische Verzerrungen zu vermeiden (z. B. durch Alter, Geschlecht, Einkommen).

    “incentive-compatible setup”:
    Die Entscheidung der Teilnehmenden hatte reale Konsequenzen, denn sie konnten tatsächlich einen Gutschein gewinnen. Dies erhöht die Qualität der Entscheidungen, da sich Personen realistischer verhalten, wenn ein echter Anreiz besteht.

Fazit:
Laut dem verlinkten Artikel fördern incentive-kompatible Designs ein Verhalten, das den wahren Präferenzen entspricht, da sich rational handelnde Teilnehmende bemühen, ihren eigenen Nutzen/Profit zu maximieren, genauso wie es im echten Leben auch ist.


Daten

Datenimport und -aufbereitung

Die Daten, die Sie für die nachfolgenden Analysen verwenden, wurden zu Replikationszwecken von den Autoren der Studie zur Verfügung gestellt und können hier heruntergeladen werden:

Bhavya Mohan, Ryan W. Buell, Leslie K. John (2020) Lifting the Veil: The Benefits of Cost Transparency. Marketing Science 39(6):1105-1121. mksc.2019.1200.sm1.pdf

Wir haben die Daten für Sie heruntergeladen und im Unterordner mit dem Namen Daten bereitgestellt. Für ihre Analyse werden die Dateien Experiment1.csv und Experiment2.csv genutzt. Für die Zusatzaufgabe ist die Datei Experiment3.csv relevant.


  1. Lesen Sie den Datensatz Experiment1.csv aus dem Unterordner Daten in R ein. Nennen Sie den Datensatz in R daten_exp1.

Im Datensatz sind unterschiedliche Variablen enthalten. Weiterhin haben wir Ihnen ein Readme mit den Beschreibungen zu den Variablen bereitgestellt. Nutzen Sie dieses und den Text aus Aufgabe 2, um die Variablen zu beschreiben.


Der Datensatz enthält verschiedene Variablen, die sich auf ein Experiment zu Konsumentscheidungen beziehen.

Die Variable treatment kennzeichnet die experimentelle Bedingung, wobei der Wert 1 angibt, dass den Teilnehmenden eine Kostentransparenz präsentiert wurde, während 0 für die Kontrollgruppe steht, die keine solche Information erhielt.

Die Variable everlane beschreibt die Wahl einer Geschenkkarte: Ein Wert von 1 bedeutet, dass sich die Person für Everlane entschieden hat, während 0 eine Wahl von J. Crew kennzeichnet.

Mit der Variable passed wird festgehalten, ob der oder die Teilnehmende den Verständnistest bestanden hat (1) oder nicht (0). Die Angabe email_provided zeigt an, ob eine E-Mail-Adresse hinterlassen wurde (1 = ja, 0 = nein).

Das Geschlecht der Befragten ist durch die Variable female erfasst: Ein Wert von 1 steht für weiblich, 0 für männlich. Das Alter der Personen ist in der Variable age dokumentiert und liegt als numerische Angabe vor.

Die Bildung wird durch educ erfasst, wobei 1 für ein niedriges Bildungsniveau steht und 5 für ein postgraduales Bildungsniveau (z.B. Master oder höher). Schließlich enthält die Variable income die Einkommenskategorie: 1 steht für kein Einkommen, während 12 bedeutet, dass keine Angabe gemacht wurde oder die Person ihr Einkommen nicht weiß.


Deskriptive Analyse

Sie sollten sich im ersten Schritt einen Überblick über ihre Daten verschaffen.

  1. Auf Basis des Datensatzes daten_exp1 aus Aufgabe 3 erstellen Sie eine deskriptive Tabelle mit der Anzahl an Beobachtungen, den Mittelwerten, der Standardabweichungen, dem Median, sowie den Minima und Maxima für alle in daten_exp1 enthaltenen Variablen.

Beschreiben und interpretieren Sie ihre Tabelle. Gehen Sie insbesondere auf die Verteilungen der einzelnen Variablen ein. Was fällt hier besonders auf.


Deskriptive Statistik
Variable Anzahl Ausprägungen Fehlende Werte (%) Mittelwert Standardabweichung Minimum Median Maximum
treatment 2 0 0.5 0.5 0.0 0.0 1.0
everlane 2 0 0.6 0.5 0.0 1.0 1.0
passed 2 0 0.8 0.4 0.0 1.0 1.0
email_provided 2 0 0.6 0.5 0.0 1.0 1.0
female 2 0 0.5 0.5 0.0 0.0 1.0
age 58 1 37.6 11.7 18.0 35.0 81.0
educ 6 1 3.8 0.8 1.0 4.0 5.0
income 13 1 7.6 2.4 1.0 8.0 12.0

Im Datensatz liegen überwiegend numerische Variablen vor, darunter sowohl binäre Indikatoren (z.B. Gruppenzugehörigkeit, Geschlecht, Entscheidung) als auch metrisch oder ordinal skalierte Angaben wie Alter, Bildungsniveau und Einkommen. In der folgenden Beschreibung werden typische Lage- und Streuungsmaße wie Mittelwert, Median, Minimum, Maximum sowie Standardabweichung betrachtet. Ziel ist es, ein erstes Bild der Verteilungen zu gewinnen und Auffälligkeiten zu benennen, die für die spätere Analyse von Bedeutung sein könnten.

  • treatment: Zugehörigkeit zur Experimentalbedingung
    Diese binäre Variable zeigt an, ob die jeweilige Person zur Treatment-Gruppe (1) oder zur Kontrollgruppe (0) gehört. Der Mittelwert liegt bei 0.5 – ein klarer Hinweis auf eine gleichmäßige Verteilung. Die Standardabweichung liegt bei 0.5, was bei einer 50/50-Verteilung zu erwarten ist.

  • everlane: Wahl der Geschenkkarte Hier wurde codiert, ob die Geschenkkarte von Everlane (1) oder J.Crew (0) gewählt wurde. Der Mittelwert beträgt 0.63, was bedeutet, dass etwa 63% Everlane gewählt haben. Die Verteilung ist also leicht in Richtung Everlane verschoben.

  • passed: Verständnistest bestanden
    Etwa 80% der Teilnehmenden haben den Verständnistest bestanden (Mittelwert = 0.8). Die Verteilung ist deutlich in Richtung „bestanden“ verschoben, die Standardabweichung liegt entsprechend bei 0.4.

  • email_provided: E-Mail-Adresse angegeben
    Hier wurde erfasst, ob eine E-Mail-Adresse angegeben wurde (1) oder nicht (0). Mit einem Mittelwert von 0.56 ist die Verteilung relativ ausgewogen, mit leichter Tendenz zur Angabe einer Adresse.

  • female: Geschlecht
    Mit einem Mittelwert von 0.49 ist das Verhältnis zwischen weiblich (1) und männlich (0) nahezu ausgeglichen. Die Variable ist korrekt binär kodiert.

  • age: Alter
    Das Alter liegt zwischen 18 und 81 Jahren. Der Mittelwert beträgt rund 37.6 Jahre, der Median liegt bei 35. Die Verteilung ist leicht rechtsschief, da der Mittelwert über dem Median liegt. Die Standardabweichung von 11.7 Jahren zeigt eine breite Streuung.

  • educ: Bildungsniveau
    Das Bildungsniveau ist auf einer Skala von 1 bis 5 erfasst. Der Mittelwert liegt bei 3.8, der Median bei 4. Die Mehrheit scheint also ein eher hohes Bildungsniveau zu haben. Die Skala wird mit Min = 1 und Max = 5 vollständig genutzt.

  • income: Einkommenskategorie
    Die Einkommensvariable reicht von 1 bis 12, wobei laut Dokumentation die Kategorie 12 für „keine Angabe / weiß nicht“ steht. Der Mittelwert liegt bei 7.6, der Median bei 8. Das deutet auf mittlere bis höhere Einkommensgruppen hin. Der Maximalwert 12 sollte ggf. bei weiterführenden Analysen als fehlender Wert behandelt werden.

Was fällt besonders auf?

Insgesamt zeigt die deskriptive Analyse, dass die Randomisierung erfolgreich war, da die Experimental- und Kontrollgruppen nahezu gleich groß sind. Ein Großteil der Teilnehmenden hat den Verständnistest bestanden, was auf ein gutes Verständnis der Instruktionen hinweist. Die Geschlechterverteilung ist ausgeglichen, und die Altersverteilung reicht von 18 bis 81 Jahren, mit einem Schwerpunkt im jüngeren bis mittleren Erwachsenenalter. Auch das Bildungsniveau liegt tendenziell eher im oberen Bereich. Auffällig ist, dass die Einkommensvariable einen Kategorienwert für „keine Angabe“ enthält, der für statistische Analysen gegebenenfalls als fehlend behandelt werden sollte.


  1. Im Datensatz daten_exp1 gibt es Variablen für die keine Beobachtungen vorhanden sind.
  • Gegeben ihrer Variablenbeschreibung in Aufgabe 3:
    • Macht es Sinn die Beobachtungen aus dem Datensatz zu entfernen, wenn für bestimmte Variablen keine Werte vorhanden sind?
    • Wenn ja, warum?
    • Wie viele Beobachtungen entfernen Sie dadurch aus ihrem Datensatz?

Entfernen Sie nun alle Beobachtungen (d.h. gesamte Zeilen aus dem Datensatz), bei denen für mindestens eine der erhobenen Variablen kein Wert vorliegt, da unvollständige Daten für die Analyse nicht berücksichtigt werden sollen.

Untersuchen Sie weiterhin, ob sich die Teilnehmer, die die Webseite mit der Kostentransparenz gesehen haben (Treatmentgruppe), systematisch von jenen unterscheiden, die die Kontrollversion gesehen haben. Auch wenn es sich um ein Experiment handelt, bei dem die Zuteilung zu den Gruppen zufällig erfolgt ist, sollten Sie dennoch prüfen, ob es unbeabsichtigte (systematische) Unterschiede zwischen den Gruppen gibt. Erstellen Sie hierfür eine Balancing-Tabelle, in der Sie die Mittelwerte von Alter (age), Geschlecht (female), Einkommensstufe (income) und Bildungsniveau (educ) zwischen den beiden Gruppen vergleichen, die Differenzen berechnen und mithilfe von T-Tests prüfen, ob diese Unterschiede statistisch signifikant sind.

  • Beschreiben und interpretieren Sie ihre Tabelle.
    • Was fällt Ihnen in Bezug auf die p-Werte auf?
    • Was müssten Sie bei einer weiteren Regressionsanalyse berücksichtigen?

Hinweis: Die beiden Gruppen, die Sie in der Balancing Tabelle betrachten sollen, können aus den Werten (1 und 0) der Variable treatment abgeleitet werden.


Ja, es macht durchaus Sinn, Beobachtungen zu entfernen, bei denen für mindestens eine der analyserelevanten Variablen kein Wert vorliegt.
Warum?

  • Es handelt sich um zentrale Variablen (z.B. age,female, income, educ), die später in Gruppenvergleichen oder Regressionsanalysen verwendet werden.
  • Fehlende Werte würden entweder zu Fehlern in der Berechnung führen oder das Ergebnis verzerren, wenn man sie unbehandelt lässt.
  • Durch das Entfernen dieser Fälle bleibt die Analyse auf Basis vollständiger, vergleichbarer Informationen bestehen.

Vier Beobachtungen in daten_exp1 sind nicht vollständig, d.h. sie enthalten mindestens einen fehlenden Wert (NA) in einer der Spalten.

Balancing-Tabelle: Vergleich Treatment vs. Kontrolle
Variable Mittelwert Kontrolle Mittelwert Treatment p-Wert
age 37.913 37.273 0.541
female 0.488 0.490 0.964
educ 3.734 3.794 0.418
income 7.405 7.763 0.098

Beschreibung

Die Tabelle zeigt den Vergleich der Mittelwerte zentraler soziodemographischer Merkmale zwischen der Treatmentgruppe (die die transparente Webseite gesehen hat) und der Kontrollgruppe. Untersucht werden die Merkmale Alter, Geschlecht, Bildungsniveau und Einkommen. Für jede Variable ist der Mittelwert in beiden Gruppen angegeben, ergänzt durch den p-Wert eines T-Tests, der anzeigt, ob sich die Gruppen signifikant unterscheiden.

Interpretaion

Beispielsweise beträgt das durchschnittliche Alter in der Kontrollgruppe 38 Jahre und in der Treatmentgruppe 37 Jahre. Der p-Wert von 0,541 zeigt, dass dieser Unterschied statistisch nicht signifikant ist.
Ähnlich verhält es sich bei den anderen Merkmalen: Für Geschlecht liegt der p-Wert bei 0,964, für Bildungsniveau bei 0,418 und für Einkommen bei 0,098. Keiner dieser Werte unterschreitet das gängige Signifikanzniveau von 0,05. Das bedeutet, dass sich die beiden Gruppen in diesen Merkmalen nicht systematisch unterscheiden.

Was fällt in Bezug auf die p-Werte auf?

Alle p-Werte liegen über 0,05 – teils deutlich (z. B. bei female), teils knapp (z. B. bei income mit 0,098). Das deutet darauf hin, dass die Gruppen sich nicht signifikant unterscheiden, also im Sinne der Randomisierung ausreichend vergleichbar sind. Der leicht erhöhte p-Wert bei Einkommen (0,098) könnte bei strenger Interpretation auf einen potenziell kleinen Unterschied hindeuten, ist aber nicht signifikant.

Was ist bei einer Regressionsanalyse zu berücksichtigen?

Trotz fehlender signifikanter Unterschiede ist es gute Praxis, relevante soziodemographische Merkmale wie Alter, Geschlecht, Einkommen und Bildungsniveau in die Regressionsanalyse als Kontrollvariablen aufzunehmen. Das erhöht die Präzision der Schätzung des Behandlungseffekts und kontrolliert für mögliche zufällige Unterschiede, die bei kleinen Stichproben auftreten können.

Insbesondere bei dem leicht auffälligen Einkommen sollte in der Regression geprüft werden, ob dieser Faktor mit dem Ergebnis zusammenhängt. Auch ohne signifikante Unterschiede stärkt die Kontrolle solcher Kovariaten die Aussagekraft und Robustheit der Ergebnisse.


Nachdem Sie sich in den vorangegangenen Aufgaben bereits mit der Verteilung der Daten und den Unterschieden zwischen den einzelnen Gruppen auseinandergesetzt haben, geht es nun um eine explorative Betrachtung von Zusammenhängen zwischen den zentralen Variablen im Datensatz.

  1. In dieser Aufgabe führen Sie eine Korrelationsanalyse durch, um herauszufinden, ob und wie stark einzelne Merkmale - wie Alter, Bildung, Einkommen oder Geschlecht - mit der Treatment-Zugehörigkeit sowie der Entscheidung für die Everlane-Gutscheinkarte zusammenhängen.

Wählen Sie die folgenden Variablen aus dem Datensatz daten_exp1 aus:

  • treatment
  • everlane
  • age
  • income
  • educ
  • female

Berechnen Sie die Korrelationsmatrix dieser Variablen. Visualisieren Sie die Matrix (als Tabelle oder Grafik), in der die Korrelationskoeffizienten und deren Stärke farblich dargestellt sind.

Beschreiben und interpretieren Sie ihre Tabelle/Grafik. Gehen Sie hierbei auch auf folgende Fragen ein:

  • Was bedeutet ein positiver Zusammenhang (Korrelation) zwischen treatment und everlane im Kontext der Hypothese, dass Kostentransparenz die Entscheidung für Everlane beeinflusst?
  • Warum kann eine Korrelation auf einen Zusammenhang hinweisen, aber nicht ausreichen, um einen kausalen Effekt nachzuweisen - selbst wenn wir wissen, dass treatment im Experiment zufällig zugewiesen wurde?
  • Was nützt ihnen eine Korrelationsmatrix im Vergleich zu einem einfachen Mittelwertvergleich zwischen den Gruppen?

Hinweis: Für die Darstellung der Korrelationsmatrix können Sie z.B. das Paket corrplot verwenden.


Beschreibung

Die dargestellte Korrelationsmatrix zeigt die paarweisen linearen Zusammenhänge zwischen sechs zentralen Variablen des Datensatzes: treatment, everlane, age, income, educ und female. Die Korrelationen reichen von -1 (perfekter negativer Zusammenhang) über 0 (kein Zusammenhang) bis +1 (perfekter positiver Zusammenhang).

Interpretation

Auffällig ist, dass nahezu alle Korrelationen sehr schwach sind. Der höchste beobachtete Zusammenhang besteht zwischen treatment und everlane mit einem Korrelationskoeffizienten von +0.16. Dies ist zwar ein positiver Zusammenhang, aber inhaltlich eher schwach und nicht signifikant. Es bedeutet: Personen, die der Treatmentgruppe zugeordnet wurden, haben etwas häufiger auch die Everlane-Geschenkkarte ausgewählt – allerdings ist diese Verbindung statistisch nur minimal ausgeprägt.

Alle anderen Korrelationen liegen in einem Bereich zwischen -0.05 und +0.19, was auf keine substantiellen linearen Zusammenhänge zwischen den untersuchten Merkmalen hinweist. Beispielsweise ist der Zusammenhang zwischen Alter und Einkommen mit -0.02 praktisch nicht vorhanden, ebenso wenig wie der zwischen Bildung und Treatment (0.04) oder Geschlecht (female) und Everlane (0.09).

Was bedeutet ein positiver Zusammenhang zwischen treatment und everlane im Kontext der Hypothese?

Ein positiver Zusammenhang von 0.16 bedeutet, dass Teilnehmer:innen der Treatmentgruppe etwas häufiger die Everlane-Geschenkkarte gewählt haben. Im Kontext der Hypothese, dass Kostentransparenz die Entscheidung beeinflusst, könnte dies ein erster explorativer Hinweis sein, dass Transparenz tatsächlich einen gewissen Einfluss auf die Entscheidung hatte. Dennoch ist dieser Zusammenhang sehr schwach, sodass er keine ausreichende Evidenz für einen Effekt liefert.

Warum kann eine Korrelation auf einen Zusammenhang hinweisen, aber nicht ausreichen, um einen kausalen Effekt nachzuweisen – selbst wenn treatment zufällig zugewiesen wurde?

Eine Korrelation beschreibt lediglich statistische Kovariation, sagt aber nichts über Ursache und Wirkung. Selbst wenn treatment zufällig zugewiesen wurde, könnte der beobachtete Zusammenhang auf Zufall oder konfundierende Faktoren zurückgehen. Außerdem misst die Korrelation nur lineare Zusammenhänge und kann nicht kontrollieren, ob andere Variablen (z.B. Einkommen oder Alter) Einfluss auf die Entscheidung genommen haben. Für einen kausalen Nachweis ist eine multivariate Regressionsanalyse mit Kontrollvariablen erforderlich.

Was nützt eine Korrelationsmatrix im Vergleich zu einem einfachen Mittelwertvergleich zwischen Gruppen?

Eine Korrelationsmatrix bietet eine kompakte Übersicht über lineare Zusammenhänge zwischen mehreren Variablen gleichzeitig – unabhängig von Gruppenzugehörigkeiten. Während der Mittelwertvergleich zwei Gruppen anhand einer Zielvariable vergleicht, zeigt die Korrelationsanalyse wechselseitige Beziehungen zwischen allen Variablen im Datensatz. Dadurch lassen sich erste Hypothesen generieren, Zusammenhänge erkennen und relevante Einflussgrößen für weitere statistische Modellierungen identifizieren.


  1. In Aufgabe 1 und 2 haben Sie gelesen, dass den Teilnehmern ein Angebot gemacht wurde, eine Everlane-Gutscheinkarte anzunehmen. Erzeugen Sie eine geeignete Grafik, die den durchschnittlichen Anteil der angenommenen Angebote (d.h. den Anteil, in dem die Everlane-Karte gewählt wurde) getrennt für die Treatment- und die Kontrollgruppe darstellt. Fügen Sie in der Grafik zusätzlich den Standardfehler der Mittelwerte ein. Führen Sie einen T-Test durch, um zu prüfen, ob der Unterschied im Mittelwert zwischen der Treatment- und Kontrollgruppe statistisch signifikant ist, und geben Sie das Testergebnis (den p-Wert) deutlich sichtbar in der Grafik an. Achten Sie dabei auf eine verständliche Beschriftung Ihrer Grafik sowie auf einen aussagekräftigen Titel.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf folgende Fragen ein:

  • Welche Aussage lässt sich auf Basis des durchgeführten T-Tests treffen?
  • Welche der in den vorherigen Aufgaben (vgl. Aufgabe 4 und 5) analysierten Faktoren könnten dazu beigetragen haben, dass ein signifikanter Unterschied im Anteil angenommener Everlane-Angebote zwischen Treatment- und Kontrollgruppe beobachtet wird?

Beschreibung:

Die Grafik zeigt den durchschnittlichen Anteil der angenommenen Everlane-Angebote, getrennt nach Treatment- und Kontrollgruppe. Die Fehlerbalken stellen den Standardfehler dar. Ein T-Test wurde durchgeführt, um zu prüfen, ob der beobachtete Unterschied signifikant ist. Der berechnete p-Wert ist < 0.05, was auf einen signifikanten Unterschied hindeutet.

Interpretation:

Der signifikante Unterschied deutet darauf hin, dass das Treatment einen kausalen Effekt auf die Annahmewahrscheinlichkeit hatte.

Mögliche Gründe dafür sind (vgl. Aufgabe 4 & 5):

  • Veränderte Markenwahrnehmung durch das Treatment.
  • Motivationale Effekte, z. B. durch mehr wahrgenommene Fairness oder Identifikation.
  • Unterschiedliche Reaktionen auf Anreize oder soziale Normen, die im Treatment angesprochen wurden.

In den vorherigen Aufgaben des Projekts haben Sie sich bereits intensiv mit dem Experiment 1 auseinandergesetzt, in dem untersucht wurde, ob und wie die Offenlegung von Produktionskosten - also Kostentransparenz - das Konsumverhalten beeinflusst. Es wurde gezeigt: Wenn Konsument:innen transparent mitgeteilt wird, wie sich die Kosten eines Produkts zusammensetzen, steigt ihre Bereitschaft, bei dem entsprechend transparenten Unternehmen einzukaufen.

Diese Ergebnisse legen nahe, dass die Offenlegung sensibler Unternehmensinformationen (wie Produktionskosten) das Vertrauen der Konsument:innen in das Unternehmen stärkt und sie somit eher zu einem Kauf motiviert.

Doch was genau ist der psychologische Mechanismus hinter dieser Wirkung? Ist es tatsächlich das Vertrauen in das Unternehmen, das durch die Offenlegung sensibler Informationen gestärkt wird - und in der Folge die Kaufbereitschaft erhöht?

Um genau diese Frage zu beantworten, führen die Autoren ein weiteres Experiment durch, das den vermuteten psychologischen Vermittlungsmechanismus des Vertrauens genauer untersucht. Dabei wurde geprüft, ob Vertrauen tatsächlich als Mediator zwischen Kostentransparenz und Kaufinteresse wirkt. Hierzu wurde ein kontrolliertes Online-Experiment mit über 600 Teilnehmer:innen durchgeführt. Die Teilnehmenden wurden zufällig einer von zwei Bedingungen zugewiesen:

  • In der Kostentransparenz-Gruppe (Treatment) wurde zusätzlich eine detaillierte Aufschlüsselung der Produktionskosten angegeben. Diese beinhaltete die einzelnen Kostenkomponenten (z.B. Kakaobutter, Verpackung, Arbeitskosten) sowie die Gesamtkosten der Schokoladentafel (vgl. Abbildung 2 im Anhang).

  • In der Kontrollgruppe sahen die Teilnehmer die Verpackung einer fiktiven Schokoladenmarke namens „Cocoa Passion“. Diese enthielt nur die üblichen Informationen wie Zutaten, Nährwerte und eine Produktbeschreibung.

Ziel war es, zu untersuchen, ob die Offenlegung dieser sensiblen Informationen das Vertrauen der Konsument:innen in die Marke stärkt - und ob dieses Vertrauen wiederum die Kaufbereitschaft beeinflusst. In den nächsten Aufgaben werden Sie diese Studie genauer beleuchten, analysieren und evaluieren, ob sich die Hypothese empirisch bestätigen lässt.

  1. Lesen Sie die Daten des zweiten Experiments (Experiment2.csv) in R ein. Nennen Sie den Datensatz daten_exp2. Benennen Sie die Variable cost in treatment um.

Untersuchen Sie, ob sich die Teilnehmer, die die Verpackung mit transparenter Kosteninformation gesehen haben, systematisch von jenen unterscheiden, die nur die Kontrollversion gesehen haben.

Erstellen Sie hierfür eine Balancing-Tabelle, in der Sie die Mittelwerte von Alter (age), Geschlecht (female), Einkommensstufe (income), Bildungsniveau (educ), Vertrauen (trust) und Kaufbereitschaft (wtb) zwischen den beiden Gruppen vergleichen, die Differenzen berechnen und mithilfe von T-Tests prüfen, ob diese Unterschiede statistisch signifikant sind. Nehmen Sie weiterhin die Anzahl an Beobachtungen in der Treatment- und in der Kontrollgruppe in ihre Tabelle mit auf.

Beschreiben und interpretieren Sie ihre Tabelle. Gehen Sie dabei insbesondere auf folgende Fragen ein:

  • Was versteht man unter der Variable wtb?
  • Was lässt sich aus der Größen der Stichprobe ableiten?
  • Wo könnte es bei einer Regression (oder einem sonstigen Vergleich der Gruppen) zu Problemen kommen und was wären mögliche Auswirkungen?

Hinweis: Für die Beschreibung der wtb können Sie das bereitgestellte Readme nutzen.


Balancing-Tabelle: Vergleich Treatment vs. Kontrolle
Variable Mittelwert Treatment Mittelwert Kontrolle Differenz p-Wert
Anzahl N NA NA NA NA
age 34.063 36.272 -2.208 0.016
female 0.475 0.424 0.051 0.207
income 6.791 6.960 -0.169 0.372
educ 3.568 3.515 0.053 0.443
trust 5.273 4.825 0.448 0.000
wtb 4.273 3.740 0.533 0.001

Beschreibung

Die Balancing-Tabelle zeigt einen Vergleich zentraler Merkmale zwischen der Treatmentgruppe (Teilnehmende, die die transparente Kosteninformation gesehen haben) und der Kontrollgruppe (Teilnehmende ohne diese Information). Für jede Variable – darunter Alter, Geschlecht, Einkommen, Bildung, Vertrauen (trust) und Kaufbereitschaft (wtb) – werden die durchschnittlichen Werte in beiden Gruppen sowie die Differenz und der p-Wert aus einem T-Test angegeben. Zusätzlich enthält die Tabelle auch die Gesamtanzahl an Beobachtungen pro Gruppe. Ziel der Tabelle ist es, festzustellen, ob die Gruppen hinsichtlich relevanter Ausgangsvariablen systematisch voneinander abweichen.

Interpretation

Die Analyse zeigt, dass die Gruppen in den meisten Merkmalen gut balanciert sind: Für Geschlecht, Einkommen und Bildung bestehen keine signifikanten Unterschiede. Auffällig ist jedoch die Altersdifferenz, die statistisch signifikant ist und daher als möglicher Confounder berücksichtigt werden sollte. Besonders deutlich ist der Unterschied bei Vertrauen und Kaufbereitschaft: Beide Werte liegen in der Treatmentgruppe signifikant höher, was darauf hinweist, dass die transparente Darstellung der Kosteninformationen das Vertrauen in das Produkt stärkt und die Kaufabsicht erhöht. Diese Unterschiede sind zentral für die Wirkung des Treatments im Experiment.

Was ist wtb?

Die Variable wtb steht für “willingness to buy”, also die Kaufbereitschaft der Befragten. Sie misst, in welchem Maß die Teilnehmenden bereit sind, das präsentierte Produkt zu kaufen. Diese Skala ist zentral, da sie das eigentliche Konsumentenverhalten im Experiment widerspiegelt. In Kombination mit der Variable trust erlaubt sie Aussagen darüber, ob die Verpackung mit Kosteninformation das Vertrauen und letztlich die Kaufbereitschaft erhöht.

Was lässt sich aus der Größen der Stichprobe ableiten?

Mit über 600 Beobachtungen ist die Stichprobe statistisch robust. Das bedeutet, selbst kleine Unterschiede können signifikant werden, wenn sie systematisch auftreten. Eine ausreichend große Stichprobe erhöht zudem die Repräsentativität und ermöglicht den Einsatz parametrischer Tests wie dem T-Test, der gewisse Verteilungsannahmen voraussetzt.

Wo könnte es bei einer Regression (oder einem sonstigen Vergleich der Gruppen) zu Problemen kommen und was wären mögliche Auswirkungen?

Ein möglicher Konfundierungsfaktor ist das Alter – es unterscheidet sich signifikant zwischen den Gruppen und könnte auch die Variablen trust und wtb beeinflussen. In einer Regressionsanalyse sollte Alter daher als Kontrollvariable berücksichtigt werden.

Zudem besteht zwischentrust und wtb vermutlich eine hohe Korrelation, was zu Multikollinearität führen kann. Dies kann die Interpretation der Regressionskoeffizienten erschweren, da sich die beiden Effekte gegenseitig überlappen. Die Lösung besteht darin, Variablen ggf. getrennt zu modellieren oder VIF-Werte (Variance Inflation Factors) zur Diagnostik zu nutzen.


  1. In ihrem Datensatz gibt es einige Beobachtungen ohne vorhandene Werte. Behalten Sie nur die Beobachtungen bei denen vollständige Werte vorliegen. Erzeugen Sie eine geeignete Grafik, welche den durchschnittlichen Anteil der ‘Kaufbereitschaft’ im zweiten Experiment für die Treatment- und Kontrollgruppe darstellt.

Die Grafik soll:

  • die Mittelwerte der Kaufbereitschaft für beide Gruppen zeigen,
  • die zugehörigen Standardfehler als Fehlerbalken visualisieren und
  • das Ergebnis des T-Tests, der die Mittelwertdifferenz prüft, direkt in die Grafik integrieren.

Beschreiben und interpretieren Sie ihre Grafik.


Beschreibung und Interpretation

Die Grafik zeigt die durchschnittliche Kaufbereitschaft der Teilnehmer:innen im zweiten Experiment, getrennt nach Kontroll- und Treatmentgruppe. Auf der x-Achse sind die beiden Gruppen dargestellt: links die Kontrollgruppe, deren Teilnehmer:innen keine Informationen zu den Produktionskosten der Schokolade erhielten, und rechts die Treatmentgruppe, deren Teilnehmer:innen eine detaillierte Kostenaufstellung auf der Verpackung sahen. Die y-Achse gibt den mittleren Wert der Kaufbereitschaft an.

Die Höhe der beiden Balken entspricht dem jeweiligen Mittelwert in der Gruppe. Der Balken für die Treatmentgruppe ist sichtbar höher als der der Kontrollgruppe. Daraus lässt sich ablesen, dass die Kaufbereitschaft in der Treatmentgruppe im Durchschnitt höher war. Die schwarzen Fehlerbalken über den Säulen zeigen den Standardfehler des Mittelwerts, also die statistische Unsicherheit. Beide Gruppen weisen relativ kleine Standardfehler auf, was auf eine stabile Verteilung der Werte innerhalb der Gruppen hindeutet.

Im Titel der Grafik ist der p-Wert des durchgeführten T-Tests angegeben. Mit einem p-Wert von 0.0012 ist der Unterschied zwischen den beiden Gruppen statistisch signifikant auf dem üblichen 5%-Niveau. Das bedeutet, dass die Wahrscheinlichkeit, diesen Unterschied zufällig zu beobachten, sehr gering ist. Man kann also mit hoher Sicherheit davon ausgehen, dass die höhere Kaufbereitschaft in der Treatmentgruppe auf die gezeigte Kostentransparenz zurückzuführen ist und nicht auf Zufall.

Insgesamt legt die Grafik nahe, dass die Offenlegung von Produktionskosten das Vertrauen der Konsument:innen stärkt und zu einer signifikant höheren Kaufbereitschaft führt. Damit liefert sie einen starken empirischen Hinweis auf den positiven Effekt von Kostentransparenz im Kontext unternehmerischer Kommunikation.


Nachdem Sie nun die Differenzen in der Kaufabsicht zwischen der Treatment- und der Kontrollgruppe im zweiten Experiment überprüft und getestet haben, geht es im nächsten Schritt darum, den möglichen Mediator Vertrauen genauer zu untersuchen. Hierfür sollen Sie sich in einem ersten Schritt das Vertrauen der Personen allgemein anschauen, um einen Eindruck zu dieser wichtigen Variable zu bekommen. Dafür werden Personen anhand hohem und niedrigem Vertrauen und deren Kaufbereitschaft für das Produkt unterteilt.

  1. Erstellen Sie eine oder mehrere geeignete Grafik(en), die den Zusammenhang zwischen Vertrauen (Trust) und der Kaufabsicht (WTB) unabhängig der beiden Treatment- und Kontrollgruppen darstellen. Achten Sie auf eine passende Darstellung der Informationen.

Die Grafik(en) sollen folgende Informationen enthalten:

  • Unterteilen Sie ihre Daten in Personen mit hohem und niedrigem Vertrauen. Nutzen Sie für die Unterteilung den Median des Vertrauens in ihren Daten als Schwellenwert.
  • Abhängig der Einstufungen in hohes und niedriges Vertrauen soll nun die durchschnittliche Kaufbereitschaft dargestellt werden. Hier soll die Grafik so dargestellt werden, dass auf der x-Achse das Vertrauensniveau (“hoch” und “niedrig”) und auf der y-Achse die entsprechende Kaufbereitschaft abgebildet wird.
  • Berechnen Sie weiterhin die Mittelwerte der beiden Vertrauensgruppen und visualisieren diese in geeigneter Art und Weise in ihren Grafik(en).
  • Führen Sie einen t-Test durch, um zu prüfen, ob die Mittelwertsunterschiede zwischen den beiden Vertrauensgruppen statistisch signifikant sind. Geben Sie den p-Wert in der Grafik an.

Beschreiben und interpretieren Sie ihre Grafik(en). Beantworten Sie insbesondere folgende Fragen:

  • Welche Implikationen hat ein signifikanter Unterschied für die Rolle von Vertrauen auf Kaufentscheidungen?
  • Wie stark unterscheidet sich die Kaufbereitschaft zwischen Personen mit hohem und niedrigem Vertrauen?
  • Könnte auf Basis ihrer Darstellung Vertrauen als Mediator zwischen dem Treatment und der Kaufbereitschaft fungieren?

Beschreibung und Interpretation

Die dargestellte Grafik zeigt den Zusammenhang zwischen dem Vertrauensniveau der Teilnehmenden und ihrer durchschnittlichen Kaufbereitschaft (WTB – willingness to buy) im zweiten Experiment. Die Teilnehmer:innen wurden anhand des Medians der Vertrauensvariable (trust) in zwei Gruppen unterteilt: eine Gruppe mit niedrigem Vertrauen und eine mit hohem Vertrauen. Für beide Gruppen wurde der jeweilige Mittelwert der Kaufbereitschaft berechnet und als Balkendiagramm dargestellt. Zusätzlich sind Fehlerbalken eingezeichnet, die den Standardfehler der Mittelwerte anzeigen. Im Titel der Grafik ist der p-Wert eines t-Tests aufgeführt, der die Signifikanz der Mittelwertdifferenz prüft.

Die Grafik zeigt deutlich, dass Teilnehmende mit hohem Vertrauen eine signifikant höhere Kaufbereitschaft zeigen als solche mit niedrigem Vertrauen. Der Mittelwert der Kaufbereitschaft liegt in der Hoch-Vertrauensgruppe deutlich über dem der Niedrig-Vertrauensgruppe. Die Fehlerbalken überlappen sich kaum, was bereits visuell auf einen statistisch signifikanten Unterschied hindeutet. Der T-Test bestätigt dies: Mit einem p-Wert von nahezu 0 (genauer < 0.0001) ist der Unterschied hochsignifikant.

Welche Implikationen hat ein signifikanter Unterschied für die Rolle von Vertrauen auf Kaufentscheidungen?

Ein signifikanter Unterschied in der Kaufbereitschaft zwischen Personen mit hohem und niedrigem Vertrauen legt nahe, dass Vertrauen ein zentraler psychologischer Einflussfaktor auf Konsumentscheidungen ist.
Im Kontext der Studie bedeutet das: Wenn Konsument:innen einem Unternehmen stärker vertrauen – etwa weil dieses transparent mit Informationen umgeht –, sind sie eher bereit, dessen Produkte zu kaufen. Vertrauen fungiert somit als eine Art psychologischer Hebel, der wirtschaftliches Verhalten beeinflusst. Aus Sicht der Unternehmen unterstreicht dies die strategische Bedeutung von Vertrauensaufbau, beispielsweise durch Offenlegung von Produktionskosten, Nachhaltigkeitspraktiken oder ethischer Kommunikation.

Welche Implikationen hat ein signifikanter Unterschied für die Rolle von Vertrauen auf Kaufentscheidungen?

Ein signifikanter Unterschied in der Kaufbereitschaft zwischen Personen mit hohem und niedrigem Vertrauen legt nahe, dass Vertrauen ein zentraler psychologischer Einflussfaktor auf Konsumentscheidungen ist. Im Kontext der Studie bedeutet das: Wenn Konsument:innen einem Unternehmen stärker vertrauen – etwa weil dieses transparent mit Informationen umgeht –, sind sie eher bereit, dessen Produkte zu kaufen. Vertrauen fungiert somit als eine Art psychologischer Hebel, der wirtschaftliches Verhalten beeinflusst. Aus Sicht der Unternehmen unterstreicht dies die strategische Bedeutung von Vertrauensaufbau, beispielsweise durch Offenlegung von Produktionskosten, Nachhaltigkeitspraktiken oder ethischer Kommunikation.

Könnte auf Basis Ihrer Darstellung Vertrauen als Mediator zwischen dem Treatment und der Kaufbereitschaft fungieren?

Die Ergebnisse dieser Visualisierung unterstützen die Annahme, dass Vertrauen ein plausibler Mediator im kausalen Zusammenhang zwischen Kostentransparenz (Treatment) und Kaufbereitschaft (WTB) sein könnte. Bereits in Aufgabe 7 wurde gezeigt, dass die Treatmentgruppe eine signifikant höhere Kaufbereitschaft hatte. In der aktuellen Analyse sehen wir, dass Vertrauen stark mit Kaufbereitschaft zusammenhängt. Daraus ergibt sich die Hypothese, dass Kostentransparenz über das Vertrauen wirkt – also: Transparenz → mehr Vertrauen → höhere Kaufbereitschaft. Um dies endgültig zu bestätigen, müsste man in einer nächsten Aufgabe eine formale Mediationsanalyse durchführen, bei der geprüft wird, ob der Effekt des Treatments auf WTB ganz oder teilweise über das Vertrauen vermittelt wird.


Regressionsanalyse

Sie haben nun ihren Datensatz kennengelernt und es scheint so, als ob insbesondere Personen, welche transparente Kosten sehen, dazu neigen, das Produkt zu kaufen. Doch um ihre deskriptiven Analysen zu erhärten, wollen Sie im folgenden eine Analyse mittels Regressionen durchführen.

  1. Betrachten Sie hier noch einmal das erste Experiment (daten_exp1). Führen Sie eine Regression durch, bei der Ihnen everlane als abhängige Variable dient. Als erklärende Variable nutzen Sie das treatment. Erstellen sie eine weitere Regression, die zusätzlich noch für die folgenden Variablen kontrolliert:

Stellen Sie die Regressionsergebnisse in einer Tabelle mit stargazer oder modelsummary dar!

Beschreiben und interpretieren Sie ihre Ergebnisse. Gehen Sie insbesondere auf folgende Fragen ein:


Regressionsergebnisse:
Einfluss von Treatment auf Wahl von Everlane
Nur Treatment Mit Kontrolle
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
treatment 0.152*** 0.155***
(0.042) (0.042)
age -0.002
(0.002)
educ -0.001
(0.026)
income -0.012
(0.009)
female 0.091*
(0.042)
Num.Obs. 505 505
R2 0.025 0.039
R2 Adj. 0.023 0.030
AIC 688.1 688.6
BIC 696.5 713.9
RMSE 0.48 0.47
Std.Errors IID IID

Beschreibung und Interpretation

In beiden Modellen ist die abhängige Variable everlane, also ob sich eine Person für die Geschenkkarte von Everlane entschieden hat (1 = Ja, 0 = Nein). Das Ziel ist es, zu untersuchen, ob die Zugehörigkeit zur Treatmentgruppe – also die Sichtbarkeit der Kostentransparenz – diese Entscheidung beeinflusst.

Modell 1: Nur Treatment

In der ersten Spalte wird lediglich das Treatment als erklärende Variable berücksichtigt. Der geschätzte Koeffizient für treatment beträgt 0.152 und ist auf dem 1%-Niveau statistisch signifikant (***). Das bedeutet: Teilnehmende in der Treatmentgruppe haben im Durchschnitt eine um etwa 15,2 Prozentpunkte höhere Wahrscheinlichkeit, sich für die Everlane-Karte zu entscheiden als Personen in der Kontrollgruppe. Diese Differenz ist statistisch signifikant und spricht für einen positiven Effekt von Kostentransparenz.

Modell 2: Mit Kontrollvariablen

Das zweite Modell ergänzt dem Treatment vier Kontrollvariablen: Alter (age), Bildungsniveau (educ), Einkommen (income) und Geschlecht (female). Auch hier bleibt der Treatment-Effekt robust und sogar leicht höher mit einem geschätzten Wert von 0.155, wiederum hochsignifikant (***). Das spricht dafür, dass der beobachtete Effekt nicht durch andere demografische Unterschiede erklärt werden kann, sondern ein eigener Einfluss des Treatments besteht.

Die übrigen Variablen sind weitgehend insignifikant – mit einer Ausnahme: female ist mit einem Koeffizienten von 0.091 auf dem 5%-Niveau signifikant (*). Das deutet darauf hin, dass Frauen eher bereit sind, die Everlane-Karte zu wählen als Männer – unabhängig vom Treatment.

Der angepasste R²-Wert steigt nur leicht von 0.023 auf 0.030 – die zusätzlichen Variablen verbessern die Erklärungskraft des Modells nur geringfügig. Das bedeutet: Der größte erklärte Anteil stammt weiterhin vom Treatment.

Lässt sich der Effekt des Treatments kausal interpretieren?

Ja – weitgehend. Da es sich bei treatment um eine zufällig zugewiesene Experimentvariable handelt (vgl. Beschreibung aus Aufgabe 2: “between-subjects randomized experiment”), erfüllt das Treatment die wichtigste Voraussetzung für eine kausale Interpretation: Exogene Zuweisung.
Die Randomisierung sorgt dafür, dass alle anderen Einflussfaktoren im Mittel gleich verteilt sind. Die Signifikanz des Treatment-Effekts (p < 0.001) belegt zudem, dass dieser Effekt sehr wahrscheinlich nicht durch Zufall entsteht. Daher können wir den Effekt des Treatments kausal interpretieren:
Kostentransparenz erhöht mit hoher Wahrscheinlichkeit die Wahrscheinlichkeit, dass Everlane gewählt wird.

Ist es wichtig, auf weitere Faktoren zu kontrollieren?

Ja, obwohl das Treatment randomisiert ist, ist es methodisch sinnvoll, zusätzliche Kontrollvariablen wie Alter, Bildung, Einkommen oder Geschlecht in das Modell aufzunehmen, denn:

Im Modell zeigt sich, dass der Effekt von treatment durch die Kontrollen nicht abgeschwächt wird – das stärkt die Aussagekraft der Ergebnisse.

Bezug zu Aufgabe 5

In Aufgabe 5 wurde mithilfe einer Balancing-Tabelle geprüft, ob sich Treatment- und Kontrollgruppe systematisch unterscheiden – das war nicht der Fall. Alle getesteten Merkmale (Alter, Geschlecht, Bildung, Einkommen) unterschieden sich nicht signifikant, was auf eine gelungene Randomisierung hindeutet. Trotzdem zeigt die Regressionsanalyse, dass einzelne Merkmale wie female einen signifikanten Effekt auf die Everlane-Wahl haben können. Das bekräftigt nochmals, warum es sinnvoll ist, auch bei scheinbar balancierten Gruppen Kontrollvariablen mit aufzunehmen – etwa um genau diese zusätzlichen Einflussfaktoren zu identifizieren und den Behandlungseffekt zu isolieren.

Fazit

Die Regressionsanalyse bestätigt die deskriptiven Ergebnisse: Die Offenlegung von Produktionskosten (Treatment) erhöht signifikant die Wahrscheinlichkeit, dass Konsument:innen sich für das transparente Unternehmen entscheiden. Dieser Effekt ist robust gegenüber Kontrollen und kann als kausal interpretiert werden. Kontrollvariablen verbessern zusätzlich die Modellgüte und zeigen, dass z.B. Frauen tendenziell transparenteren Marken stärker vertrauen.


Während die bisherigen Analysen zeigen, dass das Treatment einen Effekt hat, stellt sich nun die Frage, warum das so ist. Nun sollten Sie im weiteren Verlauf durch vertiefende Regressionsanalysen prüfen, ob dies auf das Vertrauen der Kunden zurückzuführen ist. Dazu betrachten Sie noch einmal den Datensatz zu Experiment 2 (daten_exp2) und untersuchen, ob das Treatment (Kunden sehen transparente Kostenstruktur) zu einer höheren Kaufabsicht führt, weil sie das Vertrauen der Konsumenten in das Unternehmen stärkt.

  1. Schauen Sie sich den Einfluss der Kostentransparenz auf die Kaufabsicht in den folgenden zwei Regressionen genauer an und zeigen Sie ihre Ergebnisse nebeneinander:

1. Regression: Abhängige Variable ist die Kaufabsicht; die erklärende Variable ist das Treatment.

2. Regression: Wie in der 1. Regression, doch kontrollieren Sie hier zusätzlich auf die Variablen Alter, Einkommensniveau, Bildungsstufe und Geschlecht.

Stellen Sie die Regressionsergebnisse in einer Tabelle mit stargazer oder modelsummary dar!

Beschreiben und interpretieren Sie ihre Ergebnisse allgemein. Gehen Sie weiterhin auch speziell auf folgende Fragen ein:


Einfluss von Kostentransparenz auf Kaufabsicht
Nur Treatment Mit Kontrolle
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
(Intercept) 3.740*** 3.702***
(0.115) (0.470)
treatmentTreatment 0.533** 0.501**
(0.163) (0.166)
age -0.013+
(0.007)
income 0.023
(0.036)
educ 0.102
(0.099)
female -0.001
(0.168)
Num.Obs. 612 601
R2 0.017 0.025
R2 Adj. 0.016 0.016
AIC 2601.0 2558.4
BIC 2614.3 2589.1
Log.Lik. -1297.502 -1272.177
F 10.649 3.009
RMSE 2.02 2.01

Beschreibung und Interpretation

Die Tabelle zeigt zwei lineare Regressionsmodelle, die den Einfluss von Kostentransparenz (treatment) auf die Kaufabsicht (wtb) im Rahmen des zweiten Experiments analysieren. Im ersten Modell (“Nur Treatment”) wird ausschließlich die Zugehörigkeit zur Treatmentgruppe als erklärende Variable verwendet. Das zweite Modell (“Mit Kontrolle”) erweitert die Analyse um soziodemografische Kontrollvariablen: Alter, Einkommen, Bildungsniveau und Geschlecht.

Im ersten Modell beträgt der geschätzte Effekt der Treatment-Variable 0.533 und ist statistisch hochsignifikant (p<0.01). Dies bedeutet, dass Teilnehmende, die die Verpackung mit transparenter Kostenstruktur gesehen haben, im Durchschnitt eine um etwa 0.53 Punkte höhere Kaufabsicht äußerten (auf einer Skala von 1 = “überhaupt nicht wahrscheinlich” bis 7 = “sehr wahrscheinlich”) als jene in der Kontrollgruppe. Das ist ein substanzieller Unterschied, der auf eine positive Wirkung der Kostentransparenz hinweist.

Das zweite Modell kontrolliert zusätzlich für Alter, Einkommen, Bildungsniveau und Geschlecht. Der Effekt des Treatments bleibt mit 0.501 nahezu gleich groß und weiterhin hochsignifikant (p<0.01). Dies zeigt, dass die zusätzlichen Variablen den Treatment-Effekt kaum verändern. Der einzige Kontrollfaktor mit (grenzwertiger) Signifikanz ist das Alter: Mit einem geschätzten Koeffizienten von -0.013 zeigt sich, dass ältere Personen tendenziell eine etwas geringere Kaufbereitschaft haben, was durch das Pluszeichen für Signifikanzniveau p<0.1 angedeutet wird. Einkommen, Bildung und Geschlecht zeigen keine signifikanten Einflüsse.

Der Vergleich der erklärten Varianz zeigt, dass das Modell mit Kontrollen eine etwas höhere Güte aufweist (R² = 0.025 vs. 0.017), der Unterschied bleibt aber gering. Die Residuenstreuung (RMSE) bleibt nahezu identisch.

Sollten die Kontrollvariablen in der zweiten Regression den Koeffizienten des Treatments ändern?

Das hängt davon ab, ob die Kontrollvariablen mit der Treatmentzuweisung korrelieren. Wie in Aufgabe 8 gezeigt, bestand kein signifikanter Unterschied zwischen den Gruppen im Hinblick auf Alter, Einkommen, Bildung oder Geschlecht. Daher war nicht zu erwarten, dass sich der Treatment-Koeffizient stark verändert. Genau das bestätigt sich in der Tabelle: Der Effekt sinkt nur minimal von 0.533 auf 0.501, bleibt aber in der Größenordnung und signifikant. Das spricht für eine erfolgreiche Randomisierung.

Gibt es einen signifikanten Unterschied in der Größe des Treatment-Effekts zwischen den beiden Modellen?

Nein. Die Differenz von 0.032 ist gering, und beide Koeffizienten liegen innerhalb der jeweiligen Standardfehler. Dies deutet darauf hin, dass die Kontrolle zusätzlicher Variablen kaum Einfluss auf die geschätzte Wirkung des Treatments hat. Die Randomisierung scheint gut funktioniert zu haben, sodass systematische Unterschiede in den Kovariaten nicht relevant waren.

Bringt die Regression Vorteile gegenüber der reinen Mittelwertdarstellung in Aufgabe 9?

Ja, Regressionen bieten mehrere Vorteile. Erstens ermöglichen sie eine präzisere Schätzung des Effekts unter Kontrolle anderer Einflussfaktoren. Zweitens geben sie Konfidenzintervalle, p-Werte und weitere Modellgütemaße aus. Drittens lassen sich durch die Aufnahme zusätzlicher Variablen auch Wechselwirkungen oder Moderator-/Mediatorbeziehungen untersuchen. Eine reine Mittelwertdifferenz ist weniger flexibel und erlaubt keine Aussagen über andere Einflussgrößen.

Ist der Effekt des Treatments kausal interpretierbar?

Grundsätzlich ja – unter bestimmten Voraussetzungen. Da es sich um ein randomisiertes Experiment handelt, wurde das Treatment zufällig zugewiesen. Dies erfüllt die zentrale Voraussetzung der Unabhängigkeit zwischen Treatment und potenziellen Störfaktoren. Solange keine systematische Drop-out-Raten oder Messfehler bestehen, darf der Treatment-Koeffizient als kausaler Effekt auf die Kaufabsicht interpretiert werden.

Welche Voraussetzungen müssen erfüllt sein, um den Treatment-Effekt als kausal interpretieren zu können?

Die wichtigsten Voraussetzungen sind: - Randomisierung der Treatment-Zuweisung (gegeben), - keine systematischen Unterschiede in unbeobachteten Variablen (z.B. durch Dropout oder Selbstselektion), - keine Interaktionen zwischen Teilnehmern (Stable Unit Treatment Value Assumption, SUTVA), - korrekt spezifiziertes Modell (z.B. linear, keine wichtigen Variablen ausgelassen).

Was würde sich ändern, wenn Vertrauen (trust) als weitere Variable aufgenommen würde?

Wird trust als zusätzliche erklärende Variable in das Modell aufgenommen, könnte sich der Treatment-Effekt verringern oder sogar statistisch insignifikant werden.
Der Grund: Vertrauen könnte ein Mediator sein – also eine Variable, durch die das Treatment wirkt. Das heißt: Die transparente Darstellung der Kosten stärkt das Vertrauen, und das erhöhte Vertrauen führt zur höheren Kaufbereitschaft. In einem solchen Fall würde trust den Effekt des treatment „erklären“ und damit den direkten Effekt des Treatments auf die Kaufabsicht reduzieren. Das wäre ein starkes Indiz für eine indirekte Wirkungsweise über psychologische Mechanismen – und genau das wird in den nächsten Aufgaben untersucht.


Sie haben nun gesehen, dass es auch hier einen direkten Effekt des Treatments (transparente Kostenstrukur) auf die Kaufabsicht gibt. Doch um die dahinter liegenden Mechanismen zu verstehen, müssen Sie tiefer in psychologische Prozesse eintauchen. Experiment 2 zeigt dafür ein entsprechendes Design, um zu testen, ob Vertrauen als vermittelnder Mechanismus eine Rolle spielt. Im nächsten Schritt analysieren Sie nun selbst diese Beziehung mit theoretischen Modellen und Regressionsmethoden, um ein Gefühl dafür zu bekommen, wie sich direkte und indirekte Effekte voneinander unterscheiden.

  1. Bevor Sie im nächsten Schritt ein konkretes DAG zu einem psychologischen Mediationsmechanismus erstellen, machen Sie sich zunächst mit den theoretischen Grundlagen von Directed Acyclic Graphs (DAGs) vertraut. DAGs (gerichtete azyklische Graphen) sind ein nützliches Werkzeug in der Kausalanalyse.

Beantworten Sie folgende theoretische Fragen zu DAGs:


Wofür werden DAGs in der empirschne Forschung verwendet?

DAGs werden in der empirischen Forschung genutzt, um kausale Zusammenhänge zwischen Variablen übersichtlich darzustellen. Sie zeigen mit Pfeilen, welche Variable welche beeinflusst – zum Beispiel ob Bildung das Einkommen beeinflusst oder ob es andere Faktoren gibt, die dazwischenfunken. Das ist besonders hilfreich, um herauszufinden, welche Variablen man kontrollieren sollte, damit man den echten Effekt messen kann – und nicht versehentlich auf Scheinkorrelationen hereinfällt.

Außerdem helfen DAGs dabei, Fehler wie den Collider Bias zu vermeiden, also Verzerrungen, die entstehen, wenn man eine falsche Variable einbezieht. Sie zeigen auch sogenannte Backdoor-Pfade, also Umwege, über die sich zwei Variablen scheinbar beeinflussen, obwohl sie das eigentlich gar nicht tun. So kann man besser entscheiden, was in eine Analyse rein sollte – und was lieber nicht.

Gerade in der Kausalforschung sind DAGs extrem hilfreich, weil sie komplexe Zusammenhänge klar strukturieren. Sie zwingen einen dazu, schon vor der Analyse die Theorie hinter den Daten durchzudenken.

Nennen und beschreiben Sie zwei zentrale Knotentypen in einem DAG: Confounder und Mediator

  1. Confounder (Störfaktor)
    Ein Confounder ist eine Variable, die sowohl das Treatment als auch das Outcome beeinflusst. Wenn man Confounder nicht berücksichtigt, kann die Schätzung des kausalen Effekts verzerrt sein, weil der Zusammenhang zwischen Treatment und Outcome dann nicht mehr eindeutig kausal ist.

    Beispiel im Projektkontext:
    Man stelle sich vor, Alter hätte die Zuweisung zum Treatment beeinflusst (z. B. ältere Personen erhalten eher Informationen zu transparenten Verpackungskosten) und zugleich einen Einfluss auf die Kaufabsicht (z. B. ältere Menschen sind grundsätzlich skeptischer beim Kaufen). In diesem Fall wäre Alter ein Confounder, den man in der Regression kontrollieren sollte, um den tatsächlichen Effekt des Treatments korrekt zu erfassen.

    In der gezeigten Analyse ist Alter kontrolliert worden, aber es zeigte sich kein starker Einfluss auf die Treatment-Zuweisung – das spricht dafür, dass Confounding durch Alter unwahrscheinlich ist, was wiederum für die gute Randomisierung spricht.

  2. Mediator (Vermittler)
    Ein Mediator liegt kausal zwischen Treatment und Outcome. Er erklärt also, wie oder warum ein Treatment wirkt.

    Beispiel im Projektkontext:. Die Variable Vertrauen (trust) könnte ein Mediator sein. Das Treatment (Transparenz über Verpackungskosten) erhöht Vertrauen, und dieses Vertrauen führt zu höherer Kaufabsicht. In einem DAG würde das so aussehen:

    treatmenttrustwtb

    Wenn Vertrauen also ein echter Mediator ist, würde sich der Effekt des Treatments verringern oder sogar verschwinden, sobald Vertrauen im Modell enthalten ist.

Worin besteht der zentrale Unterschied, ob Vertrauen als Kontrollvariable (Confounder) oder als Mediator behandelt wird - und warum ist Letzteres entscheidend für das Verständnis psychologischer Prozesse im vorliegenden Experiment?

  1. Vertrauen als Confounder:
    Wenn Vertrauen als Confounder betrachtet würde, würde das bedeuten, dass es bereits vor der Treatment-Zuweisung besteht und sowohl das Treatment als auch die Kaufabsicht beeinflusst. In diesem Fall wäre Vertrauen eine Störvariable, die den direkten Zusammenhang zwischen Treatment und Kaufabsicht verzerren könnte. Man würde Vertrauen kontrollieren, um den “wahren” Effekt des Treatments freizulegen, weil der Effekt ohne Kontrolle möglicherweise überschätzt wäre.

    Beispielhafte Interpretation:
    Menschen mit höherem Grundvertrauen bevorzugen vielleicht eher Informationen über transparente Verpackungskosten und haben auch generell mehr Kaufbereitschaft.
    → Dann müsste man Vertrauen kontrollieren, um den direkten Effekt der Verpackungskosten-Offenlegung zu isolieren.

    Aber: Diese Annahme passt nicht gut zum Versuchsaufbau, denn Vertrauen wird eher vom Treatment ausgelöst – nicht umgekehrt.

  2. Vertrauen als Mediator:
    Wenn Vertrauen ein Mediator ist, liegt es kausal zwischen dem Treatment und der Kaufabsicht. Das heißt: Die transparente Darstellung der Verpackungskosten erhöht erst das Vertrauen, und dieses erhöhte Vertrauen führt zu einer stärkeren Kaufabsicht. Vertrauen ist in diesem Fall also nicht Störfaktor, sondern Teil des Wirkmechanismus.

    Beispielhafte Interpretation:
    Transparente Verpackungskosten → stärken Vertrauen → erhöhen die Kaufbereitschaft.

    Hier wäre es falsch, Vertrauen einfach herauszurechnen, da man dann den interessanten Teil des Effekts – nämlich die psychologische Wirkung – unterdrückt. Stattdessen würde man das Interesse darauf richten, wie viel vom Treatment-Effekt vermittelt wird (indirekter Effekt) und wie viel davon direkt wirkt (direkter Effekt).

Warum ist es entscheidend für das Verstädnis von dem Projekt:

Wenn Vertrauen ein Mediator ist, dann zeigt sich: Der Effekt der transparenten Verpackungskosten läuft über psychologische Mechanismen wie Vertrauensaufbau. Und das ist für die Praxis extrem relevant – denn es bedeutet, dass Vertrauen ein Schlüsselhebel ist, den man bewusst ansprechen kann.

→ Nur wenn Vertrauen als Mediator verstanden wird, kann man diese psychologische Wirkung erklären, messen und in der Praxis nutzen. Andernfalls würden wichtige Erkenntnisse über die Wirkung des Treatments verdeckt bleiben.


  1. Nutzen Sie nun das Directed Acyclic Graph (DAG), um die Beziehungen zwischen den Variablen Treatment (T), Vertrauen (V) und Kaufbereitschaft (K) zu analysieren und den vermuteten Mediationsmechanismus zu untersuchen.

Beschreiben und interpretieren Sie ihr DAG und die Beziehungen zwischen den Variablen. Gehen Sie insbesondere auf folgende Fragen und Aspekte ein:

Hinweis 1: Für die Erstellung des DAGs können Sie das Paket dagify verwenden. Als Grundlage und Hilfsmittel können Sie die Vorlesungsfolien nutzen.

Hinweis 2: Eine direkte Visualisierung des DAGs in R ist schön, aber keine Pflicht. Sie können das DAG auch in Word/PowerPoint zeichnen und ihre Grafik mittels include_graphics() einfügen.


Beschreibung

Zur Untersuchung des vermuteten Mediationsmechanismus zwischen Treatment (T), Vertrauen (V) und Kaufbereitschaft (K) wurde ein Directed Acyclic Graph (DAG) erstellt, der die theoretisch angenommenen kausalen Beziehungen zwischen diesen Variablen abbildet. Das DAG basiert auf der Annahme, dass die Transparenz über Verpackungskosten (T) das Vertrauen der Konsument:innen (V) stärkt, und dass dieses Vertrauen wiederum positiv auf die Kaufbereitschaft (K) wirkt. Zusätzlich wird berücksichtigt, dass das Treatment auch einen direkten Einfluss auf die Kaufbereitschaft haben könnte – beispielsweise weil Konsument:innen die Information über Verpackungskosten als Zeichen von Fairness oder Nachhaltigkeit deuten.

Das Modell zeigt somit zwei kausale Pfade von T zu K:

Interpretation

Diese Struktur ermöglicht es, zwischen einem direkten Effekt und einem vermittelten Effekt zu unterscheiden. Der Mediator „Vertrauen“ wird dabei als zentrale psychologische Größe verstanden, über die das Treatment wirkt. Das bedeutet: Der Effekt der Kostentransparenz entsteht nicht ausschließlich durch die Information selbst, sondern vor allem dadurch, dass Konsumenten dem Anbieter mehr Vertrauen schenken, was wiederum ihre Kaufentscheidung beeinflusst.

Das DAG verdeutlicht somit, dass Vertrauen nicht nur eine begleitende Variable, sondern ein kausales Bindeglied im Wirkmechanismus ist. Es liefert damit die Grundlage, um sowohl die Gesamtwirkung des Treatments als auch den psychologischen Vermittlungsprozess differenziert zu analysieren.

Begründen und erklären Sie die Struktur und den Aufbau ihres DAGs

Das DAG zeigt die angenommenen Kausalbeziehungen zwischen dem Treatment (T), Vertrauen (V) und der Kaufbereitschaft (K). Die Struktur basiert auf der Hypothese, dass das Treatment – in Form der Information über transparente Verpackungskosten – zunächst das Vertrauen erhöht, und dass dieses Vertrauen dann die Kaufabsicht positiv beeinflusst. Deshalb gibt es einen gerichteten Pfeil von T zu V und von V zu K. Zusätzlich wurde ein direkter Pfeil von T zu K aufgenommen, um abzubilden, dass das Treatment möglicherweise auch einen direkten Einfluss auf die Kaufentscheidung hat, unabhängig vom Vertrauen. Diese Struktur erlaubt es, den Gesamt-Effekt des Treatments in einen direkten und einen indirekten (mediierten) Anteil zu zerlegen, was für die Analyse psychologischer Wirkmechanismen entscheidend ist.x

Welche Annahmen müssen getroffen werden, damit Vertrauen tatsächlich als Mediator interpretiert werden kann?

Damit Vertrauen als Mediator gelten kann, müssen folgende Bedingungen erfüllt sein:

Welche Verzerrungen oder Störfaktoren könnten den Mediator-Effekt von Vertrauen beeinflussen? Wie könnte dies die Ergebnisse verzerren?

Mehrere Risiken können die Schätzung des Mediator-Effekts verfälschen:

→ Solche Verzerrungen können dazu führen, dass der vermutete indirekte Effekt über Vertrauen falsch eingeschätzt wird – was wiederum zu falschen Schlüssen über die Wirkung des Treatments führt. Daher ist saubere Datenerhebung und ein theoretisch klar abgestütztes Modell essenziell.


  1. Führen Sie nun eine Regression durch, bei der Ihnen trust (Vertrauen) als abhängige Variable dient. Weiterhin soll ihnen treatment als erklärende Variable dienen. Erstellen sie eine weitere Regression, die zusätzlich noch für die folgenden Variablen kontrolliert: Alter, Einkommensniveau, Bildungsstufe und ob die Personen weiblich sind.

Stellen Sie die Regressionsergebnisse in einer Tabelle mit stargazer oder modelsummary dar!

Beschreiben und interpretieren Sie ihre Ergebnisse. Gehen Sie bei der Interpretation der Ergebnisse insbesondere auf folgende Fragen ein:


Einfluss von Kostentransparenz auf Vertrauen
Nur Treatment Mit Kontrolle
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
(Intercept) 4.825*** 4.716***
(0.079) (0.320)
treatmentTreatment 0.448*** 0.454***
(0.111) (0.113)
age -0.001
(0.005)
income -0.021
(0.024)
educ 0.058
(0.067)
female 0.179
(0.114)
Num.Obs. 612 601
R2 0.026 0.035
R2 Adj. 0.024 0.027
AIC 2133.5 2095.6
BIC 2146.8 2126.4
Log.Lik. -1063.762 -1040.795
F 16.188 4.291
RMSE 1.38 1.37

Beschreibung

In der ersten Regression („Nur Treatment“) wird das Vertrauen (trust) ausschließlich durch die Variable treatment erklärt. Der geschätzte Koeffizient beträgt 0.448 mit einem Standardfehler von 0.111 und ist statistisch hochsignifikant (* p < 0.01)**. Das bedeutet, dass Teilnehmer der Treatment-Gruppe im Durchschnitt 0.448 Punkte höheres Vertrauen äußerten als die Kontrollgruppe.

In der zweiten Regression („Mit Kontrolle“) wurden zusätzlich die Kontrollvariablen Alter, Einkommen, Bildungsniveau und Geschlecht aufgenommen. Der Treatment-Koeffizient liegt hier bei 0.454 (Standardfehler: 0.113), also nahezu identisch zur ersten Regression – ebenfalls hochsignifikant. Die aufgenommenen Kontrollvariablen zeigen keine statistisch signifikanten Effekte auf Vertrauen. Die Schätzwerte sind klein, und die Standardfehler relativ groß.

Interpretation

Der signifikante positive Koeffizient in beiden Modellen zeigt, dass Transparenz über Verpackungskosten das Vertrauen in das Produkt oder den Anbieter stärkt. Der nahezu unveränderte Wert des Treatment-Koeffizienten trotz zusätzlicher Kontrollvariablen spricht dafür, dass die Beziehung robust ist und nicht durch Drittvariablen verzerrt wird.

Die fehlende Signifikanz der Kontrollvariablen deutet darauf hin, dass Alter, Einkommen, Bildung und Geschlecht in diesem Zusammenhang keine wesentlichen Einflussfaktoren auf Vertrauen sind – zumindest nicht innerhalb des gegebenen Experiments. Insgesamt unterstützt das Ergebnis die Annahme, dass Vertrauen durch das Treatment beeinflusst wird, was wiederum eine Voraussetzung für einen funktionierenden Mediationspfad (T → V → K) ist.

Macht es Ihrer Ansicht nach Sinn, auf die zusätzlichen Variablen in Regression 2 zu kontrollieren? Worauf müssen Sie besonders achten?

Ja, es macht methodisch Sinn, diese Kontrollvariablen einzubeziehen – insbesondere, um zu prüfen, ob der Effekt von treatment möglicherweise durch Drittvariablen verzerrt ist. Besonders achten muss man darauf, dass diese Variablen nicht post-treatment sind (also nicht durch das Treatment selbst beeinflusst werden), da man sonst Verzerrungen durch sogenannte post-treatment biases riskiert. Im konkreten Fall zeigt sich jedoch: Die Kontrollvariablen verändern den Koeffizienten kaum, was ein Hinweis auf erfolgreiche Randomisierung ist. Sie dienen hier eher als Absicherung denn als notwendige Korrektur.

Was bedeutet ein signifikanter positiver Koeffizient für treatment in Bezug auf Vertrauen?

Ein signifikanter positiver Koeffizient zeigt, dass die Information über Verpackungskosten (treatment) einen kausalen, vertrauensfördernden Effekt hat. Teilnehmer:innen, die diese Information erhalten, berichten statistisch signifikant mehr Vertrauen gegenüber dem Produkt oder Anbieter als die Kontrollgruppe. Der Effekt ist robust, auch bei Kontrolle relevanter Hintergrundmerkmale.

Warum ist dieser Pfad (Treatment ➝ Trust) notwendig, damit eine Mediation überhaupt möglich ist?

Damit eine Mediation über Vertrauen (T → V → K) überhaupt angenommen werden kann, muss es zunächst einen signifikanten Zusammenhang zwischen Treatment und Vertrauen geben. Wenn dieser Pfad fehlt, kann Vertrauen logischerweise nicht als vermittelnde Variable wirken. Der signifikante Effekt zeigt hier, dass Vertrauen durch das Treatment beeinflusst wird – das ist die zentrale Voraussetzung für die Mediation.

Überlegen Sie, ob andere Faktoren, die Sie möglicherweise nicht berücksichtigt haben, diesen Zusammenhang ebenfalls erklären könnten.

Mögliche unbeachtete Einflussfaktoren könnten z.B. sein:

Wenn solche Variablen sowohl das Vertrauen als auch die Reaktion auf das Treatment beeinflussen, könnten sie den Effekt verzerren. Ohne Berücksichtigung solcher ungemessenen Confounder ist also Vorsicht bei der Interpretation geboten – auch wenn die Randomisierung gut zu funktionieren scheint.


  1. Nachdem Sie nun den Effekt des Treatments auf das Vertrauen geschätzt und ausgewertet haben, sollen Sie nun testen, ob das Vertrauen als Mediator zwischen Treatment und Kaufabsicht wirkt.

Führen Sie eine Regression durch, bei der Ihnen die Kaufbereitschaft als abhängige Variable dient. Weiterhin sollen die erklärende Variablen nun treatment, sowie das Vertrauen (trust) umfassen. Erstellen sie eine weitere Regression, die zusätzlich noch auf Alter, Einkommensniveau, Bildungsstufe und ob die Personen weiblich sind, kontrolliert.

Stellen Sie die Regressionsergebnisse passend in einer Tabelle dar!

Beschreiben und interpretieren Sie ihre Ergebnisse. Gehen Sie bei der Interpretation der Ergebnisse insbesondere auf folgende Fragen ein:


Mediationstest:
Vertrauen als Vermittler zwischen Treatment und Kaufabsicht
Ohne Vertrauen (A) Mit Vertrauen (B)
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
(Intercept) 3.702*** -0.155
(0.470) (0.457)
treatment 0.501** 0.129
(0.166) (0.140)
age -0.013+ -0.013*
(0.007) (0.006)
income 0.023 0.041
(0.036) (0.030)
educ 0.102 0.055
(0.099) (0.082)
female -0.001 -0.148
(0.168) (0.140)
trust 0.818***
(0.050)
Num.Obs. 601 601
R2 0.025 0.327
R2 Adj. 0.016 0.320
AIC 2558.4 2337.7
BIC 2589.1 2372.9
Log.Lik. -1272.177 -1160.835
F 3.009 48.027
RMSE 2.01 1.67

Beschreibung

In Modell A („Ohne Vertrauen“) wird die Kaufabsicht (wtb) durch das Treatment sowie vier Kontrollvariablen erklärt. Der Koeffizient für treatment beträgt 0.501 mit einem Standardfehler von 0.166 und ist statistisch signifikant auf dem 5%-Niveau. Das bedeutet: Personen, die die Information über Verpackungskosten erhalten haben, zeigten eine signifikant höhere Kaufbereitschaft.

Im Modell B („Mit Vertrauen“) wird zusätzlich die Variable trust als möglicher Mediator aufgenommen. Dadurch verändert sich das Ergebnis stark:

Diese Veränderung legt den Verdacht nahe, dass der Effekt von treatment über trust vermittelt wird – ein typischer Fall eines Mediationseffekts.

Interpretation

Die Ergebnisse zeigen: Der ursprünglich signifikante Effekt von treatment verschwindet nahezu vollständig, sobald Vertrauen als erklärende Variable in das Modell aufgenommen wird. Das bedeutet: Die positive Wirkung von Verpackungskostentransparenz auf die Kaufbereitschaft entsteht maßgeblich über den Vertrauenseffekt.

Kurz: Das Treatment stärkt das Vertrauen – und dieses Vertrauen beeinflusst dann die Kaufentscheidung. Das ist ein klassisches Muster einer vollständigen Mediation. Die Kund:innen entscheiden sich nicht wegen der Info an sich für das Produkt, sondern weil sie diese Information als ehrlich, nachvollziehbar oder fair empfinden – also vertrauensstärkend.

Was könnten Ihrer Ansicht nach Gründe sein, dass treatment jetzt nicht mehr signifkant ist? Woran könnt das im Detail liegen?

Der Effekt von treatment wird im zweiten Modell durch trust absorbiert, weil trust der eigentliche Vermittler des Zusammenhangs ist. In Modell A erklärt treatment noch die gesamte Wirkung. Sobald trust hinzukommt, erklärt diese Variable den gleichen Varianzanteil besser – und treatment verliert seine Signifikanz. Dies deutet klar auf einen vermittelten Zusammenhang hin (treatmenttrustwtb).

Warum ist es wichtig, trust und treatment gemeinsam in einem Modell zu betrachten?

Nur durch die gleichzeitige Modellierung beider Variablen lässt sich klären, ob der Effekt des Treatments direkt oder indirekt wirkt. Ohne trust würde man annehmen, das Treatment wirke direkt auf die Kaufbereitschaft – was das Ergebnis verkürzt oder sogar falsch interpretieren würde. Erst die gemeinsame Betrachtung macht den psychologischen Wirkmechanismus sichtbar.

Warum könnte trust eine “notwendige Bedingung” sein, damit Transparenz der Kostenstruktur zu höherer Kaufbereitschaft führt?

Vertrauen ist das entscheidende Bindeglied, das eine sachliche Information (Kostenangabe) in ein positives Konsumentenverhalten (Kaufabsicht) übersetzt. Ohne Vertrauen könnten Konsument:innen die Information als belanglos oder sogar als taktisch empfinden. Erst wenn die Information als glaubwürdig erlebt wird, entfaltet sie ihre Wirkung. Vertrauen ist somit notwendig, aber nicht automatisch gegeben – es muss aktiv durch Transparenz aufgebaut werden.


In den vorangegangenen Modellen wurde untersucht, ob das Treatment (Kostentransparenz) das Vertrauen in das Unternehmen beeinflusst und ob Vertrauen wiederum mit der Kaufabsicht zusammenhängt.

  1. Bewerten Sie das experimentelle Design der Studie 2. Gehen Sie dabei auch darauf ein, inwiefern Ihre Ergebnisse aus Aufgabe 13 bis 16 das theoretische Verständnis von Vertrauensbildung in der Konsumentenpsychologie bestätigt oder infrage stellt. Welche Stärken und Schwächen sehen Sie bezüglich der internen Validität und der Kausalitätsaussagen? Diskutieren Sie zudem kurz, inwiefern die Ergebnisse auf andere Bevölkerungsgruppen oder kulturelle Kontexte übertragbar sind.

Hinweis: Informationen zum Verständnis der Vertrauensbildung in der Konsumentenpsychologie können Sie in dem folgenden Artikel auf Seite 2 bis 5 nachlesen.


Bewertung des experimentellen Designs der Studie 2

Die Ergebnisse aus den vorherigen Aufgaben bestätigen zentrale Theorien der Konsumentenpsychologie, wie sie auch im Artikel dargestellt werden. Vertrauen entsteht laut Literatur auf Basis von Kompetenz, Verlässlichkeit, Problemlösebereitschaft und Loyalität.
Genau diese Dimensionen sind auch in den Ergebnissen der Studie wiederzufinden: Die Information über transparente Verpackungskosten stärkt das Vertrauen – und dieses Vertrauen hat einen klaren Einfluss auf die Kaufabsicht.

Der Artikel betont, dass Vertrauen ein interdisziplinäres Konzept ist, das in der Marktkommunikation eine Brückenfunktion übernimmt.
Die Studie greift dieses Verständnis auf und operationalisiert es empirisch durch den Mediationstest. Besonders der Aspekt, dass Vertrauen Unsicherheit reduziert, passt sehr gut zu den Ergebnissen: Kund:innen, die mehr Vertrauen haben, sind eher bereit zu kaufen – ein klassischer Vertrauensmechanismus, wie er auch im E-Commerce diskutiert wird.

Stärken des Designs

Schwächen des Designs

Übertragbarkeit auf andere Kontexte

Die Studie wurde wahrscheinlich mit einer relativ homogenen Stichprobe (z.B. Studierende oder Online-Panel) durchgeführt. Wie der Artikel betont, hängt Vertrauen stark von individuellen Erfahrungen und kulturellen Kontexten ab. In kollektivistischen Kulturen, in denen Gruppenzugehörigkeit oder soziale Autorität eine größere Rolle spielen, könnten andere Mechanismen zur Vertrauensbildung dominieren.

Besonders im E-Commerce wird Vertrauen oft durch technische Sicherheit, Nutzerbewertungen oder Plattformreputation aufgebaut – diese Dimension fehlt im Experiment. Somit wäre eine Übertragung auf digitale Kontexte oder andere Länder nur eingeschränkt möglich, solange diese Unterschiede nicht berücksichtigt werden


Zusatzaufgabe

Zu Beginn des Projektes hatten wir erwähnt, dass die Experimente, welche im Projekt durchgeführt wurden, auf Grund eines Missgeschicks in der Online-Darstellung von unterschiedlichen Produkten zustande kam. Hier wurden von einem privat geführten Online-Händler Geldbörsen in fünf Farbvarianten angeboten, wobei beabsichtigt war, allen Farben eine einheitliche Kostentransparenz-Infografik zuzuordnen. Aufgrund eines Versehens wurde die Infografik jedoch nur bei drei Farben implementiert. Dieses zufällige Ereignis führte zu einer klaren Trennung zwischen den Produkten mit dieser und ohne diese Infografik. Das dadurch entstandene natürliche Experiment sollen Sie sich in der Zusatzaufgabe näher anschauen.

  1. Lesen Sie sich den nachfolgenden Text zum Aufbau des natürlichen Experiments innerhalb dieses Papers durch und beantworten anschließend nachfolgende Fragen:

On December 2, 2013, a privately held online retailer launched a holiday gift shop with a single email to its mailing list, promoting a leather wallet offered in five colors (burgundy, black, grey, bone, and tan) and priced at $115.00. Later, at the end of January, to boost post-holiday sales, the retailer decided to add a cost transparency infographic to the online product detail pages for each of the wallet’s five color combinations. The retailer’s intention was to use the same infographic for all wallets since they differed only in color.

However, due to an inadvertent mistake, the infographic was not introduced for two of the wallet colors (bone and tan). Consequently, the cost transparency information was implemented for only three of the five wallet colors (burgundy, black, and grey) over a period of five weeks. This error created a natural experiment, enabling us to test the impact of cost transparency on wallet sales.

Therefore we have the following procedure:


Beantworten Sie nun die folgenden Fragen in Bezug auf den vorherigen Text:


Wie ist das natürliche Experiment aufgebaut, und warum wird es als solches klassifiziert?

Das natürliche Experiment entstand unbeabsichtigt durch einen Implementierungsfehler: Die Infografik zur Kostentransparenz wurde nur bei drei von fünf Farbvarianten eines Ledergeldbeutels eingeblendet (burgundy, black, grey), während sie bei zwei Farben (bone, tan) nicht erschien. Dadurch ergab sich eine natürliche Vergleichsgruppe (kein Treatment) und eine Behandlungsgruppe (mit Infografik), obwohl die Zuweisung nicht aktiv gesteuert wurde. Genau das macht es zu einem natürlichen Experiment: Die Zuteilung des „Treatments“ (Infografik) erfolgte nicht absichtlich durch die Forscher, sondern durch ein reales Ereignis – hier ein technischer Fehler – unter ansonsten vergleichbaren Bedingungen (gleiche Produkte, gleicher Shop, identische Preissetzung etc.).

Welche Rolle spielt das zufällige Versäumnis, die Infografik bei zwei der fünf Farbvarianten einzuführen, in der Experimentstruktur?

Das Versehen war der Auslöser für die zufällige Gruppenzuteilung. Es verhinderte eine flächendeckende Einführung der Infografik und ermöglichte so einen kausalen Vergleich zwischen Gruppen mit und ohne Kostentransparenz. Ohne dieses Versehen hätte man keinen klaren Kontrast gehabt – alle Kund:innen hätten die gleiche Information gesehen, sodass kein Kontrollvergleich möglich gewesen wäre. In der Logik des Experiments spielt das Versehen also dieselbe Rolle wie eine zufällige Treatment-Zuweisung in klassischen Experimenten: Es erzeugt vergleichbare Gruppen, die sich (idealerweise) nur in einem Aspekt unterscheiden – hier der Sichtbarkeit der Infografik.

Warum ist es notwendig, Variablen wie Seitenaufrufe und Lagerbestandsproxies in die Analyse einzubeziehen?

Die Sichtbarkeit oder Beliebtheit einzelner Farbvarianten könnte die Verkäufe unabhängig vom Treatment beeinflussen. Wenn z.B. die Farbe „grey“ zufällig besonders beliebt oder häufiger aufgerufen wurde, könnte das zu höheren Verkaufszahlen führen – unabhängig davon, ob eine Infografik gezeigt wurde oder nicht. Deshalb ist es notwendig, Seitenaufrufe als Proxy für Nachfrage und Lagerbestände als Proxy für Verfügbarkeit zu kontrollieren. Ohne diese Kontrollvariablen könnte man fälschlich annehmen, dass ein Verkaufseffekt durch die Infografik verursacht wurde, obwohl er in Wahrheit durch unterschiedliche Popularität oder Verfügbarkeit bedingt war.

Welche potenziellen Verzerrungen könnten auftreten, wenn diese Kontrollvariablen nicht berücksichtigt werden?

Wenn man Seitenaufrufe und Lagerbestand nicht kontrolliert, besteht die Gefahr, dass Scheineffekte (Confounding) entstehen. Beispielsweise könnte eine Farbvariante besonders oft aufgerufen oder beworben worden sein, was zu höheren Verkaufszahlen führte – ganz unabhängig von der Infografik. Ohne Berücksichtigung dieser Faktoren würde der Effekt fälschlich dem Treatment zugeschrieben, was zu einer Überschätzung des Einflusses der Kostentransparenz führen könnte. Ebenso könnte ein mangelnder Lagerbestand (z.B. „tan“ ist ausverkauft) die Verkäufe drücken und damit den Kontrolldurchschnitt verfälschen. Das würde den Effekt der Infografik künstlich verstärken oder abschwächen, je nach Richtung der Verzerrung.


  1. Lesen Sie weiterhin das Kapitel “Difference-in-Differences” in Huntington-Klein (2021), speziell Kapitel 18.1 und 18.2 und beantworten Sie die folgenden Fragen dazu:

Kann eine Difference-in-Differences-Regression helfen, den kausalen Effekt der Kostentransparenz auf die Verkaufszahlen zu identifizieren?

Gehen Sie bei der Beantwortung dieser Frage insbesondere auf die nachfolgenden Punkte ein:


Die Anwendung einer Difference-in-Differences (DiD)-Regression ist im Kontext des beschriebenen natürlichen Experiments eine sinnvolle Methode, um den kausalen Effekt der Kostentransparenz auf die Verkaufszahlen der verschiedenen Geldbörsenfarben zu identifizieren. Das zugrundeliegende Ereignis – ein unbeabsichtigter Implementierungsfehler bei der Darstellung der Kostentransparenz-Infografik – sorgt dafür, dass einige Farbvarianten der Geldbörse (burgundy, black, grey) die Infografik erhielten, während andere (bone, tan) davon unbeabsichtigt ausgeschlossen wurden. Dieser zufällige Unterschied schafft eine natürliche Vergleichsstruktur, die sich methodisch für eine DiD-Analyse eignet.

Eine Difference-in-Differences-Analyse nutzt in diesem Fall zwei Arten von Variation zur Identifikation des kausalen Effekts: Zum einen wird die zeitliche Variation betrachtet, also wie sich die Verkaufszahlen vor und nach der Einführung der Infografik entwickeln. Zum anderen wird die gruppenspezifische Variation genutzt, also der Unterschied zwischen den Farbvarianten mit Infografik (Behandlungsgruppe) und ohne Infografik (Kontrollgruppe). Indem man die Differenz in der Entwicklung der Verkaufszahlen zwischen diesen beiden Gruppen über die Zeit hinweg vergleicht, isoliert man den Effekt, der allein auf die Infografik zurückzuführen ist. Entscheidend ist dabei, dass der Vergleich nicht auf absoluten Verkaufszahlen basiert, sondern auf der Veränderung der Verkaufszahlen im Zeitverlauf innerhalb jeder Gruppe – daher der Begriff “Difference-in-Differences”.

Damit die DiD-Schätzung tatsächlich eine gültige kausale Interpretation erlaubt, muss eine zentrale Voraussetzung erfüllt sein: die sogenannte „Parallel Trends“-Annahme. Diese besagt, dass sich – in Abwesenheit des Treatments – die Verkaufszahlen der behandelten und der unbehandelten Gruppe im gleichen Trend entwickelt hätten. Mit anderen Worten: Wäre die Infografik nicht eingeführt worden, hätten sich die Verkaufszahlen beider Gruppen im Zeitverlauf parallel verändert. Nur wenn diese Annahme plausibel ist, kann die Differenz der Differenzen tatsächlich dem Treatment-Effekt zugeschrieben werden. Im gegebenen Fall wäre das beispielsweise der Fall, wenn Farben wie burgundy und tan – trotz unterschiedlicher Beliebtheit – ohne Infografik ähnliche Verkaufstrends gehabt hätten.

Ein einfacher Vorher-Nachher-Vergleich innerhalb der Behandlungsgruppe reicht hingegen nicht aus. Solch ein Vergleich ignoriert alle anderen zeitlichen Einflüsse, die gleichzeitig wirken könnten, etwa allgemeine Nachfrageschwankungen nach Weihnachten, Marketingaktionen oder saisonale Effekte. Diese Einflüsse betreffen meist alle Produkte gleichermaßen – also sowohl die behandelte als auch die unbehandelte Gruppe – und lassen sich daher nur durch den Vergleich beider Gruppen voneinander trennen. Nur wenn sich die Kontrollgruppe nicht verändert, die Behandlungsgruppe aber schon, kann diese Veränderung dem Treatment zugeschrieben werden.

Basierend auf der Literatur zu DiD-Methoden und den Informationen aus dem Paper lässt sich eine passende Regressionsgleichung formulieren, mit der der Effekt der Kostentransparenz gemessen werden kann. Die abhängige Variable ist \(Y_{it}\), die Anzahl der verkauften Einheiten von Farbvariante i am Tag t. Die zentrale erklärende Variable ist der Interaktionsterm zwischen der Gruppenzugehörigkeit \(\text{Treat}_i\) (1 für Farben mit Infografik, 0 sonst) und der Zeitvariable \(\text{Post}_t\) (1 für Tage nach der Einführung der Infografik, 0 sonst). Dieser Interaktionsterm \(\text{Treat}_i \cdot \text{Post}_t\) trägt den geschätzten Effekt der Maßnahme.

Die vollständige Regressionsgleichung lautet:

\[ Y_{it} = \beta_0 + \beta_1 \cdot Treat_i + \beta_2 \cdot Post_t + \beta_3 \cdot (Treat_i \cdot Post_t) + \gamma \cdot X_{it} + \varepsilon_{it} \]

Dabei beschreibt \(\beta_0\) das durchschnittliche Ausgangsniveau der Verkaufszahlen für die Kontrollgruppe vor dem Treatment. \(\beta_1\) erfasst den Unterschied zwischen Behandlungs- und Kontrollgruppe vor dem Treatment. \(\beta_2\) spiegelt allgemeine Zeitveränderungen wider, die beide Gruppen betreffen. Die zentrale Schätzgröße ist \(\beta_3\), der Differenz-in-Differenzen-Schätzer, der den kausalen Effekt des Treatments auf die Verkaufszahlen misst. Zusätzlich enthält das Modell \(X_{it}\), einen Vektor an Kontrollvariablen – insbesondere Seitenaufrufe (als Maß für Nachfrage) und Lagerbestand (als Maß für Verfügbarkeit), die mögliche Verzerrungen durch ungleiche Beliebtheit oder Verfügbarkeit der Farben ausgleichen sollen.

Fazit
Insgesamt erlaubt dieser Ansatz eine robuste Identifikation des Effekts, sofern die Parallelitätsannahme glaubwürdig erscheint und keine systematischen Unterschiede in den Ausgangsbedingungen oder zeitlichen Trends zwischen den Gruppen bestehen. Das natürliche Experiment, das durch den technischen Fehler bei der Infografik ausgelöst wurde, liefert in diesem Fall eine hervorragende Grundlage für eine solche Analyse. Die Difference-in-Differences-Methode bietet also einen fundierten, kausal interpretierbaren Ansatz zur Quantifizierung des Einflusses von Kostentransparenz auf das Kaufverhalten.


  1. Zum Abschluss des Projekts sollen Sie sich das oben beschriebene natürliche Experiment genauer anschauen. Lesen Sie hierzu die Daten (Experiment3.csv) in R ein. Nennen Sie den Datensatz daten_exp3. Erstellen Sie eine Variable log_units, die die logarithmierte Anzahl an verkauften Einheiten darstellt.

Erstellen Sie weiterhin eine passende Grafik, die die durchschnittliche Anzahl der verkauften Produkte je Treatment pro Woche abbildet. Fügen Sie weiterhin eine vertikale Linie für den 28. Januar 2014 in ihre Grafik ein, welche die Einführung der Kostentransparenz markiert.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die Entwicklung der durchschnittlichen Verkaufszahlen in beiden Gruppen vor und nach dem 28. Januar ein. Gibt es visuelle Hinweise auf eine Wirkung der Kostentransparenz?

Hinweis: Für die Ableitung der Wochen aus dem Datumsformat kann die Funktion isoweek() aus dem Paket lubridate verwendet werden.


Beschreibung und Interpretation

Die dargestellte Grafik zeigt die durchschnittlich verkauften Einheiten pro Woche, getrennt nach Treatment- und Kontrollgruppe, im Zeitraum vor und nach dem 28. Januar 2014. An diesem Datum wurde in einem Online-Shop für einige Produktvarianten eine Infografik zur Kostentransparenz eingeführt. Diese Veränderung wird durch eine vertikale gestrichelte Linie markiert.

Die x-Achse stellt fortlaufend sortierte Kalenderwochen dar, nicht im typischen Kalenderformat, sondern als aufsteigende Zeitreihe. Die y-Achse gibt die durchschnittlich verkauften Einheiten der jeweiligen Gruppen pro Woche an. Dabei repräsentiert die orange Linie die Treatmentgruppe (Produkte mit transparenter Kosteninfografik) und die graue Linie die Kontrollgruppe (Produkte ohne Infografik).

Vor dem 28. Januar verlaufen die beiden Linien auf ähnlichem Niveau. Zwar gibt es Schwankungen, aber beide Gruppen zeigen eine relativ gleichmäßige Entwicklung mit nur geringfügigen Unterschieden. Dies spricht für die Gültigkeit der Paralleltrends-Annahme, also der Annahme, dass sich beide Gruppen ohne das Treatment in ähnlicher Weise weiterentwickelt hätten.

Nach der Einführung des Treatments ändert sich das Bild deutlich: Die Verkaufszahlen der Treatmentgruppe steigen sichtbar an, während die der Kontrollgruppe entweder konstant bleiben oder sogar leicht zurückgehen. Diese Divergenz ist ein visueller Hinweis auf einen positiven Effekt der Kostentransparenz auf die Verkaufszahlen.

  1. Gibt es visuelle Hinweise auf eine Wirkung der Kostentransparenz?
    Ja, die Grafik liefert einen deutlichen visuellen Hinweis auf einen positiven Effekt der Maßnahme: Nach Einführung der Infografik steigen die durchschnittlich verkauften Einheiten in der Treatmentgruppe stark an, während die Kontrollgruppe keine vergleichbare Veränderung zeigt. Die Differenz zwischen den Gruppen vergrößert sich also nach dem Treatment-Zeitpunkt, was ein zentrales Merkmal eines kausalen Effekts im Sinne eines Difference-in-Differences-Ansatzes ist.

  2. Wie entwickeln sich die Verkaufszahlen vor und nach dem 28. Januar in beiden Gruppen?
    Vor dem 28. Januar zeigen beide Gruppen ähnliche Verkaufsniveaus mit kleineren Schwankungen, aber keinem systematischen Auseinanderdriften. Nach der Einführung des Treatments steigt das Verkaufsniveau in der Treatmentgruppe deutlich, während es in der Kontrollgruppe nur leicht variiert. Das legt nahe, dass der beobachtete Unterschied auf das Treatment zurückzuführen ist und nicht auf andere zeitgleiche Entwicklungen.

  3. Was bedeutet ein gleich starker Anstieg beider Gruppen vor dem Treatment für die Interpretation?
    Wenn sich beide Gruppen vor dem Treatment ähnlich entwickeln, stärkt das die sogenannte „Parallel Trends“-Annahme. Diese ist eine zentrale Voraussetzung für die Gültigkeit eines Difference-in-Differences-Ansatzes. Sie besagt: Wenn es ohne Treatment keine systematischen Unterschiede in der Entwicklung gegeben hätte, dann kann jede Abweichung nach dem Treatment-Zeitpunkt dem Treatment selbst zugeschrieben werden. Das bedeutet: Der Differenzwert nach der Maßnahme, abzüglich des Differenzwerts vor der Maßnahme, kann als kausaler Effekt interpretiert werden, sofern keine anderen verzerrenden Einflüsse (z.B. zeitgleiche externe Schocks, selektive Zuweisung) vorhanden sind.


  1. Erstellen Sie eine (mehrere) weitere passende Grafik(en), die die durchschnittlich verkauften Einheiten pro Tag in Treatment und Kontrolle vor und nach der Einführung der Kostentransparenz abbildet. Ergänzen Sie in ihrer Grafik die jeweiligen Standardfehler als Fehlerbalken. Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die Unterschiede vor und nach der Einführung der Kostentransparenz ein.

Hinweis: Für die Erstellung der Grafik können Sie sich an Aufgabe 7 und 9 orientieren.


Beschreibung und Interpretation

Die dargestellte Grafik zeigt die durchschnittlich verkauften Einheiten pro Tag in den jeweiligen Gruppen – Treatment und Kontrolle – vor und nach der Einführung der Kostentransparenz am 28. Januar 2014. Die vier Zeitreihen sind farblich voneinander abgegrenzt und ermöglichen eine differenzierte Betrachtung der Entwicklungen. Die Treatment-Gruppe ist dabei in violett (vor der Einführung) und türkis (nach der Einführung) dargestellt, die Kontrollgruppe in grün (vorher) und rot (nachher). Zusätzlich zur Mittelwertentwicklung sind die zugehörigen Standardfehler als transparente Bänder visualisiert, die einen Eindruck über die statistische Unsicherheit der Mittelwerte erlauben.

Beim Vergleich der Linienverläufe fällt zunächst auf, dass die durchschnittlich verkauften Einheiten in der Treatment-Gruppe nach Einführung der Kostentransparenz sichtbar ansteigen. Die türkisfarbene Linie liegt dabei über weite Strecken oberhalb der violetten Vorher-Linie. Dies deutet darauf hin, dass die Einführung der transparenten Kosteninformation in der Treatment-Gruppe mit einem Anstieg der täglichen Verkaufszahlen einhergeht. Zwar sind Schwankungen erkennbar, jedoch liegt der allgemeine Trend nach dem Stichtag höher als zuvor. Besonders auffällig ist, dass dieser Anstieg in der Kontrollgruppe nicht in gleichem Maße auftritt. Die rote Nachher-Linie der Kontrollgruppe zeigt im Vergleich zur grünen Vorher-Linie nur geringe bis keine Veränderungen im Niveau, was auf eine relative Konstanz der Verkaufszahlen in der Kontrollgruppe schließen lässt.

Diese Unterschiede zwischen Treatment- und Kontrollgruppe vor und nach der Maßnahme bieten erste visuelle Hinweise auf einen möglichen kausalen Effekt der Kostentransparenz. Unter der Voraussetzung, dass beide Gruppen vor dem 28. Januar eine ähnliche Entwicklung gezeigt haben – was hier grafisch zumindest annähernd sichtbar ist – spricht der plötzliche, selektive Anstieg in der Treatment-Gruppe für einen behandlungsspezifischen Effekt. Auch die Breite der Standardfehlerbänder, die nach der Einführung der Maßnahme teils überlappen, zeigt, dass eine gewisse statistische Unsicherheit besteht, der Unterschied jedoch robust genug erscheint, um als Hypothese für weiterführende statistische Tests in Frage zu kommen.

Fazit
Insgesamt lässt sich aus der Grafik schließen, dass die Einführung der Kostentransparenz möglicherweise einen positiven Einfluss auf die Verkaufszahlen der entsprechenden Produktvarianten hatte. Die visuelle Trennung der Entwicklungen zwischen den beiden Gruppen deutet auf einen differenziellen Effekt hin, der mit Hilfe eines Difference-in-Differences-Ansatzes quantitativ genauer überprüft werden sollte. Die gezeigte Grafik stellt somit einen wichtigen ersten Schritt dar, um die Wirkung des natürlichen Experiments einzuordnen und in den weiteren analytischen Prozess zu überführen.


  1. In der vorherigen Aufgabe haben Sie den Effekt von Kostentransparenz auf die Verkaufszahlen anhand eines deskriptiven Vergleichs untersucht. Dabei haben Sie die durchschnittlich täglich verkauften Einheiten je Treatment vor und nach der Einführung der Transparenzmaßnahme grafisch gegenübergestellt. In dieser Aufgabe sollen Sie diesen Effekt nun ökonometrisch genauer untersuchen, indem Sie den Difference-in-Differences Ansatz in einem Regressionsrahmen anwenden.

Untersuchen Sie den Effekt der Einführung von Kostentransparenz auf die Verkaufszahlen mithilfe einer Difference-in-Differences Regression. Verwenden Sie hierfür Beobachtungen an Werktagen, sowie am Wochenende (Montag bis Sonntag), mit positiven Verkaufszahlen.

Erstellen Sie insgesamt zwei Regressionsmodelle:

Stellen Sie die Ergebnisse anschaulich dar. Beschreiben und interpretieren Sie Ihre Ergebnisse. Gehen Sie insbesondere auf folgende Aspekte ein.

Hinweis 1: Nutzen Sie für die Schätzung die feols()-Funktion aus dem fixest-Paket.

Hinweis 2: Nutzen Sie die logarithmierten täglichen Verkaufszahlen als abhängige Variable.


Difference-in-Differences:
Einfluss von Kostentransparenz auf Verkaufszahlen
Ohne Kontrolle Mit Wochentagseffekten
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
(Intercept) 1.285*** 1.334***
(0.049) (0.076)
treated 0.105+ 0.106+
(0.063) (0.063)
post 0.066 0.064
(0.077) (0.077)
treated × post 0.182+ 0.182+
(0.099) (0.099)
factor(weekday)Monday -0.046
(0.089)
factor(weekday)Saturday -0.036
(0.091)
factor(weekday)Sunday -0.164+
(0.091)
factor(weekday)Thursday -0.139
(0.089)
factor(weekday)Tuesday -0.041
(0.089)
factor(weekday)Wednesday 0.079
(0.089)
Num.Obs. 470 470
R2 0.060 0.081
R2 Adj. 0.054 0.063
AIC 716.7 718.3
BIC 733.3 759.8
RMSE 0.51 0.51
Std.Errors IID IID

Zur Untersuchung des kausalen Effekts von Kostentransparenz auf die Verkaufszahlen wurde ein Difference-in-Differences (DiD) Regressionsansatz angewandt. In beiden Modellen – dem Basismodell ohne Kontrollvariablen sowie dem Modell mit Kontrolle für Wochentagseffekte – diente die logarithmierte Anzahl der täglich verkauften Einheiten (log_units) als abhängige Variable. Die Schätzung erfolgte mithilfe der feols()-Funktion, wobei Interaktionseffekte zwischen der Behandlungsgruppe (treated) und dem Zeitraum nach Einführung der Transparenzmaßnahme (post) im Zentrum des Interesses standen.

Im Basismodell beträgt der Koeffizient für die Interaktion treated × post rund 0.182 und ist auf dem 10%-Niveau signifikant. Dies bedeutet, dass in der Treatmentgruppe nach der Einführung der Kostentransparenz die Verkaufszahlen im Durchschnitt etwa 18,2 % höher lagen als in der Kontrollgruppe – interpretiert als ein relativer Effekt, da die abhängige Variable logarithmiert ist. Dieser Effekt bleibt in der zweiten Regression, die zusätzlich die Effekte der einzelnen Wochentage kontrolliert, nahezu unverändert und beträgt ebenfalls 0.182, was die Robustheit des geschätzten Zusammenhangs unterstreicht. Die Kontrolle für Wochentagseffekte verbessert zwar das erklärte leicht (von 0.060 auf 0.081), hat jedoch kaum Einfluss auf die Schätzung des Haupteffekts.

Die Verwendung der logarithmierten Verkaufszahlen bringt dabei mehrere Vorteile mit sich. Erstens ermöglicht sie eine Interpretation der Regressionskoeffizienten als prozentuale Veränderungen, was in ökonomischen Kontexten oft intuitiver und praxisrelevanter ist. Zweitens reduziert sie potenzielle Verzerrungen, die durch starke Ausreißer bei den Verkaufszahlen entstehen könnten, und wirkt heteroskedastischen Strukturen entgegen, was die Effizienz der Schätzungen erhöht.

In Bezug auf die Kausalität lässt sich festhalten, dass das natürliche Experiment – basierend auf einem unbeabsichtigten Implementierungsfehler – eine quasi-zufällige Zuweisung des Treatments ermöglicht hat. Dadurch ist die Paralleltrendanahme plausibel, wonach sich die Verkaufszahlen in beiden Gruppen ohne Treatment parallel entwickelt hätten. Da zudem mit festen Zeit- und Gruppenindikatoren sowie einem Interaktionsterm gearbeitet wurde, lässt sich der Effekt von treated × post als plausibler kausaler Effekt der Kostentransparenz interpretieren – zumindest unter der Annahme, dass keine systematischen Störfaktoren gleichzeitig mit dem Treatment eingeführt wurden.

Die Kontrolle für Wochentagseffekte ist in diesem Kontext ebenfalls hilfreich, da sie typische Verkaufsschwankungen über die Woche hinweg berücksichtigt. Ohne diese Kontrolle könnten Unterschiede in der Verteilung von Wochenendtagen zwischen Kontroll- und Treatmentgruppe die Schätzung verzerren. Beispielsweise könnten sonntägliche Verkaufszahlen generell niedriger ausfallen, was ohne Kontrolle fälschlicherweise als Effekt des Treatments interpretiert werden könnte.

Fazit
Die Ergebnisse sprechen insgesamt für einen positiven Effekt der Maßnahme: Die Einführung von Kostentransparenz scheint – wenn auch mit begrenzter statistischer Signifikanz – zu einer spürbaren Erhöhung der Verkaufszahlen geführt zu haben. Angesichts der ökonomischen Relevanz eines Effekts von über 18 % wäre es durchaus sinnvoll, über eine Beibehaltung oder sogar Ausweitung der Transparenzstrategie nachzudenken – etwa durch Anwendung auf andere Produktlinien.

Allerdings sollten auch die potenziellen Probleme eines natürlichen Experiments berücksichtigt werden. Die Zuweisung zum Treatment erfolgte nicht vollständig zufällig, sondern war abhängig von technischen Umständen (bestimmte Farben mit und ohne Infografik). Unterschiede in Farbepräferenzen, Verfügbarkeiten oder Werbemaßnahmen könnten die Ergebnisse potenziell verzerren. Ebenso besteht die Gefahr ungemessener zeitgleich auftretender Einflüsse, etwa Marketingaktionen oder externe Ereignisse, die mit der Einführung der Infografik zusammenfielen. Diese könnten den beobachteten Effekt zumindest teilweise erklären.

Nichtsdestotrotz liefert die Analyse deutliche Hinweise auf einen positiven Effekt der Kostentransparenz. Sie illustriert, wie eine einfache visuelle Maßnahme das Vertrauen der Konsument:innen stärken und sich letztlich verkaufsfördernd auswirken kann – ein Befund, der sowohl ökonomisch als auch psychologisch von Bedeutung ist.


Literatur

Mohan, B., Buell, R. W., & John, L. K. (2020). Lifting the veil: The benefits of cost transparency. Marketing Science, 39(6), 1105-1121. https://doi.org/10.1287/mksc.2019.1200


Anhang

Mediator

Im Rahmen von Mediationen ist der Mediator eine Variable, die den erklärenden Zusammenhang zwischen einer unabhängigen und einer abhängigen Variable vermittelt. Dabei wird untersucht, inwieweit der Einfluss der unabhängigen Variablen (z.B. Kostentransparenz) auf die abhängige Variable (z.B. Kaufabsicht) über einen vermittelnden Mechanismus - wie das Vertrauen der Kunden - erfolgt.

  1. Mediatoreffekt: Der Mediatoren-Effekt, oft als ACME (Average Causal Mediation Effect) bezeichnet, beschreibt den indirekten Effekt, den die unabhängige Variable auf die abhängige Variable über den Mediator ausübt. Ist dieser Effekt signifikant, signalisiert dies, dass ein wesentlicher Teil des gesamten Einflusses über den vermittelnden Mechanismus läuft. Gleichzeitig kann ein nicht-signifikanter direkter Effekt (ADE - Average Direct Effect) darauf hindeuten, dass der Mediator den hauptsächlichen Erklärungsmechanismus darstellt.

  2. Funktion und Wirkung des Mediators: Analog zum Konzept der signalgebenden Funktion bei Statussymbolen - deren Wert unter anderem von der Exklusivität und dem sozialen Kontext abhängt - fungiert der Mediator als vermittelnder Kanal, der erklärt, wie und warum der ursprüngliche Zusammenhang zwischen zwei Variablen zustande kommt. Der Mediator „überträgt“ quasi den Effekt der unabhängigen Variable auf die abhängige Variable. Dadurch kann in Modellen, in denen der direkte Zusammenhang zwischen der unabhängigen und der abhängigen Variable durch die Einbeziehung des Mediators verschwindet oder abgeschwächt wird, abgeleitet werden, dass der Mechanismus über den Mediator läuft. Dies ermöglicht ein tieferes Verständnis der zugrundeliegenden psychologischen Prozesse - etwa wie das Vertrauen der Kunden die Wirkung von Kostentransparenz auf deren Kaufabsicht vermittelt.

Zusammengefasst spielt der Mediator eine zentrale Rolle bei der Aufklärung der kausalen Mechanismen, indem er als vermittelnder Faktor zwischen Ursache und Wirkung identifiziert wird. Die signifikante Vermittlung über den Mediator zeigt, dass nicht allein das Vorhandensein von Kostentransparenz entscheidend ist, sondern auch, inwiefern diese Transparenz das Vertrauen stärkt - was wiederum maßgeblich die Kaufabsicht beeinflusst. So liefert die Mediationsanalyse wertvolle Einsichten, die über einfache bivariate Zusammenhänge hinausgehen und die Komplexität kausaler Mechanismen innerhalb von sozialen oder marktorientierten Prozessen sichtbar machen.

Informationen zum Studiendesign des Experiments 1 und 2

Abbildung 1: Kostentransparenz Infografik

Abbildung 1: Kostentransparenz Infografik

Abbildung 2: Design der Schokoladenverpackung ohne und mit Kostentransparenz

Abbildung 2: Design der Schokoladenverpackung ohne und mit Kostentransparenz