Motivation

Earnings Conference Calls sind zentrale Informationsereignisse in Finanzmärkten. Hier kommuniziert das Management direkt mit Investoren und Analysten über die aktuelle Geschäftslage und Zukunftsaussichten. Die finanzwirtschaftliche Forschung zeigt, dass diese Calls erhebliche Kursbewegungen auslösen können - doch die zugrundeliegenden Mechanismen sind noch nicht vollständig verstanden.

Während traditionelle Finanztheorie von effizienten Märkten ausgeht, die alle verfügbaren Informationen sofort verarbeiten, zeigen empirische Studien, dass die Art der Kommunikation und das Sentiment der Aussagen eigenständige Erklärungskraft für Aktienkursreaktionen besitzen. Diese Erkenntnisse haben direkte praktische Relevanz: Banken nutzen Sentiment-Analysen für algorithmische Handelsstrategien, Hedge Fonds entwickeln systematische Ansätze zur Textauswertung, und Asset Manager integrieren qualitative Informationen in ihre Bewertungsmodelle.

In diesem Projekt kombinieren Sie Event Studies - eine etablierte Methode der empirischen Finanzforschung zur Messung von Informationseffekten - mit modernen Large Language Models zur systematischen Textanalyse. Sie untersuchen, ob und wie sich qualitative Aussagen des Managements in quantifizierbaren Marktreaktionen niederschlagen, und lernen dabei sowohl die methodischen Grundlagen der Kausalitätsidentifikation als auch den praktischen Umgang mit KI-gestützten Finanzanalysen kennen.

Event-Study-Methodik und theoretische Diskussion

  1. Lesen Sie das Kapitel “Event Studies” in Huntington-Klein (2021) und beantworten Sie die folgenden Fragen dazu:

Kann eine Eventstudie helfen, den kausalen Effekt eines Earnings Conference Calls auf die Aktienrendite eines Unternehmens zu identifizieren? Gehen Sie bei der Beantwortung dieser Frage insbesondere auf die nachfolgenden Punkte ein:


Kann eine Eventstudie helfen, den kausalen Effekt eines Earnings Conference Calls auf die Aktienrendite eines Unternehmens zu identifizieren?
Ja, eine Eventstudie kann dazu beitragen, den kausalen Effekt eines Earnings Conference Calls auf die Aktienrendite eines Unternehmens zu identifizieren, aber nur unter strengen Annahmen. Das Hauptziel ist es, die “anormalen Renditen” zu isolieren – das sind die Renditen, die nicht durch normale Marktbewegungen oder unternehmensspezifische Faktoren erklärt werden können, sondern direkt auf das Ereignis zurückzuführen sind. Die Eventstudie misst die Wirkung einer “Behandlung” (hier: der Earnings Call) auf das untersuchte Wertpapier, indem sie die Reaktion isoliert und von anderen Einflüssen bereinigt.

Welche Art von Variation nutzt eine Eventstudie zur Identifikation des Effekts?
Eine Eventstudie nutzt die zeitliche Variation des Ereignisses, um den Effekt zu identifizieren. Sie beobachtet die Aktienrendite eines Unternehmens im Ereignisfenster um den Zeitpunkt des Earnings Conference Calls. Die Annahme ist, dass alle anderen Informationen, die die Rendite beeinflussen könnten, entweder im Normalfall absorbiert werden (und so “normale” Renditen schätzbar sind) oder konstant sind bzw. keinen Einfluss haben. Die Eventstudie versucht, die Differenz der tatsächlichen Rendite zur erwarteten “Normalrendite” im Ereignisfenster als den Effekt des Earnings Calls zu interpretieren. Die Identifikation basiert somit auf der plötzlichen und unerwarteten Änderung der Information zum Zeitpunkt des Ereignisses, die sich in den Aktienkursen niederschlägt.

Welche Voraussetzung(en) müssen erfüllt sein, damit die Eventstudie eine gültige Kausalschätzung liefert?
Exogenität des Ereignisses (keine Störereignisse): Dies ist die wichtigste Bedingung für kausale Inferenz. Es dürfen keine anderen relevanten Informationen oder Ereignisse gleichzeitig mit dem Earnings Conference Call bekannt werden, die ebenfalls die Aktienrendite beeinflussen könnten. Der Earnings Call muss das einzige neue, informationsrelevante Ereignis im betrachteten Fenster sein.
Effiziente Märkte (semi-starke Form): Die Informationen aus dem Earnings Call müssen vom Markt sofort und vollständig verarbeitet werden. Eine verzögerte oder unvollständige Informationsverarbeitung würde die Messung verzerren.
Korrekte Spezifikation des Normalrenditemodells: Das Modell zur Schätzung der “normalen” Rendite (die Rendite, die ohne das Ereignis erwartet worden wäre) muss korrekt sein. Fehler im Modell können zu verzerrten abnormalen Renditen und damit zu falschen Kausalitätszuschreibungen führen.
Keine Selektionsverzerrung: Die untersuchten Unternehmen oder die Art der Calls dürfen sich nicht systematisch von anderen Unternehmen oder Calls unterscheiden, was die Ergebnisse beeinflussen könnte.
In der Praxis ist die Exogenität (Vermeidung simultaner Störereignisse) oft die größte Herausforderung.

Was bedeutet das “Joint-Test Problem” in diesem Kontext?
Das “Joint-Test Problem” (oder “Joint Hypothesis Problem”) bezieht sich auf die grundlegende Schwierigkeit, in Event Studies die Hypothese über die Markteffizienz von der Hypothese über die spezifische Reaktion auf ein Ereignis zu trennen. Wenn eine Eventstudie signifikante anomale Renditen identifiziert, testet sie gemeinsam (jointly) zwei Hypothesen:
Die Hypothese, dass die verwendeten Modelle zur Schätzung der “normalen” Renditen korrekt sind (d.h., das zugrunde liegende Finanzmarktmodell ist gültig).
Die Hypothese, dass das Ereignis tatsächlich eine Wirkung auf die Aktienrendite hat.
Das Problem ist, dass man bei einem signifikanten Ergebnis nicht eindeutig sagen kann, ob dieser Effekt auf eine tatsächliche Marktreaktion auf den Call zurückzuführen ist oder ob das Ergebnis lediglich eine Fehlklassifikation oder eine unzureichende Spezifikation des Marktmodells zur Folge hat. Man testet also nie nur die Wirkung des Ereignisses, sondern immer auch die Gültigkeit des verwendeten Finanzmarktmodells. Dies macht eine rein kausale Schlussfolgerung schwierig, da das Ergebnis auch auf ein möglicherweise fehlerhaftes Modell der Erwartungsbildung des Marktes zurückgeführt werden könnte.


Daten und Datenaufbereitung

Finanzmarktkennzahlen

  1. Sie sollten in einem ersten Schritt Finanzkennzahlen aus Datastream herunterladen. Insbesondere sollten Sie den Return Index (RI) und die Total Assets (WC02999) für alle Firmen im Euro Stoxx 600 Technology Index ( wir haben Ihnen die RIC Kürzel in der Readme bereitgestellt ) vom 01.01.2020 bis heute extrahieren.

Bitte laden Sie für den Return Index tägliche Daten herunter und für die Total Assets Quartalsdaten. Weiterhin sollten Sie den Total Return Index (RI) des Euro Stoxx 600 (RIC = .STOXX) herunterladen (auch tägliche Daten). Bitte achten Sie darauf alle Daten in Euro herunterzuladen.

Achten Sie darauf die RIC als eindeutige Identifikationskennung in ihren Datensatz aufzunehmen.

Das Institut für Finanzwirtschaft der Universität Ulm hat einen ausführlichen Guide zu Datastream erstellt, der Ihnen beim Download der Daten sicherlich helfen kann.

Die Universität Ulm stellt für den Download Remote-PCs zur Verfügung, auf die Sie sich von daheim aus einloggen können. Bitte buchen Sie sich hier einen Slot um Zugriff auf diese PCs zu erhalten: https://www.uni-ulm.de/mawi/iof/lehre/proposals-for-theses/datastream-and-workspace/

Sie sollten ihre Daten in Excel herunterladen und in ihrem Projekt im Unterordner data abspeichern.

Hinweis 1: Es empfiehlt sich zwei Tabellenblätter im Excel File anzulegen, eines für die täglichen Daten und eines für die Quartalsdaten

Hinweis 2: Datastream ist eine Datenbank, die Kennzahlen zur Finanzlage von börsennotierten Unternehmen weltweit beinhaltet. Die Lizenzen zu Datastream an der Universität Ulm werden von der Studienkommission Wirtschaftswissenschaften und der LBBW bezahlt und die Datenbank steht allen WiWi-Studierenden frei zur Verfügung. Nähere Informationen zu Datastream finden Sie hier (Bitte beachten: Sie müssen im Uninetz (z.B. über VPN) eingeloggt sein um die Informationen zu sehen und um sich auf die Remote-PCs loggen zu können).

Hinweis 3: Bei den Total Assets müssen Sie immer das Enddatum des vorherigen Jahres nehmen für den Download, d.h. Start Date wäre 31.12.2019


  1. Lesen Sie die Excel Datei, welche Sie in Aufgabe 2 erstellt haben, in R ein. Achten Sie darauf, dass diese Daten tidy und richtig formatiert sind. Joinen Sie die täglichen Daten mit den Quartalsdaten für die relevanten Firmen. Die Quartalsdaten zählen für das komplette Quartal zu dem diese hinzugemerged wurden.

Setzen Sie sich mit den Aktienkursen auseinander und beantworten folgende Fragen: - Sie wollen in Aufgabe 4 Renditen berechnen, warum sollten Sie Daten zum “Total Return Index” und nicht dem “Price” oder “Unadjusted Price” herunterladen? Schauen Sie sich zur Klärung dieser Frage den Guide der Uni Ulm zu Datastream genauer an. Diesen Guide sollten sie auch für den Download der Daten heranziehen.

Hinweis: In dem tidy Datensatz sollten Sie eine Spalte mit dem Unternehmensidentifier (RIC), eine mit dem Datum und eine mit der Variablen (RI bzw. Total Assets) haben


Der Total Return Index (RI) ist für die Renditeberechnung unerlässlich, da er, im Gegensatz zum reinen Preis oder Unadjusted Price, nicht nur die Kursentwicklung, sondern auch Dividendenzahlungen und andere Kapitalmaßnahmen (wie Aktiensplits) berücksichtigt. Der RI stellt sicher, dass alle Erträge, die ein Investor aus einer Anlage generiert (als wären Dividenden reinvestiert worden), korrekt abgebildet werden. Würde man nur den reinen Kurs betrachten, würde die tatsächliche Performance systematisch unterschätzt, da Dividenden und Anpassungen durch Kapitalmaßnahmen ignoriert würden. Der Uni Ulm Guide zu Datastream bestätigt, dass der Total Return Index der Standard für die Abbildung der Gesamtrendite ist und somit für valide finanzwirtschaftliche Renditeberechnungen unerlässlich.


Renditen berechnen

  1. In ihrem Datastream-Datensatz, welchen Sie in Aufgabe 2 bereits eingelesen und in Aufgabe 3 bearbeitet haben, sind die Total Return Indices (RI) der größten Unternehmen aus der Tech-Branche in Europa enthalten, sowie der Total Return Indix des Euro Stoxx 600. Der Euro Stoxx 600 ist ein großer, diversifizierter Aktienindex in Europa in dem die 600 größten Unternehmen gelistet sind. Sie sollten den Euro Stoxx 600 als Benchmark ( Rendite des Marktes ) für ihre betrachteten Unternehmen verwenden. Bitte berechnen Sie in dieser Aufgabe die Tagesrenditen aller Einzelunternehmen als:

\[\begin{equation} Rendite_{i,t} = \frac{RI_{i,t} - RI_{i,t-1}}{RI_{i,t-1}} \end{equation}\]

mit i = {jedes Einzelunternehmen im Datensatz} und t = {Tag}

und des Euro Stoxx 600 als:

\[\begin{equation} Rendite_{m,t} = \frac{RI_{m,t} - RI_{m,t-1}}{RI_{m,t-1}} \end{equation}\]

mit m = {Euro Stoxx 600} und t = {Tag}

Prüfen Sie auf NA in den Anfangszeilen und entfernen Sie diese.

Speichern Sie die Renditen der jeweiligen Unternehmen in einer neuen Variable Rendite ab und die Rendite des Euro Stoxx 600 als Marktrendite.



  1. In Aufgabe 1 hatten Sie sich bereits mit der Event-Study Methodik beschäftigt, welche Sie im weiteren Verlauf des Projektes anwenden sollen. Ein erster Schritt ist es, sogenannte Abnormale Renditen zu berechnen. Dies sollten Sie in dieser Aufgabe mit dem sogenannten Market-adjusted returns model tun. Bitte ziehen Sie dafür die Rendite des Marktindex von der Rendite des einzelnen Unternehmens pro Tag ab.

\[\begin{equation} AbnormaleRendite_t = Rendite_{i,t} - Rendite_{m,t} \end{equation}\]

Beantworten Sie dazu folgende Frage:

  • Warum ist es nötig die Marktrendite ( \(Rendite_{m,t}\) ) von der Rendite der Einzelaktien abzuziehen? Nutzen Sie ihre Erkenntnisse aus Aufgabe 1 zur Beantwortung dieser Frage.

Das Abziehen der Marktrendite von der Einzelaktienrendite ist ein Kernschritt der Event-Study-Methodik. Dies dient dazu, den kausalen Effekt eines spezifischen Ereignisses (wie eines Earnings Calls) auf die Aktienrendite zu isolieren. Aktienrenditen werden maßgeblich von allgemeinen Marktbewegungen beeinflusst, die nichts mit dem jeweiligen Unternehmen zu tun haben. Durch das Subtrahieren der Marktrendite wird dieser marktweite Einfluss herausgerechnet.
Dadurch soll die verbleibende abnormale Rendite ausschließlich den Anteil widerspiegeln, der auf die firmenspezifische Information des Ereignisses zurückzuführen ist. Dies ist entscheidend, um die in Aufgabe 1 besprochene Voraussetzung der Exogenität des Ereignisses zu erfüllen und eine validere Kausalschätzung zu erhalten, indem “Störgeräusche” des Gesamtmarktes kontrolliert werden.


Earnings Call-Transkripte von LSEG Workspace einlesen

Die Basis für alle weiteren Analysen sind die Abnormalen Renditen der einzelner Unternehmen, die Sie in den vorherigen Aufgaben berechnet haben. Jedoch benötigen Sie nun noch ein Event, dessen Effekt Sie im Rahmen der Eventstudie analysieren möchten. Hier kommen die bereits in der Motivation erwähnten Earnings-Conference-Calls ins Spiel, die Sie im weiteren Verlauf des Projekts näher analysieren sollten. Die Earnings Conference Calls finden für große Unternehmen in der Regel quartalsweise statt. Manche Unternehmen halten jedoch auch nur halbjährliche Earnings Conference Calls ab und andere verzichten ganz darauf.

  1. Wir haben Ihnen die Earnings Conference Calls aus LSEG Workspace für alle Firmen aus dem Euro Stoxx 600 Technology Sektor ab 2020 bis zum aktuellen Rand heruntergeladen und diese unter data/transcripts.zip bereitgestellt. Lesen Sie die Dateien in R ein. Ihr Datensatz sollte für jedes Transkript das RIC-Kürzel, Datum und den Text des Transkripts beinhalten, dies können Sie aus dem Namen der Datei extrahieren.

Hinweis: Das RIC Kürzel finden Sie im Namen der Datei (Beispiel: “2020-Jan-28-SAPG.DE-140242583050-Transcript.txt” -> “Datum-RIC-Nummer-Transcript.txt”)



Die Earnings Conference Calls laufen immer gleich ab: Zuerst spricht der CEO und meist CFO über die aktuellen Entwicklungen am Markt und wie das Unternehmen aktuell steht. Weiterhin werden Einschätzungen für die Zukunft angesprochen. Im zweiten Teil, der Q&A Sektion, dürfen Analysten Fragen an das Management stellen. Dieser Teil ist meist informativer als die vorbereiteten Statements des Managements, da die Fragen nicht vorher abgesprochen werden und das Management spontane Antworten bereithalten muss.

Sie sollen sich in diesem Projekt auf den zweiten Teil, d.h. die Q&A Section in den Earnings Conference Calls konzentrieren.

  1. Analysieren Sie im ersten Schritt die Earnings Conference Calls indem Sie einige davon überfliegen. Schauen Sie explizit nach Hinweisen, ob und wie die Q&A Sektion im Text von den anderen Inhalten abgetrennt ist. Anschließend sollten Sie diese Q&A Sektion in den Earnings Conference Calls in R extrahieren, da Sie nur diese Sektion in den späteren Aufgaben analysieren sollen.

Da es vorteilhaft für ihre weitergehenden Analysen ist möglichst kompakte Texte ohne Redundanzen zu haben, sollten Sie zusätzlich die Definitionen und Disclaimer Sektion am Ende des Earnings Calls entfernen.

Hinweis 1: Der Anteil der Q&A Sektion an der Gesamtkonversation liegt in der Regel unter 80%. Für manche Earnings Conference Calls ist dieser Anteil höher, aber hier würde ich empfehlen nachzuschauen, ob Sie die Q&A Sektion richtig extrahiert haben. Manchmal gibt es keine Q&A Sektion, dann sollte dort auch kein Text extrahiert werden.

Hinweis 2: Nutzen Sie das Paket stringr um Textmanipulationen vorzunehmen. In diesem Cheatsheet sehen Sie die Hauptanwendungen inkl. regulärer Ausdrücke, welche wichtig sind um mit Texten zu arbeiten.



  1. Stellen Sie in einer Grafik anschaulich dar, wie viele Worte in einem typischen Earnings Conference Call verwendet werden und wie viel davon die Q&A Sektion einnimmt.

Beschreiben Sie ihre Grafik.

Hinweis: Eventuell wollen Sie hier die Verteilungen zeigen o.ä.? Entscheiden Sie selbst, welche Grafik Sie produzieren.


Der vorliegende Plot stellt die Beziehung zwischen der Gesamtzahl der Wörter in einem Earnings Conference Call (ECC) und der Anzahl der Wörter, die spezifisch in der Q&A-Sektion dieses Calls verwendet werden, dar. Dabei repräsentiert die X-Achse die Gesamtzahl der Wörter im ECC, während die Y-Achse die Anzahl der Wörter in der Q&A-Sektion abbildet. Die Farbskala des Plots visualisiert zusätzlich das Verhältnis, also den Anteil der Q&A-Wörter zur Gesamtzahl der Wörter, und wird als “Q&A-Anteil” bezeichnet.

In der Interpretation dieses Plots fällt auf, dass Punkte, die nahe an der Diagonalen liegen, Calls kennzeichnen, bei denen der Q&A-Anteil sehr hoch ist, teilweise nahe 100%. Dies deutet darauf hin, dass in diesen Fällen ein Großteil des gesamten Transkripts der Fragerunde gewidmet war. Des Weiteren ist ersichtlich, dass viele der analysierten Calls einen Q&A-Anteil unter 80% aufweisen, was als typisch für Earnings Conference Calls gelten kann. Es gibt jedoch auch einzelne Calls, die sehr hohe Q&A-Anteile von nahezu 100% zeigen. Solche Ausprägungen könnten auf besonders ausführliche Q&A-Abschnitte oder andere Spezifika des jeweiligen Calls hinweisen. Zusammenfassend liefert der Plot einen guten Überblick über die Verteilung sowohl der Länge als auch des relativen Anteils der Q&A-Sektionen innerhalb der gesamten Earnings Conference Calls.

Für die Selektion der Q&A-Sektion wurde methodisch vorgegangen, indem Transkripte zunächst auf typische Q&A-Überschriften wie „Questions and Answers“, „Q&A“, „Q and A“ oder „q-and-a“ (kleingeschrieben mit Bindestrich) untersucht wurden. Speziell für das Startmuster „Questions and Answers“ wurde die Erkennung nur dann aktiviert, wenn es von einer Trennlinie (mindestens 5 Gleichheitszeichen) direkt davor begleitet wurde, um Fehlinterpretationen zu vermeiden. Die Suche nach dem Beginn der Q&A-Sektion erfolgte sequenziell, wobei das erste gefundene Startmuster mit Priorität auf „Questions and Answers“ mit Trennlinie herangezogen wurde. Das Ende der Q&A-Sektion wurde über typische Endabschnitte wie „Disclaimer“, „Definitions“ oder „End of Q&A“ bestimmt; falls kein solches Endmuster gefunden wurde, wurde die Sektion bis zum Ende des Dokuments angenommen. Transkripte ohne eine erkennbare Q&A-Überschrift wurden von der Analyse ausgeschlossen, um kompakte und redundanzarme Q&A-Sektionen für die weitere Verarbeitung zu gewährleisten.


Themenkategorien und Sentiment-Scores

Nachdem Sie nun die Earnings Conference Calls in R eingelesen und einen ersten Eindruck von deren Inhalt erhalten haben sollten Sie diese mit einem LLM (konkret mit Google Gemini) analysieren. Dafür sollten Sie einen Zero-Shot Prompt erstellen und mit Hilfe dieses Prompts die Aussage der Q&A Sektionen der Earnings Conference Calls analysieren.

  1. Entwickeln Sie einen Zero-Shot Prompt für ein Large Language Model (LLM), der Earnings Conference Call Transcripts analysiert und strukturierte Sentiment-Bewertungen ausgibt. Bitte beachten Sie dabei folgende Punkte:

Zielkategorien:

  • Unternehmensperformance (Finanzlage, Wachstumschancen, Unternehmensrisiken)
  • Marktumfeld (Branche, Wettbewerb, externe Faktoren)

Output-Format:

  • JSON-Struktur mit Sentiment-Scores von -1 (sehr negativ) bis +1 (sehr positiv)
  • Keine zusätzlichen Erklärungen oder Markdown-Formatierung

Sie sollten in ihrem Prompt nach einem JSON Output verlangen (strukturiertes Format), welchen Sie mit dem Paket jsonlite gut in R verarbeiten können.

Hinweis 1: Im Anhang ist eine Erklärung für die Unterschiede zwischen einem Zero-Shot Prompt, einem One-Shot Prompt und einem Few-Shot Prompt

Hinweis 2: Wir haben Ihnen ein Tutorial zusammengestellt, welches das Prompting an einem Beispiel zeigt.


Prompt:

## Bitte analysiere den folgenden Text aus der Q&A-Sektion eines Earnings Conference Calls. Nutze dabei eine geringe Kreativität ( temperature = 0.2). Gib anschließend eine strukturierte Sentiment-Bewertung für die beiden Kategorien Unternehmensperformance und Marktumfeld aus.
## 
## Bewerte jede Kategorie mit einem Sentiment-Score von -1 (sehr negativ) bis +1 (sehr positiv).
## 
## Gib ausschließlich ein JSON-Objekt zurück, ohne Text, ohne Einleitung, ohne Erklärung und ohne Markdown-Formatierung, sodass die Antwort direkt in R mit fromJson eingelesen werden kann:
## 
## {
##   "Unternehmensperformance": <Sentiment-Score>,
##   "Marktumfeld": <Sentiment-Score>
## }
## 
## Text zur Analyse:
## %s

  1. Im nächsten Schritt sollten Sie sich in das Paket ellmer einarbeiten. Durch ellmer erhalten Sie Zugriff auf alle gängigen LLMs mittels R über einen API Zugang. Wir haben ihnen für dieses Projekt ein Google Konto pro Gruppe erstellt und den API Schlüssel für jede Gruppe in das dazugehörige Repo (Readme) gepushed.
  • Lesen Sie sich in das ellmer Paket ein und wie Sie den API Schlüssel für Google Gemini in ihrer .Renviron Datei hinterlegen können
  • Untersuchen Sie die unterschiedlichen Modelle, die Google zur Verfügung stellt und deren Ratelimits: https://ai.google.dev/gemini-api/docs/models?hl=de

Bitte beantworten Sie folgende Fragen:

  • Was sind die Vorteile/Nachteile der einzelnen Google Modelle?
  • Welches (kostenlose) Modell würden Sie für ihre aktuellen Analysen bevorzugt einsetzen? Begründen Sie!
  • Welche Möglichkeiten haben Sie, nicht in die Ratelimits zu kommen?
  • In ellmer können Sie mittels dem params() Parameter auch die Temperatur ihres Modells einstellen. Was ist mit der Temperatur gemeint und was sind die Vorteile/Nachteile einer niedrigen Temperatur?

Was sind die Vorteile/Nachteile der einzelnen Google Modelle?
Betrachtet man die von Google angebotenen Gemini-Modelle im Kontext der aktuellen Analyse, so bieten diese unterschiedliche Vor- und Nachteile. Das Gemini 2.5 Flash Modell, als die neueste Inkarnation der “Flash”-Reihe, ist für extrem hohe Volumen und schnelle Ausführung zu geringen Kosten optimiert. Es bietet voraussichtlich verbesserte Fähigkeiten in Bezug auf Geschwindigkeit und Effizienz bei gleichzeitig großem Kontextfenster, ist jedoch bei sehr komplexen Schlussfolgerungen möglicherweise weniger präzise als größere Modelle. Das Gemini 2.5 Pro Modell hingegen ist für komplexere und anspruchsvollere Aufgaben konzipiert, die eine höhere Inferenzqualität erfordern und ebenfalls über ein sehr großes Kontextfenster verfügen. Dies geht jedoch voraussichtlich mit höheren Kosten und einer langsameren Verarbeitung pro Anfrage einher. Das ältere Gemini 1.5 Pro Modell bietet ein ausgewogenes Verhältnis von Leistung und Fähigkeiten für eine breitere Palette komplexerer Aufgaben und verfügt ebenfalls über ein 1-Million-Token-Kontextfenster, ist aber im Vergleich zu den 2.5-Modellen weniger leistungsfähig und teurer.

Welches (kostenlose) Modell würden Sie für ihre aktuellen Analysen bevorzugt einsetzen?
Für die Sentiment-Analyse von 429 Earnings Conference Call Transkripten würde Google Gemini 2.5 Flash bevorzugt eingesetzt. Die Begründung hierfür liegt in seiner Optimierung für hohe Volumen, seiner Geschwindigkeit und Kosteneffizienz, welche bei der Verarbeitung einer so großen Menge an Transkripten entscheidend sind. Obwohl Gemini 2.5 Pro potenziell nuanciertere Ergebnisse liefern könnte, ist für die breite Sentiment-Analyse über viele Dokumente hinweg die Effizienz und das Kosten-Nutzen-Verhältnis des Flash-Modells in der Regel überlegen.

Welche Möglichkeiten haben Sie, nicht in die Ratelimits zu kommen?
Ein wichtiger Aspekt bei der Nutzung der Google-API sind die gesetzten Ratelimits, die die Anzahl und Häufigkeit der Anfragen beschränken. Um diese Limits nicht zu überschreiten, empfiehlt es sich, Anfragen so effizient wie möglich zu gestalten, beispielsweise durch kurze und präzise Prompts, die wenig Tokens verbrauchen. Ebenso hilfreich ist das Zwischenspeichern (Caching) von Ergebnissen, um wiederholte API-Anfragen zu vermeiden. Große Anfragen sollten in kleinere Teile aufgeteilt werden, und ein verantwortungsvoller Umgang mit der API-Nutzung durch Monitoring und Steuerung der Anfragefrequenz ist ratsam.

Was ist mit der Temperatur gemeint und was sind die Vorteile/Nachteile einer niedrigen Temperatur?
Ein weiterer Parameter, den man in ellmer über die Funktion params() steuern kann, ist die sogenannte Temperatur. Diese beeinflusst, wie kreativ oder zufällig die Antworten des Modells ausfallen. Eine niedrige Temperatur (beispielsweise zwischen 0.1 und 0.3) führt zu konsistenten, deterministischen und vorhersehbaren Antworten, die besonders bei faktenbasierten oder analytischen Aufgaben von Vorteil sind. Nachteilig kann sein, dass die Antworten dadurch monoton oder weniger abwechslungsreich wirken. Höhere Temperaturen (zum Beispiel ab 0.7) erlauben kreativere und vielfältigere Ausgaben, bergen aber das Risiko, dass die Antworten ungenauer oder spekulativer werden. Für unser Projekt halten wir eine niedrige bis mittlere Temperatur um 0.2 bis 0.3 für optimal, um verlässliche und nachvollziehbare Ergebnisse zu erzielen.


  1. Nutzen Sie ihren in Aufgabe 9 erstellten Prompt mit dem ellmer Paket und ihrem Google API-Key um alle 431 Earnings Conference Call Transkripte zu analysieren. Nutzen Sie für ihre Analyse das Modell Google Gemini 2.0-flash oder Google Gemini 2.5-flash.

Speichern Sie die Ergebnisse ihrer Analyse in einem strukturierten Tibble ab. Anschließend sollten Sie den Datensatz auch unter data/sentiment.Rds abspeichern.

Stellen Sie ihre Ergebnisse in einer Tabelle dar und beschreiben diese kurz:

  • Wie ist der Mittelwert, Standardabweichung und Median der Einschätzung bezüglich Unternehmensperformance und Marktumfeld in ihren Earnings Conference Calls?

Hinweis 1: Achten Sie darauf nicht bei jedem Knitten die Analyse neu zu starten, sondern setzen Sie den Chunk dieser Aufgabe auf eval = FALSE und lassen Sie die Analyse nur einmal durchlaufen und speichern Sie die Ergebnisse ab (und laden diese später um damit weiterarbeiten zu können)

Hinweis 2: Achten Sie auf ihre Ratelimits und beanspruchen Sie den API Zugriff nicht zu stark, z.B. durch den Einbau von “sleep”-Zeiten in ihrem Code


Sentiment Scores der Earnings Conference Calls
Kennzahl Unternehmensperformance Marktumfeld
Mittelwert 0.731 0.241
Standardabweichung 0.286 0.500
Median 0.800 0.400

Beschreibung der Ergebnisse:

Die Ergebnisse zeigen, dass der Mittelwert für die Einschätzung der Unternehmensperformance bei 0.731 liegt, was auf eine tendenziell positive durchschnittliche Einschätzung über alle analysierten Calls hinweist. Die Standardabweichung von 0.286 ist vergleichsweise gering und deutet darauf hin, dass die individuellen Einschätzungen nicht extrem stark vom Mittelwert abweichen, was eine relativ hohe Konzentration der Meinungen impliziert. Der Median von 0.800 ist höher als der Mittelwert, was eine mögliche leichte Linksschiefe in der Verteilung suggeriert, bei der ein Großteil der Daten auf der höheren Seite des Mittelwerts liegt.

Für das Marktumfeld beträgt der Mittelwert 0.241, was auf eine leicht positive, aber deutlich neutralere durchschnittliche Einschätzung hindeutet als die der Unternehmensperformance. Die Standardabweichung von 0.500 ist im Vergleich zur Unternehmensperformance deutlich höher, was auf eine größere Streuung und somit eine breitere Verteilung der Einschätzungen zum Marktumfeld hinweist; hier gibt es eine größere Varianz in den Meinungen. Der Median von 0.400 ist höher als der Mittelwert, was auch hier auf eine mögliche Linksschiefe in der Verteilung der Marktumfeldeinschätzungen hindeuten könnte.

Zusammenfassend lässt sich festhalten, dass die Unternehmensperformance tendenziell positiver eingeschätzt wird als das allgemeine Marktumfeld. Während die Einschätzungen zur Unternehmensperformance mit einem Mittelwert von 0.731 relativ optimistisch sind und eine geringere Streuung aufweisen (Standardabweichung 0.286), ist die Einschätzung des Marktumfelds mit einem Mittelwert von 0.241 deutlich neutraler und gleichzeitig stärker variierend (Standardabweichung 0.500). Die Mediane bestätigen diese Tendenzen und deuten in beiden Fällen auf eine Konzentration der Werte auf der positiveren Seite des Spektrums hin, wobei insbesondere bei der Unternehmensperformance ein großer Teil der Einschätzungen sehr positiv ausfällt. Die höhere Standardabweichung beim Marktumfeld könnte auf größere Unsicherheit oder divergentere Meinungen bezüglich der allgemeinen Marktbedingungen hindeuten.


Sie haben in der vorherigen Aufgabe die Stimmung bezüglich der Kategorien Unternehmensperformance und Marktperformance in den Earnings Conference Calls bestimmt. Eine Frage wäre, ob sich diese Stimmung über die Zeit hinweg verändert hat. In der folgenden Aufgabe sollen Sie sich die durchschnittliche Stimmung in diesen zwei Kategorien für die einzelnen Jahre in ihrem Datensatz näher anschauen.

  1. Erstellen Sie eine geeignete Grafik um die Stimmung aller Earnings Conference Calls eines Jahres zu visualisieren. Tragen Sie separat die Stimmung bezüglich Unternehmensperformance und Marktumfeld ab.

Beschreiben Sie ihre Grafik.

Interpretieren Sie diese Grafik, insbesondere im Hinblick auf die gesamtwirtschaftlichen Ereignisse der letzten fünf Jahre. Hätten Sie die Ergebnisse in dieser Art erwartet?

Hinweis: Sie sollten sich hier eine sinnvolle Grafik überlegen, welche die Stimmungslage über die Zeit gut darstellt.


Beschreibung der Visualisierung:

Zur Darstellung der Stimmung in Earnings Conference Calls (ECCs) wurden mithilfe eines LLM (Google Gemini 2.5 Flash) Sentiment-Scores in drei Kategorien eingeteilt:

  • Positiv: Score > +0.1
  • Neutral: Score zwischen -0.1 und +0.1
  • Negativ: Score < -0.1

Diese konservative Einteilung reduziert Überinterpretationen kleiner Schwankungen. Die Visualisierung zeigt den prozentualen Anteil der Kategorien je Jahr, getrennt nach Unternehmensperformance und Marktumfeld. Die Farben sind intuitiv gewählt: Grün für positiv, Orange für neutral und Rot für negativ. Prozentwerte werden nur bei Anteilen ab 3 % angezeigt, um Überlagerungen zu vermeiden.

Zusätzlich zeigt die Grafik, wie sich die Stimmung im Zeitverlauf entwickelt, was mit einer zusätzlichen Analyse der durchschnittlichen Sentiment-Scores pro Jahr gut korreliert: So liegt das Sentiment für die Unternehmensperformance in den meisten Jahren deutlich positiver als das zum Marktumfeld, was sich auch in der relativen Stabilität der positiven Kategorien widerspiegelt.

Interpretation der Ergebnisse:

Die Visualisierung zeigt wirtschaftlich nachvollziehbare Entwicklungen: Im Jahr 2020, das stark vom COVID-19-Schock geprägt war, nahm der Anteil negativer Stimmungen insbesondere beim Marktumfeld deutlich zu, während das Unternehmenssentiment vergleichsweise stabil blieb, was auf eine optimistischere Selbsteinschätzung der Firmen hindeutet.

Im Jahr 2021 stiegen die neutralen Einschätzungen an, was auf eine vorsichtige Stabilisierung und Anpassung des Marktes nach der ersten Krisenphase schließen lässt.

Im Jahr 2022 ging der Anteil positiver Bewertungen in beiden Kategorien spürbar zurück, beeinflusst durch geopolitische Unsicherheiten wie den Ukrainekrieg, Inflation und steigende Zinsen, wobei das Marktumfeld besonders stark betroffen war.

Für die Jahre 2023 und 2024 sind leichte Erholungen erkennbar, wobei die Unternehmensperformance weiterhin optimistischer bewertet wird als das Umfeld.

Der Unterschied zwischen Unternehmens- und Marktsentiment könnte die Tendenz der Unternehmen widerspiegeln, ihre Lage positiver darzustellen als es das makroökonomische Umfeld zulässt, was auf eine gewisse Resilienz oder anhaltenden Optimismus schließen lässt.

Einordnung im Kontext der Eventstudienlogik (vgl. Aufgabe 1):

Diese Ergebnisse lassen sich gut in die Eventstudienlogik einordnen: Earnings Calls sind wichtige Informationsereignisse, deren Wirkung sich in den Stimmungsschwankungen widerspiegelt. Die schnelle Reaktion des Sentiments auf externe Schocks spricht für eine effiziente Informationsverarbeitung durch den Markt. Gleichzeitig zeigen die Daten die Grenzen kausaler Interpretation in turbulenten Zeiten, in denen externe Einflüsse schwer von spezifischen Eventwirkungen zu trennen sind (Joint-Test-Problem).

Fazit:

Die Analyse zeigt, dass sich die Stimmung in Earnings Conference Calls systematisch entlang realwirtschaftlicher Ereignisse verschiebt. Die Kombination aus Anteilsvisualisierung und Jahresmittelwerten gibt einen umfassenden Überblick über die Sentimententwicklung. Die differenzierte Betrachtung von Unternehmens- und Markteinschätzungen liefert wertvolle Erkenntnisse für weitere Eventstudienanalysen.

Hinweis: Prozentwerte in den Balken wurden bewusst nur ab einem Anteil von 3 % angezeigt, um die Lesbarkeit zu verbessern.


Eventstudie

Um zu evaluieren, ob die Earnings Conference Calls tatsächlich einen Einfluss auf die Aktienkurse der einzelnen Unternehmen hatten können Sie eine sogenannte Eventstudie durchführen, welche Sie bereits in Aufgabe 1 kennen gelernt haben. Bei einer Eventstudie betrachten Sie nur die Zeit (bei uns die Tage) unmittelbar vor oder nach einem Event. In diesem Projekt ist ein Event ein Earnings Conference Call des jeweiligen Unternehmens. Sie sollen in diesem Projekt herausfinden, wie sich über alle Unternehmen hinweg die Earnings Conference Calls auf die Aktienrenditen auswirken.

  1. Verbinden Sie den Datensatz über die Stimmung der Earnings Conference Calls (sentiment.Rds) zu den einzelnen Unternehmen mit den abnormalen Renditen und speichern diesen Datensatz als gesamtdatensatz in R ab. Sie können das RIC-Kürzel und Datum für den Join verwenden. Sollte der Earnings Conference Call an keinem Handelstag stattgefunden haben, so joinen Sie bitte mit dem darauffolgenden Handelstag.

Hinweis: Die Funktion cumsum() könnte für diese Aufgabe hilfreich sein


Kontext und Zielsetzung:

In dieser Aufgabe verbinden wir die Sentiment-Daten der Earnings Conference Calls mit den abnormalen Renditen der Unternehmen, um die Wirkung der Events auf die Aktienkurse zu untersuchen. Dabei erstellen wir eine Event-Variable, kumulierte Renditen und weitere Dummy-Variablen, die in den folgenden Analysen verwendet werden können.

Interpretation und Bedeutung: To-Do: Einfügen: Car101_ hier wurde die Summe erstellt, aber falls ein handelstag nicht verfügbar war, so wurde der nächst kleinere/ größere gewählt

Der so erzeugte Datensatz verbindet präzise die Sentiment-Einschätzungen der Earnings Calls mit den zugehörigen abnormalen Renditen. Die Event-Variable ermöglicht eine genaue Analyse des Verhaltens der Aktienkurse im Zeitraum von fünf Handelstagen vor bis fünf Handelstagen nach dem Call.

Die kumulierten abnormalen Renditen über das breite Fenster (-5 bis +5 Tage) sowie das engere Fenster (-1 bis +1 Tage) erlauben eine differenzierte Betrachtung der Marktreaktionen. Die Dummy-Variablen für die Stimmungs-Kategorien unterstützen die Untersuchung, ob und wie sich die Marktreaktionen je nach positiver, neutraler oder negativer Stimmung unterscheiden.

Jahresdummies gewährleisten, dass makroökonomische und zeitliche Effekte in den anschließenden Analysen kontrolliert werden können, was die Validität der Ergebnisse erhöht.

Fazit:

Mit diesem Gesamtdatensatz wurde eine solide Basis geschaffen, um die kausalen Effekte von Earnings Conference Calls auf Aktienrenditen zu untersuchen. Die klare Dokumentation und robuste Umsetzung sichern die wissenschaftliche Qualität und Nachvollziehbarkeit des Projekts.


  1. Erstellen Sie je ein Liniendiagramm für die von ihnen betrachteten Unternehmen: Eines für die Stimmung bezüglich der Unternehmensperformance und eines bezüglich der Marktperformance.

Sie sollten in ihren Grafiken die kumulierten Renditen im Zeitraum [-5,5] Tage um einen Earnings Conference Call darstellen. - Die Variable “Event” sollte die Tage vor und nach dem Earnings Conference Call enthalten ([-5,5]) und auf der x-Achse dargestellt werden - Die Variable ar_505 sollte die durchschnittliche kumulierte abnormale Rendite für den jeweiligen Tag auf der y-Achse abtragen (für alle Unternehmen in ihrem Datensatz) - In jeder Grafik sollten Sie eine extra Linie zeichnen für Earnings Conference Calls mit einer positiven/negativen und neutralen Stimmung und deren Einfluss auf den Aktienmarkt

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie hierbei insbesondere darauf ein, welche Erwartungen Sie auf der Basis ihrer Lektüre aus Aufgabe 1 hatten und in wie weit diese Erwartungen sich erfüllt haben.

Hinweis: In diesen Grafiken stellen Sie nicht jedes Event (d.h. die Auswirkungen eines jeden Earnings Conference Calls) einzeln dar, sondern gesamt für alle Earnings Conference Calls.


Zielsetzung:

In dieser Aufgabe visualisieren wir den Einfluss der Earnings Conference Calls auf die kumulierten abnormalen Renditen im Ereignisfenster von [-5,5] Tagen. Die Grafiken zeigen die durchschnittlichen kumulierten abnormalen Renditen (ar_505) getrennt nach den Stimmungs-Kategorien (positiv, neutral, negativ) für die Einschätzungen zur Unternehmensperformance und zum Marktumfeld.

Beschreibung und Interpretation:

Die beiden Liniendiagramme visualisieren die durchschnittlichen kumulierten abnormalen Renditen (ar_505) im Zeitraum von fünf Tagen vor bis fünf Tagen nach den Earnings Conference Calls. Die Darstellungen sind jeweils nach der Stimmung der Calls in den Kategorien „positiv“, „neutral“ und „negativ“ getrennt – für die Unternehmensperformance und das Marktumfeld.

Bei der Unternehmensperformance zeigen sich klare und erwartungsgemäße Unterschiede: Earnings Calls mit positiver Stimmung führen zu einem kontinuierlichen Anstieg der kumulierten abnormalen Renditen, der besonders unmittelbar nach dem Eventtag (Tag 0) stark ausgeprägt ist und eine maximale positive Reaktion an Tag +5 erreicht. Negative Stimmungen sind dagegen mit einem deutlichen Rückgang der kumulierten abnormalen Renditen verbunden, der bereits vor dem Eventtag leicht einsetzt und nach dem Event weiter verstärkt wird. Neutrale Stimmungen resultieren in verhältnismäßig stabilen Renditen ohne signifikante Ausschläge. Dieses Muster unterstützt die Annahme effizienter Märkte, in denen relevante Informationen aus Earnings Conference Calls schnell und differenziert in den Kursen reflektiert werden.

Im Vergleich hierzu sind die Effekte für das Marktumfeld insgesamt schwächer ausgeprägt, jedoch zeigen sich ähnliche Trends: Positive Stimmungen sind mit leichten positiven Renditeentwicklungen verbunden, negative Stimmungen führen zu moderaten Rückgängen, und neutrale Stimmungen bleiben nahe am Nullpunkt der kumulierten abnormalen Renditen. Dies weist darauf hin, dass firmenspezifische Informationen einen stärkeren Einfluss auf die Kursentwicklung haben als allgemeine Marktsentiments, was im Kontext der Eventstudienlogik plausibel ist.

Die deutlichsten Marktreaktionen treten unmittelbar um den Eventtag auf, was die theoretische Erwartung bestätigt, dass Finanzmärkte neu verfügbare Informationen aus Earnings Conference Calls effizient und zeitnah verarbeiten. Die klare Trennung der Kurven nach Stimmungskategorien verdeutlicht, dass nicht nur die Existenz eines Events, sondern insbesondere die qualitative Einschätzung (Sentiment) dessen Inhalt entscheidend für die Kursentwicklung ist.

Diese empirischen Ergebnisse erfüllen die in Aufgabe 1 formulierten Erwartungen bezüglich der Kausalität von Earnings Conference Calls auf Aktienrenditen und der Funktionsweise effizienter Märkte. Die Analyse zeigt, dass positive, neutrale und negative Stimmungen aus den Calls differenzierte und signifikante Marktreaktionen auslösen.

Für eine weiterführende Analyse wäre es empfehlenswert, die statistische Signifikanz der beobachteten Effekte zu prüfen und mögliche Einflussfaktoren wie Branchenzugehörigkeit, Marktvolatilität oder simultane Ereignisse zu berücksichtigen. Auch die Rolle der Informationsqualität und der Marktteilnehmererwartungen könnte näher untersucht werden.

Fazit:

Die Visualisierungen belegen eindrücklich, dass die Stimmung in Earnings Conference Calls einen signifikanten und differenzierten Einfluss auf die kumulierten abnormalen Renditen ausübt. Die Ergebnisse bestätigen zentrale Hypothesen aus der Eventstudienliteratur und unterstreichen die Relevanz qualitativer Informationsaspekte für die Marktreaktionen. Dies liefert wertvolle Erkenntnisse für Investoren, Unternehmen und Forschende im Bereich der Finanzmarktanalyse.

Zusammenfassend bieten die Visualisierungen einen überzeugenden empirischen Nachweis für die Rolle von Sentiment in der Kapitalmarktreaktion auf Unternehmenskommunikation und bestätigen die Relevanz von Eventstudien für die Analyse von Marktreaktionen.


Regressionen

Sie haben bisher den Einfluss der Earnings Conference Calls auf die Aktienrendite der größten europäischen Unternehmen im Technologie-Sektor visuell betrachtet. Im letzten Abschnitt dieser Projektarbeit analysieren Sie ihre Daten mittels linearer Regressionen.

  1. In dieser Aufgabe sollten Sie zwei Regressionen erstellen:

Regressieren Sie die kumulierten abnormalen Renditen um das Event car_101 auf die Dummyvariablen

Diese Dummyvariablen geben die Stimmung in den Earnings-Conference Calls wieder.

Beschreibung und interpretieren Sie ihre Regressionsergebnisse und gehen Sie dabei auch auf folgende Fragen ein:


Regressionsergebnisse des Einflusses von Stimmungen auf kumulierte abnormale Renditen
Regression 1: Negative Stimmungen Regression 2: Positive Stimmungen
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
(Intercept) 0.0171*** -0.0464***
(0.0020) (0.0076)
negativ_firm -0.0587***
(0.0085)
negativ_market -0.0099**
(0.0038)
positiv_firm 0.0537***
(0.0081)
positiv_market 0.0099**
(0.0038)
Num.Obs. 2907 2907
R2 0.023 0.022
R2 Adj. 0.023 0.021
AIC -5677.1 -5673.5
BIC -5653.2 -5649.6
Log.Lik. 2842.566 2840.747
F 34.645 32.786
RMSE 0.09 0.09

Beschreibung der Regressionsanalysen:

Für diese Aufgabe wurden zwei lineare Regressionen erstellt, um den Einfluss von Stimmungen aus Earnings Conference Calls auf die kumulierten abnormalen Renditen im Ereignisfenster von Tag -1 bis Tag +1 (car_101) zu analysieren.

Regression 1: Diese Regression untersucht, wie sich die car_101 durch negative Stimmungen verändert. Die unabhängigen Variablen sind negativ_firm (eine Dummy-Variable für eine negative Einschätzung der Unternehmensperformance) und negativ_market (eine Dummy-Variable für eine negative Einschätzung des Marktumfelds).

Regression 2: Diese Regression analysiert den Einfluss positiver Stimmungen auf die car_101. Die unabhängigen Variablen sind positiv_firm (eine Dummy-Variable für eine positive Einschätzung der Unternehmensperformance) und positiv_market (eine Dummy-Variable für eine positive Einschätzung des Marktumfelds).

Interpretation der Regressionsergebnisse:

Regression 1: Negative Stimmungen

Regression 2: Positive Stimmungen

Gesamteinschätzung

Die Regressionsergebnisse zeigen konsistent, dass sowohl negative als auch positive Stimmungen, die in Earnings Conference Calls ausgedrückt werden, einen statistisch signifikanten Einfluss auf die kumulierten abnormalen Renditen haben. Negative Stimmungen sind mit sinkenden Renditen assoziiert, während positive Stimmungen zu steigenden Renditen führen. Firmen-spezifische Stimmungen haben dabei einen deutlich stärkeren Einfluss als marktweite Stimmungen. Die geringen R-squared-Werte in beiden Modellen weisen jedoch darauf hin, dass die betrachteten Stimmungs-Dummyvariablen nur einen kleinen Teil der Variation in den kumulierten abnormalen Renditen erklären, was bedeutet, dass andere, nicht im Modell enthaltene Faktoren einen wesentlich größeren Einfluss auf die Aktienrenditen ausüben.

Was ist die Vergleichsgruppe in den beiden Regressionen?

Die Vergleichsgruppe in diesen Regressionen wird durch die Kodierung der Dummy-Variablen bestimmt. Jede Dummy-Variable nimmt den Wert 1 an, wenn die entsprechende Stimmung zutrifft, und den Wert 0, wenn sie nicht zutrifft. Die Vergleichsgruppe sind folglich jene Earnings Calls, bei denen die jeweilige Stimmungs-Dummy-Variable, die in der Regression als unabhängige Variable verwendet wird, den Wert 0 aufweist.

In Regression 1 (negative Stimmungen):
Die Vergleichsgruppe umfasst Unternehmen, bei deren Earnings Conference Calls weder eine negative firmen-spezifische Stimmung (negativ_firm = 0) noch eine negative marktweite Stimmung (negativ_market = 0) festgestellt wurde. Der Intercept der ersten Regression (0.0171) repräsentiert die durchschnittliche abnormale Rendite dieser Gruppe.

In Regression 2 (positive Stimmungen):
Die Vergleichsgruppe umfasst Unternehmen, bei deren Earnings Conference Calls weder eine positive firmen-spezifische Stimmung (positiv_firm = 0) noch eine positive marktweite Stimmung (positiv_market = 0) festgestellt wurde. Der Intercept der zweiten Regression (−0.0464) repräsentiert die durchschnittliche abnormale Rendite dieser Gruppe.

Unter welchen Voraussetzungen können die Koeffizienten kausal interpretiert werden? Sind diese Annahmen gegeben?

Für eine kausale Interpretation der Regressionskoeffizienten, also die Schlussfolgerung, dass die Stimmungen in den Earnings Conference Calls die abnormalen Renditen verursachen, müssen mehrere strikte Annahmen erfüllt sein:

Zeitliche Abfolge (Temporal Precedence)

Kovariation

Ausschluss von Drittvariablen/Störfaktoren (Non-Spuriousness/Confounding)


  1. In ihrer deskriptiven Analyse haben Sie bereits gesehen, dass die Unternehmen, die Sie in diesem Projekt betrachten, alle unterschiedlich groß sind. Weiterhin haben Sie gesehen, dass es ein unterschiedliches Stimmungsbild in den Calls über die einzelnen Jahre hinweg gibt. Dafür möchten Sie in ihren Regressionen nun kontrollieren.

    1. Regressieren Sie die car_101 auf die Variablen negativ_firm und negativ_market und kontrollieren Sie auf die Größe des jeweiligen Unternehmens, indem Sie die Variable Total_Assets in ihre Regression aufnehmen
    2. Fügen Sie in einer zweiten Analyse zusätzlich zu den Variablen aus der 1. Regression auch noch Dummyvariablen für die Jahre in dem das Event stattgefunden hat ihrer Regression hinzu.
    3. Führen Sie die Regressionen aus 1. und 2. auch für die Variablen positiv_firm und positiv_market anstatt negativ_firm und negativ_market durch, sodass Sie am Ende 4 Regressionen haben

Beschreiben und interpretieren Sie ihre Ergebnisse im Hinblick auf die Größe der Koeffizienten und deren Signifikanz. Gehen Sie insbesondere auf folgende Fragen ein:


Regressionsergebnisse: Einfluss von Stimmung, Unternehmensgröße (RI) und Jahr auf car_101
Negativ-Stimmungen + RI Negativ-Stimmungen + RI + Jahr Positiv-Stimmungen + RI Positiv-Stimmungen + RI + Jahr
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
(Intercept) 0.0496*** 0.0509*** -0.0121 -0.0103
(0.0069) (0.0076) (0.0102) (0.0105)
negativ_firm -0.0558*** -0.0504***
(0.0085) (0.0085)
negativ_market -0.0112** -0.0161***
(0.0038) (0.0039)
log(RI) -0.0046*** -0.0047*** -0.0047*** -0.0048***
(0.0009) (0.0009) (0.0009) (0.0009)
Y2021 -0.0074 -0.0072
(0.0056) (0.0056)
Y2022 0.0052 0.0061
(0.0055) (0.0055)
Y2023 0.0085 0.0086
(0.0055) (0.0055)
Y2024 -0.0150** -0.0143*
(0.0056) (0.0056)
Y2025 0.0239*** 0.0252***
(0.0071) (0.0071)
positiv_firm 0.0516*** 0.0454***
(0.0081) (0.0082)
positiv_market 0.0112** 0.0166***
(0.0038) (0.0039)
Num.Obs. 2907 2907 2907 2907
R2 0.031 0.045 0.031 0.044
R2 Adj. 0.030 0.042 0.030 0.041
AIC -5699.3 -5729.1 -5697.0 -5727.2
BIC -5669.4 -5669.4 -5667.1 -5667.4
Log.Lik. 2854.652 2874.559 2853.477 2873.597
F 31.361 16.898 30.554 16.647
RMSE 0.09 0.09 0.09 0.09

Beschreibung der Regressionsanalysen:

Für diese Aufgabe wurden vier lineare Regressionen erstellt, um den Einfluss von Stimmungen aus Earnings Conference Calls auf die kumulierten abnormalen Renditen (car_101) zu analysieren, wobei zusätzlich für Unternehmensgröße und Jahreseffekte kontrolliert wird. Die abhängige Variable in allen vier Regressionen ist car_101.

Regression 1 (“Negativ-Stimmungen + RI”): Regressiert car_101 auf negativ_firm und negativ_market, kontrolliert für die Unternehmensgröße mittels der Logarithmierung der Bilanzsumme (log(RI), wobei RI für Total_Assets steht).

Regression 2 (“Negativ-Stimmungen + RI + Jahr”): Erweitert Regression 1 um Dummyvariablen für die Jahre des Events (Y2021, Y2022, Y2023, Y2024, Y2025).

Regression 3 (“Positiv-Stimmungen + RI”): Regressiert car_101 auf positiv_firm und positiv_market, kontrolliert für die Unternehmensgröße mittels log(RI).

Regression 4 (“Positiv-Stimmungen + RI + Jahr”): Erweitert Regression 3 um Dummyvariablen für die Jahre des Events (Y2021, Y2022, Y2023, Y2024, Y2025).

Interpretation der Regressionsergebnisse:

Allgemeine Beobachtungen über alle Regressionen:
Die Ergebnisse zeigen, dass die Kontrolle für Unternehmensgröße (log(RI)) und Jahreseffekte die R-squared-Werte der Modelle leicht erhöht, was auf eine verbesserte Erklärungskraft hindeutet. Der log(RI)-Koeffizient ist in allen vier Regressionen negativ (ca. -0.0046 bis -0.0048). Dies bedeutet, dass größere Unternehmen (gemessen an der Bilanzsumme) tendenziell geringere kumulierte abnormale Renditen aufweisen, was ein bekanntes Phänomen in der Finanzmarktforschung ist (Size-Effect oder größere Unternehmen reagieren weniger volatil auf spezifische Events). Der RMSE bleibt in allen Modellen konstant bei 0.09.

Spezifische Interpretation der einzelnen Regressionen

Regression 1 (Negativ-Stimmungen + RI)

Regression 2 (Negativ-Stimmungen + RI + Jahr)

Regression 3 (Positiv-Stimmungen + RI)

Regression 4 (Positiv-Stimmungen + RI + Jahr)

Warum sollte ihre Regression nicht fünf Dummyvariablen, je eine für jedes Jahr, sondern nur vier beinhalten?

In einer Regression mit kategorialen Variablen, wie den Jahres-Dummies, wird immer eine Kategorie als Referenzkategorie (Basislinie) ausgelassen, um das Problem der Multikollinearität (Dummy Variable Trap) zu vermeiden. Wenn alle fünf Jahre (z.B. Y2021 bis Y2025, falls diese die einzigen Jahre im Datensatz sind) als separate Dummyvariablen in das Modell aufgenommen würden, wäre die Summe dieser Dummyvariablen eine Konstante (nämlich 1 für jede Beobachtung). Diese konstante Summe würde perfekt mit dem Intercept des Regressionsmodells korrelieren, was zu einer perfekten Multikollinearität führt und die Schätzung der Koeffizienten unmöglich macht. Indem ein Jahr ausgelassen wird (z.B. ein Jahr vor 2021 oder eines der Jahre 2021-2025 als Basis), werden die Koeffizienten der verbleibenden Jahres-Dummies als Differenz zum Referenzjahr interpretiert.

Verändert sich durch die Dummyvariablen der Koeffizient von negativ_firm und negativ_market bzw. positiv_firm und positiv_market?

Ja, die Koeffizienten der Stimmungs-Dummyvariablen (negativ_firm, negativ_market, positiv_firm, positiv_market) verändern sich, wenn die Jahreseffekte als Dummyvariablen hinzugefügt werden (Vergleich von Regression 1 mit 2, und Regression 3 mit 4). Obwohl die Koeffizienten in allen Fällen weiterhin dieselbe Richtung und eine vergleichbare Größenordnung beibehalten, zeigen die Anpassungen an, dass ein Teil des Effekts, der ursprünglich den Stimmungs-Dummyvariablen zugeschrieben wurde, tatsächlich durch die zeitliche Entwicklung der kumulierten abnormalen Renditen über die Jahre hinweg mitbestimmt war. Durch die Aufnahme der Jahres-Dummies wird dieser gemeinsame Varianzanteil herausgerechnet.

Hätten Sie eine Veränderung des Koeffizienten von negativ_firm, negativ_market, positiv_firm oder positiv_market erwartet? Begründen Sie ihre Antwort mit ihren deskriptiven Analysen.

Ja, eine Veränderung der Koeffizienten wäre erwartet worden. Die Begründung liegt in der Aussage der Aufgabenstellung selbst und Ihrer deskriptiven Analyse: “Weiterhin haben Sie gesehen, dass es ein unterschiedliches Stimmungsbild in den Calls über die einzelnen Jahre hinweg gibt.” Wenn die Stimmung in den Calls (Ihre unabhängigen Variablen) systematisch über die Jahre variiert und gleichzeitig die kumulierten abnormalen Renditen auch über die Jahre hinweg variieren, dann besteht eine Korrelation zwischen den Stimmungen und den Jahres-Dummies. Das Hinzufügen der Jahres-Dummies ermöglicht es dem Modell, diesen “geteilten” Effekt zu isolieren. Die Anpassung der Koeffizienten in Ihrem Ergebnis bestätigt diese Erwartung, da sich die Werte für die Stimmungs-Dummyvariablen leicht ändern, nachdem die Jahreseffekte kontrolliert wurden.


  1. Zum Abschluss sollten Sie dazu Stellung beziehen, in wie weit die Erkenntnisse aus diesem Projekt für eine Handelsstrategie genutzt werden könnten. Konkret sollten Sie erläutern ob es sinnvoll ist eine Unternehmensaktie bei einem negativem Sentiment im Earnings Conference Call automatisiert zu verkaufen.

Beziehen Sie sich in ihrer Argumentation insbesondere auf:

Begründen Sie jeden Kritikpunkt konkret mit Bezug auf Ihre Projektarbeit und schließen Sie mit einer realistischen Einschätzung ab: Wofür könnten Ihre Ergebnisse trotz dieser Limitationen in der Praxis dennoch wertvoll sein?


Die in unserem Projekt gewonnenen Erkenntnisse bieten eine Grundlage für die Entwicklung von Handelsstrategien, indem sie aufzeigen, dass die Stimmungen in Earnings Conference Calls signifikante Auswirkungen auf abnormale Renditen haben. Die empirischen Ergebnisse belegen, dass negative Stimmungen mit einem Rückgang der kumulierten abnormalen Renditen assoziiert sind, während positive Stimmungen einen Anstieg bewirken. Dennoch erfordert die konkrete Frage, ob es sinnvoll ist, eine Unternehmensaktie bei einem negativen Sentiment im Earnings Conference Call automatisiert zu verkaufen, eine kritische Betrachtung verschiedener Aspekte, darunter zeitliche Gegebenheiten, methodische Limitationen unserer Event Study und Unsicherheiten, die sich aus der LLM-basierten Sentiment-Analyse ergeben.

Zeitliche Aspekte spielen eine entscheidende Rolle. Unsere Event Study (Aufgabe 14) zeigt, dass die signifikantesten Marktreaktionen unmittelbar am oder kurz nach dem Eventtag (Tag 0) auftreten. Negative Stimmungen führen bereits vor Tag 0 zu einem leichten Renditerückgang, der sich nach dem Call verstärkt, während positive Stimmungen direkt nach Tag 0 zu einem Anstieg führen. Dies deutet auf eine rasche Informationsverarbeitung durch den Markt hin. Für eine automatisierte Handelsstrategie ist es unerlässlich, das Sentiment des Earnings Calls in nahezu Echtzeit zu erfassen und zu verarbeiten. Da die Sentiment-Analyse der Transkripte jedoch eine gewisse Verzögerung aufweist – die Transkripte müssen erst erstellt und das Sentiment extrahiert werden, was Stunden bis Tage dauern kann –, könnte der Großteil der relevanten Marktreaktion bereits erfolgt sein, bevor die Strategie aktiv werden kann. Ein automatisierter Verkauf auf Basis eines verspätet vorliegenden negativen Sentiments würde möglicherweise die größten Kursrückgänge verpassen oder sogar erfolgen, wenn der Markt bereits eine Gegenbewegung einleitet.

Hinzu kommen methodische Limitationen unserer Event Study. Obwohl sie ein etabliertes Instrument zur Untersuchung durchschnittlicher Marktreaktionen darstellt, hat sie ihre Grenzen. Unsere Grafiken in Aufgabe 14 visualisieren durchschnittliche kumulierte abnormale Renditen; dies bedeutet nicht, dass jedes einzelne Event dieselbe Reaktion hervorruft. Eine Strategie, die sich ausschließlich auf den Durchschnitt stützt, birgt somit Risiken bei individuellen Aktienbewegungen. Des Weiteren besteht das sogenannte Joint-Test-Problem: Es ist schwierig, die kausale Wirkung des Sentiments von anderen, oft gleichzeitig veröffentlichten fundamentalen Informationen (z.B. Gewinnzahlen oder Zukunftsprognosen) zu trennen. Obwohl unsere Regressionen (Aufgabe 15 und 16) einen statistisch signifikanten Zusammenhang zwischen Sentiment und abnormalen Renditen aufzeigen, erklären die sehr niedrigen R-squared-Werte (2-4%) nur einen geringen Teil der Varianz in den abnormalen Renditen. Dies impliziert, dass der überwiegende Teil der Kursbewegungen durch andere, nicht im Modell erfasste Faktoren bestimmt wird. Das Fehlen weiterer Kontrollvariablen (z.B. Branchenzugehörigkeit, Marktvolatilität, Managementqualität) schränkt zudem die kausale Interpretierbarkeit des reinen Sentiment-Effekts ein. Eine Handelsstrategie, die nur auf Sentiment basiert, würde diese entscheidenden Kontextvariablen ignorieren.

Schließlich sind Unsicherheiten bei der LLM-Sentiment-Analyse zu berücksichtigen. Obwohl große Sprachmodelle wie Google Gemini 2.5 Flash leistungsfähig sind, ist die Sprache in Finanzkommunikation oft nuanciert, geschäftsspezifisch und kann euphemistisch sein. Ein “neutrales” Sentiment könnte beispielsweise bewusst vage gehalten sein, um negative Nachrichten zu kaschieren. Das LLM könnte solche subtilen Bedeutungen, Sarkasmus oder Ironie möglicherweise nicht immer vollständig oder korrekt erfassen. Die “Black-Box”-Natur dieser Modelle erschwert zudem die Nachvollziehbarkeit ihrer Entscheidungen, was die Identifikation und Korrektur von Fehlinterpretationen erschwert.

Zusammenfassend lässt sich festhalten, dass ein automatisierter Verkauf einer Unternehmensaktie, der allein auf einem negativen Sentiment aus einem Earnings Conference Call basiert, nicht als sinnvoll erachtet werden kann und erhebliche Risiken birgt. Der geringe Erklärungsanteil des Sentiments an den Aktienrenditen würde zu einer hohen Rate an Fehlsignalen und potenziell erheblichen Verlusten führen, da zahlreiche stärkere Einflussfaktoren unberücksichtigt blieben.

Trotz dieser Limitationen sind unsere Forschungsergebnisse in der Praxis dennoch wertvoll. Die Analyse des Sentiments in Earnings Conference Calls durch LLMs kann als ergänzende Informationsquelle in umfassenderen Anlageentscheidungen oder komplexeren Handelsstrategien dienen. Das Sentiment könnte beispielsweise als Filter fungieren, um Unternehmen mit einem extrem negativen oder positiven Stimmungsbild für eine vertiefte manuelle Analyse zu selektieren. Darüber hinaus können die LLM-basierten Sentiment-Scores als quantifizierbare Kennzahlen für qualitative Aspekte der Unternehmenskommunikation dienen, was Anlegern eine strukturiertere Einbeziehung von “weichen Faktoren” wie dem Managementton oder Zukunftsaussichten in die fundamentale Analyse ermöglicht. Die erarbeiteten Sentiment-Daten und die Event-Study-Struktur bieten zudem eine exzellente Basis für weiterführende Forschung und die Entwicklung von noch komplexeren quantitativen Modellen, die Sentiment mit anderen relevanten Finanzdaten kombinieren.


Zusatzaufgabe

In Aufgabe 6 berechnen Sie die abnormalen Renditen der einzelnen von ihnen betrachteten Unternehmen. Nun könnte es allerdings sein, dass es nicht ausreicht den Marktindex einfach von der Aktienrendite abzuziehen um für die erwartete Performance der Aktie zu kontrollieren. Potentiell wäre es besser für die durchschnittliche Performance der Aktie zu kontrollieren in der keine Events stattfinden.

Sie können eine solche durchschnittliche Performance schätzen. Dazu sollten Sie eine Schätzperiode vor dem Event definieren. Diese Periode sollen Sie auf 120 bis 10 Handelstage vor dem Event festlegen. Die durchschnittliche Rendite der Einzelaktie sollten Sie in dieser Periode auf die Marktrendite regressieren. Dieses Modell wird Risk-adjusted returns model in Huntington-Klein (2021) genannt:

\[\begin{equation} \hat{Rendite}_{i,t} = \alpha + \beta Rendite_{m,t} \end{equation}\]

Anschließend nutzen Sie die vorhergesagten Werte und ziehen diese in der Eventphase von der Rendite der Einzelaktie ab.

  1. Erstellen Sie die kumulierten abnormalen Renditen im Zeitraum -5 bis +5 mit Hilfe ihres Risk-adjusted returns model neu (und nennen diese mar_505). Erstellen Sie die kumulierten abnormalen Renditen im Zeitraum -1 bis +1 um das Event mit Hilfe ihres Risk-adjusted returns model neu (und nennen die Variable cmar_101) und vergleichen die Werte in einer geeigneten Grafik mit den Ergebnissen aus dem market-adjusted returns model (car_101).

Im Rahmen unserer Zusatzaufgabe haben wir das Konzept des Risk-adjusted returns model (auch bekannt als Market Model) angewendet, um eine präzisere Schätzung der erwarteten Aktienrenditen vorzunehmen. Dieses Modell geht über die einfache Marktanpassung hinaus, indem es die individuelle Beziehung jeder Aktie zum Markt berücksichtigt. Es wird durch die Gleichung \[\begin{equation} \hat{Rendite}_{i,t} = \alpha + \beta Rendite_{m,t} \end{equation}\] beschrieben, wobei \(\hat{Rendite}_{i,t}\) die erwartete Rendite der Aktie \(i\) zum Zeitpunkt \(t\) ist, \(\alpha\) einen aktienspezifischen konstanten Faktor (der eine systematische Über- oder Unterperformance abbilden kann) und \(\beta\) die Sensitivität der Aktie gegenüber Marktbewegungen darstellt. Um diese Parameter zu schätzen, wurde für jeden einzelnen Event (Earnings Conference Call) eine eigene Regression durchgeführt. Dabei haben wir die täglichen Renditen der Einzelaktie auf die täglichen Marktrenditen in einer Schätzperiode von 120 bis 10 Handelstagen vor dem jeweiligen Event regressiert. Mit den so gewonnenen, aktienspezifischen \(\hat{\alpha}\)- und \(\hat{\beta}\)-Werten konnten wir anschließend die erwarteten Renditen für jeden Tag im Eventfenster von -5 bis +5 Handelstagen prognostizieren. Die neuen, bereinigten abnormalen Renditen (\(AR_{i,t}\)) ergaben sich dann, indem diese erwarteten Renditen von den tatsächlichen Aktienrenditen abgezogen wurden, woraus sich die kumulierten Werte mar_505 und cmar_101 ergeben.

In der Grafik wird der Vergleich der durchschnittlichen kumulierten abnormalen Renditen im Zeitraum von -5 bis +5 Handelstagen visualisiert, berechnet nach dem “Market Adjusted”-Verfahren (entspricht unserer ursprünglichen car-Berechnung) und dem “Risk Adjusted”-Verfahren (entspricht unserer mar-Berechnung). Bei der Betrachtung der Grafik fällt auf, dass die Unterschiede zwischen den beiden Modellansätzen zwar nicht dramatisch, aber dennoch erkennbar sind. Beide Linien bewegen sich zwar generell nahe der Null-Linie, jedoch verläuft die “Risk Adjusted”-Linie über den gesamten Zeitraum durchweg konstanter und liegt näher an der Null-Achse als die “Market Adjusted”-Linie. Letztere zeigt eine leicht ausgeprägtere negative Tendenz um den Eventtag herum und wirkt insgesamt volatiler. Das “Risk Adjusted”-Modell scheint somit die durchschnittlichen kumulierten abnormalen Renditen stärker in Richtung Null zu korrigieren.

Diese festgestellten Unterschiede lassen sich durch die zugrundeliegenden Annahmen der beiden Modelle erklären. Das Market-Adjusted-Modell, das als Basis für unsere car-Berechnungen diente, ist ein sehr einfaches Modell, das implizit annimmt, dass die erwartete Rendite einer Aktie schlicht der Marktrendite entspricht – also \(\alpha=0\) und \(\beta=1\). Diese Vereinfachung ignoriert aktienspezifische Risikoprämien oder unterschiedliche Sensitivitäten gegenüber Marktbewegungen. Im Gegensatz dazu berücksichtigt das Risk-Adjusted-Modell diese individuellen Aktieneigenschaften, indem es \(\alpha\) und \(\beta\) empirisch schätzt. Dadurch kann es systematische Renditekomponenten, die nicht direkt mit dem Event zusammenhängen, besser identifizieren und aus der abnormalen Rendite herausfiltern. Dies führt zu einer “reineren” und präziseren Messung des tatsächlichen Effekts, der einzig dem Earnings Conference Call zugeschrieben werden kann. Die Tatsache, dass die absoluten Abweichungen zwischen den beiden Linien in unserer Grafik nicht sehr groß sind, könnte darauf hindeuten, dass für die von uns betrachteten Unternehmen im Technologiesektor die vereinfachenden Annahmen des Market-Adjusted-Modells im Durchschnitt nicht extrem unzutreffend sind, oder dass sich positive und negative Abweichungen der \(\alpha\)- und \(\beta\)-Werte weitgehend ausgleichen. Dennoch bietet das Risk-Adjusted-Modell eine methodisch fundiertere Schätzung, indem es die individuellen Risiko-Rendite-Profile der Aktien berücksichtigt.


  1. Erstellen Sie die Grafik von Aufgabe 12 neu.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie auch auf folgende Fragen ein:


Beschreibung der Grafiken

Die beiden vorliegenden Liniendiagramme visualisieren die Entwicklung der Stimmungen in Earnings Calls über die Jahre 2020 bis 2025, basierend auf Large Language Model (LLM)-Analysen. Sie zeigen den jährlichen Anteil der Anrufe, die als negativ, neutral oder positiv kategorisiert wurden.

Grafik 1: Stimmung zur Unternehmensperformance (2020–2025)

Diese Grafik stellt den Anteil der Earnings Calls dar, bei denen die Stimmung bezüglich der Unternehmensperformance als negativ, neutral oder positiv eingestuft wurde.

Grafik 2: Stimmung zum Marktumfeld (2020–2025)

Diese Grafik zeigt den Anteil der Earnings Calls, bei denen die Stimmung bezüglich des Marktumfelds als negativ, neutral oder positiv eingestuft wurde.

Interpretation der Grafiken

Die beiden Liniendiagramme bieten wichtige Einblicke in die zeitliche Entwicklung der kommunizierten Stimmungen in Earnings Calls:

Könnte es zu Problemen führen, wenn in der Schätzperiode vor dem Event ein weiterer Earnings-Conference Call enthalten ist?

Ja, es könnte zu erheblichen Problemen führen, wenn in der Schätzperiode vor dem Haupt-Event (dem Earnings Conference Call, den wir gerade analysieren) ein weiterer Earnings Conference Call desselben Unternehmens enthalten ist.

Warum könnte dies ein Problem sein, oder warum nicht?

Dies stellt ein potenzielles Problem dar, da die Schätzperiode (120 bis 10 Handelstage vor dem Event) dazu dient, die “normale” Beziehung zwischen der Aktienrendite und der Marktrendite zu ermitteln. Diese normale Beziehung wird durch die Parameter \(\alpha\) und \(\beta\) im Risk-adjusted returns model repräsentiert. Wenn in dieser Schätzperiode ein weiterer signifikanter Informations-Event wie ein Earnings Conference Call stattfindet, sind die Aktienrenditen an diesen Tagen wahrscheinlich abnormal und nicht “normal”. Das bedeutet, die Annahmen über das stabile Renditegenerierungsprozess in der Schätzperiode könnten verletzt werden.

Die Aufnahme solcher abnormalen Renditen in die Regression zur Schätzung von \(\alpha\) und \(\beta\) würde zu verzerrten (biased) Schätzungen dieser Parameter führen. Wenn \(\alpha\) und \(\beta\) nicht korrekt geschätzt werden, dann sind auch die anschließend prognostizierten erwarteten Renditen für das eigentliche Eventfenster fehlerhaft. Dies wiederum würde dazu führen, dass die berechneten abnormalen Renditen für das zu untersuchende Event ebenfalls verzerrt sind und somit der tatsächliche Effekt des Events nicht korrekt abgebildet wird. Man könnte einen Teil der abnormalen Rendite des aktuellen Events fälschlicherweise der “normalen” Performance zuschreiben, oder umgekehrt.

Aus diesem Grund wird in einer sorgfältigen Event Study in der Regel darauf geachtet, die Schätzperiode von allen anderen bekannten, kursrelevanten Ereignissen zu “bereinigen”. Man würde Zeiträume um andere Earnings Conference Calls oder ähnliche große Nachrichtenereignisse aus der Schätzperiode ausschließen, um sicherzustellen, dass die geschätzten \(\alpha\) und \(\beta\) tatsächlich die normale Markt-Aktien-Beziehung widerspiegeln. Eine Situation, in der ein Earnings Conference Call in der Schätzperiode liegt, könnte also die Gültigkeit und die kausale Interpretierbarkeit der Ergebnisse unserer Event Study stark beeinträchtigen.


  1. Lesen Sie das Kapitel “Fixed Effects” in Huntington-Klein (2021), speziell Kapitel 16.1

  1. Regressieren Sie die cmar_101 auf die Variablen negativ_firm und negativ_market und kontrollieren Sie auf die Größe des jeweiligen Unternehmens, indem Sie die Variable Total_Assets in ihre Regression aufnehmen. Kontrollieren Sie weiterhin auf das Jahr in dem das Event stattgefunden hat. Fügen Sie weiterhin der Regression Firmen-Fixe Effekte hinzu.

Beschreiben und interpretieren Sie ihre Ergebnisse.

Gehen Sie zusätzlich auf die folgenden Frage ein:

Hinweis: Mit dem Paket fixest und der Funktion feols() können Sie einfach ihren Regressionen fixe Effekte hinzufügen


Regressionsergebnisse: Einfluss von Stimmung, Unternehmensgröße (RI), Jahr und Firmen-Fixen Effekten auf cmar_101
Negativ-Stimmungen (mit Firm FE) Positiv-Stimmungen (mit Firm FE)
+ p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001
negativ_firm -0.0363
(0.0468)
negativ_market -0.0154
(0.0097)
log(RI) -0.0362*** -0.0364***
(0.0077) (0.0078)
Y2021 0.0055 0.0057
(0.0136) (0.0132)
Y2022 0.0162 0.0167
(0.0108) (0.0107)
Y2023 0.0197 0.0196
(0.0200) (0.0201)
Y2024 -0.0041 -0.0038
(0.0149) (0.0147)
Y2025 0.0305 0.0313
(0.0233) (0.0233)
positiv_firm 0.0326
(0.0422)
positiv_market 0.0154+
(0.0078)
Num.Obs. 2879 2879
R2 0.115 0.115
R2 Adj. 0.104 0.104
R2 Within 0.054 0.054
R2 Within Adj. 0.051 0.051
AIC -5790.6 -5789.9
BIC -5563.9 -5563.2
RMSE 0.09 0.09
Std.Errors by: ric by: ric
FE: ric X X

Beschreibung der Regressionsergebnisse:

Die Regression untersucht den kumulativen anormalen Return über 101 Tage (cmar_101) als abhängige Variable. Die unabhängigen Variablen umfassen negativ_firm (firmenspezifische negative Stimmung), negativ_market (marktbezogene negative Stimmung), log(RI) (Logarithmus eines Indikators für Unternehmensgröße, hier als Kontrolle für Total_Assets interpretiert), sowie Dummy-Variablen für die Jahre 2021 bis 2025 (Y2021 bis Y2025). Zusätzlich werden Firmen-Fixe Effekte (Firm FE) kontrolliert. Die Ergebnisse stammen aus der Spalte “Negativ-Stimmungen (mit Firm FE)” der Tabelle.

Die Koeffizienten und deren Signifikanz sind wie folgt:

Die Regression basiert auf 2879 Beobachtungen. Das Bestimmtheitsmaß R^2 beträgt 0.115, was bedeutet, dass etwa 11.5% der Varianz von cmar_101 durch das Modell erklärt werden. Das angepasste R^2 (R^2 Adj.) liegt bei 0.104.

Interpretation der Ergebnisse:

Die Interpretation der Regressionsergebnisse basiert auf der Spalte “Negativ-Stimmungen (mit Firm FE)”:

Was sind Firmen-Fixe Effekte und warum könnten diese für Ihre Regression sinnvoll sein?

Definition von Firmen-Fixen Effekten:

Firmen-Fixe Effekte (engl. Firm Fixed Effects, kurz FE) sind eine Methode in der ökonometrischen Analyse von Paneldaten, die dazu dient, unbeobachtete, zeitkonstante Heterogenität auf Firmenebene zu kontrollieren. Wenn man Daten über mehrere Zeitpunkte für dieselben Unternehmen hat, gibt es oft Merkmale, die sich zwischen den Unternehmen unterscheiden, aber über die Zeit für ein bestimmtes Unternehmen konstant bleiben. Solche Merkmale könnten zum Beispiel die Qualität des Managements, die Unternehmenskultur, das grundlegende Geschäftsmodell oder dauerhafte Wettbewerbsvorteile sein, die schwer direkt zu messen sind.

Die Kernidee der Firmen-Fixen Effekte besteht darin, diese firmenspezifischen, zeitlich invarianten Effekte aus der Analyse zu entfernen. Technisch wird dies erreicht, indem entweder für jede Firma eine separate Dummy-Variable in die Regression aufgenommen wird oder durch eine sogenannte “Within-Transformation” der Daten. Bei der Within-Transformation wird für jede Variable der firmenspezifische Mittelwert über die Zeit von den einzelnen Beobachtungen abgezogen. Dadurch werden alle firmenspezifischen Komponenten, die sich über die Zeit nicht ändern, eliminiert.

Sinnhaftigkeit von Firmen-Fixen Effekten für die Regression:

Die Aufnahme von Firmen-Fixen Effekten ist für die vorliegende Regression aus mehreren Gründen äußerst sinnvoll:

  1. Kontrolle unbeobachteter firmenspezifischer Heterogenität: Unternehmen sind sehr unterschiedlich. Diese Unterschiede (z.B. Branchenzugehörigkeit, Größe, Reputation, Managementqualität, interne Prozesse, Risikobereitschaft) können sich auf die Art und Weise auswirken, wie ein Unternehmen von negativer Stimmung beeinflusst wird oder wie seine Aktienkurse auf Ereignisse reagieren. Wenn diese unbeobachteten firmenspezifischen Eigenschaften mit den Stimmungs-Variablen (z.B. negativ_firm) korreliert sind, würde das Fehlen einer Kontrolle dieser Effekte zu einer Verzerrung der geschätzten Koeffizienten führen. Firmen-Fixe Effekte fangen diese unbeobachteten, zeitkonstanten Faktoren ein und verhindern, dass ihre Effekte fälschlicherweise den erklärenden Variablen zugeschrieben werden.

  2. Reduzierung von Endogenität und Stärkung der Kausalität: Unbeobachtete firmenspezifische Merkmale könnten sowohl die Stimmung (z.B. eine schlecht geführte Firma erzeugt mehr negative Nachrichten) als auch den cmar_101 beeinflussen. Wenn dies der Fall ist, wäre der Zusammenhang zwischen Stimmung und cmar_101 endogen, und die geschätzten Koeffizienten wären verzerrt. Durch die Einführung von Firmen-Fixen Effekten wird dieser Endogenität entgegengewirkt, da sie Variationen innerhalb derselben Firma über die Zeit analysieren. Die Schätzung des Effekts einer Variablen (z.B. Stimmung) erfolgt dann basierend auf Änderungen dieser Variable innerhalb derselben Firma, was zu einer glaubwürdigeren kausalen Interpretation beitragen kann.

  3. Fokus auf die “Within-Variation”: Die Verwendung von Firmen-Fixen Effekten ermöglicht es der Regression, sich auf die Auswirkungen von Änderungen der Stimmung und anderer zeitvarianter Kovariaten auf den cmar_101 innerhalb desselben Unternehmens zu konzentrieren. Dies ist oft die relevantere Frage, wenn man den dynamischen Einfluss von Stimmung untersuchen möchte, anstatt statische Unterschiede zwischen Unternehmen.

Zusammenfassend lässt sich sagen, dass Firmen-Fixe Effekte dazu beitragen, die Robustheit und Validität der Regressionsergebnisse zu erhöhen, indem sie potenzielle Verzerrungen durch unbeobachtete, firmenspezifische Merkmale eliminieren.


Literatur

Anhang

Prompt Arten

Prompt-Arten unterscheiden sich in der Anzahl der Beispiele, die Sie dem KI-Modell geben:

Zero-Shot Prompt

  • Keine Beispiele gegeben
  • Nur die Aufgabe wird beschrieben
  • Beispiel: “Übersetze ins Englische: Guten Morgen”

One-Shot Prompt

  • Ein einziges Beispiel wird gezeigt
  • Das Modell lernt aus diesem einen Beispiel
  • Beispiel: “Übersetze ins Englische:

Guten Tag → Good day Guten Morgen → ?”

Few-Shot Prompt

  • Mehrere Beispiele werden gegeben (typisch 2-5)
  • Das Modell kann aus mehreren Mustern lernen
  • Beispiel: “Übersetze ins Englische:

Guten Tag → Good day Auf Wiedersehen → Goodbye Danke → Thank you Guten Morgen → ?”