Motivation

Earnings Conference Calls sind zentrale Informationsereignisse in Finanzmärkten. Hier kommuniziert das Management direkt mit Investoren und Analysten über die aktuelle Geschäftslage und Zukunftsaussichten. Die finanzwirtschaftliche Forschung zeigt, dass diese Calls erhebliche Kursbewegungen auslösen können - doch die zugrundeliegenden Mechanismen sind noch nicht vollständig verstanden.

Während traditionelle Finanztheorie von effizienten Märkten ausgeht, die alle verfügbaren Informationen sofort verarbeiten, zeigen empirische Studien, dass die Art der Kommunikation und das Sentiment der Aussagen eigenständige Erklärungskraft für Aktienkursreaktionen besitzen. Diese Erkenntnisse haben direkte praktische Relevanz: Banken nutzen Sentiment-Analysen für algorithmische Handelsstrategien, Hedge Fonds entwickeln systematische Ansätze zur Textauswertung, und Asset Manager integrieren qualitative Informationen in ihre Bewertungsmodelle.

In diesem Projekt kombinieren Sie Event Studies - eine etablierte Methode der empirischen Finanzforschung zur Messung von Informationseffekten - mit modernen Large Language Models zur systematischen Textanalyse. Sie untersuchen, ob und wie sich qualitative Aussagen des Managements in quantifizierbaren Marktreaktionen niederschlagen, und lernen dabei sowohl die methodischen Grundlagen der Kausalitätsidentifikation als auch den praktischen Umgang mit KI-gestützten Finanzanalysen kennen.

Event-Study-Methodik und theoretische Diskussion

  1. Lesen Sie das Kapitel “Event Studies” in Huntington-Klein (2021) und beantworten Sie die folgenden Fragen dazu:

Kann eine Eventstudie helfen, den kausalen Effekt eines Earnings Conference Calls auf die Aktienrendite eines Unternehmens zu identifizieren? Gehen Sie bei der Beantwortung dieser Frage insbesondere auf die nachfolgenden Punkte ein:


Eine Eventstudie ist eine empirische Methode, die vor allem in der Finanzforschung angewendet wird. Untersucht wird, wie sich ein bestimmtes Ereignis auf eine Variable - z.B. auf den Aktienkurs - auswirkt. Dabei muss dieses Event zu einem bestimmten Zeitpunkt stattfinden, es gibt also einen klaren Zeitraum vor und nach dem Ereignis.

Welche Art von Variation nutzt eine Eventstudie zur Identifikation des Effekts?
Eine Eventstudie nutzt zeitliche Variation rund um ein klar definiertes Ereignis, wie z.B. die Durchführung eines Earnings Conference Calls, um den Effekt dieses Ereignisses auf ein Ergebnis (z.B. die Aktienrendite) zu messen. Es wird also die Rendite direkt vor und direkt nach der ECC gemessen. Diese Methode basiert auf der Annahme, dass der Zeitpunkt des Events eine plötzliche, exogene Informationsveränderung darstellt.

Voraussetzungen für gültige Kausalschätzung
Eine Eventstudie kann also helfen, den kausalen Effekt eines Earnings Conference Calls auf die Aktienrendite eines Unternehmens zu identifizieren. Allerdings müssen dafür bestimmte Bedingungen erfüllt sein, damit kausale Schätzungen möglich sind. Zum einen dürfen keine anderen Ereignisse rund um den Earnings Call stattfinden, welche die Aktienrendite beeinflussen könnten (z.B. regulatorische Änderungen, Makronachrichten, Produktankündigungen). Wenn dies der Fall wäre, wäre die beobachtete Änderung nicht eindeutig dem Earnings Call zuzuordnen. Zum anderen müssen alle entscheidenden Informationen, die zu einer Veränderung des Kurses führen könnten, ausschließlich aus dem Earnings Call stammen. Es dürfen also keine Investoren bereits vor dem Earnings Call die entsprechenden Informationen haben, da sonst das Ereignis seinen Effekt verliert. Eine weitere Annahme ist die der effizienten Märkte. Es wird davon ausgegangen, dass Märkte rasch und vollständig auf neue Informationen reagieren. Wenn dies nicht der Fall wäre, würde sich der Effekt über mehrere Tage ziehen, was die Nachvollziehbarkeit erschwert. Eine letzte Bedingung ist, dass man wissen muss, wie sich der Kurs ohne das Event entwickelt hätte, um entsprechende Unterschiede analysieren zu können. Dies wird meist auf Basis eines Marktmodells gemacht, welches allerdings gut spezifiziert sein muss.

Das Joint-Test Problem
Das Joint-Test Problem ist ein zentrales methodisches Problem bei Eventstudien. Bei Eventstudien werden immer zwei Hypothesen getestet. Zum einen die Hypothese, ob das Event einen Effekt auf eine bestimmte Variable hat und zum anderen, ob das Modell zur Schätzung der normalen Renditen korrekt spezifiziert ist. Erhält man also einen Effekt, lässt sich nicht sicher sagen, ob der Effekt tatsächlich durch das Event verursacht wurde oder ob der Effekt nur auf ein schlechtes Modell zurückgeht. Beispielsweise wenn der Aktienkurs nach einem Earnings Call steigt, könnte das entweder an neuen Informationen aus dem Call liegen – oder daran, dass das Modell die erwartete Kursentwicklung falsch vorhergesagt hat.

Zusammenfassend kann man sagen, dass eine Eventstudie helfen kann, den kausalen Effekt eines Earnings Conference Calls auf die Aktienrendite zu identifizieren, allerdings nur wenn bestimmte Annahmen erfüllt sind. Jedoch selbst wenn alle Annahmen erfüllt sind kann die Interpretation der Ergebnisse durch das Joint-Test Problem erschwert werden.


Daten und Datenaufbereitung

Finanzmarktkennzahlen

  1. Sie sollten in einem ersten Schritt Finanzkennzahlen aus Datastream herunterladen. Insbesondere sollten Sie den Return Index (RI) und die Total Assets (WC02999) für alle Firmen im Euro Stoxx 600 Technology Index ( wir haben Ihnen die RIC Kürzel in der Readme bereitgestellt ) vom 01.01.2020 bis heute extrahieren.

Bitte laden Sie für den Return Index tägliche Daten herunter und für die Total Assets Quartalsdaten. Weiterhin sollten Sie den Total Return Index (RI) des Euro Stoxx 600 (RIC = .STOXX) herunterladen (auch tägliche Daten). Bitte achten Sie darauf alle Daten in Euro herunterzuladen.

Achten Sie darauf die RIC als eindeutige Identifikationskennung in ihren Datensatz aufzunehmen.

Das Institut für Finanzwirtschaft der Universität Ulm hat einen ausführlichen Guide zu Datastream erstellt, der Ihnen beim Download der Daten sicherlich helfen kann.

Die Universität Ulm stellt für den Download Remote-PCs zur Verfügung, auf die Sie sich von daheim aus einloggen können. Bitte buchen Sie sich hier einen Slot um Zugriff auf diese PCs zu erhalten: https://www.uni-ulm.de/mawi/iof/lehre/proposals-for-theses/datastream-and-workspace/

Sie sollten ihre Daten in Excel herunterladen und in ihrem Projekt im Unterordner data abspeichern.

Hinweis 1: Es empfiehlt sich zwei Tabellenblätter im Excel File anzulegen, eines für die täglichen Daten und eines für die Quartalsdaten

Hinweis 2: Datastream ist eine Datenbank, die Kennzahlen zur Finanzlage von börsennotierten Unternehmen weltweit beinhaltet. Die Lizenzen zu Datastream an der Universität Ulm werden von der Studienkommission Wirtschaftswissenschaften und der LBBW bezahlt und die Datenbank steht allen WiWi-Studierenden frei zur Verfügung. Nähere Informationen zu Datastream finden Sie hier (Bitte beachten: Sie müssen im Uninetz (z.B. über VPN) eingeloggt sein um die Informationen zu sehen und um sich auf die Remote-PCs loggen zu können).

Hinweis 3: Bei den Total Assets müssen Sie immer das Enddatum des vorherigen Jahres nehmen für den Download, d.h. Start Date wäre 31.12.2019


  1. Lesen Sie die Excel Datei, welche Sie in Aufgabe 2 erstellt haben, in R ein. Achten Sie darauf, dass diese Daten tidy und richtig formatiert sind. Joinen Sie die täglichen Daten mit den Quartalsdaten für die relevanten Firmen. Die Quartalsdaten zählen für das komplette Quartal zu dem diese hinzugemerged wurden.

Setzen Sie sich mit den Aktienkursen auseinander und beantworten folgende Fragen: - Sie wollen in Aufgabe 4 Renditen berechnen, warum sollten Sie Daten zum “Total Return Index” und nicht dem “Price” oder “Unadjusted Price” herunterladen? Schauen Sie sich zur Klärung dieser Frage den Guide der Uni Ulm zu Datastream genauer an. Diesen Guide sollten sie auch für den Download der Daten heranziehen.

Hinweis: In dem tidy Datensatz sollten Sie eine Spalte mit dem Unternehmensidentifier (RIC), eine mit dem Datum und eine mit der Variablen (RI bzw. Total Assets) haben


Warum nutzen wir den Total Return Index (RI) um Rediten zu berechnen und nicht den (unangepassten) Preis der Aktie?
Der Total Return Index eignet sich ideal, um die Volatilität und Performance einer Anlage zu messen. Der unangepasste Preis ist dagegen lediglich der historische Börsenpreis der Aktie. Er eignet sich lediglich dazu, Aktienkursbeschränkungen einzuführen und seine Daten zu filtern, aber nicht zur Berechnung der Rendite. Die Variable „Preis” ist der bereinigte Preis um Aktiensplits und ähnliche Kapitalmaßnahmen. Da der Preis jedoch nicht um Dividenden bereinigt ist, eignet sich die Variable nicht für die Berechnung der Renditen.


Renditen berechnen

  1. In ihrem Datastream-Datensatz, welchen Sie in Aufgabe 2 bereits eingelesen und in Aufgabe 3 bearbeitet haben, sind die Total Return Indices (RI) der größten Unternehmen aus der Tech-Branche in Europa enthalten, sowie der Total Return Indix des Euro Stoxx 600. Der Euro Stoxx 600 ist ein großer, diversifizierter Aktienindex in Europa in dem die 600 größten Unternehmen gelistet sind. Sie sollten den Euro Stoxx 600 als Benchmark ( Rendite des Marktes ) für ihre betrachteten Unternehmen verwenden. Bitte berechnen Sie in dieser Aufgabe die Tagesrenditen aller Einzelunternehmen als:

\[\begin{equation} Rendite_{i,t} = \frac{RI_{i,t} - RI_{i,t-1}}{RI_{i,t-1}} \end{equation}\]

mit i = {jedes Einzelunternehmen im Datensatz} und t = {Tag}

und des Euro Stoxx 600 als:

\[\begin{equation} Rendite_{m,t} = \frac{RI_{m,t} - RI_{m,t-1}}{RI_{m,t-1}} \end{equation}\]

mit m = {Euro Stoxx 600} und t = {Tag}

Prüfen Sie auf NA in den Anfangszeilen und entfernen Sie diese.

Speichern Sie die Renditen der jeweiligen Unternehmen in einer neuen Variable Rendite ab und die Rendite des Euro Stoxx 600 als Marktrendite.



  1. In Aufgabe 1 hatten Sie sich bereits mit der Event-Study Methodik beschäftigt, welche Sie im weiteren Verlauf des Projektes anwenden sollen. Ein erster Schritt ist es, sogenannte Abnormale Renditen zu berechnen. Dies sollten Sie in dieser Aufgabe mit dem sogenannten Market-adjusted returns model tun. Bitte ziehen Sie dafür die Rendite des Marktindex von der Rendite des einzelnen Unternehmens pro Tag ab.

\[\begin{equation} AbnormaleRendite_t = Rendite_{i,t} - Rendite_{m,t} \end{equation}\]

Beantworten Sie dazu folgende Frage:

  • Warum ist es nötig die Marktrendite ( \(Rendite_{m,t}\) ) von der Rendite der Einzelaktien abzuziehen? Nutzen Sie ihre Erkenntnisse aus Aufgabe 1 zur Beantwortung dieser Frage.

Warum ist es nötig die Marktrendite von der Rendite der Einzelaktien abzuziehen
Die Marktrendite beeinflusst alle Aktien am gleichen Tag. Um zu sehen, wie ein Ereignis wie ein Earnings Call die Aktie speziell beeinflusst, muss man diese allgemeinen Markteffekte herausrechnen. Deshalb zieht man die Marktrendite von der Einzelaktienrendite ab. So erhält man die abnormale Rendite, die nur den firmenspezifischen Effekt zeigt.
Ohne diesen Schritt könnte man nicht sagen, ob die Renditeänderung durch das Ereignis oder durch den Markt allgemein verursacht wurde.
Das ist wichtig, damit die Eventstudie den kausalen Effekt des Ereignisses korrekt messen kann.


Earnings Call-Transkripte von LSEG Workspace einlesen

Die Basis für alle weiteren Analysen sind die Abnormalen Renditen der einzelner Unternehmen, die Sie in den vorherigen Aufgaben berechnet haben. Jedoch benötigen Sie nun noch ein Event, dessen Effekt Sie im Rahmen der Eventstudie analysieren möchten. Hier kommen die bereits in der Motivation erwähnten Earnings-Conference-Calls ins Spiel, die Sie im weiteren Verlauf des Projekts näher analysieren sollten. Die Earnings Conference Calls finden für große Unternehmen in der Regel quartalsweise statt. Manche Unternehmen halten jedoch auch nur halbjährliche Earnings Conference Calls ab und andere verzichten ganz darauf.

  1. Wir haben Ihnen die Earnings Conference Calls aus LSEG Workspace für alle Firmen aus dem Euro Stoxx 600 Technology Sektor ab 2020 bis zum aktuellen Rand heruntergeladen und diese unter data/transcripts.zip bereitgestellt. Lesen Sie die Dateien in R ein. Ihr Datensatz sollte für jedes Transkript das RIC-Kürzel, Datum und den Text des Transkripts beinhalten, dies können Sie aus dem Namen der Datei extrahieren.

Hinweis: Das RIC Kürzel finden Sie im Namen der Datei (Beispiel: “2020-Jan-28-SAPG.DE-140242583050-Transcript.txt” -> “Datum-RIC-Nummer-Transcript.txt”)



Die Earnings Conference Calls laufen immer gleich ab: Zuerst spricht der CEO und meist CFO über die aktuellen Entwicklungen am Markt und wie das Unternehmen aktuell steht. Weiterhin werden Einschätzungen für die Zukunft angesprochen. Im zweiten Teil, der Q&A Sektion, dürfen Analysten Fragen an das Management stellen. Dieser Teil ist meist informativer als die vorbereiteten Statements des Managements, da die Fragen nicht vorher abgesprochen werden und das Management spontane Antworten bereithalten muss.

Sie sollen sich in diesem Projekt auf den zweiten Teil, d.h. die Q&A Section in den Earnings Conference Calls konzentrieren.

  1. Analysieren Sie im ersten Schritt die Earnings Conference Calls indem Sie einige davon überfliegen. Schauen Sie explizit nach Hinweisen, ob und wie die Q&A Sektion im Text von den anderen Inhalten abgetrennt ist. Anschließend sollten Sie diese Q&A Sektion in den Earnings Conference Calls in R extrahieren, da Sie nur diese Sektion in den späteren Aufgaben analysieren sollen.

Da es vorteilhaft für ihre weitergehenden Analysen ist möglichst kompakte Texte ohne Redundanzen zu haben, sollten Sie zusätzlich die Definitionen und Disclaimer Sektion am Ende des Earnings Calls entfernen.

Hinweis 1: Der Anteil der Q&A Sektion an der Gesamtkonversation liegt in der Regel unter 80%. Für manche Earnings Conference Calls ist dieser Anteil höher, aber hier würde ich empfehlen nachzuschauen, ob Sie die Q&A Sektion richtig extrahiert haben. Manchmal gibt es keine Q&A Sektion, dann sollte dort auch kein Text extrahiert werden.

Hinweis 2: Nutzen Sie das Paket stringr um Textmanipulationen vorzunehmen. In diesem Cheatsheet sehen Sie die Hauptanwendungen inkl. regulärer Ausdrücke, welche wichtig sind um mit Texten zu arbeiten.



  1. Stellen Sie in einer Grafik anschaulich dar, wie viele Worte in einem typischen Earnings Conference Call verwendet werden und wie viel davon die Q&A Sektion einnimmt.

Beschreiben Sie ihre Grafik.

Hinweis: Eventuell wollen Sie hier die Verteilungen zeigen o.ä.? Entscheiden Sie selbst, welche Grafik Sie produzieren.


Beschreibung der Grafik
Die Grafik zeigt zwei Histogramme, welche die Verteilung der Anzahl an Worten jeweils des gesamten Transkriptes und des Q&A-Anteils zeigen. Auf der y-Achse sind die Anzahl an Transkripten abgetragen und auf der x-Achse die Anzahl an Worten. Das Histogramm für das gesamte Transkript ist blau eingefärbt und das Histogramm mit auschließlich dem Q&A-Anteil ist orange eingefärbt.
An dem blauen Histogramm lässt sich erkennen, dass die meisten Transkripte eine insgesamte Länge von ungefähr 9000 bis 10000 Worten haben. Es gibt vereinzelt Ausreißer nach oben mit fast 20000 Wörten. Auch nach unten gibt es ein paar Transkripte mit nur 3000 bis 4000 Wörten. Dabei handelt es sich in der Regel um Earnings Calls, bei denen kein Q&A stattgefunden hat. Das gelbe Histogramm zeigt, dass der Umfang der Q&As an den Earnings Calls meistens etwa 6000 Wörter ausmacht. Auch dort gibt es Ausreißer nach oben mit bis zu 13000 Wörtern im Earnings Call. Es gibt einen gewissen Anteil an Transkripten, die keine Q&As beinhalten, was die kleine Ausprägung bei 0 erklärt. Diese gehören zu den kürzer gehaltenen Earnings Calls, bei denen kein Q&A stattgefunden hat.


Themenkategorien und Sentiment-Scores

Nachdem Sie nun die Earnings Conference Calls in R eingelesen und einen ersten Eindruck von deren Inhalt erhalten haben sollten Sie diese mit einem LLM (konkret mit Google Gemini) analysieren. Dafür sollten Sie einen Zero-Shot Prompt erstellen und mit Hilfe dieses Prompts die Aussage der Q&A Sektionen der Earnings Conference Calls analysieren.

  1. Entwickeln Sie einen Zero-Shot Prompt für ein Large Language Model (LLM), der Earnings Conference Call Transcripts analysiert und strukturierte Sentiment-Bewertungen ausgibt. Bitte beachten Sie dabei folgende Punkte:

Zielkategorien:

  • Unternehmensperformance (Finanzlage, Wachstumschancen, Unternehmensrisiken)
  • Marktumfeld (Branche, Wettbewerb, externe Faktoren)

Output-Format:

  • JSON-Struktur mit Sentiment-Scores von -1 (sehr negativ) bis +1 (sehr positiv)
  • Keine zusätzlichen Erklärungen oder Markdown-Formatierung

Sie sollten in ihrem Prompt nach einem JSON Output verlangen (strukturiertes Format), welchen Sie mit dem Paket jsonlite gut in R verarbeiten können.

Hinweis 1: Im Anhang ist eine Erklärung für die Unterschiede zwischen einem Zero-Shot Prompt, einem One-Shot Prompt und einem Few-Shot Prompt

Hinweis 2: Wir haben Ihnen ein Tutorial zusammengestellt, welches das Prompting an einem Beispiel zeigt.


“Du bist ein erfahrener Finanzanalyst, der auf die Bewertung von Unternehmenskommunikation spezialisiert ist.

Deine Aufgaben:
- Objektive Sentiment-Analyse von Earnings-Calls
- Bewertung der Unternehmensperformance über die Faktoren Finanzlage, Wachstumslage und Unternehmensrisiken
- Bewertung des Marktumfeld unter Berücksichtigung der Faktoren Branche, Wettbewerb und externen Faktoren

Deine Arbeitsweise:
- Verwende eine Skala von -1 (sehr negativ) bis +1 (sehr positiv)
- Gebe keine zusätzlichen Erklärungen oder Markdown Formatierungen

Bitte gebe deine Antwort für den Analysierten Earnings-Call als JSON-Output ausschließlich im folgenden Format aus:

{
Finanzlage: <numerischer Score zwischen -1 und 1>,
Wachstumschancen: <numerischer Score zwischen -1 und 1>,
Unternehmensrisiken: <numerischer Score zwischen -1 und 1>,
Branche: <numerischer Score zwischen -1 und 1>,
Wettbewerb: <numerischer Score zwischen -1 und 1>,
Externe_Faktoren: <numerischer Score zwischen -1 und 1>
}”


  1. Im nächsten Schritt sollten Sie sich in das Paket ellmer einarbeiten. Durch ellmer erhalten Sie Zugriff auf alle gängigen LLMs mittels R über einen API Zugang. Wir haben ihnen für dieses Projekt ein Google Konto pro Gruppe erstellt und den API Schlüssel für jede Gruppe in das dazugehörige Repo (Readme) gepushed.
  • Lesen Sie sich in das ellmer Paket ein und wie Sie den API Schlüssel für Google Gemini in ihrer .Renviron Datei hinterlegen können
  • Untersuchen Sie die unterschiedlichen Modelle, die Google zur Verfügung stellt und deren Ratelimits: https://ai.google.dev/gemini-api/docs/models?hl=de

Bitte beantworten Sie folgende Fragen:

  • Was sind die Vorteile/Nachteile der einzelnen Google Modelle?
  • Welches (kostenlose) Modell würden Sie für ihre aktuellen Analysen bevorzugt einsetzen? Begründen Sie!
  • Welche Möglichkeiten haben Sie, nicht in die Ratelimits zu kommen?
  • In ellmer können Sie mittels dem params() Parameter auch die Temperatur ihres Modells einstellen. Was ist mit der Temperatur gemeint und was sind die Vorteile/Nachteile einer niedrigen Temperatur?

Was sind die Vorteile/Nachteile der einzelnen Google Modelle?
Google bietet mit Gemini die drei wesentlichen Modelle “2.5 Pro”, “2.5 Flash” und “2.5 Flash-Lite” an. Hierbei unterstützen alle Modelle die Eingabeformate Audio, Bilder, Videos und Text, wobei das Modell “2.5 Pro” zusätzlich das Format “PDF” unterstützt. Alle Modelle geben Text als Ausgabeformat zurück. Die Modelle “2.5 Pro” und “2.5 Flash” unterstützen jeweils ein Eingabetoken-Limit von 1.048.676 und ein Ausgabetoken-Limit von 65.536, während das Modell “2.5 Flash-Lite” ein Limit von 1.000.000 Eingabetoken und 64.000 Ausgabetoken hat. Alle Modelle unterstützen Funktionen wie strukturierte Ausgabe, Caching, Funktionsaufrufe, Codeausführung, „Denken“ sowie das Nachschlagen von Quellen. Das Modell “2.5 Flash-Lite” verfügt zusätzlich über die Funktion „URL-Kontext“.
Trotz ähnlicher Funktionen und Tokenlimits ist das Modell “2.5 Pro” das leistungsstärkste. Es eignet sich optimal zur Lösung schwieriger Probleme, zur Analyse großer Datenmengen, für komplexe Programmierung, logisches Denken und multimodales Verständnis.
Das Modell “2.5 Flash” stellt das beste Preis-Leistungs-Verhältnis dar. Es denkt nur bei Bedarf nach oder kann so eingestellt werden, dass es für Denkprozesse ein Kontingent nutzt. Dadurch eignet es sich sehr gut für Aufgaben mit geringer Latenz und hohem Volumen, die dennoch Denkprozesse erfordern.
Das Modell “2.5 Flash-Lite” ist das schwächste Modell, jedoch auch das kostengünstigste. Es eignet sich am besten für Echtzeitanwendungen mit besonders geringer Latenz.

Welches (kostenlose) Modell würden Sie für Ihre aktuellen Analysen bevorzugt einsetzen?
Für unseren Fall wäre das Modell “2.5 Pro” am besten geeignet, jedoch ist dieses nicht kostenlos verfügbar. Die nächstbeste Option wäre das Modell “2.5 Flash”. Für dieses gelten Begrenzungen hinsichtlich der Anfragen pro Minute, pro Tag und der Token pro Minute, es ist aber innerhalb dieser Grenzen nutzbar.
Das Modell ist besser geeignet als das Modell “2.5 Flash-Lite”, da es Denkprozesse unterstützt und sich gut für Aufgaben mit hohem Volumen eignet.

Welche Möglichkeiten haben Sie, nicht in die Ratelimits zu kommen?
Eine Möglichkeit, nicht über das Ratenlimit zu kommen, besteht darin, mehrere einzelne Anfragen zu einer gebündelten Anfrage zusammenzufassen. Dies reduziert die Anzahl der Anfragen pro Minute und pro Tag und vermeidet so das Erreichen des Ratenlimits. Eine weitere Möglichkeit besteht darin, sich ausschließlich auf notwendige Anfragen zu beschränken, die tatsächlich für die Projektarbeit benötigt werden. Dadurch wird verhindert, dass das Ratenlimit für unnötige Anfragen verbraucht wird.

Was ist mit der Temperatur aus dem Ellmer-Paket gemeint, und was sind die Vorteile/Nachteile einer niedrigen Temperatur?
Die Temperatur aus dem Ellmer-Paket ist ein Parameter zur Steuerung der Kreativität bzw. Zufälligkeit des Large Language Models (LLM) und hat einen Wertebereich von 0 bis 1.
Eine hohe Temperatur (> 0.7) führt zu variantenreicheren und kreativeren Antworten des LLM und somit bei wiederholten Aufrufen desselben Prompts zu weniger konsistenten Ergebnissen.
Eine niedrige Temperatur (< 0.3) führt zu wenig Varianz zwischen verschiedenen Aufrufen und somit zu konsistenten und reproduzierbaren Aussagen. Dies eignet sich besonders für deterministische Aufgaben wie das Zusammenfassen von Texten oder die Interpretation von Daten.


  1. Nutzen Sie ihren in Aufgabe 9 erstellten Prompt mit dem ellmer Paket und ihrem Google API-Key um alle 431 Earnings Conference Call Transkripte zu analysieren. Nutzen Sie für ihre Analyse das Modell Google Gemini 2.0-flash oder Google Gemini 2.5-flash.

Speichern Sie die Ergebnisse ihrer Analyse in einem strukturierten Tibble ab. Anschließend sollten Sie den Datensatz auch unter data/sentiment.Rds abspeichern.

Stellen Sie ihre Ergebnisse in einer Tabelle dar und beschreiben diese kurz:

  • Wie ist der Mittelwert, Standardabweichung und Median der Einschätzung bezüglich Unternehmensperformance und Marktumfeld in ihren Earnings Conference Calls?

Hinweis 1: Achten Sie darauf nicht bei jedem Knitten die Analyse neu zu starten, sondern setzen Sie den Chunk dieser Aufgabe auf eval = FALSE und lassen Sie die Analyse nur einmal durchlaufen und speichern Sie die Ergebnisse ab (und laden diese später um damit weiterarbeiten zu können)

Hinweis 2: Achten Sie auf ihre Ratelimits und beanspruchen Sie den API Zugriff nicht zu stark, z.B. durch den Einbau von “sleep”-Zeiten in ihrem Code


Zusammenfassung der Bewertungsfaktoren
Kategorie Mittelwert Median SD Bereich
Finanzlage 0.64 0.7 0.33 Unternehmensperformance
Wachstumschancen 0.84 0.9 0.15 Unternehmensperformance
Unternehmensrisiken -0.18 -0.3 0.36 Unternehmensperformance
Branche 0.48 0.6 0.39 Marktumfeld
Erwerb 0.64 0.7 0.27 Marktumfeld
Externe Faktoren -0.20 -0.3 0.46 Marktumfeld

Beschreibung der Grafik
Die dargestellte Tabelle zeigt die Ergebnisse der Earnings Calls Analyse durch Gemini. Dafür wurden von den bewerteten Kategorien “Finanzlage”, “Wachstumschancen”, “Unternehmensrisiken”, “Branche”, “Wettbewerb” und “Externe_Faktoren” jeweils der Mittelwert, der Median und die Standardabweichung berechnet. Zudem ist angegeben, ob die jeweilige Kategorie dem Bereich Unternehmensperformance oder Marktumfeld zugeordnet wird. Da Gemini die einzelnen Kategorien auf einer Skala zwischen -1 (sehr negativ) und 1 (sehr positiv) bewertet hat, sind hier auch nur Werte zwischen 1 und -1 zu erkennen.

Die Kategorie Finanzlage ist mit einem Mittelwert von 0,64 und einem Median von 0,7 recht positiv Bewertet. Allerdings ist die Standardabweichung mit 0,33 recht hoch, was auf größere Schwankungen zwischen den Unternehmen hindeutet.
Die Wachstumschancen sind mit einem Mittelwert von 0,84 und einem Median von 0,9 sehr positiv. Auch die Standardabweichung ist mit 0,15 relativ klein, was auf wenige Schwankungen hindeutet.
Die Unternehmensrisiken wurden mit einem Mittelwert von -0,18 und einem Median von -0,3 leicht negativ eingeschätzt.
Die Branche ist mit einem Mittelwert von 0,48 und eine Median von 0,6 wieder positiv. Die Standardabweichung mit 0,39 ist recht hoch.
Der Wettbewerb wurde ebenfalls positiv eingeschätzt, mit einem Mittelwert von 0,64 und einem Median von 0,7.
Die Externen Faktoren haben einen Mittelwert von -0,2 und einem Median von -0,3. Die Standardabweichung ist mit 0,46 sehr hoch.

Zusammenfassend kann man anhand der Tabelle erkennen, dass die Stimmung der meisten Kategorien recht positiv ist.


Sie haben in der vorherigen Aufgabe die Stimmung bezüglich der Kategorien Unternehmensperformance und Marktperformance in den Earnings Conference Calls bestimmt. Eine Frage wäre, ob sich diese Stimmung über die Zeit hinweg verändert hat. In der folgenden Aufgabe sollen Sie sich die durchschnittliche Stimmung in diesen zwei Kategorien für die einzelnen Jahre in ihrem Datensatz näher anschauen.

  1. Erstellen Sie eine geeignete Grafik um die Stimmung aller Earnings Conference Calls eines Jahres zu visualisieren. Tragen Sie separat die Stimmung bezüglich Unternehmensperformance und Marktumfeld ab.

Beschreiben Sie ihre Grafik.

Interpretieren Sie diese Grafik, insbesondere im Hinblick auf die gesamtwirtschaftlichen Ereignisse der letzten fünf Jahre. Hätten Sie die Ergebnisse in dieser Art erwartet?

Hinweis: Sie sollten sich hier eine sinnvolle Grafik überlegen, welche die Stimmungslage über die Zeit gut darstellt.


Beschreibung der Grafik
Die Grafik zeigt die durchschnittlichen Stimmungswerte pro Jahr für das Marktumfeld und die Unternehmensperformance, basierend auf allen von Gemini analysierten Earnings Conference Calls im Zeitraum von 2020 bis 2025.
Dabei wird deutlich, dass die Stimmung im Marktumfeld – bestehend aus den Faktoren Branche, Wettbewerb und externe Einflüsse – in jedem Jahr positiv ausfällt. Das Jahr 2021 stellt mit einem Wert von über 0,5 einen deutlichen Ausreißer nach oben dar, während 2025 mit einem Wert von rund 0,18 einen markanten Rückgang zeigt. Die übrigen Jahre bewegen sich auf einem stabilen Niveau zwischen 0,24 und 0,31.
Auch die durchschnittliche Stimmung zur Unternehmensperformance fällt in jedem Jahr positiv aus. Insbesondere die Jahre 2020 bis 2024 zeigen relativ konstante und hohe Werte zwischen 0,39 und 0,50. Im Jahr 2025 hingegen ist ein klarer Rückgang auf etwa 0,30 zu beobachten.

Interpretation der Grafik
Zu Beginn des Jahres 2020 ist ein deutlicher Stimmungseinbruch beim Marktumfeld erkennbar – ein plausibler Effekt der COVID-19-Pandemie. Während externe Unsicherheiten die Stimmung dämpfen, bleibt die Bewertung der eigenen Unternehmenslage vergleichsweise stabil.
Im Jahr 2021 folgt eine ausgeprägte Erholungsphase in beiden Bereichen, vermutlich als Folge der wirtschaftlichen Wiederbelebung nach den pandemiebedingten Einschränkungen.
Ab 2022 sinkt die Stimmung erneut, was mit neuen Herausforderungen wie der steigenden Inflation, erhöhten Zinsen sowie dem Ausbruch des Ukrainekriegs in Verbindung gebracht werden kann. Diese Entwicklungen belasten sowohl das Marktumfeld als auch die Wahrnehmung der Unternehmensperformance.
Im Jahr 2023 bleibt das Marktumfeld auf dem angespannten Vorjahresniveau. Die Unternehmensperformance hingegen zeigt eine positive Entwicklung – möglicherweise ein Hinweis darauf, dass sich viele Unternehmen erfolgreich an die neuen Rahmenbedingungen anpassen konnten.
Im Jahr 2024 fällt die durchschnittliche Stimmung in beiden Bereichen erneut ab. Gründe dafür könnten politische Unsicherheiten wie die US-Wahlen, das Zerbrechen der Ampel-Koalition in Deutschland oder das Ausrufen des Kriegsrechts in Südkorea sein.
Der stärkste Stimmungsrückgang ist im Jahr 2025 zu beobachten – sowohl im Marktumfeld als auch in der Unternehmensperformance. Dies könnte auf eine zunehmende Unsicherheit auf den Weltmärkten zurückzuführen sein, ausgelöst durch unvorhersehbare handelspolitische Maßnahmen der US-Regierung sowie durch eskalierende Spannungen im Nahen Osten, insbesondere zwischen Iran, Israel und den USA.

Die Ergebnisse entsprechen insgesamt den Erwartungen und spiegeln die zentralen wirtschaftlichen und politischen Entwicklungen der vergangenen fünf Jahre auf nachvollziehbare Weise wider.


Eventstudie

Um zu evaluieren, ob die Earnings Conference Calls tatsächlich einen Einfluss auf die Aktienkurse der einzelnen Unternehmen hatten können Sie eine sogenannte Eventstudie durchführen, welche Sie bereits in Aufgabe 1 kennen gelernt haben. Bei einer Eventstudie betrachten Sie nur die Zeit (bei uns die Tage) unmittelbar vor oder nach einem Event. In diesem Projekt ist ein Event ein Earnings Conference Call des jeweiligen Unternehmens. Sie sollen in diesem Projekt herausfinden, wie sich über alle Unternehmen hinweg die Earnings Conference Calls auf die Aktienrenditen auswirken.

  1. Verbinden Sie den Datensatz über die Stimmung der Earnings Conference Calls (sentiment.Rds) zu den einzelnen Unternehmen mit den abnormalen Renditen und speichern diesen Datensatz als gesamtdatensatz in R ab. Sie können das RIC-Kürzel und Datum für den Join verwenden. Sollte der Earnings Conference Call an keinem Handelstag stattgefunden haben, so joinen Sie bitte mit dem darauffolgenden Handelstag.

Hinweis: Die Funktion cumsum() könnte für diese Aufgabe hilfreich sein



  1. Erstellen Sie je ein Liniendiagramm für die von ihnen betrachteten Unternehmen: Eines für die Stimmung bezüglich der Unternehmensperformance und eines bezüglich der Marktperformance.

Sie sollten in ihren Grafiken die kumulierten Renditen im Zeitraum [-5,5] Tage um einen Earnings Conference Call darstellen. - Die Variable “Event” sollte die Tage vor und nach dem Earnings Conference Call enthalten ([-5,5]) und auf der x-Achse dargestellt werden - Die Variable ar_505 sollte die durchschnittliche kumulierte abnormale Rendite für den jeweiligen Tag auf der y-Achse abtragen (für alle Unternehmen in ihrem Datensatz) - In jeder Grafik sollten Sie eine extra Linie zeichnen für Earnings Conference Calls mit einer positiven/negativen und neutralen Stimmung und deren Einfluss auf den Aktienmarkt

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie hierbei insbesondere darauf ein, welche Erwartungen Sie auf der Basis ihrer Lektüre aus Aufgabe 1 hatten und in wie weit diese Erwartungen sich erfüllt haben.

Hinweis: In diesen Grafiken stellen Sie nicht jedes Event (d.h. die Auswirkungen eines jeden Earnings Conference Calls) einzeln dar, sondern gesamt für alle Earnings Conference Calls.


Beschreibung der Grafik
In den zwei dargestellten Grafiken ist die durchschnittliche kummulierte abnormale Rendite jeweils 5 Tage vor und 5 Tage nach der Earnings Call Conference abgetragen. Die erste Grafik zeigt dabei die Entwicklungen nach der Marktstimmung und die zweite Grafik zeigt die Entwicklulngen nach der Unternehmensstimmung. In beiden Grafiken zeigt die x-Achse die Tage um den Earnings Call (-5 Tage bis +5 Tage), wobei an Tag 0 der Earnings Call stattfand. Auf der y-Achse wird die kumulative abnormale Rendite gezeigt. Die Unternehmen wurden in die Gruppen Negativ (orange), Neutral (blau) und Positiv (grün) untergliedert, was die Stimmung in den Earnings Calls jeweils für das Unternehmen und für den Markt darstellt.

Interpretation der Grafik
In der ersten Grafik ist zu erkennen, dass etwa zwei Tage vor dem Earnings Call die Renditen aller Unternehmen, egal welcher Stimmung zunächst etwas sinken. Besonders ist dies bei Unternehmen die sich neutral zur Marktstimmung geäußert haben. Dieses Absinken lässt sich allgemein damit erklären, dass vermutlich manche Investoren kurz vor den Earnings Calls einen Teil ihrer Aktien verkaufen, um im Falle einer Korrektur nach dem Earnings Call nicht davon betroffen zu sein. Kurz vor dem Earnings Call nehmen die Renditen wieder etwas zu, vor allem bei negativer Marktstimmung. Die Tage nach dem Earnings Call steigt vor allem die Rendite der Unternehmen mit neutraler Marktstimmung sehr an. Danach sinken die Renditen bei allen Stimmungsbildern wieder. Aus der ersten Grafik lässt sich also erkennen, dass die Äußerung des Unternehmens bezüglich positiver oder negativer Aussichten des Marktes keine großen Einflüsse auf die Renditen haben. Dies könnte unteranderem daran liegen, dass Investoren eher auf unternehmensspezifische Informationen reagieren als auf allgemeine Aussagen zur Branche oder zum Markt.

Die zweite Grafik zeigt etwas ausgeprägtere Muster. Vor der Earnings Call Conference entwickeln sich die Renditen ähnlich wie in der ersten Grafik. Nach dem Earnings Call allerdings sieht man auch hier einen starken Anstieg bei der neutralen Stimmung. Auch bei negativer Stimmung ist jetzt ein Anstieg zu erkennen. Dies lässt sich dadurch erklären, dass bei einer negativen Stimmung die Erwartungen meistens nicht hoch sind. Wenn diese Erwartungen dann erfüllt werden oder auch nur leicht übertroffen werden, kann das zu einer positiven Reaktion führen. Letztendlich bleibt es aber bei der negativen Stimmung, was den Abschwung danach erklären würde. Auffällig ist, dass sich die Renditen bei positiver Unternehmensstimmung kaum verändern. Dies könnte damit zusammenhängen, dass bei positiver Unternehmensstimmung die Erwartungen relativ hoch sind. Wenn diese dann nicht deutlich übertroffen werden, führt dies zu keinem starken Anstieg der Renditen, da vermutlich schon einiges in die Aktie eingepreist ist.

Auffällig ist sowohl in Bezug auf den Markt und das Unternehmen, dass kurz vor dem Earnings Call Bewegungen der Renditen stattfinden, was bedeutet, dass entweder viel gekauft oder verkauft wird. Die Verläufe könnten darauf hindeuten, dass ein Teil der Informationen bereits vor dem Earnings Call im Markt ist, oder zumindest der Markt Erwartungen bildet, die sich in den Kursen widerspiegeln. Dies könnte auch durch Analystenberichte, Medienberichte oder Marktgerüchte geschehen. Außerdem ist auffällig, dass die kumulierte Rendite bei einer neutralen Unternehmensstimmung oder Marktstimmung am höchsten ausfällt. Dies könnte an den nicht vorhandenen Erwartungen liegen, wodurch schon ein paar wenige positive Ergebnisse aus dem Earnings Call zu positiven Kursbewegungen führen könnten.


Regressionen

Sie haben bisher den Einfluss der Earnings Conference Calls auf die Aktienrendite der größten europäischen Unternehmen im Technologie-Sektor visuell betrachtet. Im letzten Abschnitt dieser Projektarbeit analysieren Sie ihre Daten mittels linearer Regressionen.

  1. In dieser Aufgabe sollten Sie zwei Regressionen erstellen:

Regressieren Sie die kumulierten abnormalen Renditen um das Event car_101 auf die Dummyvariablen

Diese Dummyvariablen geben die Stimmung in den Earnings-Conference Calls wieder.

Beschreibung und interpretieren Sie ihre Regressionsergebnisse und gehen Sie dabei auch auf folgende Fragen ein:


Regression von kumulierter market-adjusted Rendite auf Unternehmens- und Marktstimmung
Negative Stimmung Positive Stimmung
* p < 0.1, ** p < 0.05, *** p < 0.01
Konstante 0.008* -0.032*
(0.004) (0.018)
Negative Unternehmensstimmung -0.051**
(0.022)
Negative Marktstimmung 0.006
(0.012)
Positive Unternehmensstimmung 0.049**
(0.021)
Positive Marktstimmung -0.010
(0.012)
Num.Obs. 403 403
R2 0.014 0.014
R2 Adj. 0.010 0.009

Beschreibung
Die erste Regression analysiert den Einfluss negativer Unternehmens- sowie negativer Marktstimmung nach einem Earnings Call auf die kumulierte abnormale Rendite in einem Zeitfenster von einem Tag vor bis einem Tag nach dem Event. Die Konstante liegt bei 0,8 %, was bedeutet, dass bei neutraler Stimmung eine durchschnittliche kumulierte abnormale Rendite in dieser Höhe zu erwarten ist. Sie ist auf dem 10 %-Niveau signifikant. Der Koeffizient für negative Unternehmensstimmung beträgt –6,6 % und ist auf dem 1 %-Niveau signifikant. Dies weist darauf hin, dass eine negative Unternehmensstimmung mit einer um 6,6 Prozentpunkte niedrigeren kumulierten abnormalen Rendite verbunden ist. Der Parameter für negative Marktstimmung beträgt 1,0 %, ist jedoch statistisch nicht signifikant auf dem 10 %-Niveau.
Die zweite Regression untersucht den Einfluss positiver Unternehmens- sowie positiver Marktstimmung auf die kumulierte abnormale Rendite. Die Konstante liegt bei –4,2 % und ist auf dem 5 %-Niveau signifikant. Der Regressor für positive Unternehmensstimmung beträgt +6,3 % und ist ebenfalls auf dem 1 %-Niveau signifikant. Der Koeffizient für positive Marktstimmung beträgt –1,4 %, ist jedoch statistisch nicht signifikant auf dem 10 %-Niveau.

Was ist die Vergleichsgruppe in den Regressionen?
Die Vergleichsgruppe in der ersten Regression besteht aus allen Earnings Calls, in denen keine negative Unternehmens- oder Marktstimmung festgestellt wurde – d. h. die Stimmungen waren entweder neutral oder positiv.
In der zweiten Regression bilden jene Earnings Calls die Vergleichsgruppe, in denen keine positive Unternehmens- oder Marktstimmung vorlag – also Fälle mit neutraler oder negativer Stimmung.

Was sind die Voraussetzungen für eine kausale Interpretation der Koeffizienten? Sind diese Ihrer Meinung nach gegeben?
Für eine kausale Interpretation müssen verschiedene Bedingungen erfüllt sein: Erstens sollten die 429 Earnings-Call-Beobachtungen von 30 Unternehmen repräsentativ für die Grundgesamtheit aller Unternehmen im EuroStoxx 600 sein. Zweitens müssen die erklärenden Variablen – also die Stimmungsdummies – exogen sein, d. h. sie dürfen nicht selbst durch andere Einflussgrößen (wie z. B. Renditen) beeinflusst werden. Drittens dürfen keine relevanten Variablen ausgelassen werden (omitted variable bias), die sowohl mit der Stimmung als auch mit der Rendite zusammenhängen könnten.
Diese Voraussetzungen sind in der vorliegenden Analyse nur eingeschränkt erfüllt. Beispielsweise wurden wichtige Einflussgrößen wie Umsatz, Gewinn oder Analystenerwartungen nicht kontrolliert, obwohl sie die Stimmung und die Rendite gleichzeitig beeinflussen könnten. Außerdem ist denkbar, dass die Stimmungswahrnehmung im Earnings Call selbst bereits durch externe Faktoren oder Kursreaktionen vorab geprägt ist. Daher sollte das Ergebnis nicht kausal interpretiert, sondern als korrelativer Zusammenhang verstanden werden.


  1. In ihrer deskriptiven Analyse haben Sie bereits gesehen, dass die Unternehmen, die Sie in diesem Projekt betrachten, alle unterschiedlich groß sind. Weiterhin haben Sie gesehen, dass es ein unterschiedliches Stimmungsbild in den Calls über die einzelnen Jahre hinweg gibt. Dafür möchten Sie in ihren Regressionen nun kontrollieren.

    1. Regressieren Sie die car_101 auf die Variablen negativ_firm und negativ_market und kontrollieren Sie auf die Größe des jeweiligen Unternehmens, indem Sie die Variable Total_Assets in ihre Regression aufnehmen
    2. Fügen Sie in einer zweiten Analyse zusätzlich zu den Variablen aus der 1. Regression auch noch Dummyvariablen für die Jahre in dem das Event stattgefunden hat ihrer Regression hinzu.
    3. Führen Sie die Regressionen aus 1. und 2. auch für die Variablen positiv_firm und positiv_market anstatt negativ_firm und negativ_market durch, sodass Sie am Ende 4 Regressionen haben

Beschreiben und interpretieren Sie ihre Ergebnisse im Hinblick auf die Größe der Koeffizienten und deren Signifikanz. Gehen Sie insbesondere auf folgende Fragen ein:


Regression von kumulierter market-adjusted Rendite auf Stimmung, Assets und Jahresdummies
Negativ ohne Jahr-Dummies Negativ mit Jahr-Dummies Positiv ohne Jahr-Dummies Positiv mit Jahr-Dummies
* p < 0.1, ** p < 0.05, *** p < 0.01
Konstante 0.009* 0.064 -0.035* 0.021
(0.005) (0.072) (0.020) (0.075)
Negative Unternehmensstimmung -0.045** -0.043*
(0.023) (0.023)
Negative Marktstimmung -0.004 -0.004
(0.012) (0.013)
Positive Unternehmensstimmung 0.044** 0.043*
(0.022) (0.022)
Positive Marktstimmung 0.000 0.000
(0.012) (0.013)
Bilanzsumme (Assets) 0.000 0.000 0.000 0.000
(0.000) (0.000) (0.000) (0.000)
Jahr 2020 -0.048 -0.049
(0.073) (0.073)
Jahr 2021 -0.059 -0.059
(0.073) (0.073)
Jahr 2022 -0.050 -0.050
(0.073) (0.073)
Jahr 2023 -0.053 -0.053
(0.073) (0.073)
Jahr 2024 -0.064 -0.065
(0.073) (0.073)
Num.Obs. 367 367 367 367
R2 0.016 0.024 0.014 0.022
R2 Adj. 0.008 0.002 0.006 0.001

Beschreibung
In der Tabelle sind vier Regressionen dargestellt. In der ersten Regression wurde die kumulierte abnormale Rendite in einem Zeitfenster von einem Tag vor bis einem Tag nach dem Event auf die negative Markt- und Unternehmensstimmung regressiert. Zusätzlich wurde auf die Größe der Unternehmen kontrolliert, indem die Total Assets mitaufgenommen wurden. Der Effekt ist mit -0,065 auf dem 1%-Niveau signifikant. Das bedeutet: Wenn die Unternehmensstimmung negativ ist, sinkt die kumulierte abnormale Rendite im Schnitt um ca. 6,5 Prozentpunkte im Vergleich zur Referenzgruppe. Die negative Marktstimmung hat zwar einen positiven Einfluss, jedoch ist dieser nicht signifikant.
Ein ähnliches Bild sehen wir auch bei der zweiten Regression, bei der zusätzlich noch das Jahr als Dummyvariable aufgenommen wurde. Auch hier hat die negative Unternehmensstimmung einen signifikanten Effekt auf die abnormale Rendite. Das Hinzunehmen der Jahre führt hier jedoch nicht zu großen Unterschieden. Auch hier hat die Marktstimmung keinen signifikanten Einfluss auf die abnormale Rendite.
Bei den Regressionen 3 und 4 hat die positive Unternehmensstimmung jeweils einen signifikant positiven Effekt auf die abnormalen Renditen (0.063 und 0.061). Unternehmen, die in Calls eine positive Stimmung vermitteln, erzielen im Durchschnitt also höhere kumulierte abnormale Renditen als die neutrale Vergleichsgruppe. Die Marktstimmung hat auch hier in beiden Fällen keinen Signifikanten Einfluss.
Zusätzlich ist zu erkennen, dass die Bilanzsumme in allen Modellen keinen signifikanten Einfluss auf die abnormalen Renditen hat. Das spricht dafür, dass die Unternehmensgröße keinen direkten Einfluss auf die Rendite hat. Auch die Jahr-Dummies haben keinen Effekt. Das heißt, dass es keine systematischen Unterschiede in der durchschnittlichen abnormalen Rendite über die Jahre hinweg gibt, wenn man die anderen Faktoren konstant hält.

Warum sollte ihre Regression nicht fünf Dummyvariablen, je eine für jedes Jahr, sondern nur vier beinhalten?
Wenn man für alle fünf Jahre Dummyvariablen einfügen würde und gleichzeitig eine Konstante (Intercept) in der Regression hat, entsteht Multikollinearität. Die fünfte Jahresvariable wäre perfekt vorhersehbar aus den anderen und der Konstante. Deshalb muss ein Jahr ausgelassen werden, damit man alle anderen Jahre im Vergleich zu dieser Referenzkategorie interpretieren kann.

Verändert sich durch die Dummyvariablen der Koeffizient von negativ_firm und negativ_market bzw. positiv_firm und positiv_market?
Nein, die Koeffizienten verändern sich kaum, wenn man die Dummyvariablen hinzufügt. Bei negativer Unternehmensstimmung verändert sich der Koeffizient lediglich von -0.065 auf -0.062. Bei positiver Unternehmensstimmung verändert sich der Koeffizient von 0.063 auf 0.061. Die Effekte sind also robust gegenüber der Kontrolle für das Jahr, was dafür spricht, dass diese Stimmungen nicht stark mit bestimmten Jahren korreliert sind.

Hätten Sie eine Veränderung des Koeffizienten von negativ_firm, negativ_market, positiv_firm oder positiv_market erwartet? Begründen Sie ihre Antwort mit ihren deskriptiven Analysen.
Nein, eine Veränderung der Koeffizienten war nicht zu erwarten. Die Regressionen zeigen, dass die Unternehmensstimmung – die in der deskriptiven Statistik recht klar positiv oder negativ ausfällt – signifikante Unterschiede in den Renditen bewirkt. Die Marktstimmung ist dagegen diffuser und hat erwartungsgemäß keinen signifikanten Einfluss, was mit der höheren Streuung und der negativen Einschätzung externer Faktoren zusammenhängt.


  1. Zum Abschluss sollten Sie dazu Stellung beziehen, in wie weit die Erkenntnisse aus diesem Projekt für eine Handelsstrategie genutzt werden könnten. Konkret sollten Sie erläutern ob es sinnvoll ist eine Unternehmensaktie bei einem negativem Sentiment im Earnings Conference Call automatisiert zu verkaufen.

Beziehen Sie sich in ihrer Argumentation insbesondere auf:

Begründen Sie jeden Kritikpunkt konkret mit Bezug auf Ihre Projektarbeit und schließen Sie mit einer realistischen Einschätzung ab: Wofür könnten Ihre Ergebnisse trotz dieser Limitationen in der Praxis dennoch wertvoll sein?


In unserem Projekt haben wir untersucht, ob man Aktien automatisch verkaufen sollte, sobald das Sentiment aus einem Earnings Call negativ ist. Dabei fällt zuerst auf: Die Kurse bewegen sich oft schon am Call-Tag oder sogar noch während des Calls – unser Sentiment-Score dagegen steht in der Regel erst Stunden bis Tage später fertig zur Verfügung, weil erst das Transkript verarbeitet und an das LLM geschickt werden muss. Für einen schnellen Trade ist das einfach zu spät.

Außerdem haben wir die abnormalen Renditen mit einem recht simplen Marktmodell auf Basis des Euro Stoxx 600 berechnet. Das heißt, wir haben weder makroökonomische Schocks noch Unterschiede zwischen großen und kleinen oder hoch- und geringliquiden Firmen berücksichtigt. Solche Vereinfachungen können dazu führen, dass die tatsächliche Wirkung des Call-Sentiments überschätzt oder unterschätzt wird. Und wenn ein Call zeitgleich mit einer großen M&A-Ankündigung oder Quartalszahl stattfindet, lässt sich gar nicht mehr sauber sagen, was genau den Kurs bewegt hat.

Die Sentiment-Analyse mit einem LLM wie Google Gemini bringt zusätzliche Unsicherheit. Schon minimale Änderungen im Prompt oder in der Reihenfolge der Fragen liefern teils sehr unterschiedliche Scores. Und weil das Modell keine Begründungen ausgibt, ist oft unklar, warum ein Call als „negativ“ eingestuft wurde. Finanzjargon versteht das LLM auch nicht immer korrekt – Begriffe wie „beat‑and‑raise“ oder „cautious outlook“ landen schnell mal in der falschen Kategorie.

Deshalb wäre ein automatischer Verkaufsalgorithmus, der nur auf dem negativen LLM-Sentiment basiert, zurzeit stark risikobehaftet und operativ zu langsam. Viel sinnvoller ist es, das negative Sentiment als Warnsignal zu sehen: Es zeigt, welche Calls man genauer von Hand anschauen sollte. In einem hybriden Modell kann es dann zusammen mit anderen Indikatoren (Analystenkommentaren, Volumensignalen, Volatilität) ein nützliches Feature sein – aber nie allein die Entscheidung für einen Verkauf treffen.


Zusatzaufgabe

In Aufgabe 6 berechnen Sie die abnormalen Renditen der einzelnen von ihnen betrachteten Unternehmen. Nun könnte es allerdings sein, dass es nicht ausreicht den Marktindex einfach von der Aktienrendite abzuziehen um für die erwartete Performance der Aktie zu kontrollieren. Potentiell wäre es besser für die durchschnittliche Performance der Aktie zu kontrollieren in der keine Events stattfinden.

Sie können eine solche durchschnittliche Performance schätzen. Dazu sollten Sie eine Schätzperiode vor dem Event definieren. Diese Periode sollen Sie auf 120 bis 10 Handelstage vor dem Event festlegen. Die durchschnittliche Rendite der Einzelaktie sollten Sie in dieser Periode auf die Marktrendite regressieren. Dieses Modell wird Risk-adjusted returns model in Huntington-Klein (2021) genannt:

\[\begin{equation} \hat{Rendite}_{i,t} = \alpha + \beta Rendite_{m,t} \end{equation}\]

Anschließend nutzen Sie die vorhergesagten Werte und ziehen diese in der Eventphase von der Rendite der Einzelaktie ab.

  1. Erstellen Sie die kumulierten abnormalen Renditen im Zeitraum -5 bis +5 mit Hilfe ihres Risk-adjusted returns model neu (und nennen diese mar_505). Erstellen Sie die kumulierten abnormalen Renditen im Zeitraum -1 bis +1 um das Event mit Hilfe ihres Risk-adjusted returns model neu (und nennen die Variable cmar_101) und vergleichen die Werte in einer geeigneten Grafik mit den Ergebnissen aus dem market-adjusted returns model (car_101).

Beschreibung der Grafik
In der Grafik sind die kummulierten abnormalen Renditen jeweils am Tag der ECC und jeweils am Tag davor und danach dargestellt. Die Renditen wurden einmal nach dem Market-adjustet Modell und nach dem Risk-adjusted Modell berechnet. Die Boxplots stellen hier die Verteilung der Renditen dar.

Interpretation der Grafik
In dieser Analyse wurde überprüft, ob das einfache Market-adjusted Returns-Modell zur Berechnung abnormaler Renditen um Earnings Conference Calls (ECC) vergleichbare Ergebnisse liefert wie das differenziertere Risk-adjusted Returns-Modell. Während beim Market-adjusted-Modell die Marktrendite direkt von der Aktienrendite subtrahiert wird, basiert das Risk-adjusted-Modell auf einer Regressionsschätzung individueller Renditeverläufe vor dem Eventzeitraum. Dabei wird die erwartete Aktienrendite als lineare Funktion der Marktrendite modelliert.
Ein Vergleich der cmar_101 mit den zuvor berechneten car_101 (basierend auf dem einfachen Modell) zeigt, dass sich beide Ansätze im Ergebnis kaum unterscheiden. Wie man in der Grafik erkennt, ergeben sich nur sehr geringe oder gar keine Unterschiede in Lage und Streuung der Werte. Diese Beobachtung lässt sich plausibel damit erklären, dass viele der analysierten Unternehmen – allesamt große europäische Technologiekonzerne – eine hohe Korrelation mit dem Gesamtmarkt aufweisen. Die im Risk-adjusted-Modell geschätzten β-Koeffizienten dürften somit bei vielen Unternehmen nahe 1 liegen, während die Intercepte (α) tendenziell gering sind. In einem solchen Fall nähert sich das Risk-adjusted-Modell stark dem einfachen Market-adjusted-Modell an.
Es lässt sich also festhalten, dass der Mehraufwand des Risk-adjusted-Modells in diesem spezifischen Datensatz keinen signifikanten zusätzlichen Informationsgewinn liefert. Für Unternehmen mit stabiler Marktkopplung scheint das einfachere Modell somit ausreichend geeignet zu sein. In Szenarien mit höherer Volatilität, geringer Marktkorrelation oder strukturellen Besonderheiten wäre das Risk-adjusted-Modell hingegen potenziell informativer.


  1. Erstellen Sie die Grafik von Aufgabe 12 neu.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie auch auf folgende Fragen ein:


Beschreibung der Grafik
Die Grafiken zeigen die durchschnittliche kumulierte abnormale Rendite rund um den Earnings Conference Call für den Zeitraum von fünf Handelstagen vor bis fünf Handelstage nach dem Event (−5 bis +5). Dabei wird zwischen der Marktstimmung und der Unternehmensstimmung differenziert. Grundlage dieser Darstellung ist das Risk-adjusted Returns-Modell, bei dem die erwartete Rendite mithilfe einer Regression in einer Schätzperiode (−120 bis −10 Handelstage vor dem Event) individuell je Unternehmen berechnet wurde. Die Stimmungen wurden wieder mithilfe der unterschiedlichen Linien dargestellt.
Insgesamt betrachtet ist ein ähnliches Muster wie in Aufgabe 14 zu sehen. Es gibt also so gut wie keine Unterschiede zum Market-adjusted-Modell.

Könnte es zu Problemen führen, wenn in der Schätzperiode vor dem Event ein weiterer Earnings-Conference Call enthalten ist?
Ja, dies kann zu erheblichen Verzerrungen führen, da die Schätzperiode eigentlich eine “normale” Zeit repräsentieren soll – also eine Phase ohne außergewöhnliche Ereignisse. Ist in diesem Zeitraum ein weiterer Earnings Conference Call enthalten, besteht die Gefahr, dass dieser bereits abnormal hohe oder niedrige Renditen verursacht, die fälschlicherweise als „normal“ modelliert werden. Dadurch könnten die geschätzten erwarteten Renditen verzerrt sein und somit auch die daraus abgeleiteten abnormalen Renditen.

Warum ist das ein Problem?
Ein verzerrtes α oder β aus der Regressionsschätzung führt zu einer fehlerhaften Berechnung der erwarteten Renditen, was wiederum die Interpretation der abnormalen Renditen im Eventfenster verfälscht. Besonders kritisch ist dies, wenn ECCs sehr häufig stattfinden (z.B. bei Quartalsdaten), da sich die Schätzfenster dann teilweise überschneiden können. Um dem entgegenzuwirken, sollte idealerweise geprüft werden, ob innerhalb der Schätzperiode frühere Events liegen und diese ggf. aus der Regression ausgeschlossen werden.


  1. Lesen Sie das Kapitel “Fixed Effects” in Huntington-Klein (2021), speziell Kapitel 16.1

  1. Regressieren Sie die cmar_101 auf die Variablen negativ_firm und negativ_market und kontrollieren Sie auf die Größe des jeweiligen Unternehmens, indem Sie die Variable Total_Assets in ihre Regression aufnehmen. Kontrollieren Sie weiterhin auf das Jahr in dem das Event stattgefunden hat. Fügen Sie weiterhin der Regression Firmen-Fixe Effekte hinzu.

Beschreiben und interpretieren Sie ihre Ergebnisse.

Gehen Sie zusätzlich auf die folgenden Frage ein:

Hinweis: Mit dem Paket fixest und der Funktion feols() können Sie einfach ihren Regressionen fixe Effekte hinzufügen


Regression von kumulierte risk-adjusted Rendite auf Stimmung, Assets, Jahresdummies und Firmen-Fixe Effekte
(1)
* p < 0.1, ** p < 0.05, *** p < 0.01
Negative Unternehmensstimmung -0.032
(0.022)
Negative Marktstimmung -0.003
(0.025)
Bilanzsumme (Assets) 0.000
(0.000)
Jahr 2020 -0.032***
(0.011)
Jahr 2021 -0.046***
(0.007)
Jahr 2022 -0.039***
(0.005)
Jahr 2023 -0.038***
(0.009)
Jahr 2024 -0.054***
(0.007)
Num.Obs. 365
R2 0.092
R2 Adj. -0.007
R2 Within 0.018
R2 Within Adj. -0.006
Std.Errors by: RIC
FE: RIC X

Beschreibung
In dieser Regression wird die kumulierte risikoadjustierte Rendite (cmar_101) im Zeitraum von einem Tag vor bis einem Tag nach dem Earnings Call auf verschiedene Einflussfaktoren geschätzt: negative Unternehmensstimmung, negative Marktstimmung, Bilanzsumme (Assets) sowie Jahresdummies für 2020 bis 2024. Zudem werden firmenspezifische fixe Effekte berücksichtigt.
Es zeigt sich, dass weder die Unternehmens- noch die Marktstimmung signifikant auf die Rendite wirken. Auch die Unternehmensgröße hat keinen erkennbaren Einfluss. Die Jahresdummies hingegen sind allesamt statistisch signifikant negativ auf dem 1%-Niveau: Das Jahr 2020 ist mit einer Rendite von -3,2% verbunden, 2021 mit -4,6%, 2022 mit -3,9%, 2023 mit -3,8% und 2024 mit -5,4%.

Interpretation
Die signifikant negativen Effekte der Jahre 2020–2024 im Vergleich zum Basisjahr 2025 könnten durch makroökonomische Schocks erklärt werden – insbesondere die COVID-19-Pandemie, geopolitische Spannungen wie der Ukraine-Krieg sowie geldpolitische Straffungen aufgrund der globalen Inflation. Die ausbleibende Signifikanz der Stimmungsvariablen deutet darauf hin, dass die Stimmung entweder bereits in den Kursen antizipiert war oder als wenig kursrelevant wahrgenommen wurde.

Was sind Firmen-Fixe Effekte und warum könnten diese für ihre Regression sinnvoll sein?
Firmen-Fixe Effekte kontrollieren für zeitlich konstante, unternehmensspezifische Merkmale wie Branche, Geschäftsmodell, Management oder Risikoexposition. Sie ermöglichen eine isolierte Betrachtung der zeitlich variablen Effekte, indem Unterschiede zwischen Firmen herausgerechnet werden. Dadurch wird die Schätzung verzerrungsfreier und kausal interpretierbar.


Literatur

Anhang

Prompt Arten

Prompt-Arten unterscheiden sich in der Anzahl der Beispiele, die Sie dem KI-Modell geben:

Zero-Shot Prompt

  • Keine Beispiele gegeben
  • Nur die Aufgabe wird beschrieben
  • Beispiel: “Übersetze ins Englische: Guten Morgen”

One-Shot Prompt

  • Ein einziges Beispiel wird gezeigt
  • Das Modell lernt aus diesem einen Beispiel
  • Beispiel: “Übersetze ins Englische:

Guten Tag → Good day Guten Morgen → ?”

Few-Shot Prompt

  • Mehrere Beispiele werden gegeben (typisch 2-5)
  • Das Modell kann aus mehreren Mustern lernen
  • Beispiel: “Übersetze ins Englische:

Guten Tag → Good day Auf Wiedersehen → Goodbye Danke → Thank you Guten Morgen → ?”