Motivation

In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.

Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer Vernetzung:

Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin, dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über soziale Schichten hinweg vernetzt sind, profitieren tendenziell von besseren wirtschaftlichen Perspektiven.

Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.

Datengrundlage

Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:

Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.

Einlesen

Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.

  1. Lesen Sie den Datensatz social_capital_county.rds aus dem Unterordner “Daten” in R ein und nennen diesen Datensatz social_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.

Schränken Sie ihren Datensatz auf folgende Variablen ein:

  • county
  • ec_county
  • exposure_grp_mem_county
  • bias_grp_mem_county
  • pop2018

Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.

Beantworten Sie auch folgende Fragen:

  • Was ist eine Beobachtung?
  • Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
  • In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?

Beschreibung der Variablen

County: 5-stelliger County FIPS Code, welcher als eindeutiger Identifikator für das jeweilige County dient.
ec_county: Steht für die Economic Connectedness. Misst also, die Stärke der sozialen Vernetzung zwischen Menschen mit sozioökonomischen niedrigem Status (low-SES) und Menschen mit sozioökonomisch hohem Status(high-SES). Ein hoher Wert von ec_county sagt aus, dass beide Personengruppen gut vernetzt sind, was in besseren wirtschaftlichen Aufsteigschancen resultiert.
exposure_grp_mem_county: Hier wird der durschnittliche allgemeine Kontakt in den jeweiligen sozialen Gruppen gemessen, den low-SES Personen in einem County mit High-SES Personen haben.
bias_grp_mem_county: Steht für den sogenannten Freundschafts-Bias. Dieser misst, in wie weit low-SES Personen dazu neigen, weniger Freundschaften mit high-SES personen zu schließen. Also wie viel Freundschaften aus den allgemeinen Kontakten vorherrschen.
pop2018: Zeigt die Bevölerungsgröße im Jahr 2018.

Was ist eine Beobachtung:
Eine Beobachtung in diesem Datensatz ist ein einzelnes County in den USA. Jede Zeile stellt ein County dar und enthält Informationen zu wirtschaftlicher Vernetzung, Exposition, Freundschafts-Bias und Bevölkerung.

Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?:

Beschreibung Anzahl
Counties im Datensatz 3089
Gesamtanzahl der Counties in den USA 3143

Prozentualer Anteil, dass man Informationen zu allen Variablen hat:
In 95.14 % der Fälle liegen die Daten vollständig vor.


  1. Weiterhin haben wir Ihnen den Datensatz county_covariates.dta im Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihn covariates.

Schränken Sie diesen Datensatz auf die folgenden Variablen ein:

  • county
  • kfr_pooled_pooled_p25
  • gini99_simple

Generieren Sie eine neue Variable upward_mobility als kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die Variable kfr_pooled_pooled_p25.

Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.

Hinweis: Mit dem haven Paket können Sie .dta Dateien einlesen


Beschreibung der Variablen:

county: Auch hier stellen die Zahlen ein FIPS Code dar, welcher ein eindeutiger Identifikator für die jeweiligen Counties sind
upward_mobility: Die wirtschaftliche Mobilität wurde generiert, indem man “kfr_pooled_pooled_p25” mit 100 multipliziert hat. Sie zeigt die Höhe von Erwachsenen, welche in ihrer Kindheit, Eltern hatten, die eher niedriges Einkommen hatten. Ein höherer Wert der upward mobility zeigt, dass Kinder in diesem County im Leben bessere Aufstiegschancen haben.
gini99_simple: Zeigt, wie ungleich das Einkommen in einem County verteilt ist. Größere Unterschiede zwischen Arm und Reich spiegeln sich in einem höheren Wert der Variable wider. Der Wert ist so angepasst, dass der Anteil des Einkommens der reichsten 1% herausgerechnet wurde.


  1. Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.

Lesen sie die Daten County_census_data.shp in R ein und speichern diesen in R als county_census_shape ab. Neben den County Namen und und Polygonen enthält dieser Datensatz auch das geschätzte Median Einkommen pro County für das Jahr 2023 (medincE).

Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren


  1. Verbinden Sie die Dataframes county_census_shape, covariates und social_capital_county zu einem Datensatz analysis_data.
  • Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
  • Welcher Datensatz sollte der Hauptdatensatz sein? Warum?

Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?

Mit einem Left Join bleiben alle Counties aus county_census_shape erhalten, selbst wenn für einige keine entsprechenden Daten in covariates oder social_capital_county vorhanden sind, und die fehlenden Daten werden als NA angezeigt.

Welcher Datensatz sollte der Hauptdatensatz sein? Warum?

Der Hauptdatensatz sollte county_census_shape sein, weil dieser die vollständigen geografischen Informationen und die grundlegenden Identifikatoren (wie GEOID) enthält. Andere Datensätze (wie covariates und social_capital_county) liefern zusätzliche Variablen, die zu den geografischen Daten hinzugefügt werden sollen, ohne diese zu verlieren.


  1. Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:
  • upward_mobility
  • ec_county
  • exposure_grp_mem_county
  • bias_grp_mem_county

Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:

  • Was genau misst die wirtschaftliche Mobilität (upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
  • Bitte schauen Sie sich an, wie die sozialen Vernetzung (ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.

Hinweis: Die genaue Berechnung der sozialen Vernetzung (ec_county) finden Sie im Dokument “social_capital_codebook.pdf”


Was misst die wirtschaftliche Mobilität?: Die Wahrscheinlichkeit, dass ärmere Kindern (also im unteren Viertel der Einkommensverteilung) im Erwachsenen-Alter ein höheres Einkommen erziehelen. Kurz: die Chancen sich wirtschaftlich zu verbessern.
Was misst die soziale Vernetzung?: Wie stark Menschen mit mit niedrigem sozioökonomischen Status (low-SES) und Menschen mit hohem sozioökonomischen Status (high-SES) vernetzt sind. Aus einem hohen Wert geht hervor, dass es viele Freundschaften zwischen diesen Gruppen gibt.
Warum eine hohe soziale Vernetzung zu einer hohen wirtschaftlichen Mobilität führt:
1. Ärmere Kinder können von Freundschaften mit Menschen aus höheren Einkommensgruppen profitieren. Es könnte zu besseren Jobmöglichkeiten, Bildungsmöglichkeiten und eventuellen Praktika führen. Menschen aus höheren Einkommensgruppen haben oft mehr Wissen dazu und können dieses teilen. Hier sollte angenommen werden, dass soziale Netzwerke wie Facebook genutzt werden, um beruflich oder finanziell voranzukommen.
2. Motivation durch den Kontakt mit Personen aus den höheren Einkoommensgruppen. Kinder aus ärmeren Haushalten sehen die Möglichkeiten und streben Ähnliches an.
3. Direkte Unterstützung durch die wohlhabenderen Personen durch Empfehlungen bei Bewerbungen oder finanzieller Unterstützung. Angenommen die Freundschaften sind echt und nicht nur oberflächlich.
Berechnung der sozialen Vernetzung: Für jede Person mit niedrigen sozioökonomischen Status wird geschaut, wie viele ihrer Freundschaften zu Menschen mit hohem SES gehören. Dazu teilt man diese Anzahl durch die Anzahl der gesamten Freunde dieser Person. Dann wird der Durchschnitt aller Personen in einem County berechnet, welcher dann angibt wie stark die beiden sozialen Gruppen insgesamt miteinander vernetzt sind.
Wie Exposition und Freundschafts-Bias die soziale Vernetzung beeinflusst: Exposition gibt an, wie viele Menschen aus höheren Schichten in einem County für ärmere Menschen potenziell als Freunde zur Verfügung stehen. Eine hohe Exposition sollte daher die soziale Vernetzung positiv beeinflussen. Die Wahrscheinlichkeit Freundschaften mit high-SES Personen steigt, wenn mehr von diesen zur Verfügung stehen. Angenommen die Exposition führt zu tatsächlichen Interaktionen und Freundschaften. Der Freundschafts-Bias misst, in wie weit Personen aus einer Gruppe es bevorzugen Freundschaften innerhalb ihrer eigenen sozialen Gruppe zu bilden. Ein hoher Wert wirkt sich also negativ auf die soziale Vernetzung aus. Wenn mehr low-SES bevorzugt nur Freundschaften mit low-SES Personen bilden wollen oder umgekehrt, sinkt die wahrscheinlichkeit von low-SES und high-SES Freundschaften.


Deskriptive Analysen

Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.

  1. Schauen Sie sich in einem ersten Schritt an, wie die Variablen im Datensatz analysis_data über alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.

Beschreiben und interpretieren Sie Ihre Tabelle.

Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?

Hinweis: Achten Sie auf eine schöne Darstellung ihrer Tabelle mittels der Pakete kableExtra oder gt!


Statistische Auswertung der Variablen
Median Haushalts- einkommen Einkommens- ungleichheit Wirtschaftliche Mobilität Economic Connectedness Index Exposition Freundschafts-Bias Bevölkerung in 2018
Mittelwert 65.046,65 0,29 42,72 0,81 0,91 0,06 107.129,87
Median 63.161,50 0,29 41,96 0,81 0,91 0,06 27.837,50
Minimum 16.170,00 -0,06 12,22 0,29 0,26 -0,11 544,00
Maximum 178.707,00 0,57 68,83 1,36 1,49 0,33 10.098.052,00
Standardabweichung 18.388,68 0,06 6,49 0,18 0,21 0,05 337.331,88
25%-Quantil 54.113,25 0,24 38,43 0,69 0,76 0,03 12.618,75
75%-Quantil 73.216,25 0,33 46,11 0,94 1,05 0,10 71.974,50

Beschreibung:
Die vorliegende Tabelle stellt Informationen zu den verschiedenen Variablen aus dem Datensatz zur Verfügung. Mittelwert, Median, Minimum und Maximum, Standardabweichung und das 25%ige und 75%ige Quantil.

Interpretation:
Auffälligkeiten gibt es zum einen in der Variable pop2018 also bei der Population der Counties 2018. Dort ist die Spannweite also Entfernung von Minimum zu Maximum extrem groß. Dies deutet daraufhin, dass es massive Unterschiede in vermutlich ländlichen Counties zu städtischen Counties gibt. Dass es viele kleine Counties und wenige sehr große Counties gibt, lässt sich aus dem Median von pop2018 ableiten, dieser ist deutlich unter dem Mittelwert. Die Spannweite der exposure Variable (zwischen 0.2 und 1.4) zeigt, dass es keine extremen Ausreißer gibt. Der Freundschafts-Bias ist in vielen Counties gering aber es gibt auch einige negative Werte. Diese könnten in Regionen auftreten, wo Menschengruppen noch stark seggregiert sind (siehe Interpretation in Aufgabe 7). Dass ec_county keine nennenswerten Ausreißer hat, deutet darauf hin, soziale Netzwerke in den meisten Counties relativ ähnlich sind. Das niedrigste Median Einkommen liegt bei 16.170 USD und das Maximum bei 178.707 USD. Die große Different zeigt, die unterschiedlichen wirtschaftlichen Verhältnisse der Regionen und vorallem die extrem unterschiedlichen Lebendbedingungen in den USA. Der Mitelwert ist leicht höher als das 75% Quantil was bedeutet, dass einige reiche Counties den Durchschnitt nach oben ziehen.


Soziale Vernetzung und wirtschaftliche Mobilität

Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre Analyse näheres über die soziale Vernetzung lernen, den Economic Connectedness Index (ec_county), welcher aus den Facebook Freundschaften generiert wurde. Die Daten des Economic Connectedness Index wurden auf County Ebene aggregiert, beruhen jedoch auf Freundschaftsdaten von individuellen Facebook Nutzern.

  1. Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.

Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:

Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?

Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt sich das tigris Paket und der Befehl shift_geometry() um Alaska, Hawaii und Puerto Rico schön darstellen zu lassen.


Beschreibung:
Die erstellte Karte enthält Informationen zu dem Economic Conectedness Index (ECI) auf US-County Ebene dar. Violett bezeichnet einen geringen ECI bis zu Gelb, was einen hohen ECI widerspiegelt. Der Index umfasst Werte von etwa 0.50 bis 1.25. Entlang der Ostküste und im nürdlichen Zentrum der USA sieht man viele gelbe countys. Also eine hohe soziale Vernetzung. Die eher niedrigeren Werte treten vor allem im mittleren Westen und im Süden der USA auf. Einige Sonderfälle haben keine Werte (grau). Wir haben ja schon gesehen, dass es mehr counties gibt als wir in unseren Daten haben.

Interpretation:
Anhand der Karte stellen wir fest, dass es enorme regionale Unterschiede in der economic conectedness gibt. Der Osten ist durch Metropolen wie New York, Boston, Washington D.C dichter besiedelt und urbanisiert könnte deshalb ein dichtes Netz an kulturellen und wirtschaftlichen Netzwerken bieten. Schon bei der Gründung der USA und während der industriellen Revolution spielten die Gebite im Osten und Norden der USA eine wichtige Rolle, weshalb sie noch heute sehr bedeutend sind (siehe Wirtschafts- und Bankwesen, welche mehrheitlich im Norden und Osten angesiedelt sind). Auch sind die meisten guten Universitäten (ivy-league) im Osten, algemein gibt es dort mehr Konzentration auf Bildungseinrichtungen. All diese Punkte wirken sich positiv auf den ECI aus.
Der Süden der USA hat eher eine Historie welche auf Trennungen und Segregation basierte siehe Jim Crow Era im späten 19 bis zum frühen 20 Jahrhundert. Diese Ungleichheiten zwischen Bevökerungsgruppen führen noch heute zu Konsequenzen, welche sich negativ auf die soziale Venetzung auswirken. Auch ist der Süden eher ländlicher, dort gibt es weniger dicht besiedelte Gebiete, weniger wirtschaftlich ausgerichtete Einrichtungen und weniger Bildungsinvesitionen, was zu kleineren Netzwerken führt.

Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?
Der ECI sollte eine tatsächliche Ursache für die wirtschftliche Mobilität haben und nicht nur zufällig damit zusammenhängen. Der ECI sollte ein gutes Maß dafür sein, wie stark die Menschen miteinander vernetzt sind. Er muss zeigen, ob Leute aus verschiedenen sozialen Schichten wirklich miteinander in Kontakt stehen und Freunschaften bilden. Die Daten solltenn richtig sein, Verzerrungen führen zu falschen Schlussfolgerungen.


  1. Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.

Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:

  • Median Haushaltseinkommen in dem County (medincE)
  • Wirtschaftliche Mobilität in dem County (upward_mobility)
  • Einkommensungleichheit in dem County (gemessen mit dem Gini-Koeffizient des Counties) (gini99_simple)

Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.

Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:

  • Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.

Top und Bottom 10 Counties basierend auf Economic Connectedness Index
County-Name Rank Economic Connectedness Index Median Haushalts- einkommen Wirtschaftliche Mobilität Einkommens- ungleichheit
Top Counties
Rockingham County, New Hampshire 1 1,36 113.927 45,31 0,23
Douglas County, Colorado 2 1,35 145.737 48,24 0,12
San Francisco County, California 3 1,31 141.446 50,39 0,31
Morgan County, Utah 4 1,29 126.092 54,12 0,15
Madison County, Idaho 5 1,28 58.259 51,54 0,22
Arlington County, Virginia 6 1,27 140.160 46,28 0,39
Sussex County, New Jersey 7 1,26 114.316 47,04 0,18
Wright County, Minnesota 8 1,25 106.666 49,54 0,18
Gunnison County, Colorado 9 1,25 77.358 48,71 0,35
Pitkin County, Colorado 10 1,24 100.318 45,83 -0,01
Bottom Counties
Todd County, South Dakota 1 0,29 39.148 30,18 0,32
Oglala Lakota County, South Dakota 2 0,33 34.769 24,84 NA
Terrell County, Georgia 3 0,35 43.812 31,17 0,36
Bullock County, Alabama 4 0,36 36.723 34,57 0,31
Allendale County, South Carolina 5 0,36 31.603 31,40 0,33
Robeson County, North Carolina 6 0,36 40.318 32,10 0,36
Early County, Georgia 7 0,38 53.750 33,83 0,46
Marlboro County, South Carolina 8 0,38 36.293 32,82 0,31
Crisp County, Georgia 9 0,39 42.745 32,89 0,42
Scotland County, North Carolina 10 0,40 43.500 31,08 0,39

Beschreibung:
Die Tabelle enthält das Ranking der 10 Counties mit der höchsten sozialen Vernetzung und die 10 Counties mit der niedrigsten sozialen Vernetzung. Platz 1 hat eine economic connectedeness von 1,36 (Rockingham County in New Hampshire und der schlechteste County ist Scotland County in North Carolina mit 0.40 economic connectedness. Ebenfalls enthält die Tabelle Daten über das Median-Haushaltseinkommen in Spalte 4(höchstes: 145.737; niedrigstes: 31.603), über die wirtschaftliche Mobilität (höchste: 54,12 ; niedgriste: 24,84) in Spalte 5 und über die Einkommensungleichheit in der letzten Spalte.
Interpretation:
In den Top 10 Counties sieht man den Trend, dass diese jeweils ein hohes Haushaltseinkommen im Median haben, welches von 58.259 USD bis hin zu 145.737 USD reicht. Die Einkommensungleichheit in den Counties sind relativ gering bis auf ein paar Auschläge in Gunnison County, Arlington County und San Francisco County. Auch weisen alle 10 Counties eine hohe wirtschaftliche Mobilität auf. Sie haben einen economic Index von 1,24 bis 1,36. Bei den jeweils niedrigsten Counties ist es das Gegenteil. Der economic Index liegt hier zwischen 0,29 und 0,40. Sie sind betroffen von neidrigen Haushaltseinkommen im Median, weches von 31.603 USD (Allendale County, South Carolinia) bis maximal 53.750 USD (Early County, Georgia) geht. Das maximale durchschnittliche Haushaltseinkommen liegt unter dem minimum der Top 10 Counties. Es herrscht eine hohe Einkommensungleichheit von 0,31 bis 0,46 und die wirtschaftliche Mobilität ist ebnfalls gering mit einem Tief von 24,84 in Oglala Lakota County, South Dakota und einem maximalen Hoch von 34,57 in Bullock County, Georgia.
Haben wir die Unterschiede erwartet?
Ja die Unterschiede waren erwartbar. Es war zu erwarten, dass ein hohes Haushaltseinkommen mit einer hohen sozialen Vernetzung korreliert. Hohe soziale Vernetzung zwischen den Gruppen führt zu mehr Austausch von Wissen und Ressourcen was zu mehr Wirtschaftlichkeit führt. Dies spiegelt sich dann in der Förderung des durchschnittlichen Einkommen wieder. Auch war es zu erwarten, dass dieser Austausch zu mehr Möglichkeiten/Chancen führt, was in einer höheren wirtschaftlichen Mobilität endet. Eine höheree economic connectednness führt demnach auch zu weniger Einkommensungleichheit. Ebenfalls die Lage der Counties spielt eine Rolle. Counties in den Top 10 liegen in wirtschaftlich stärkeren Regionen und in der Nähe von Metropolen z.B San Francisco oder Washington D.C. Es gibt mehr Vernetzung und Chancen für LOW-SES. Die Bottom Counties liegen eher in ländlichen Regionen im Süden der USA, was wir auch in der Aufgabe 7 gesehen haben. Sie sind eher von wirtschaftlichen schwachen Regionen umgeben.


Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?

  1. In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot) erstellen, welches die wirtschaftliche Mobilität (upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
  • In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?

Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen


Beschreibung:
Aus der Grafik entnimmt man den Zusammenhang zwischen dem Economic Connectedness Index auf der X-Achse und der wirtschaftlichen Mobilität auf der Y-Achse (upward_mobility). Jeder Punkt im vorliegenden Streudiagramm repräsentiert einen County in den USA. Die rote Linie zeigt die lineare Regressionsgerade. Der Korrelationswert beträgt 0,72 also eine starke positive Korrelation.

Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?
Anhand der Grafik sehen wir, dass es einen positiven Zusammenhang zwischen sozialer Vernetzung und wirtschaftlicher Mobilität gibt. Counties mit höherer economic connectedness haben eher eine höhere wirtschaftliche Mobilität.

Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
Ja, der Zusammenhang entspricht den Erwartungen aus Aufgabe 5. Soziale Netzwerke insbesondere zwischen Menschen mit hohen und niedrigem sozioökonomischen Status, können die wirtschaftliche Mobilität fördern.

In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?
Am stark positiven Korrelationswert von 0,72 sieht man, dass soziale Vernetzung ein wichtiger Faktor für die wirtschaftliche Mobilität ist. Allerdings sollte auch der Einfluss anderer Faktoren wie Bildungszugang, Arbeitsmarksituation etc. berücksichtigt werden, um den Anteil des Einflusses der sozialen Vernetzung genauer zu bestimmen.


  1. Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
  • Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
  • Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index

Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:

  • San Francisco County, California
  • Arlington County, Virginia
  • Morgan County, Utah
  • New York County, New York
  • Bronx County, New York

Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.

Beschreibung:
Das erste Punktediagramm stellt die Verbindungen zwischen der Einkommensungleichheit und der sozialen Vernetzung dar. Auf der X-Achse die Einkommensungleichheit gemessen mit dem Gini-Koeffizient und auf der Y-Achse der Economic Connectedness Index. Die rote Linie zeigt die Korrelation welche hier -0.67 beträgt. Das zweite Diagramm zeigt den Zusammenhang von dem Economic Connectedness Index auf der Y-Achse und dem durchschnittlichen Haushaltseinkommen auf der X-Achse.Hier beträgt die Korrelation gemessen an der roten Linie 0.72. Eine weitere Anmerkung sollte sein, dass das County Morgan County, Utah eigentlich nicht zu den 500 größten Counties gehört, weshalb hier die 500 größten Counties (nach Population) und Morgan County, Utah dargestellt sind.

Interpretation:
Aus der ersten Grafik liest man, dass in Regionen mit höherer Einkommensungleichheit, die soziale Vernetzung niedriger ist. San Francisco liegt in einem Bereich mit mittlerer Einkommensungleichheit weisst allerdings einen hohen economic connectedness Index auf. Dies liegt vermutlich an der Vernetzung und Möglichkeiten z.B durch den Silicon Valley. New York County, NY hat eine der höchsten Einkommensungleichhheiten. Hier ist die Trennung von Arm und Reich sehr hoch. Economic connectedness ist eher mittelmäßig.
Die zweite Grafik zeigt, dass die soziale Vernetzung zunimmt mit steigendem durchschnittlichem Haushaltseinkommen. Wohlhabende Counties wie Douglas County und San Francisco neigen dazu, wohlhabend zu sein und sind deshalb besser vernetzt. Wirtschaftlicher Wohlstand durch das Silicon Valley. New York County zeigt durch sein hohes Median-Haushaltseinkommen, aber auch einem etwas niedrigeren EC-Index, dass es innerhalb des Counties soziale Ungleichheiten gibt. Bronx County in New York hat sowohl ein niedrigeres Haushaltseinkommen als auch eine niedrigere soziale Vernetzung. Dies könnte durch auf soziale und wirtschaftliche Ungleichheiten hindeuten. Die Beobachtungen bestätigen den Erwartungen, da wir bereits in Aufgabe 5 angenommen haben, dass höhere wirtschaftliche Ressourcen (z. B. Einkommen) die soziale Vernetzung fördern können. Allerdings gibt es auch Außnahmen, wie in New York County, wo trotz hohen Einkommens die Vernetzung niedriger ist. Dies war allerdings auch zu erwarten, da man weiß die Segregation in New York ist heute noch relativ hoch.


Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.

  1. Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
  • Economic Connectedness Index (ec_county)
  • Wirtschaftliche Mobilität (upward_mobility)
  • Median Haushaltseinkommen (medincE)
  • Bevölkerung in 2018 (pop2018)
  • Einkommensungleichheit (gini99_simple)
  • Exposition (exposure_gpr_mem_county)
  • Freundschafts-Bias (bias_grp_mem_county)

Beschreiben und interpretieren Sie ihre Korrelationsmatrix.


Beschreibung:
Die Matrix zeigt die Korrelation zwischen sieben Variablen mit Hilfe von Feldern. Die Korrelation reich von -1 (starke negative Korrelation) bis hin zu 1 (starke positive Korrelation), wobei 0 keine Korrelation bedeutet. Je dunkler das Feld blau ist, desto stärker korrelieren die Variablen positiv und je dunkler das Feld rot ist, desto stärker korrelieren die Variablen negativ.

Interpretation:
Wir wollen uns jetzt die interessanten Variablen genauer anschauen.
1.Economic Connectedness Index: Er hat eine starke positive Korrelation von 0.73 mit der wirtschaftlichen Mobilität. Durch stärkere soziale Vernetzung steigen also die Chancen für wirtschaftlichen Aufstieg. In wirtschaftlich guten Regionen wie Silicon Valley oder Arlington County gibt es eine hohe Vernetzung zwischen Gruppen, die es Haushalten ermöglicht, ihre Einkommen zu steigern. Desweiteren hat er einen positiven Zusammenhang mit dem Haushaltseinkommen im Median von 0.63. Wohlhabendere Counties spiegeln sich also in einer besseren sozialen Vernetzung wider. Der EC-Index korreliert stark negativ mit Einkommensungleichheit. Starke Einkommensungleichheit fördert Segregation und erschwert sozialen Austausch. Auch mit der Exposition von High-SES Personen korreliert er stark positiv (0.94). Mehr Kontakt zu wohlhabenderen Schichten führt also zu einer höheren sozialen Vernetzung.
2.Upward Mobility: Wirtschaftliche Mobilität korreliert positiv mit dem durchschnittlichen Haushaltseinkommen (0.71). Höheres Einkommen fördert also die Aufstiegschancen. Einkommensungleichheit mindert diese jedoch (-0.60)
3.Freundschafts-Bias: Dieser korreliert jeweils negativ mit dem EC-Index (-0.38) und mit der Exposition (-0.18). Sozial seggregierte Regionen verhindern also eine soziale vernetzung.
4.Exposition: Sehr starke Korrelation mit dem EC-Index. Eine der stärksten Korrelationen in der Matrix. Zeigt also, der Kontakt und die Exposition mit wirtschaftlich besser gestellten Personen ist fast vollständig mit dem EC-Index verknüpft. Sie ist also eine der wichtigsten Variablen für eine gute soziale Vernetzung. in denen einkommensschwache Menschen Zugang zu besseren Schulen, Jobs oder Nachbarschaften haben (hohe Exposition), erreichen automatisch höhere Werte im EC-Index. Stark negativ korreliert die Exposition mit Einkommensungleichheit (-0.60). Counties mit hoher Exposition haben häufiger geringere Einkommensungleichheit, da hier die Regionen weniger seggregiert sind.


Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?

  1. Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.


Beschreibung:
Diese Grafik zeigt den Zusammenhang von Median Haushaltseinkommen auf der X-Achse und Economic Connectedness Index auf der Y-Achse. Die Counties sind farblich und gemessen in der wirtschaftlichen Mobilität. Gelb bedeutet weniger wirtschaftliche Mobililität und Blau bedeutet hohe wirtschaftliche Mobilität. Die meisten Counties verteilen sich im Bereich bei einem Haushaltseinkommen von 40.000 und 80.000 USD und einem EC-Index von 0,5 und 1,0. Im unteren Einkommensbereich finden sich einige Counties mit relativ hohem EC-Index. So gibt es aber auch in einem Bereich mit hohem Einkommen Counties mit geringem EC-Index.

Interpretation:
Je höher das Median Haushaltseinkommen desto höher auch der EC-Index. Wohlhabende Regionen sind stärker und besser Vernetzt. Dies ermöglicht bessere Chancen für soziale und wirtschaftliche Mobilität. Allerdings gibt es auch vereinzelte Counties, welche trotz hohem Haushaltseinkommen und hohem EC-Index wenig wirtschaftliche Mobilität haben. Dies deutet auf mögliche Segregation hin, bei der einkommensstarke Gruppen isoliert bleiben und keine Vorteile erhalten. Regionen mit niedrigem EC-Index und niedrigem Haushaltseinkommen weissen vermutlich starke Seggregation und wenig Wirtschaft auf. Diese Counties könnten eher ländlich sein. Die Ausreißer die trotz moderatem EC-Index und niedrigem Haushaltseinkommen hohe wirtschaftliche Mobilität aufweisen, verdanken dies vermutlich politischen Initiativen und Förderungen (z.B von Bildung).


  1. Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.

Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:

  • Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
  • In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
  • Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
  • Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?

Rückwärtskausalität: Bedeutet, dass man annimmt die soziale Vernetzung beeinflusst die wirtschaftliche Mobilität eigentlich ist es aber andersrum. Die Autoren argumentieren, dass der EC-Index durch Freundschaftsmuster in der Jugend bestimmt wird, lange bevor wirtschaftliche Mobilität stattfinden kann. Deshalb wird Rückwärtskausalität ausgeschlossen.
Selektionseffekte: Tritt auf, wenn bestimmte Individuen oder Haushalte aktiv entscheiden, in Regionen mit besserer sozialer Vernetzung zu ziehen. Dadurch entsteht eine Verzerrung im Zusammenhang zwischen EC-Index und Mobilität. Laut Studie blebit der Effekt stabil, selbst wenn migrationsbedingte Selektionseffekte berücksichtigt werden.
Ausgelassene Variablen: Es könnte unbeobachtete oder nicht gemessene Variablen geben, die sowohl die wirtschaftliche Mobilität als auch die soziale Vernetzung beeinflussen, wodurch der Zusammenhang zwischen den beiden nur scheinbar kausal ist. Z.b Bildung, Politik oder Kultur. Die Autoren nutzen robuste Kontrollvariablen wie Bildungsgrad, ethnische Vielfalt und wirtschaftliche Struktur, um den Einfluss potenzieller ausgelassener Variablen zu minimieren.
Glaubhaftigkeit der Argumentation: Die Argumente der Autoren, insbesondere die Nutzung von Freundschaftsnetzwerken in der Jugend als Messgröße für den EC-Index, wirken überzeugend. Dies reduziert das Risiko von Rückwärtskausalität erheblich. Es bleibt unklar, wie vollständig und repräsentativ die Daten über Freundschaftsnetzwerke sind. Eventuell wurden wichtige Aspekte sozialer Beziehungen nicht berücksichtigt. Desweiteren könnten Freundschaften kulturell unterschiedlich interpretiert werden, was die Ergebnisse verzerrt. Insgesamt ist die Argumentation schlüssig und gut abgesichert, jedoch nicht vollständig wasserdicht. Es bleibt Raum für Zweifel an nicht erfassten Variablen und der Messmethodik.
Optimale Bedingungen zur Messung eines kausalen Effekts:
1.Experimentelle Daten: Randomisiertes Kontrollgruppendesign wäre ideal, bei dem Menschen zufällig in Regionen mit unterschiedlichem EC-Index zugewiesen werden.
2.Langfristige Beobachtungsstudien: Daten über Freundschaftsnetzwerke, wirtschaftliche Entwicklung und Mobilität müssten über Jahrzehnte hinweg gesammelt werden, um zeitliche Abfolgen genau zu bestimmen.
3.Kontrolle von Störfaktoren: Es sollten möglichst umfassende Daten über potenzielle Störvariablen wie Bildung, Kultur, lokale Wirtschaftspolitik und Migration erfasst werden.
4.Simulationsmodelle: Kombiniert mit empirischen Daten könnten Simulationsmodelle genutzt werden, um den Einfluss von Netzwerken auf wirtschaftliche Mobilität unter verschiedenen Szenarien zu testen.


Einflussfaktoren auf die soziale Vernetzung

Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?

  1. Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe Exposition (exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.

Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.

Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?


Beschreibung:
Wie in Aufgabe 7 sehen wir eine Karte der USA auf County-Ebene. Diesmal zeigt die Karte die Exposition in den jeweiligen Counties. Die Farbcodierung reicht von Gelb (hohe Exposition) über Orange bis Lila (niedrige Exposition). Hohe Exposition (Gelb) vorallem in Küstenstaaten (Kalifornien, New York, Boston). Lilatöne besonders im Süden und einigen regionen des mittleren Westens. Alaska und Hawaii zeigen gemischte Muster
Vergleich:
Die Karte weißt Ähnlichkeiten zu der Karte aus Aufgabe 7 (wirtschaftsliche Mobilität) auf. Regionen mit hoher wirtschaftlicher Mobilität (z. B. urbane und wirtschaftlich entwickelte Gebiete an der Ost- und Westküste) weisen auch tendenziell eine hohe Exposition auf. Ländliche Gebiete mit geringer wirtschaftlicher Mobilität (vorallem im Süden) zeigen ebenfalls niedrige Exposition. Einige ländliche Gebiete mit moderater Mobilität zeigen eine überraschend niedrige Exposition, was darauf hindeutet, dass andere Mechanismen (z. B. Bildung oder kulturelle Faktoren) die Mobilität dort unterstützen könnten. Die Annahme, dass die Exposition eine Rolle für die soziale Vernetzung und somit für die wirtschaftliche Mobilität spielt, wird größtenteils durch die Karte gestützt. Regionen mit hoher Exposition bieten mehr Möglichkeiten für Kontakte zwischen Einkommensgruppen, was die soziale Vernetzung fördert.


Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.

  1. Um zu untersuchen ob es eine entsprechende Segregation der Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein Punktediagramm erzeugen, welche auf der x-Achse die Exposition (exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihr Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.

Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:

  • Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?

Beschreibung:

Die Grafik zeigt den Zusammenhang zwischen Exposition (x-Achse), Freundschafts-Bias (y-Achse) und der sozialen Vernetzung (Economic Connectedness Index, dargestellt durch die Farbskala gelb bis blau). Zusätzlich sind die Counties “San Francisco County, California” und “Bronx County, New York” hervorgehoben. Steigende Werte auf der x-Achse bedeuten eine höhere Exposition, also einen höheren Anteil gutverdienender Personen in einem County. Höhere Werte auf der y-Achse deuten auf einen stärkeren Freundschafts-Bias hin. Gelb zeigt einen niedrigen Economic Connectedness Index und Blau zeigt einen hohen EC-Index.
Interpretation: Counties mit höherer Exposition zeigen tendenziell eine höhere soziale Vernetzung (bläuliche Farben). Dies deutet darauf hin, dass ein höherer Anteil gutverdienender Personen in einem County die Wahrscheinlichkeit erhöht, dass Menschen Freundschaften mit Personen aus höheren Einkommensgruppen schließen können. Counties mit höherem Freundschafts-Bias weisen eine geringere soziale Vernetzung (gelbe Farbtöne) auf. Ein hoher Bias schränkt die Verbindung zwischen Einkommensgruppen ein, selbst wenn die Exposition hoch ist. Hohe Exposition und ein niedriger Freundschafts-Bias maximiert die soziale Vernetzung. Beispiele wie San Francisco zeigen, dass eine moderate bis hohe Exposition kombiniert mit einem geringen Freundschafts-Bias zu einem hohen ECI führt. Hohe Exposition und ein hoher Freundschafts-Bias führt zu einer eingeschränkten sozialen Vernetzung trotz hoher Exposition, da die Trennung zwischen Einkommensgruppen stark ist. Bronx County ist ein Beispiel dafür. Der ECI steigt also tendenziell in Counties mit hoher Exposition und niedrigem Bias.


  1. Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.

Maßnahmen für höhere Exposition:
1.Steueranreize für Diversität: Steuervergünstigungen für private Investoren könnten den Bau von Wohnraum in wohlhabenden Regionen fördern. Dies könnte zu einer stärkeren sozialen und wirtschaftlichen Durchmischung führen.
2.Stärkung öffentlicher Verkehrsmittel: Bessere Mobilität zwischen einkommensschwachen und einkommensstarken Regionen durch gut ausgebaute öffentliche Verkehrsmittel, um den Zugang zu Arbeitsplätzen, Bildungseinrichtungen und sozialen Netzwerken zu erleichtern.
Maßnahmen zur Reduzierung des Freundschafts-Bias:
1.Bildungsprogramme: Soziale und wirtschaftliche Diversität in Schulen fördern, eventuell auch gemischte Schulbezirke. Schulaustausche zwischen Schulen aus einkommensschwachen und einkommensstarken Gegenden.
2.Inklusive Gemeinschaftsprojekte: Förderung von lokalen Vereinen, Sportclubs oder gemeinnützigen Projekten, die den Austausch zwischen verschiedenen sozialen Gruppen fördern. Veranstaltungen und Programme, die gezielt auf die Vernetzung von Menschen aus unterschiedlichen Einkommensgruppen abzielen. Institutionen wie Vereine, Schulen oder lokale Netzwerke können dazu beitragen, den Freundschafts-Bias zu reduzieren und die soziale Vernetzung zu stärken. Deshalb auch finanzielle Förderung von Institutionen, die sich für soziale Integration und Chancengleichheit einsetzen.
Förderung von beruflicher und sozialer Mobilität:
1.Unterstützung von Start-ups in benachteiligten Regionen: Startkapital und Mentoring für lokale Unternehmer, um wirtschaftliche Aktivität und Vernetzung zu fördern.


Zusatzaufgabe

  1. Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:

Hier können Sie die Daten auf College Ebene herunterladen



  1. Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten funktioniert dies mit dem R Paket tidycensus. Für den API Zugang müssen Sie sich erst bei IPUMS registrieren und können danach einen API Key beantragen, welchen Sie dann für den Daten download über das tidycencus Paket hinterlegen müssen.

Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.



  1. Stellen Sie den Economic Connectedness Index des Colleges (ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paket leaflet.


  1. Erstellen Sie ein Punktediagramm auf College Ebene, welches den Zusammenhang zwischen dem Freundschafts-Bias und der Exposition beleuchtet auf College Ebene näher beleuchtet.

Tragen Sie dafür auf der x-Achse den Anteil von Studierenden mit gut verdienenden Eltern ab (exposure_parent_ses_college) und den Freundschafts-Bias unter den Studierenden (bias_parent_ses_college)

Heben Sie fünf Colleges ihrer Wahl in der Grafik hervor (inkl. Beschriftung).

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die fünf von Ihnen hervorgehobenen Colleges ein.


Beschreibung:
Das Punktediagramm zeigt die Zusammenhänge zwischen dem Anteil von Studierenden mit gut verdienenden Eltern (Exposition) auf der x-Achse und dem Freundschafts-Bias auf der y-Achse auf College-Ebene. Jeder Punkt stell ein College dar. Die rote Regressionslinie gibt den generellen Trend in den Daten wieder, mit einer leicht negativen Korrelation von -0.16. Desweiteren wurden 5 Coleges hervorgehoben. Dartmouth College (hellblau), Michigan State University (hellgrün), The University of Alabama (pink), University of Arizona (lila) und Yale University (Gelb).
Interpretation:
Die negative Korrelation von -0.16 bedeutet, dass ein höherer Anteil an wohlhabenden Studierenden tendenziell mit einem niedrigeren Freundschafts-Bias einhergeht. Bedeutet in Colleges mit mehr wohlhabenden Studierenden tendenziell eine etwas stärkere soziale Durchmischung zwischen Einkommensgruppen stattfindet. Allerdings ist die Korrelation relativ schwach, was bedeutet, dass es viele Ausnahmen gibt. Yale hat eine sehr hohe Exposition, was bedeutet, dass ein großer Anteil der Studierenden aus wohlhabenden Familien stammt. Dies macht Sinn, da Yale eine der reomiertesten Ivy-League Universitäten ist. Der Freundschafts-Bias ist relativ niedrig, was darauf hindeutet, dass es hier soziale Durchmischung gibt – wohlhabende und weniger wohlhabende Studierende interagieren. Dartmouth hat ebenfalls eine hohe Exposition, wenn auch etwas geringer als Yale. Der Freundschafts-Bias scheint etwas höher zu sein als bei Yale, was darauf hinweist, dass sich wohlhabende Studierende stärker untereinander vernetzen. Dartmouth ist kleiner und weniger divers als Yale, was dazu führen kann, dass wohlhabendere Studierende eher unter sich bleiben. Michigan State hat eine mittlere Exposition, das heißt, es gibt hier sowohl wohlhabende als auch weniger wohlhabende Studierende. Der Freundschafts-Bias ist niedrig, was darauf hindeutet, dass es eine hohe soziale Durchmischung gibt. Öffentliche Universitäten wie Michigan State haben eine breitere soziale Durchmischung als private Elite-Universitäten. Alabama hat eine mittlere Exposition, was bedeutet, dass der Anteil an wohlhabenden Studierenden nicht extrem hoch ist. Der Freundschafts-Bias scheint etwas höher zu sein, was bedeutet, dass wohlhabende Studierende stärker unter sich bleiben. Universitäten im Süden haben oft eine stärkere soziale und kulturelle Segregation als Unis an der Ost- oder Westküste. University of Arizona hat eine etwas niedrigere Exposition, das heißt, der Anteil an wohlhabenden Studierenden ist geringer als an Ivy-League-Unis. Der Freundschafts-Bias ist nicht extrem hoch, was bedeutet, dass es soziale Durchmischung gibt. Im Westen der USA gibt es generell eine etwas stärkere soziale Mobilität als im Süden. Öffentliche Universitäten haben oft eine vielfältigere Studierendenschaft als private Elite-Universitäten.
Zusammenfassung:
Je höher die Exposition, desto niedriger der Freundschafts-Bias – aber das ist nicht immer der Fall.
Elite-Unis (Yale, Dartmouth): Hohe Exposition, aber Yale zeigt weniger Freundschafts-Bias als Dartmouth → möglicherweise durch stärkere Programme für soziale Mobilität.
Große öffentliche Unis (Michigan State, Alabama, Arizona): Michigan State zeigt eine gute soziale Durchmischung. Alabama hat eine höhere Segregation, wahrscheinlich durch historische und kulturelle Faktoren. Arizona liegt irgendwo dazwischen, mit eher guter Durchmischung.



Literatur

Chetty, R., Friedman, J. N., Hendren, N., Jones, M. R., & Porter, S. R. (2018). The opportunity atlas: Mapping the childhood roots of social mobility (No. w25147). National Bureau of Economic Research. https://doi.org/10.3386/w25147

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital I: measurement and associations with economic mobility. Nature 608, 108–121 (2022a). https://doi.org/10.1038/s41586-022-04996-4

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital II: determinants of economic connectedness. Nature 608, 122–134 (2022b). https://doi.org/10.1038/s41586-022-04997-3