Motivation

In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.

Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer Vernetzung:

Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin, dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über soziale Schichten hinweg vernetzt sind, profitieren tendenziell von besseren wirtschaftlichen Perspektiven.

Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.

Datengrundlage

Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:

Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.

Einlesen

Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.

  1. Lesen Sie den Datensatz social_capital_county.rds aus dem Unterordner “Daten” in R ein und nennen diesen Datensatz social_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.

Schränken Sie ihren Datensatz auf folgende Variablen ein:

  • county
  • ec_county
  • exposure_gpr_mem_county
  • bias_grp_mem_county
  • pop2018

Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.

Beantworten Sie auch folgende Fragen:

  • Was ist eine Beobachtung?
  • Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
  • In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?

Eine Beobachtung in diesem Datensatz stellt ein einzelnes County in den USA dar. Für jedes County werden zusammengefasste Statistiken zur sozialen Vernetzung sowie demografische Informationen bereitgestellt, darunter Daten zur sozialen Exposition, zum Freundschafts-Bias und zur Bevölkerungsgröße.

Es sind 3089 Counties im Datensatz vorhanden. Die USA hat 3144 Counties und 100 County-ähnliche Regionen, also insgesamt 3244 Counties/Regionen. In 95.14 Prozent der Fälle liegen Informationen zu allen Variablen einer Beobachtung vor.

Die Variable ec_county beschreibt die soziale Vernetzung der Personen eines Counties. Konkret ist soziale Vernetzung definiert als der zweifache Anteil von Freunden mit hohem sozioökonomischen Status einer Person mit niedrigem sozioökonomischen Status. Diese Größe wird über alle Personen mit niedrigem sozioökonomischen Status gemittelt.

Die Variable exposure_gpr_mem_county gibt Auskunft über die durchschnittliche Exposition von Personen mit niedrigem sozioökonomischen Status zu Personen mit hohem sozioökonomischen Status. Diese Größe ergibt sich als der zweifache Anteil von Personen mit hohem sozioökonomischen Status, die in der Facebook-Gruppe einer Person mit niedrigem sozioökonomischen Status sind, gemittelt über alle Personen mit niedrigem sozioökonomischen Status.

Schließlich steht die Variable bias_grp_mem_county für den Freundschafts-Bias. Diese Variable stellt die Tendenz zur Freundschaftsbildung von Personen mit unterschiedlichem sozioökonomischen Status dar, die sich bereits in einer gemeinsamen Facebook-Gruppe befunden haben.

Die Variable pop2018 beinhaltet die Einwohnerzahl des Counties aus dem Jahr 2018.


  1. Weiterhin haben wir Ihnen den Datensatz county_covariates.dta im Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihn covariates.

Schränken Sie diesen Datensatz auf die folgenden Variablen ein:

  • county
  • kfr_pooled_pooled_p25
  • gini99_simple

Generieren Sie eine neue Variable upward_mobility als kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die Variable kfr_pooled_pooled_p25.

Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.

Hinweis: Mit dem haven Paket können Sie .dta Dateien einlesen


Die replication_package_README.pdf enthält eine detaillierte Beschreibung der Variablen in den verschiedenen Datensätzen, die im Rahmen der Replikation der Ergebnisse von Chetty et al. (2022) verwendet werden.

Landkreisdaten (County-Level Data) Diese Daten umfassen den FIPS-Code, die Commuting Zone (CZ) und deren Namen sowie Indizes zur Einkommens- und Rassensegregation. Weitere Variablen betreffen die Bevölkerung von 2018 und soziale Mobilität, wie den kausalen Einkommensbereich und die Teenager-Geburtenrate.

Postleitzahl-Daten (ZIP Code-Level Data) Auf Postleitzahl-Ebene werden demografische Merkmale wie die Bevölkerung 2018, das Einkommensniveau im 25. Perzentil und die Jobanzahl innerhalb von 5 Meilen erfasst. Diese Daten helfen, geografische Disparitäten und Einkommensmobilität zu analysieren.

Schulbezogene Daten (High School Data) Für jede Schule werden Merkmale wie NCES-Schul-ID, Schülerzahl, der Anteil der Schüler, die kostenlose Mahlzeiten erhalten, sowie die ethnische Zusammensetzung und Programme wie Advanced Placement (AP) erfasst.

Bildungsergebnisse und Abschlussdaten Die Daten umfassen Schülerzahlen in den Jahrgangsstufen 9-12 sowie den Anteil männlicher und weiblicher Schüler und die Teilnahme an speziellen Programmen wie AP oder begabten Programmen.

Weitere ZIP-Code-Daten Aus der American Community Survey werden Informationen zu Haushalteinkommen und Medianwerten für verschiedene Altersgruppen in verschiedenen Postleitzahlgebieten bereitgestellt.

Die wirtschaftliche Mobilität upward_mobility ist ein Maß für den finanziellen Aufstieg einer Person aus einer ärmeren Familie. Dieses Maß ist definiert als durchschnittlicher prozentualer Rang eines Erwachsenen mit ärmeren Eltern in Bezug auf das Einkommen. Dabei gelten die Eltern als arm, falls sie einkommensmäßig in den unteren 25 Prozent sind.

Der Gini-Koeffizient gini99_simple misst die Einkommensungleichheit eines Counties.


  1. Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.

Lesen sie die Daten County_census_data.shp in R ein und speichern diesen in R als county_census_shape ab. Neben den County Namen und und Polygonen enthält dieser Datensatz auch das geschätzte Median Einkommen pro County für das Jahr 2023 (medincE).

Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren



Deskriptive Analysen

Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.

  1. Verbinden Sie die Dataframes county_census_shape, covariates und social_capital_county zu einem Datensatz analysis_data.

Wir verwenden den Datensatz covariates als Hauptdatensatz, da dieser alle Beobachtungen enthält, die auch in dem Datensatz social_capital_county enthalten sind. Bei einem left_join gehen also keine Beobachtungen aus dem Datensatz social_capital_county verloren. Um diesem Datensatz noch die Kartendaten aus dem Datensatz county_census_shape hinzuzufügen, verwenden wir einen weiteren left_join. Dabei gehen 11 Beobachtungen des Datensatzes county_census_shape verloren.


  1. Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:

Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:

Hinweis: Die genaue Berechnung der sozialen Vernetzung (ec_county) finden Sie im Dokument “social_capital_codebo


Die wirtschaftliche Mobilität gibt an, wie einfach es für Menschen ist, aus einer niedrigeren Einkommensklasse in eine höhere zu steigen. In diesem Fall wird sie durch den Wert kfr_pooled_pooled_p25 gemessen, der zeigt, wie wahrscheinlich es ist, dass Leute im unteren Einkommensbereich (25. Perzentil) in ein höheres Einkommensniveau aufsteigen. Dieser Wert wird mit 100 multipliziert, sodass wir die Wahrscheinlichkeit in Prozent bekommen. Eine hohe wirtschaftliche Mobilität bedeutet also, dass es für viele Menschen im unteren Einkommensbereich leichter ist, nach oben aufzusteigen.

Die soziale Vernetzung misst, wie stark Menschen in einem County miteinander vernetzt sind, und zwar über sozioökonomische Grenzen hinweg. In diesem Projekt wird die soziale Vernetzung durch den sogenannten “Economic Connectedness Index” (ec_county) dargestellt. Ein hoher Wert dieses Index bedeutet, dass Menschen in diesem County nicht nur innerhalb ihrer eigenen sozialen Schicht miteinander verbunden sind, sondern auch starke Verbindungen zu Leuten aus anderen Schichten haben. Ein hoher Wert kann den Zugang zu Ressourcen und Chancen erleichtern, was den sozialen Aufstieg fördern könnte.

Wenn Menschen gut vernetzt sind, haben sie besseren Zugang zu Informationen, Jobmöglichkeiten und anderen Ressourcen, die für den Aufstieg wichtig sind. Ein hoher ec_county-Wert bedeutet also, dass die Menschen in einem County voneinander profitieren können, was den sozialen Aufstieg erleichtert. Menschen, die gut vernetzt sind, haben mehr Chancen, von anderen zu lernen und von deren Netzwerken zu profitieren. Zum Beispiel könnten sie von Leuten aus höheren Einkommensschichten erfahren, welche Karrieremöglichkeiten es gibt oder wie man beruflich vorankommen kann. Wenn Menschen in einem County gut über soziale Schichten hinweg vernetzt sind, werden sie wahrscheinlich auch Zugang zu besseren Ressourcen haben. Dies könnte ihren sozialen Aufstieg fördern, da sie dann nicht nur innerhalb ihrer eigenen Schicht agieren, sondern auch Kontakte zu erfolgreichen oder besser vernetzten Gruppen haben.

Der ec_county-Wert gibt an, wie gut Menschen in einem County miteinander vernetzt sind, auch über sozioökonomische Grenzen hinweg. Ein hoher ec_county-Wert bedeutet, dass Leute in diesem County starke Verbindungen zu Menschen aus unterschiedlichen sozialen Schichten haben. Der Index hilft also dabei zu verstehen, wie stark die sozialen Netzwerke innerhalb eines Countys sind und wie sehr diese Netzwerke den Austausch von Ressourcen und Informationen fördern.

Die Exposition zeigt, wie sehr die Menschen in einem County mit anderen sozioökonomischen Gruppen in Kontakt kommen. Wenn Menschen in einem County viel Kontakt mit verschiedenen sozialen Gruppen haben, sollte die soziale Vernetzung auch höher sein.

Der Freundschafts-Bias zeigt, wie stark sich Menschen in einem County eher mit Leuten aus ihrer eigenen sozialen Schicht anfreunden, anstatt Kontakte zu anderen sozialen Gruppen zu knüpfen. Ein hoher Freundschafts-Bias würde also zu einer geringeren sozialen Vernetzung führen, weil die sozialen Netzwerke innerhalb der eigenen Gruppe bleiben und keine Verbindungen zu anderen Schichten bestehen.

Wirtschaftliche Mobilität misst, wie einfach es für Personen ist, von einer niedrigen in eine höhere Einkommensklasse aufzusteigen. Soziale Vernetzung (Economic Connectedness Index, ec_county) bezieht sich auf die Stärke der wirtschaftlichen Verbindungen innerhalb eines Landkreises, basierend auf Facebook-Freundschaften und sozialen Netzwerken.

Ein hoher Wert der sozialen Vernetzung sollte die wirtschaftliche Mobilität fördern. Wenn Menschen gut vernetzt sind, haben sie besseren Zugang zu Ressourcen, Jobmöglichkeiten und wichtigen Informationen, was ihre Chancen auf ökonomischen Aufstieg erhöht. Ein hoher ec_county-Index deutet auf starke Netzwerke hin, die den Austausch von Ressourcen und Chancen erleichtern. Solche Netzwerke sollten die wirtschaftliche Mobilität verbessern.

Exposition beschreibt, wie stark Menschen in einem County bestimmten sozialen oder wirtschaftlichen Gruppen ausgesetzt sind. Eine hohe Exposition zu gut vernetzten Gruppen sollte den Economic Connectedness Index stärken, da mehr Interaktionen zu stärkeren Netzwerken führen. Freundschafts-Bias misst, wie stark sich Menschen mit anderen aus ähnlichen sozialen oder kulturellen Gruppen verbinden. Ein hoher Freundschafts-Bias könnte die Vernetzung innerhalb homogener Gruppen verstärken, während ein niedriger Bias zu breiteren, aber weniger intensiven Netzwerken führen könnte.


  1. Schauen Sie sich in einem ersten Schritt an, wie die Variablen im Datensatz analysis_data über alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.

Beschreiben und interpretieren Sie Ihre Tabelle.

Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?

Hinweis: Achten Sie auf eine schöne Darstellung ihrer Tabelle mittels der Pakete kableExtra oder gt!


Übersicht wichtiger Kenngrößen einiger Variablen
Variable Mittelwert Standardabweichung Minimum Q25 Median Q75 Maximum
Gini-Koeffizient 0.29 0.06 -0.06 0.24 0.29 0.33 0.57
wirtschaftliche Mobilität 42.72 6.48 12.22 38.44 41.95 46.07 68.83
Economic Connectedness 0.81 0.18 0.29 0.70 0.81 0.94 1.36
Exposition 0.91 0.21 0.26 0.77 0.91 1.05 1.49
Freundschafts-Bias 0.06 0.05 -0.11 0.03 0.06 0.10 0.33
Einwohnerzahl 2018 108010.41 337782.56 544.00 12630.00 27887.00 72728.50 10098052.00
Median Einkommen 64956.94 18342.48 16170.00 54088.00 63125.00 73051.00 178707.00

Der durchschnittliche Gini-Koeffizient liegt bei 0.29, was auf eine moderate Einkommensungleichheit hinweist. Ein negativer Wert von -0.06 ist jedoch ungewöhnlich und könnte auf Datenfehler hindeuten.

Der Mittelwert liegt bei 42.72, aber es gibt große Schwankungen (Minimum 12.22, Maximum 68.83), was auf regionale Unterschiede in der Mobilität hinweist.

Mit einem Mittelwert von 0.81 gibt es eine insgesamt starke soziale Vernetzung, jedoch große Unterschiede (Minimum 0.29, Maximum 1.36).

Der Mittelwert liegt bei 0.91, mit einem breiten Bereich zwischen 0.26 und 1.49, was auf unterschiedliche soziale Integrationen in den Landkreisen hinweist.

Der Wert von 0.06 zeigt einen geringen Bias, jedoch weist das Minimum von -0.11 auf ungewöhnliche Muster hin.

Die durchschnittliche Bevölkerungszahl ist 108.010, aber die große Standardabweichung und das Maximum von 10 Millionen zeigen eine starke Variation in der Größe der Landkreise.

Mit einem Durchschnitt von 65.000 US-Dollar gibt es große Einkommensunterschiede, das Minimum liegt bei 16.170 US-Dollar und das Maximum bei 178.707 US-Dollar.

Zusammenfassend lässt sich sagen, dass es bei einigen Variablen auffällige Ausreißer gibt, wie etwa der negative Wert beim Gini-Koeffizienten und beim Freundschafts-Bias. Diese Ausreißer sollten näher untersucht werden, da sie entweder auf Fehler in den Daten oder auf besondere soziale Dynamiken in den betroffenen Landkreisen hinweisen könnten. Zudem zeigen die Daten eine große Heterogenität zwischen den Landkreisen, insbesondere hinsichtlich der Bevölkerungsgröße und der sozialen Mobilität.


Soziale Vernetzung und wirtschaftliche Mobilität

Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre Analyse näheres über die soziale Vernetzung lernen, den Economic Connectedness Index (ec_county), welcher aus den Facebook Freundschaften generiert wurde. Die Daten des Economic Connectedness Index wurden auf County Ebene aggregiert, beruhen jedoch auf Freundschaftsdaten von individuellen Facebook Nutzern.

  1. Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.

Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:

Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?

Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt sich das tigris Paket und der Befehl shift_geometry() um Alaska, Hawaii und Puerto Rico schön darstellen zu lassen.


Die Karte zeigt die geographische Verteilung des Economic Connectedness Index (EC-Index) in den USA und stellt die soziale Vernetzung auf County-Ebene dar. Landkreise mit höherem EC-Index sind in dunkleren Farben eingefärbt und weisen eine stärkere soziale Vernetzung auf, während hellere Farben auf eine geringere Vernetzung hinweisen. Dies könnte auf städtische Gebiete mit aktiveren Facebook-Nutzern oder ländliche Regionen mit weniger aktiven Online-Communities hinweisen.

Um gültige Aussagen über den Einfluss des Economic Connectedness Index (EC-Index) auf die wirtschaftliche Mobilität zu treffen, müssen einige Annahmen getroffen werden. Zunächst muss die Kausalität angenommen werden, dass eine stärkere soziale Vernetzung (ein hoher EC-Index) zu einer verbesserten wirtschaftlichen Mobilität führt und nicht umgekehrt, also dass die Vernetzung die Ursache und nicht das Ergebnis der Mobilität ist.

Weiterhin muss die Repräsentativität des EC-Index gewährleistet sein, indem davon ausgegangen wird, dass der EC-Index, der auf Facebook-Freundschaften basiert, die tatsächliche soziale Vernetzung gut abbildet. In ländlichen Gebieten, in denen weniger Menschen Facebook nutzen, könnte dies jedoch zu Verzerrungen führen.

Schließlich ist es notwendig, Störfaktoren wie Bildung, Infrastruktur oder Arbeitsmöglichkeiten zu kontrollieren, um den spezifischen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität isoliert betrachten zu können.


  1. Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.

Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:

  • Median Haushaltseinkommen in dem County (medincE)
  • Wirtschaftliche Mobilität in dem County (upward_mobility)
  • Einkommensungleichheit in dem County (gemessen mit dem Gini-Koeffizient des Counties) (gini99_simple)

Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.

Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:

  • Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.

Top 10 Counties mit höchstem Economic Connectedness Index (ECI)
County ECI Median Haushaltseinkommen Wirtschaftliche Mobilität Einkommensungleichheit
Rockingham County, New Hampshire 1.36 113927 45.31 0.23
Douglas County, Colorado 1.35 145737 48.24 0.12
San Francisco County, California 1.31 141446 50.39 0.31
Morgan County, Utah 1.29 126092 54.12 0.15
Madison County, Idaho 1.28 58259 51.54 0.22
Arlington County, Virginia 1.27 140160 46.28 0.39
Sussex County, New Jersey 1.26 114316 47.04 0.18
Wright County, Minnesota 1.25 106666 49.54 0.18
Gunnison County, Colorado 1.25 77358 48.71 0.35
Pitkin County, Colorado 1.24 100318 45.83 -0.01
Top 10 Counties mit niedrigstem Economic Connectedness Index (ECI)
County ECI Median Haushaltseinkommen Wirtschaftliche Mobilität Einkommensungleichheit
Todd County, South Dakota 0.29 39148 30.18 0.32
Oglala Lakota County, South Dakota 0.33 34769 24.84 NA
Terrell County, Georgia 0.35 43812 31.17 0.36
Bullock County, Alabama 0.36 36723 34.57 0.31
Allendale County, South Carolina 0.36 31603 31.40 0.33
Robeson County, North Carolina 0.36 40318 32.10 0.36
Early County, Georgia 0.38 53750 33.83 0.46
Marlboro County, South Carolina 0.38 36293 32.82 0.31
Crisp County, Georgia 0.39 42745 32.89 0.42
Scotland County, North Carolina 0.40 43500 31.08 0.39

Die beiden Tabellen zeigen die 10 Landkreise mit dem höchsten und niedrigsten Economic Connectedness Index (ECI). Die Variablen, die betrachtet werden, sind das Median-Haushaltseinkommen, die wirtschaftliche Mobilität und die Einkommensungleichheit.

Die Unterschiede in den Variablen zwischen den Landkreisen mit hohem und niedrigem Economic Connectedness Index (ECI) waren aus folgenden Gründen zu erwarten:

Landkreise mit hohem ECI haben in der Regel ein höheres Median-Haushaltseinkommen. In Regionen mit starken sozialen Netzwerken gibt es tendenziell bessere wirtschaftliche Bedingungen, mehr berufliche Chancen und eine höhere Lebensqualität. Zum Beispiel haben Landkreise wie San Francisco und Douglas County hohe Median-Haushaltseinkommen, was auf eine starke wirtschaftliche Basis hindeutet. Solche Regionen ziehen auch mehr Fachkräfte an und bieten bessere berufliche Netzwerke.

In Landkreisen mit hohem ECI ist die wirtschaftliche Mobilität tendenziell höher. Dies kann darauf zurückgeführt werden, dass starke soziale Netzwerke bessere Möglichkeiten für den beruflichen Aufstieg bieten. Wohlhabendere, stärker vernetzte Regionen verfügen über mehr Ressourcen, Bildungseinrichtungen und berufliche Netzwerke, die den sozialen Aufstieg fördern. Landkreise wie Morgan County oder Madison County weisen daher eine hohe wirtschaftliche Mobilität auf.

Auch die Einkommensungleichheit korreliert mit dem ECI. Landkreise mit höherem ECI tendieren zu geringerer Einkommensungleichheit. Eine starke soziale Vernetzung fördert oft eine gerechtere Verteilung von Wohlstand und Ressourcen. In Regionen wie Douglas County oder Rockingham County mit niedrigeren Gini-Koeffizienten zeigt sich eine relativ gerechte Einkommensverteilung. Im Gegensatz dazu haben Landkreise mit niedrigerem ECI, wie Todd County oder Oglala Lakota County, eine höhere Einkommensungleichheit.

Insgesamt entsprechen die Unterschiede in den Variablen den Erwartungen, da eine starke soziale Vernetzung und ein hoher ECI in der Regel mit besseren ökonomischen Bedingungen, höherer Mobilität und gerechterer Einkommensverteilung einhergehen. Auf der anderen Seite führen geringe soziale Vernetzung und niedriger ECI in ärmeren Landkreisen oft zu weniger Chancen, niedrigerer wirtschaftlicher Mobilität und größerer Einkommensungleichheit.


Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?

  1. In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot) erstellen, welches die wirtschaftliche Mobilität (upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
  • In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?

Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen


Die Datenpunkte, welche für die Counties stehen, formen eine Punktewolke, welche sich von südwest bis nordost erststreckt. Es gibt wenige Counties, die nicht diesem beschriebenem Muster folgen, wie zum Beispiel die drei Regionen Hoonah-Angoon Census Area, North Slope Borough und Denali Borough aus Alaska. Diese Regionen weisen trotz hohem ECI (zwischen 1 und 1.2) eine geringe wirtschaftliche Mobilität (circa 25 bis 30 Prozent) auf. Umgekehrt besitzt das Corson County aus South Dakota einen kleinen ECI (etwas mehr als 0.4) aber eine hohe wirtschaftliche Mobilität (fast 50 Prozent). Die beiden Counties mit dem größten ECI (über 1.3) sind Douglas County in Colorado und Rockingham County in New Hampshire weisen eine vergleichsweise eher durchschnittliche wirtschaftliche Mobilität auf (zwischen 45 und 50 Prozent).

Insgesamt entsprich die Grafik jedoch unseren aufgestellten Erwartungen. Eine höhere soziale Vernetzung scheint die wirtschaftliche Mobilität positiv zu beeinflussen, wie es durch den positiven Anstieg der Regressionsgerade visualisiert wird. Ebenso deutet ein Korrelationskoeffizient von 0.72 auf diesen Zusammenhang hin. Diese Beobachtung lässt sich dadurch erklären, dass mehr ärmere Personen in Regionen mit hoher sozialer Vernetzung durch bessere Vermittlung seitens der befreundeten reicheren Personen gutbezahlte Jobs bekommen, was dazu führt, dass die wirtschaftliche Mobilität steigt.

Die Regressionsanalyse erlaubt es sogar, den Einfluss der sozialen Vernetzung zu quantifizieren. Eine Erhöhung des ECI um 0.2 Einheiten, hat zur Folge, dass die wirtschaftliche Mobilität um fast 5 Prozent steigt. Soziale Netzwerke beeinflussen wirtschaftliche Mobilität also deutlich.


  1. Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
  • Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
  • Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index

Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:

  • San Francisco County, California
  • Arlington County, Virginia
  • Morgan County, Utah
  • New York County, New York
  • Bronx County, New York

Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.

Das erste Punktdiagramm stellt den Zusammenhang zwischen sozialer Vernetzung und der Einkommensungleichheit dar. Hierbei ist der ECI auf der x-Achse und der Gini-Koeffizient auf der y-Achse positioniert. Die Punktewolke erstreckt sich von norwest nach südost. Eine hohe soziale Vernetzung ist also mit einer niedrigen Einkommensungleichheit und eine geringe soziale Vernetzung ist mit einer hohen Einkommensungleichheit in Verbindung zu bringen. Dieser aufgezeigte Zusammenhang entspricht unseren Erwartungen. Starkt ausgeprägte soziale Netzwerke innerhalbe einer Region über verschiedene sozioökonomische Gruppen haben zur Folge, dass ärmere Personen aufgrund der Unterstützung ihrer reicheren Freunde eher an besser bezahhlte Jobs kommen, womit sich die Einkommenslücke zwischen ihnen verringert.

Die hervorgehobenen Counties entsprechen zum Teil dem entdeckten Muster. Das Morgan County in Utah weist eine hohe soziale Verbundenheit auf, ebenso wie eine sehr geringe Einkommensungleichheit. Diese Beobachtung stimmt mit dem entdeckten Muster überein. Genauso ins Bild passt das Bronx County in New York. Es hat eine unterdurchschnittliche soziale Vernetzung (circa 0.7) und dafür auch eine höhere Einkommensungleichheit (0.36). Das New York County in New York hingegen hat einen deutlich größeren ECI als Bronx (circa 0.8), fällt aber durch eine besonders hohe Einkommensungleichheit auf. Diese Beobachtung ließe sich unter anderem mit der Anonymität der Großstadt erklären. Personen mit unterschiedlichem sozioökonomischen Status können zwar „Facebook-Freunde“ sein, aber keine echten „Freunde“. Eine unechte Freundschaft zu einer reichen Person ist weniger dienlich, wenn es um wirtschaftlichen Aufstieg geht.

Das Arlington County in Virginia und das San Francisco County in Kalifornien haben sehr hohe soziale Vernetzung (circa 1.3), liegen mit der Einkommensungleichheit aber auf dem selben Niveau wie Bronx (zwischen 0.3 und 0.4). Dies zeigt, dass soziale Vernetzung zwar ein ausschlaggebender Faktor für Einkommensungleichheit ist, aber es auch andere Einflüsse geben muss.

Das zweite Punktdiagramm visualisiert den Zusammenhang zwischen sozialer Vernetzung und dem Median Haushaltseinkommen eines Counties. Der ECI befindet sich erneut auf der x-Achse und das Median Haushaltseinkommen wird auf der y-Achse abgetragen. Die Punktewolke erstreckt sich von südwest nach nordost. Es lässt sich also schließen, dass bei einer hohen sozialen Verbundenheit im Allgemeinen auch mit einem hohen Median Haushaltseinkommen zu rechnen ist. Dies stimmt überein mit unseren Erwartungen. Falls Leute aus verschiedenen sozioökonomischen Schichten eine stärkere soziale Verbindung haben, so erfahren mehr ärmere Leute aufgrund ihrer Freundschaft zu reicheren Personen einen wirtschaftlichen Aufstieg, was zu einem Anstieg des Median Haushaltseinkommens führt.

Alle hervorgehobenen Counties repräsentieren diesen positiven Zusammenhang. Das Bronx County hat die geringste soziale Vernutzung und damit einhergehend auch das geringste Median Haushaltseinkommen. Die drei Counties San Francisco, Arlington und Morgan befinden sich in der oberen rechten Ecke der Punktewolke. Sie weisen eine hohe soziale Verbundenheit, sowie ein hohes Median Haushaltseinkommmen auf.


Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.

  1. Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
  • Economic Connectedness Index (ec_county)
  • Wirtschaftliche Mobilität (upward_mobility)
  • Median Haushaltseinkommen (medincE)
  • Bevölkerung in 2018 (pop2018)
  • Einkommensungleichheit (gini99_simple)
  • Exposition (exposure_gpr_mem_county)
  • Freundschafts-Bias (bias_grp_mem_county)

Beschreiben und interpretieren Sie ihre Korrelationsmatrix.


Die Korrelationsmatrix stellt die Korrelationen zwischen den verschiedenen Variablen übersichtlich dar. Es lässt sich auf den ersten Blick erkennen, dass die Einwohnerzahl mit keiner anderen Variable korreliert. Es ist höchstens eine schwache positive Korrelation (0.29) zu dem Median Einkommen vorhanden. Counties mit mehr Einwohnern übernehmen in der Regel eher die Rolle von Wirtschaftszentren. Dort gibt es also mehr gutbezahlte Arbeitsplätze, wodurch auch das Median Haushaltseinkommen tendenziell höher ist. Die soziale Vernetzung hat eine hohe positive Korrelation mit der wirtschaftlichen Mobilität (0.73). Diesen Effekt haben wir schon in Aufgabe 9 festgestellt. Aus Aufgabe 10 wissen wir auch, dass das Median Haushaltseinkommen eine hohe positive Korrelation (0.63) und dass die Einkommensungleichheit eine hohe negative Korrelation (-0.64) zur sozialen Vernetzung aufweisen. Gründe hierfür haben wir in den Aufgaben 8 und 10 diskutiert. Insbesondere kommen in der Zeile mit dem Gini-Koeffizient hohe negative Korrelationen vor, da ein großer Gini-Koeffizient grundsätzlich als „schlecht“ bezeichnet werden kann, wohingegen große Werte der anderen Variablen „gut“ sind.

Den höchsten Korrelationskoeffizienten besitzen die Variablen der sozialen Vernetzung und der Exposition (0.94). Dies ist keine Überraschung, denn diese beiden Variablen haben eine ähnliche Definition. Die Exposition spiegelt den Anteil an reichen Personen in der „Facebook-Gruppe“ einer armen Person wider, während die soziale Vernetzung den Anteil an reichen Freunden einer armen Person widerspiegelt.

Die Exposition hat auch hohe positve Korrelationswerte mit dem Median Haushaltseinkommen und der wirtschaftlichen Mobilität. Dies folgt aus der Transitivität der Korrelation, da auch die soziale Vernetzung eine hohe positive Korrelation mit den Variablen hat.

Die restlichen Einträge bewegen sich im Bereich zwischen -0.3 und 0.3, was auf eine sehr schwache bis gar keine Korrelation hindeutet.


Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?

  1. Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.


Das Punktediagramm zeigt den Zusammenhang zwischen dem Median-Haushaltseinkommen (x-Achse) und dem Economic Connectedness Index (y-Achse) für verschiedene Counties. Die Datenpunkte sind nach wirtschaftlicher Mobilität eingefärbt, wodurch Unterschiede zwischen verschiedenen Einkommensgruppen sichtbar werden.

Es ist ein klarer positiver Trend zu erkennen: Counties mit höherem Median-Haushaltseinkommen haben tendenziell auch einen höheren Economic Connectedness Index. Dies deutet darauf hin, dass wohlhabendere Gegenden stärker sozial vernetzt sind, insbesondere im wirtschaftlichen Sinne.

Counties mit niedriger wirtschaftlicher Mobilität (z. B. 30–40, gelb) sind häufiger in Bereichen mit niedrigerem Einkommen und geringerer sozialer Vernetzung zu finden. Höhere wirtschaftliche Mobilität (z. B. >60, pink) tritt eher in Regionen mit höherem Einkommen und starker wirtschaftlicher Vernetzung auf.

Die wirtschaftliche Mobilität scheint in Gegenden mit hohem Einkommen tendenziell höher zu sein, was darauf hindeutet, dass Economic Connectedness dort eine stärkere Rolle spielt. In ärmeren Regionen (linker Bereich der x-Achse) gibt es zwar auch eine gewisse Streuung im Economic Connectedness Index, aber die wirtschaftliche Mobilität ist dort eher niedrig. Dies könnte darauf hinweisen, dass die Vorteile sozialer Vernetzung für wirtschaftliche Mobilität in einkommensschwächeren Gebieten begrenzter sind als in wohlhabenderen Regionen.

Das Diagramm legt nahe, dass wirtschaftliche Vernetzung einen positiven Einfluss auf die wirtschaftliche Mobilität hat, aber dieser Effekt ist nicht für alle Einkommensgruppen gleich stark. In wohlhabenderen Gegenden scheint eine starke soziale Vernetzung stärker mit wirtschaftlicher Mobilität verbunden zu sein als in ärmeren Regionen. Dies könnte darauf hindeuten, dass zusätzliche Faktoren (z. B. Zugang zu Ressourcen, Bildungsangebote oder politische Rahmenbedingungen) eine Rolle spielen.


  1. Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.

Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:

  • Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
  • In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
  • Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
  • Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?

In Bezug auf die Analyse von Chetty et al. (2022) und den Zusammenhang zwischen dem Economic Connectedness Index (ECI) und der wirtschaftlichen Mobilität, lassen sich verschiedene Faktoren identifizieren, die einen scheinbaren Zusammenhang verursachen könnten. Diese beinhalten Rückwärtskausalität, Selektionseffekte und ausgelassene Variablen.

Rückwärtskausalität könnte bedeuten, dass nicht die soziale Vernetzung die wirtschaftliche Mobilität beeinflusst, sondern umgekehrt. In Regionen mit höherer Mobilität sind bessere berufliche Chancen vorhanden, was zu einer besseren sozialen Vernetzung führt.

Selektionseffekte könnten ebenfalls eine Rolle spielen. Menschen, die sich in Regionen mit besserer sozialer Vernetzung aufhalten, sind oft auch diejenigen, die bereits bessere wirtschaftliche Chancen haben. Das bedeutet, dass die sozialen Netzwerke in diesen Regionen eher für Menschen mit bereits höherer Mobilität oder besserem wirtschaftlichen Status zugänglich sind. Es ist möglich, dass die Menschen aufgrund ihrer höheren wirtschaftlichen Möglichkeiten in gut vernetzte Gebiete ziehen, was den Zusammenhang zwischen Mobilität und sozialer Vernetzung erklären könnte.

Die Autoren argumentieren, dass sie in ihrer Analyse eine Vielzahl von potenziellen Variablen berücksichtigt haben, die das Ergebnis verzerren könnten, wie Bildung, Arbeitsmarktbedingungen und andere sozioökonomische Faktoren. Ihre Ergebnisse bleiben auch dann konsistent, wenn diese Faktoren kontrolliert werden, was darauf hindeutet, dass der Zusammenhang nicht durch ausgelassene Variablen erklärt wird.

Chetty et al. (2022) argumentieren, dass ihre Analyse Rückwärtskausalität und Selektionseffekte ausschließt, da der Zusammenhang zwischen sozialer Vernetzung und wirtschaftlicher Mobilität auch nach Kontrolle von Variablen wie Bildung und Arbeitsmarktbedingungen bestehen bleibt. Der Zusammenhang bleibt robust, selbst wenn diese Faktoren berücksichtigt werden, was auf einen echten kausalen Zusammenhang hindeutet.

Die Argumentation der Autoren erscheint überzeugend, insbesondere aufgrund der robusten empirischen Tests. Dennoch könnte die Aggregation von Daten problematisch sein, da individuelle Unterschiede in der sozialen Vernetzung und wirtschaftlichen Mobilität möglicherweise nicht vollständig erfasst werden.

Für die Messung eines kausalen Effekts der sozialen Vernetzung wären randomisierte kontrollierte Studien ideal, da diese Rückwärtskausalität und Selektionseffekte minimieren. Zusätzlich wären längsschnittliche Daten wichtig, um Veränderungen über die Zeit zu erfassen. Die Berücksichtigung einer Vielzahl relevanter Variablen und die Nutzung natürlicher Experimente könnten ebenfalls dazu beitragen, den Zusammenhang genauer zu untersuchen.


Einflussfaktoren auf die soziale Vernetzung

Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?

  1. Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe Exposition (exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.

Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.

Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?


Die Karte aus Aufgabe 14 stellt die Exposition dar, also den Anteil der gut verdienenden Personen in einem County. Je dunkler die Farbe, desto höher der Anteil. Die zweite Karte aus Aufgabe 7 zeigt den Economic Connectedness Index, der misst, wie stark einkommensschwache und einkommensstarke Personen sozial vernetzt sind.

Ein Vergleich beider Karten zeigt, dass Regionen mit hoher Exposition oft auch eine stärkere wirtschaftliche Vernetzung aufweisen. Besonders in wirtschaftlich starken Gebieten an der Ost- und Westküste sind beide Werte tendenziell höher. In ländlichen Regionen, vor allem im Westen und Süden, sind die Werte hingegen oft niedriger. Dennoch gibt es einzelne Counties mit hoher Exposition, die keine entsprechend hohe soziale Vernetzung haben.

Daraus lässt sich ableiten, dass eine hohe Exposition zwar ein wichtiger Faktor für wirtschaftliche Vernetzung sein kann, aber nicht allein entscheidend ist. Möglicherweise spielen auch andere Einflüsse eine Rolle, wie z. B. soziale Strukturen oder Segregation innerhalb der Communities.


Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.

  1. Um zu untersuchen ob es eine entsprechende Segregation der Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein Punktediagramm erzeugen, welche auf der x-Achse die Exposition (exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihr Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.

Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:

  • Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?

Die Grafik zeigt die Beziehung zwischen Exposition (x-Achse) und Freundschafts-Bias (y-Achse) für verschiedene Counties in den USA. Dabei ist jeder Punkt ein County, dessen Farbe den Grad der sozialen Vernetzung (Economic Connectedness Index) angibt.

Counties mit hoher Exposition (weiter rechts) haben tendenziell einen niedrigeren Freundschafts-Bias (niedrigere y-Werte). Das bedeutet, dass in Regionen mit hoher Exposition (also vielen wohlhabenden Personen) weniger stark nach sozioökonomischem Status segregierte Freundschaften existieren.

Counties mit hoher sozialer Vernetzung (blau/lila) befinden sich eher im Bereich hoher Exposition. Das deutet darauf hin, dass eine höhere Durchmischung wohlhabender und weniger wohlhabender Personen in einer Region mit einer stärkeren wirtschaftlichen Vernetzung zusammenhängt.

San Francisco County, California: Liegt weit rechts mit hoher Exposition und niedrigem Freundschafts-Bias. Das bedeutet, dass dort viele Freundschaften zwischen sozioökonomisch unterschiedlichen Gruppen existieren, was zu einer starken sozialen Vernetzung führt.

Bronx County, New York: Liegt weiter links mit niedrigerer Exposition und höherem Freundschafts-Bias. Dies deutet darauf hin, dass hier stärkere soziale Segregation vorliegt, was möglicherweise die wirtschaftliche Vernetzung hemmt.

Schließlich lässt sich sagen, dass Exposition die soziale Vernetzung stärkt, während ein hoher Freundschafts-Bias sie einschränkt. San Francisco County zeigt hohe Vernetzung durch breite Exposition, während Bronx County mit höherem Bias weniger vernetzt ist. Dies deutet darauf hin, dass soziale Durchmischung die wirtschaftliche Mobilität fördern kann.


  1. Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.

Um die soziale Vernetzung und wirtschaftliche Chancen in benachteiligten Regionen zu fördern, könnten verschiedene politische Maßnahmen umgesetzt werden.

Wichtig wäre die stärkere Förderung von Bildungseinrichtungen, die sozial gemischt sind. Durch gezielte Schulplatzvergaben oder Stipendienprogramme könnten Kinder aus unterschiedlichen sozialen Schichten frühzeitig miteinander in Kontakt kommen und so Netzwerke aufbauen.

Zudem könnte eine integrative Wohnpolitik helfen, Segregation zu verringern. Sozial gemischte Wohngebiete oder Mietzuschüsse für einkommensschwache Familien würden den Austausch zwischen verschiedenen gesellschaftlichen Gruppen fördern.

Ein weiterer Ansatz wäre die Förderung von Mentoring-Programmen, die benachteiligte Jugendliche mit erfolgreichen Vorbildern vernetzen, um ihnen Zugang zu neuen Möglichkeiten zu verschaffen.

Investitionen in öffentliche Räume und Gemeinschaftszentren könnten zudem dazu beitragen, Orte für soziale Begegnungen zu schaffen. In strukturschwachen Regionen wäre es wichtig, Unternehmen gezielt zu fördern, um neue Arbeitsplätze zu schaffen und Netzwerke auszubauen.

Die Ergebnisse aus den Aufgaben 14 und 15 zeigen, dass Regionen mit hoher Exposition wie San Francisco County stärkere soziale Vernetzung aufweisen, während Orte mit hohem Freundschafts-Bias wie Bronx County tendenziell isolierter sind. Politische Maßnahmen sollten daher den Austausch zwischen sozialen Gruppen fördern, um langfristig die wirtschaftlichen Chancen für alle zu verbessern.


Zusatzaufgabe

  1. Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:

Hier können Sie die Daten auf College Ebene herunterladen



  1. Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten funktioniert dies mit dem R Paket tidycensus. Für den API Zugang müssen Sie sich erst bei IPUMS registrieren und können danach einen API Key beantragen, welchen Sie dann für den Daten download über das tidycencus Paket hinterlegen müssen.

Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.


Hier bitte ihren Code eintragen


  1. Stellen Sie den Economic Connectedness Index des Colleges (ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paket leaflet.

Hier bitte ihren Code eintragen


  1. Erstellen Sie ein Punktediagramm auf College Ebene, welches den Zusammenhang zwischen dem Freundschafts-Bias und der Exposition beleuchtet auf College Ebene näher beleuchtet.

Tragen Sie dafür auf der x-Achse den Anteil von Studierenden mit gut verdienenden Eltern ab (exposure_parent_ses_college) und den Freundschafts-Bias unter den Studierenden (bias_parent_ses_college)

Heben Sie fünf Colleges ihrer Wahl in der Grafik hervor (inkl. Beschriftung).

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die fünf von Ihnen hervorgehobenen Colleges ein.


Hier bitte ihren Code und ihre Antwort eintragen



Literatur

Chetty, R., Friedman, J. N., Hendren, N., Jones, M. R., & Porter, S. R. (2018). The opportunity atlas: Mapping the childhood roots of social mobility (No. w25147). National Bureau of Economic Research. https://doi.org/10.3386/w25147

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital I: measurement and associations with economic mobility. Nature 608, 108–121 (2022a). https://doi.org/10.1038/s41586-022-04996-4

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital II: determinants of economic connectedness. Nature 608, 122–134 (2022b). https://doi.org/10.1038/s41586-022-04997-3