Motivation

In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.

Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer Vernetzung:

Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin, dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über soziale Schichten hinweg vernetzt sind, profitieren tendenziell von besseren wirtschaftlichen Perspektiven.

Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.

Datengrundlage

Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:

Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.

Einlesen

Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.

1. Lesen Sie den Datensatz social_capital_county.rds aus dem Unterordner “Daten” in R ein und nennen diesen Datensatz social_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.

Schränken Sie ihren Datensatz auf folgende Variablen ein:

  • county
  • ec_county
  • exposure_gpr_mem_county
  • bias_grp_mem_county
  • pop2018

Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.

Beantworten Sie auch folgende Fragen:

  • Was ist eine Beobachtung?
  • Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
  • In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?

Social Capital County
county ec_county exposure_grp_mem_county bias_grp_mem_county pop2018
1001 0.72077 0.81740 0.05526 55200
1003 0.74313 0.78532 0.02950 208107
1005 0.41366 0.41513 0.13457 25782
1007 0.63152 0.71012 0.04108 22527
1009 0.72562 0.79758 0.00217 57645
1011 0.35515 0.26952 0.07974 10352

Der Datensatz social_capital_county enthält wichtige Kennzahlen zur sozialen Vernetzung auf County-Ebene in den USA. Die enthaltenen Variablen basieren größtenteils auf Facebook-Daten und liefern Einblicke in soziale Strukturen und Verbindungen zwischen Personen mit unterschiedlichem sozioökonomischem Status (SES).

Beschreibung der Variablen:

Die Variable county stellt den 5-stelligen FIPS-Code dar, der jedes County eindeutig identifiziert. Dieser Code ist eine standardisierte geografische Kennzahl und dient der Zuordnung und Analyse regionaler Daten.

Die Variable ec_county beschreibt die ökonomische Verbundenheit innerhalb eines Countys. Sie misst, in welchem Ausmaß Menschen mit niedrigem SES mit Personen mit hohem SES vernetzt sind. Konkret wird der doppelte Anteil von Hoch-SES-Freundschaften unter Low-SES-Personen berechnet und über alle Low-SES-Personen im County gemittelt. Zum Schutz der Privatsphäre wurde den Daten ein statistisches Rauschen hinzugefügt.

Die Variable exposure_grp_mem_county erfasst die durchschnittliche Exposition von Personen mit niedrigem SES gegenüber Hoch-SES-Personen innerhalb sozialer Gruppen. Dies wird ebenfalls durch den doppelten Anteil von Hoch-SES-Mitgliedern in den Gruppen von Low-SES-Nutzern bestimmt. Die Gruppenzuordnung erfolgt basierend auf Facebook-Daten, wie in Chetty et al. (2022b) beschrieben. Diese Kennzahl gibt Aufschluss darüber, wie durchmischt soziale Gruppen in Bezug auf den sozioökonomischen Status sind.

Die Variable bias_grp_mem_county misst die Verzerrung in der sozialen Vernetzung. Sie zeigt, inwiefern sich tatsächliche Freundschaftsverbindungen von der bloßen Exposition gegenüber Hoch-SES-Personen unterscheiden. Ein höherer Wert deutet darauf hin, dass trotz hoher Exposition nur wenige tatsächliche Verbindungen zu Hoch-SES-Personen bestehen, was auf soziale Segregation hindeutet.

Abschließend enthält die Variable pop2018 die Gesamtbevölkerung des Countys im Jahr 2018. Diese Zahl stammt aus öffentlich zugänglichen Daten des US Census Bureau (American Community Survey) und wurde unabhängig von den Facebook-Daten erhoben.

Insgesamt liefern diese Variablen wertvolle Einblicke in die soziale Vernetzung.

Was ist eine Beobachtung?

In diesem Datensatz entspricht eine Beobachtung einem County in den USA. Jede Zeile im Datensatz stellt demnach die sozialen Netzwerkdaten und Bevölkerungsinformationen für genau ein County dar. Die Spalten enthalten verschiedene Kennzahlen, wie z.B. die ökonomische Verbundenheit, Exposition gegenüber Hoch-SES-Personen und die Bevölkerungsgröße.

Wie viele Counties sind in diesem Datensatz vorhanden?

Anzahl der Counties im Datensatz
3089

In diesem Datensatz sind 3089 Counties gegeben.

Wie viele Counties hat die USA?

Laut der offiziellen Website des U.S. Census Bureau (https://www.census.gov/newsroom/press-releases/2024/population-estimates-more-counties-population-gains-2023.html#) hat die USA 3.144 Counties.

Anzahl der beobachteten Counties im Vergleich zur Gesamtanzahl in %:
98.25

In unserem Datensatz sind 98,25% aller Counties gegeben.

In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?

Fälle mit Informationen zu allen Variablen in %:
95.14

In 95.14% der Fälle sind Informationen zu allen Variabelen einer Beobachtung gegeben.


2. Weiterhin haben wir Ihnen den Datensatz county_covariates.dta im Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihn covariates.

Schränken Sie diesen Datensatz auf die folgenden Variablen ein:

  • county
  • kfr_pooled_pooled_p25
  • gini99_simple

Generieren Sie eine neue Variable upward_mobility als kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die Variable kfr_pooled_pooled_p25.

Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.

Hinweis: Mit dem haven Paket können Sie .dta Dateien einlesen


Beschreibung der Variablen:

Der Datensatz enthält mehrere Variablen, die wichtige Informationen zur sozialen und ökonomischen Struktur in den US-Countys liefern. Eine der Variablen ist der county-Code, der den 5-stelligen County FIPS-Code darstellt. Dieser Code ist eine standardisierte Kennung, die verwendet wird, um Countys in den USA eindeutig zu identifizieren. Der FIPS-Code ermöglicht es, Counties in verschiedenen Datensätzen und Quellen miteinander zu vergleichen und sie geographisch korrekt zuzuordnen.

Eine weitere wichtige Variable im Datensatz ist gini99_simple, die den Gini-Koeffizienten für das Jahr 1999 darstellt. Dieser wurde unter Verwendung von Steuerdaten berechnet und um den Einkommensanteil der obersten 1% der Einkommensverteilung bereinigt. Der Gini-Koeffizient ist ein Maß für die Einkommensungleichheit innerhalb eines Countys: Ein Wert von 0 deutet auf vollständige Einkommensgleichheit hin, während ein Wert von 1 eine maximale Einkommensungleichheit anzeigt.

Die dritte Variable ist die upward_mobility, die die Aufwärtsmobilität misst. Diese Variable wird berechnet, indem das ‘kfr_pooled_pooled_p25’ - Maß mit 100 multipliziert wird. Das ‘kfr_pooled_pooled_p25’ misst das mittlere Einkommenspercentil im Erwachsenenalter für Kinder, die von Eltern stammen, die im 25. Einkommenspercentil der Verteilung angesiedelt sind. Mit anderen Worten, diese Variable zeigt, inwieweit Kinder aus einkommensschwachen Familien im Vergleich zu ihren Eltern im Erwachsenenalter sozial und ökonomisch aufsteigen. Die upward_mobility stellt somit einen wichtigen Indikator für die soziale Mobilität und die Chancen auf ökonomischen Aufstieg dar.


3. Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.

Lesen sie die Daten County_census_data.shp in R ein und speichern diesen in R als county_census_shape ab. Neben den County Namen und und Polygonen enthält dieser Datensatz auch das geschätzte Median Einkommen pro County für das Jahr 2023 (medincE).

Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren



4. Verbinden Sie die Dataframes county_census_shape, covariates und social_capital_county zu einem Datensatz analysis_data.

  • Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
  • Welcher Datensatz sollte der Hauptdatensatz sein? Warum?

Wir verwenden hier einen left Join, um sicherzustellen, dass alle Einträge des Dataframes census_county_shape im finalen Datensatz vorhanden sind, Einträge aus covariates und social_capital_county werden nur dann hinzugefügt, wenn ein passender county_id-Eintrag vorhanden ist. county_census_shape ist der Hauptdatensatz, weil er die Grundstruktur der Counties enthält. Der Left Join stellt sicher, dass die vollständigen Einträge aus diesem Datensatz erhalten bleiben.


5. Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:

  • upward_mobility
  • ec_county
  • exposure_gpr_mem_county
  • bias_grp_mem_county

Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:

  • Was genau misst die wirtschaftliche Mobilität (upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
  • Bitte schauen Sie sich an, wie die sozialen Vernetzung (ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.

Hinweis: Die genaue Berechnung der sozialen Vernetzung (ec_county) finden Sie im Dokument “social_capital_codebook.pdf”


Die Variable upward_mobility misst die Wahrscheinlichkeit, dass Kinder, die in einkommensschwachen Haushalten (im 25. Einkommenspercentil) aufwachsen, im Erwachsenenalter sozial und ökonomisch aufsteigen. Ein hoher Wert deutet darauf hin, dass in dieser Region eine höhere Wahrscheinlichkeit besteht, dass Kinder aus ärmeren Familien bessere Einkommenspositionen im Erwachsenenalter erreichen. Soziale Vernetzung: ec_county

Die Variable ec_county misst die ökonomische Verbundenheit innerhalb eines Countys, insbesondere die Stärke der Verbindungen zwischen Menschen mit niedrigem sozioökonomischen Status (SES) und Menschen mit hohem SES. Es geht dabei konkret um die Anzahl und Stärke von Freundschaften, die Menschen mit unterschiedlichem wirtschaftlichen Hintergrund zueinander haben.

Warum sollte soziale Vernetzung zu wirtschaftlicher Mobilität führen?

Ein hoher Wert der sozialen Vernetzung (ec_county) könnte zu höherer wirtschaftlicher Mobilität (upward_mobility) führen, weil:

Soziales Kapital:
Soziale Netzwerke bieten Zugang zu Informationen, Ressourcen und Gelegenheiten. Menschen mit niedrigem SES, die in Netzwerke mit Personen höherer SES eingebunden sind, können wertvolle Informationen und Unterstützung erhalten, z.B. in Bezug auf Bildung, Jobs, Karrieretipps oder finanzielle Beratung. Annahme: Personen mit breiteren Netzwerken (einschließlich hoch-SES-Freundschaften) haben Zugang zu mehr wirtschaftlichen Ressourcen und sozialen Aufstiegsmöglichkeiten.

Mentoring und Rollenvorbilder:
Menschen, die engen Kontakt zu Personen mit hohem SES haben, sehen möglicherweise Rollenvorbilder, die zu höheren Bildungsabschlüssen und besseren Jobs führen. Diese Art von Einfluss kann besonders stark auf die Kinder aus einkommensschwachen Haushalten wirken. Annahme: Durch den Zugang zu positiven Rollenvorbildern und Mentoring erfahren Kinder aus armen Familien, welche Schritte notwendig sind, um wirtschaftlich aufzusteigen. Netzwerk-Effekte bei Jobmöglichkeiten: Menschen mit hohem SES haben oft Zugang zu besseren Jobmöglichkeiten. Verbindungen zu diesen Menschen können zu Empfehlungen und Zugängen zu besser bezahlten Arbeitsplätzen führen. Annahme: Soziale Vernetzung bietet Zugang zu hochwertigen beruflichen Möglichkeiten, die direkt zu höheren Einkommen führen können.

Berechnung der sozialen Vernetzung (ec_county):

Die soziale Vernetzung (ec_county) wird als Anteil der Freundschaften zwischen Personen mit niedrigem SES und Personen mit hohem SES im County gemessen. Sie stellt die ökonomische Integration durch Freundschaften dar. Exposition: exposure_gpr_mem_county

Die Exposition misst, wie häufig Personen mit niedrigem SES Personen mit hohem SES begegnen, insbesondere in sozialen Gruppen oder Umfeldern. Es geht darum, inwieweit Menschen unterschiedlichen SES in ihrem Alltag (z.B. Schulen, Arbeitsplätze) ausgesetzt sind, unabhängig davon, ob diese Begegnungen tatsächlich zu Freundschaften führen. Freundschafts-Bias: bias_grp_mem_county

Der Freundschafts-Bias misst, inwieweit sich Menschen mit niedrigem SES trotz hoher Exposition gegenüber Personen mit hohem SES dazu entscheiden, Freundschaften innerhalb ihres eigenen SES zu knüpfen. Ein hoher Bias-Wert bedeutet, dass trotz der Möglichkeit, Verbindungen mit Personen aus einem höheren SES zu knüpfen, solche Freundschaften nicht gebildet werden. Erwartungen zum Zusammenhang

Einfluss der Exposition auf die soziale Vernetzung:

Eine hohe Exposition gegenüber Menschen mit hohem SES sollte theoretisch zu einer höheren sozialen Vernetzung führen, da Menschen mit niedrigem SES öfter die Möglichkeit haben, Freundschaften mit Menschen aus wohlhabenderen Schichten zu bilden. Annahme: Je häufiger Menschen mit niedrigem SES Menschen mit hohem SES begegnen, desto höher ist die Wahrscheinlichkeit, dass Freundschaften entstehen und damit die soziale Vernetzung verbessert wird.

Einfluss des Freundschafts-Bias auf die soziale Vernetzung:

Ein hoher Freundschafts-Bias deutet darauf hin, dass Menschen mit niedrigem SES trotz der Möglichkeit, Freundschaften mit Menschen mit hohem SES zu knüpfen, dazu neigen, in ihren eigenen sozialen Schichten zu bleiben. Dies sollte zu einer geringeren sozialen Vernetzung führen, da weniger intersoziale Freundschaften gebildet werden. Annahme: Ein höherer Freundschafts-Bias reduziert die soziale Vernetzung, da Personen in ihrer eigenen sozioökonomischen Schicht verbleiben und weniger Verbindungen zu Menschen aus anderen Schichten eingehen.


Deskriptive Analysen

Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.

6. Schauen Sie sich in einem ersten Schritt an, wie die Variablen im Datensatz analysis_data über alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.

Beschreiben und interpretieren Sie Ihre Tabelle.

Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?

Hinweis: Achten Sie auf eine schöne Darstellung ihrer Tabelle mittels der Pakete kableExtra oder gt!


Zusammenfassung der numerischen Variablen in analysis_data
Variable Mittelwert Standardabweichung Minimum 25%-Quantil Median 75%-Quantil Maximum
Economic Connectedness Index 0.814 0.177 0.295 0.695 0.807 0.935 1.360
Exposition 0.906 0.212 0.255 0.765 0.905 1.052 1.486
Wirtschaftliche Mobilität 42.719 6.491 12.217 38.431 41.956 46.106 68.828
Median Haushaltseinkommen 65,046.649 18,388.683 16,170.000 54,113.250 63,161.500 73,216.250 178,707.000
Bevölkerung 2018 107,129.871 337,331.878 544.000 12,618.750 27,837.500 71,974.500 10,098,052.000
Freundschafts-Bias 0.064 0.051 -0.108 0.031 0.064 0.095 0.335
Einkommensungleichheit (Gini) 0.288 0.062 -0.056 0.244 0.286 0.328 0.573

Die oben generierte Tabelle zeigt die statistische Kennzahlen für die numerischen Variablen im Datensatz analysis_data. Diese Kennzahlen umfassen Mittelwert, Median, Minimum, Maximum, Standardabweichung, sowie das Obere(75%) und Untere(25%) Quantil. Die Analyse der Variablen lautet wie folgt:

Economic Connectedness Index:

Der Mittelwert des Economic Connectedness Index beträgt 0.814 und liegt nahe am Median von 0.807, was auf eine relativ symmetrische Verteilung hinweist. Die Werte reichen von 0.295 bis 1.360, was deutliche Unterschiede in der sozialen Vernetzung zwischen den Counties zeigt. Eine Standardabweichung von 0.177 verdeutlicht eine moderate Streuung, was auf regionale Unterschiede in der Stärke der sozialen Vernetzung hinweist. Die Quartilswerte (0.695 und 0.935) bestätigen, dass der Großteil der Counties ähnliche Werte aufweist, aber einige Ausnahmen existieren.

Exposition:

Mit einem Mittelwert von 0.906 und einem Median von 0.905 weist die Exposition eine symmetrische Verteilung auf. Die Werte variieren von 0.255 bis 1.486, was auf erhebliche Unterschiede in der sozialen Durchmischung zwischen den Counties hinweist. Die Standardabweichung von 0.212 deutet auf eine moderate Streuung hin, wobei die Quartilswerte (0.765 und 1.052) die Variabilität in den mittleren 50% der Counties beschreiben.

Wirtschaftliche Mobilität:

Die wirtschaftliche Mobilität zeigt einen Mittelwert von 42.719 und einen Median von 41.956, was auf eine annähernd normale Verteilung hindeutet. Die Werte reichen von 12.217 bis 68.828, wobei die Standardabweichung von 6.491 auf erhebliche regionale Unterschiede hinweist. Die Quartilswerte (38.431 und 46.106) verdeutlichen, dass sich die wirtschaftliche Mobilität der meisten Counties in einem engen Bereich befindet.

Median Haushaltseinkommen:

Das Median Haushaltseinkommen hat einen Mittelwert von 65,046.649 und einen Median von 63,161.500, was eine leichte Linksschiefe in der Verteilung andeutet. Die Werte reichen von 16,170.000 bis 178,707.000, was auf enorme Einkommensunterschiede zwischen den Counties hinweist. Die Standardabweichung von 18,388.683 verdeutlicht eine hohe Variabilität, wobei die Quartilswerte (54,113.250 und 73,216.250) die mittlere Verteilung der Daten beschreiben.

Bevölkerung 2018:

Die Bevölkerung hat einen Mittelwert von 107,129.871, der deutlich über dem Median von 27,837.500 liegt. Dies deutet auf eine rechtsschiefe Verteilung hin, wobei der Maximalwert von 10,098,052,000 weit vom Minimalwert (544.000) entfernt ist. Die Standardabweichung von 337,331,878 bestätigt die enormen Unterschiede zwischen großen und kleinen Counties. Die Quartilswerte (12,618.750 und 71,974.500) verdeutlichen, dass die meisten Counties eine kleinere Bevölkerung aufweisen, während einige wenige sehr groß sind.

Freundschafts-Bias:

Der Mittelwert und Median des Freundschafts-Bias sind identisch (0.064), was auf eine symmetrische Verteilung hinweist. Die Werte reichen von -0.108 bis 0.335, wobei die Standardabweichung mit 0.051 relativ gering ist. Die Quartilswerte (0.031 und 0.095) zeigen, dass sich der Großteil der Werte in einem engen Bereich befindet, was auf geringe Unterschiede zwischen den Counties hinweist.

Einkommensungleichheit (Gini):

Die Einkommensungleichheit weist einen Mittelwert von 0.288 und einen Median von 0.286 auf, was eine symmetrische Verteilung andeutet. Die Werte liegen zwischen -0.056 und 0.573. Die Standardabweichung von 0.062 deutet auf eine relativ geringe Streuung hin. Die Quartilswerte (0.244 und 0.328) zeigen, dass sich die meisten Counties in einem moderaten Bereich befinden.

Auffälligkeiten und Ausreißer:

Einige Variablen weisen klare Ausreißer und Auffälligkeiten auf. Insbesondere die Bevölkerung 2018 zeigt extreme Werte, da der Maximalwert weit über dem Median und 75%-Quantil liegt, was auf einige wenige sehr bevölkerungsreiche Counties hinweist. Ebenso zeigt das Median Haushaltseinkommen große Unterschiede zwischen den Counties, mit einem Maximalwert von 178,707.000, der die übrigen Werte weit überragt. Der Economic Connectedness Index und die Exposition haben ebenfalls ungewöhnlich hohe Maximalwerte, die als Ausreißer betrachtet werden könnten. Ein negativer Wert in der Einkommensungleichheit (Gini) ist auffällig und deutet auf mögliche Fehler in den Daten hin. Die wirtschaftliche Mobilität zeigt eine relativ große Streuung, wobei jedoch keine extremen Ausreißer erkennbar sind.


Soziale Vernetzung und wirtschaftliche Mobilität

Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre Analyse näheres über die soziale Vernetzung lernen, den Economic Connectedness Index (ec_county), welcher aus den Facebook Freundschaften generiert wurde. Die Daten des Economic Connectedness Index wurden auf County Ebene aggregiert, beruhen jedoch auf Freundschaftsdaten von individuellen Facebook Nutzern.

7. Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.

Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:

Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?

Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt sich das tigris Paket und der Befehl shift_geometry() um Alaska, Hawaii und Puerto Rico schön darstellen zu lassen.


##   |                                                                              |                                                                      |   0%  |                                                                              |                                                                      |   1%  |                                                                              |=                                                                     |   1%  |                                                                              |=                                                                     |   2%  |                                                                              |==                                                                    |   2%  |                                                                              |==                                                                    |   3%  |                                                                              |===                                                                   |   4%  |                                                                              |===                                                                   |   5%  |                                                                              |====                                                                  |   5%  |                                                                              |====                                                                  |   6%  |                                                                              |=====                                                                 |   7%  |                                                                              |=====                                                                 |   8%  |                                                                              |======                                                                |   8%  |                                                                              |======                                                                |   9%  |                                                                              |=======                                                               |  10%  |                                                                              |========                                                              |  11%  |                                                                              |========                                                              |  12%  |                                                                              |=========                                                             |  12%  |                                                                              |=========                                                             |  13%  |                                                                              |=========                                                             |  14%  |                                                                              |==========                                                            |  14%  |                                                                              |==========                                                            |  15%  |                                                                              |===========                                                           |  15%  |                                                                              |===========                                                           |  16%  |                                                                              |============                                                          |  17%  |                                                                              |============                                                          |  18%  |                                                                              |=============                                                         |  18%  |                                                                              |=============                                                         |  19%  |                                                                              |==============                                                        |  19%  |                                                                              |==============                                                        |  20%  |                                                                              |==============                                                        |  21%  |                                                                              |===============                                                       |  21%  |                                                                              |===============                                                       |  22%  |                                                                              |================                                                      |  22%  |                                                                              |================                                                      |  23%  |                                                                              |=================                                                     |  24%  |                                                                              |=================                                                     |  25%  |                                                                              |==================                                                    |  26%  |                                                                              |===================                                                   |  27%  |                                                                              |===================                                                   |  28%  |                                                                              |====================                                                  |  28%  |                                                                              |====================                                                  |  29%  |                                                                              |=====================                                                 |  30%  |                                                                              |======================                                                |  31%  |                                                                              |======================                                                |  32%  |                                                                              |=======================                                               |  33%  |                                                                              |========================                                              |  34%  |                                                                              |========================                                              |  35%  |                                                                              |=========================                                             |  35%  |                                                                              |=========================                                             |  36%  |                                                                              |==========================                                            |  37%  |                                                                              |===========================                                           |  39%  |                                                                              |============================                                          |  40%  |                                                                              |=============================                                         |  41%  |                                                                              |=============================                                         |  42%  |                                                                              |==============================                                        |  42%  |                                                                              |==============================                                        |  43%  |                                                                              |===============================                                       |  44%  |                                                                              |================================                                      |  45%  |                                                                              |================================                                      |  46%  |                                                                              |=================================                                     |  47%  |                                                                              |=================================                                     |  48%  |                                                                              |==================================                                    |  48%  |                                                                              |===================================                                   |  49%  |                                                                              |===================================                                   |  51%  |                                                                              |====================================                                  |  51%  |                                                                              |====================================                                  |  52%  |                                                                              |=====================================                                 |  53%  |                                                                              |======================================                                |  54%  |                                                                              |======================================                                |  55%  |                                                                              |=======================================                               |  56%  |                                                                              |========================================                              |  56%  |                                                                              |========================================                              |  57%  |                                                                              |=========================================                             |  58%  |                                                                              |=========================================                             |  59%  |                                                                              |==========================================                            |  60%  |                                                                              |===========================================                           |  61%  |                                                                              |===========================================                           |  62%  |                                                                              |============================================                          |  63%  |                                                                              |=============================================                         |  64%  |                                                                              |==============================================                        |  65%  |                                                                              |==============================================                        |  66%  |                                                                              |===============================================                       |  67%  |                                                                              |=================================================                     |  69%  |                                                                              |=================================================                     |  70%  |                                                                              |=================================================                     |  71%  |                                                                              |==================================================                    |  72%  |                                                                              |===================================================                   |  73%  |                                                                              |====================================================                  |  75%  |                                                                              |=====================================================                 |  76%  |                                                                              |======================================================                |  78%  |                                                                              |=======================================================               |  79%  |                                                                              |========================================================              |  80%  |                                                                              |=========================================================             |  82%  |                                                                              |===========================================================           |  84%  |                                                                              |============================================================          |  85%  |                                                                              |============================================================          |  86%  |                                                                              |=============================================================         |  87%  |                                                                              |==============================================================        |  89%  |                                                                              |===============================================================       |  90%  |                                                                              |===============================================================       |  91%  |                                                                              |=================================================================     |  92%  |                                                                              |==================================================================    |  94%  |                                                                              |==================================================================    |  95%  |                                                                              |===================================================================   |  96%  |                                                                              |====================================================================  |  97%  |                                                                              |====================================================================  |  98%  |                                                                              |===================================================================== |  99%  |                                                                              |======================================================================| 100%

Die Karte zeigt den Economic Connectedness Index für jedes County in den USA, wobei die Farben von grün (niedrige Werte) bis rot (hohe Werte) reichen.

Gelb: Diese Regionen weisen wahrscheinlich eine geringe soziale Vernetzung zwischen den sozioökonomischen Schichten auf. Es könnte also sein, dass die Bewohner sozial isolierter leben und weniger Zugang zu unterschiedlichen sozialen Netzwerken haben, was sich negativ auf die Chancen für wirtschaftliche Mobilität auswirken könnte.

Rot: Diese Regionen sind besser vernetzt, was bedeutet, dass Menschen aus verschiedenen sozioökonomischen Schichten besser miteinander in Kontakt treten können. Dies könnte den Austausch von Informationen und Ressourcen begünstigen und so die Aufstiegschancen für Menschen mit niedrigerem sozioökonomischen Status erhöhen.

Graubereiche: Diese Regionen stellen Gebiete dar, für die keine Daten zum Economic Connectedness Index vorliegen. Mögliche Gründe könnten das Fehlen ausreichender Datenquellen oder eine zu geringe Anzahl an Beobachtungen sein.

Annahmen für gültige Aussagen:

Kausalität zwischen ECI und wirtschaftlicher Mobilität:
Um gültige Aussagen darüber zu treffen, wie der Economic Connectedness Index die wirtschaftliche Mobilität beeinflusst, müssen wir sicherstellen, dass die Annahme der Kausalität zutrifft. Es ist wichtig zu berücksichtigen, dass eine starke soziale Vernetzung in einer Region nicht zwangsläufig zu mehr wirtschaftlicher Mobilität führt. Es könnte auch umgekehrt sein, dass Regionen mit höherer wirtschaftlicher Mobilität bessere Bedingungen für starke Netzwerke schaffen.

Soziale Netzwerke und ihre Wirkung auf Freundschaften:
Wir müssen annehmen, dass der ECI auch tatsächlich die Qualität der sozialen Beziehungen widerspiegelt und nicht nur die Quantität, um etwas über die Freundschaftsnetzwerke aussagen zu können. Der ECI basiert auf Facebook-Freundschaften, die möglicherweise nicht die gleichen Freundschaften widerspiegeln, die in der realen Welt für wirtschaftliche Mobilität und sozialen Aufstieg entscheidend sind. Es könnte auch sein, dass online Freundschaften nicht die gleiche Stärke oder Relevanz wie offline Freundschaften haben.

Berücksichtigung anderer Faktoren:
Um den Einfluss des ECI auf die wirtschaftliche Mobilität zu verstehen, müssen auch andere Faktoren wie Bildung, Arbeitsmarktbedingungen, Politik und regionale Wirtschaftsstrukturen berücksichtigt werden. Der ECI allein kann keine vollständige Erklärung für wirtschaftliche Aufstiegsmöglichkeiten liefern.

Zugang zu Ressourcen:
Ein weiteres wichtiges Element ist der Zugang zu Ressourcen in gut vernetzten Regionen. Starke Netzwerke könnten in bestimmten Regionen den Zugang zu Arbeitsplätzen, Bildung und anderen wichtigen wirtschaftlichen Ressourcen verbessern. Dies könnte die Aufstiegschancen in diesen Regionen erhöhen und somit die wirtschaftliche Mobilität begünstigen.


8. Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.

Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:

  • Median Haushaltseinkommen in dem County (medincE)
  • Wirtschaftliche Mobilität in dem County (upward_mobility)
  • Einkommensungleichheit in dem County (gemessen mit dem Gini-Koeffizient des Counties) (gini99_simple)

Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.

Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:

  • Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.

Vergleich der Counties mit höchsten und niedrigsten Economic Connectedness Index
County Economic Connectedness Index Median Haushaltseinkommen Wirtschaftliche Mobilität Gini-Koeffizient
Highest EC
Rockingham County, New Hampshire 1.35970 113927 45.314 0.225
Douglas County, Colorado 1.35327 145737 48.243 0.116
San Francisco County, California 1.31244 141446 50.389 0.310
Morgan County, Utah 1.29125 126092 54.124 0.154
Madison County, Idaho 1.28088 58259 51.537 0.224
Arlington County, Virginia 1.27232 140160 46.281 0.387
Sussex County, New Jersey 1.25775 114316 47.040 0.183
Wright County, Minnesota 1.25228 106666 49.544 0.184
Gunnison County, Colorado 1.24836 77358 48.711 0.347
Pitkin County, Colorado 1.24364 100318 45.834 -0.010
Lowest EC
Scotland County, North Carolina 0.39580 43500 31.079 0.387
Crisp County, Georgia 0.38777 42745 32.888 0.424
Marlboro County, South Carolina 0.38475 36293 32.818 0.307
Early County, Georgia 0.37960 53750 33.828 0.456
Robeson County, North Carolina 0.36258 40318 32.095 0.362
Allendale County, South Carolina 0.36095 31603 31.404 0.332
Bullock County, Alabama 0.35515 36723 34.566 0.315
Terrell County, Georgia 0.34741 43812 31.165 0.364
Oglala Lakota County, South Dakota 0.33048 34769 24.840 NA
Todd County, South Dakota 0.29469 39148 30.178 0.323

Die Tabelle zeigt einen Vergleich zwischen den 10 Counties mit dem höchsten und den 10 Counties mit dem niedrigsten Economic Connectedness Index (ECI). Für jedes County werden das Median Haushaltseinkommen, die wirtschaftliche Mobilität und der Gini-Koeffizient dargestellt, gerundet auf drei Stellen nach dem Komma.

Counties mit hohem Economic Connectedness Index (Highest EC):

Median Haushaltseinkommen:
Die Counties mit einem hohen ECI haben tendenziell ein hohes Median-Haushaltseinkommen. Der höchste Wert (Douglas County, Colorado) liegt bei über 145.000 USD, was darauf hindeutet, dass diese Regionen eine wohlhabendere Bevölkerung haben.

Wirtschaftliche Mobilität:
Auch die wirtschaftliche Mobilität ist in diesen Regionen relativ hoch, was sich in den Werten der Variablen „upward_mobility“ widerspiegelt. Diese Werte liegen überwiegend zwischen 45 und 54, was auf ein hohes Potenzial für wirtschaftlichen Aufstieg hinweist.

Gini-Koeffizient:
Die Einkommensungleichheit in diesen Counties zeigt einen interessanten Trend. Obwohl die meisten Counties mit hohem ECI eine moderate Einkommensungleichheit aufweisen (Gini-Koeffizient zwischen 0,1 und 0,3), gibt es auch einige Ausreißer wie Arlington County, Virginia, mit einem höheren Gini-Wert (0,387), was eine größere Einkommensungleichheit bedeutet. Es gibt jedoch auch ein County wie Pitkin County, Colorado, das einen Gini-Koeffizienten von -0,01 hat, was möglicherweise auf ungewöhnliche Daten oder eine sehr homogene Gesellschaft hinweist.

Counties mit niedrigem Economic Connectedness Index (Lowest EC):

Median Haushaltseinkommen:
In den Counties mit niedrigem ECI sind die Median-Haushaltseinkommen deutlich niedriger, mit Werten, die häufig unter 50.000 USD liegen. Das deutet darauf hin, dass diese Regionen eine ärmere Bevölkerung haben.

Wirtschaftliche Mobilität:
Die wirtschaftliche Mobilität in diesen Counties ist ebenfalls gering, mit Werten der „upward_mobility“-Variablen, die größtenteils unter 35 liegen. Diese Werte deuten darauf hin, dass die Chancen für den sozialen Aufstieg in diesen Regionen relativ begrenzt sind.

Gini-Koeffizient:
Die Einkommensungleichheit ist in diesen Counties oft höher, mit vielen Gini-Werten über 0,3. Das bedeutet, dass es eine größere Einkommensungleichheit in den weniger gut vernetzten Regionen gibt, was potenziell die Chancen für wirtschaftliche Mobilität beeinträchtigen könnte.

Interpretation der Unterschiede:

Erwartete Unterschiede:
Ja, die Unterschiede in den Variablen zwischen den Counties mit hohem und niedrigem ECI entsprechen weitgehend den Erwartungen. In Regionen mit höherer sozialer Vernetzung (also höherem ECI) gibt es tendenziell auch höhere Median-Haushaltseinkommen und bessere Chancen auf wirtschaftliche Mobilität. Dies könnte darauf hinweisen, dass eine starke soziale Vernetzung den Austausch von Informationen und Ressourcen fördert, was für den wirtschaftlichen Aufstieg vorteilhaft ist.

Gini-Koeffizient:
Es ist jedoch interessant zu bemerken, dass es auch in den hoch vernetzten Counties eine gewisse Einkommensungleichheit gibt. Der Gini-Koeffizient ist in einigen der hoch vernetzten Counties relativ hoch, was darauf hindeutet, dass auch in gut vernetzten Regionen Einkommensungleichheit existieren kann, aber die sozialen Netzwerke könnten dennoch positive Auswirkungen auf die wirtschaftliche Mobilität haben. Umgekehrt sind die schlecht vernetzten Counties (niedriger ECI) auch durch höhere Einkommensungleichheit und niedrigere wirtschaftliche Mobilität gekennzeichnet.


Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?

9. In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot) erstellen, welches die wirtschaftliche Mobilität (upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
  • In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?

Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen


Interpretation und Beschreibung:

Das Diagramm zeigt einen deutlichen positiven Zusammenhang zwischen dem Economic Connectedness Index (ECI) und der wirtschaftlichen Mobilität (upward_mobility). Die Punkte im Streudiagramm repräsentieren einzelne Counties, und die eingezeichnete Regressionsgerade verdeutlicht, dass mit steigender ökonomischer Verbundenheit auch die Wahrscheinlichkeit zunimmt, dass Personen aus einkommensschwachen Haushalten sozial und wirtschaftlich aufsteigen. Der Korrelationskoeffizient von 0.72, der in der Grafik angegeben ist, weist auf eine starke positive Korrelation zwischen diesen beiden Variablen hin, was die Bedeutung dieses Zusammenhangs statistisch untermauert.

Diese Beobachtungen stimmen mit den theoretischen Annahmen überein, die in Aufgabe 5 aufgestellt wurden. Es wurde argumentiert, dass eine höhere soziale Vernetzung – insbesondere die Stärke von Verbindungen zwischen Personen mit niedrigem sozioökonomischen Status (SES) und solchen mit hohem SES – die wirtschaftliche Mobilität fördern könnte. Diese sozialen Verbindungen können mehrere Mechanismen in Gang setzen, die für Menschen aus einkommensschwachen Haushalten von Vorteil sind. Erstens bieten soziale Netzwerke soziales Kapital, indem sie den Zugang zu Informationen, Ressourcen und beruflichen Möglichkeiten erweitern. Menschen mit niedrigem SES könnten durch Kontakte zu Personen mit hohem SES beispielsweise von Karrieremöglichkeiten, Jobempfehlungen oder hilfreichen Ratschlägen profitieren. Zweitens können Netzwerke als Plattform für Mentoring und Rollenvorbilder dienen. Kinder aus einkommensschwachen Haushalten könnten durch den Kontakt zu erfolgreichen Vorbildern motiviert werden und besser verstehen, welche Schritte notwendig sind, um wirtschaftlich aufzusteigen. Drittens ermöglichen Netzwerkeffekte eine bessere berufliche Integration, da Personen mit hohem SES oft Zugang zu qualitativ hochwertigeren Arbeitsmöglichkeiten haben. Durch Empfehlungen und Kontakte könnten sie diesen Zugang auch für Menschen mit niedrigerem SES eröffnen. Die starke Korrelation in der Grafik unterstützt diese theoretischen Überlegungen, indem sie zeigt, dass Counties mit einer stärkeren ökonomischen Vernetzung zwischen Menschen unterschiedlicher sozioökonomischer Hintergründe tendenziell höhere Werte für wirtschaftliche Mobilität aufweisen. Gleichzeitig verdeutlichen die Streuung der Datenpunkte und die Abweichungen einzelner Counties von der Regressionsgeraden, dass diese Beziehung nicht deterministisch ist und andere Faktoren ebenfalls eine Rolle spielen könnten.

Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?

Das Punktdiagramm liefert eine solide Grundlage, um diese Frage zu beantworten. Sie zeigt, dass soziale Netzwerke, gemessen am Economic Connectedness Index, einen deutlichen und messbaren Einfluss auf die wirtschaftliche Mobilität haben. Die enge Korrelation zwischen ECI und upward_mobility deutet darauf hin, dass der Grad der sozialen Integration zwischen sozioökonomischen Gruppen ein zentraler Faktor für den sozialen und wirtschaftlichen Aufstieg von Individuen ist. Soziale Netzwerke wirken dabei wie ein Multiplikator von Möglichkeiten, insbesondere für Menschen aus einkommensschwachen Haushalten. Durch Kontakte zu Personen mit höherem SES können sie nicht nur Zugang zu Karrieremöglichkeiten oder Bildungschancen erhalten, sondern auch in ihrer persönlichen und beruflichen Entwicklung gefördert werden. Soziale Netzwerke erleichtern den Austausch von Informationen und Ressourcen und schaffen damit Verbindungen, die wirtschaftliche und soziale Barrieren überwinden können. Trotz dieser klaren Tendenz zeigt die Streuung der Punkte in der Grafik, dass der Economic Connectedness Index allein nicht die gesamte Variation in der wirtschaftlichen Mobilität erklären kann. Dies weist darauf hin, dass auch andere Faktoren die wirtschaftliche Mobilität beeinflussen. Zu diesen könnten unter anderem die Qualität des Bildungssystems, der Zugang zu hochwertiger medizinischer Versorgung, lokale wirtschaftliche Bedingungen oder politische Maßnahmen gehören, die Ungleichheiten abbauen und Chancengleichheit fördern. Insbesondere regionale Unterschiede, wie wirtschaftliche Stärke oder Arbeitsmarktbedingungen, könnten ebenfalls dazu beitragen, die Streuung zu erklären. Zusammenfassend deutet die Grafik darauf hin, dass soziale Netzwerke eine entscheidende Rolle bei der Förderung der wirtschaftlichen Mobilität spielen. Gleichzeitig bleibt offen, wie andere Faktoren diesen Prozess beeinflussen und welche Maßnahmen gezielt eingesetzt werden könnten, um die positive Wirkung sozialer Vernetzung zu maximieren.


10. Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):

  • Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
  • Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index

Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:

  • San Francisco County, California
  • Arlington County, Virginia
  • Morgan County, Utah
  • New York County, New York
  • Bronx County, New York

Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.

Beschreibung und Interpretation der Diagramme:

Die beiden Punktdiagramme untersuchen die Zusammenhänge zwischen dem Economic Connectedness Index (ECI) und zwei zentralen sozioökonomischen Indikatoren: der Einkommensungleichheit, gemessen durch den Gini-Koeffizienten, sowie dem Median-Haushaltseinkommen. Die Betrachtung konzentriert sich dabei auf die 500 bevölkerungsreichsten Counties.

Economic Connectedness Index vs. Einkommensungleichheit:
Das erste Punktdiagramm zeigt einen klaren negativen Zusammenhang zwischen der Einkommensungleichheit und dem ECI. Regionen mit einer höheren Einkommensungleichheit weisen tendenziell niedrigere Werte im Economic Connectedness Index auf. Diese Beziehung wird durch eine gestrichelte Regressionslinie visualisiert, die den allgemeinen Trend verdeutlicht.

In der Praxis bedeutet dies, dass soziale und wirtschaftliche Vernetzung in Regionen mit größerer Ungleichheit eingeschränkt ist. Dies lässt sich darauf zurückführen, dass höhere Einkommensunterschiede häufig mit größeren sozialen und wirtschaftlichen Barrieren zwischen verschiedenen Einkommensgruppen einhergehen, was die Bildung von Verbindungen erschwert. Beispiele hierfür können geringere interpersonelle Kontakte zwischen Haushalten mit höherem und niedrigerem Einkommen sein oder verschiedene Zugänge zu sozialen und beruflichen Netzwerken.

Die hervorgehobenen Counties illustrieren diesen Zusammenhang deutlich: Morgan County, Utah, sticht als ein Gebiet mit niedriger Einkommensungleichheit und einem hohen ECI hervor, während Bronx County, New York, das gegenteilige Bild zeigt, mit hoher Ungleichheit und niedrigem ECI. Besonders bemerkenswert ist der Kontrast zwischen Bronx County und New York County (Manhattan). Obwohl beide räumlich nah beieinander liegen, zeigt New York County trotz hoher Einkommensungleichheit einen relativ hohen ECI. Dies deutet darauf hin, dass zusätzliche regionale Faktoren wie wirtschaftliche oder kulturelle Knotenpunkte eine Rolle spielen können, die trotz Ungleichheit Verbindungen fördern.

Economic Connectedness Index vs. Median-Haushaltseinkommen:
Das zweite Punktdiagramm beleuchtet die Beziehung zwischen dem Median-Haushaltseinkommen und dem Economic Connectedness Index. Hier zeigt sich ein positiver Zusammenhang: Höhere Median-Haushaltseinkommen gehen mit einem höheren ECI einher. Die positive Korrelation deutet darauf hin, dass wirtschaftlicher Wohlstand in einer Region bessere Voraussetzungen für soziale und wirtschaftliche Vernetzung schafft. Ein höheres Median-Einkommen könnte ein Indikator für besseren Zugang zu Bildung, beruflichen Netzwerken und Ressourcen sein, die die Interaktion und den Austausch zwischen verschiedenen sozialen Gruppen fördern.

Hervorgehobene Counties wie San Francisco County, Kalifornien, und Arlington County, Virginia, zeigen diesen Trend klar auf. Bronx County, New York, repräsentiert hingegen den gegenteiligen Fall mit niedrigem Einkommen und niedrigem ECI. Auch hier gibt es bemerkenswerte Ausnahmen: Morgan County, Utah, weist trotz eines nur moderat hohen Einkommensniveaus einen sehr hohen ECI auf. Dies könnte auf besondere lokale Bedingungen wie starken sozialen Zusammenhalt oder regional ausgeprägte Netzwerke zurückzuführen sein, die die Vernetzung in der Region fördern.

Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?

Economic Connectedness Index vs. Einkommensungleichheit:
Der negative Zusammenhang zwischen der Einkommensungleichheit und dem Economic Connectedness Index entspricht den Erwartungen, dass höhere Einkommensungleichheit den Aufbau von sozialen und wirtschaftlichen Verbindungen erschwert. Regionen mit größerer Ungleichheit stehen vor sozialen Barrieren, die oft durch eine Fragmentierung zwischen verschiedenen Einkommensgruppen geprägt sind. Diese Fragmentierung kann die Möglichkeit reduzieren, dass Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander interagieren, was sich negativ auf die Vernetzung auswirkt. Der klare Unterschied zwischen Bronx County und New York County unterstützt diese Annahme, während Manhattan als Ausnahme die Bedeutung zusätzlicher Faktoren wie kultureller und wirtschaftlicher Zentren verdeutlicht.

Economic Connectedness Index vs. Median-Haushaltseinkommen:
Der positive Zusammenhang zwischen dem Median-Haushaltseinkommen und dem Economic Connectedness Index bestätigt die Annahme, dass wirtschaftlicher Wohlstand eine wichtige Grundlage für stärkere soziale und wirtschaftliche Vernetzungen darstellt. Ein höheres Median-Einkommen korreliert oft mit besseren Möglichkeiten für Bildung und berufliche Netzwerke, die sich positiv auf die Verbindungen innerhalb und zwischen sozioökonomischen Gruppen auswirken. Auch hier bestätigen die beobachteten Daten diesen Zusammenhang. Ausnahmefälle wie Morgan County verdeutlichen jedoch, dass sozialer Zusammenhalt oder andere lokale Gegebenheiten ebenfalls einen starken Einfluss auf den ECI haben können.

Zusammenfassung:

Insgesamt stützen die Ergebnisse aus den Punktdiagrammen die theoretischen Erwartungen aus Aufgabe 5, indem sie die zentralen Hypothesen zu den Beziehungen zwischen Einkommensungleichheit, wirtschaftlichem Wohlstand und sozialer Vernetzung in den untersuchten Regionen bestätigen. Gleichzeitig zeigen die Diagramme die Bedeutung regionaler Besonderheiten und Ausnahmen wie New York County und Morgan County auf, die verdeutlichen, dass zusätzliche Faktoren wie soziale Dynamiken und regionale Netzwerke eine Rolle spielen können.


Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.

11. Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:

  • Economic Connectedness Index (ec_county)
  • Wirtschaftliche Mobilität (upward_mobility)
  • Median Haushaltseinkommen (medincE)
  • Bevölkerung in 2018 (pop2018)
  • Einkommensungleichheit (gini99_simple)
  • Exposition (exposure_gpr_mem_county)
  • Freundschafts-Bias (bias_grp_mem_county)

Beschreiben und interpretieren Sie ihre Korrelationsmatrix.


Korrelationsmatrix für ausgewählte Variablen
Variable Economic Connectedness Index Exposition Wirtschaftliche Mobilität Median Haushaltseinkommen Bevölkerung 2018 Freundschafts-Bias Einkommensungleichheit (Gini)
Economic Connectedness Index NA NA NA NA NA NA NA
Exposition 0.929 NA NA NA NA NA NA
Wirtschaftliche Mobilität 0.723 0.672 NA NA NA NA NA
Median Haushaltseinkommen 0.597 0.695 0.342 NA NA NA NA
Bevölkerung 2018 0.008 0.079 -0.075 0.288 NA NA NA
Freundschafts-Bias -0.437 -0.220 -0.375 0.035 0.153 NA NA
Einkommensungleichheit (Gini) -0.636 -0.603 -0.599 -0.379 0.147 0.312 NA

Die vorliegende Korrelationsmatrix zeigt den Zusammenhang zwischen verschiedenen Variablen. Untersucht werden der ‘Economic Connectedness Index’ (ec_county), die Exposition gegenüber Gruppenmitgliedschaften (exposure_grp_mem_county), die wirtschaftliche Mobilität (upward_mobility), das mediane Haushaltseinkommen (medincE), die Bevölkerung im Jahr 2018 (pop2018), der Freundschafts-Bias (bias_grp_mem_county) sowie die Einkommensungleichheit (gini99_simple). Die Korrelationen zwischen diesen Variablen geben Aufschluss darüber, wie stark und in welche Richtung diese Faktoren miteinander zusammenhängen.

Economic Connectedness Index:

Der Economic Connectedness Index zeigt eine starke positive Korrelation mit der wirtschaftlichen Mobilität (0.723). Dies weist darauf hin, dass Regionen, in denen Menschen besser wirtschaftlich vernetzt sind, auch bessere Bedingungen für wirtschaftlichen Aufstieg bieten. Eine hohe wirtschaftliche Vernetzung fördert den Zugang zu Ressourcen, Wissen und Netzwerken, die entscheidend für individuelle Chancen auf sozialen und ökonomischen Aufstieg sind. Gleichzeitig besteht eine sehr hohe Korrelation (0.929) zwischen dem Economic Connectedness Index und der Exposition, was darauf hindeutet, dass eine stärkere soziale Durchmischung eng mit einer besseren wirtschaftlichen Vernetzung verknüpft ist. Negative Zusammenhänge zeigt der Economic Connectedness Index mit dem Freundschafts-Bias (-0.437) und der Einkommensungleichheit (-0.636). Regionen mit homogeneren sozialen Netzwerken und größerer Einkommensungleichheit weisen tendenziell eine geringere wirtschaftliche Vernetzung auf, was den Zugang zu ökonomischen Möglichkeiten begrenzen könnte.

Exposition:

Die Exposition zeigt eine sehr hohe positive Korrelation (0.929) mit dem Economic Connectedness Index, was die enge Verbindung zwischen sozialer Durchmischung und wirtschaftlicher Vernetzung verdeutlicht. Je stärker Menschen in einer Region mit anderen sozialen und ökonomischen Gruppen in Kontakt treten, desto besser scheint die wirtschaftliche Vernetzung zu sein. Außerdem besteht eine moderate positive Korrelation zwischen Exposition und wirtschaftlicher Mobilität (0.672). Dies deutet darauf hin, dass eine stärkere soziale Durchmischung auch wirtschaftliche Aufstiegschancen begünstigen kann. Die Exposition weist zudem eine positive Verbindung mit dem Median-Haushaltseinkommen (0.695) auf, was darauf hindeutet, dass sozial gemischte Regionen tendenziell wohlhabender sind. Negative Korrelationen bestehen hingegen mit dem Freundschafts-Bias (-0.220) und der Einkommensungleichheit (-0.603). Dies deutet darauf hin, dass sozial isolierte Netzwerke und hohe Einkommensungleichheit tendenziell mit einer geringeren Exposition einhergehen.

Wirtschaftliche Mobilität:

Die wirtschaftliche Mobilität zeigt eine starke positive Korrelation mit dem Economic Connectedness Index (0.723). Dies unterstreicht die Bedeutung wirtschaftlicher Vernetzung für die Chancen, sich wirtschaftlich verbessern zu können. Auch die moderate positive Korrelation mit der Exposition (0.672) deutet darauf hin, dass soziale Durchmischung eine wichtige Rolle für wirtschaftlichen Aufstieg spielt. Die Verbindung mit dem Median-Haushaltseinkommen ist ebenfalls positiv, jedoch schwächer ausgeprägt (0.342). Dies legt nahe, dass ein höheres Haushaltseinkommen in einer Region die wirtschaftliche Mobilität begünstigen kann, jedoch nicht der dominierende Faktor ist. Negative Korrelationen zeigt die wirtschaftliche Mobilität mit dem Freundschafts-Bias (-0.375) und der Einkommensungleichheit (-0.599), was darauf schließen lässt, dass soziale Isolation und hohe Disparitäten hinderlich für wirtschaftlichen Aufstieg sind.

Median-Haushaltseinkommen:

Das Median-Haushaltseinkommen zeigt eine moderate positive Korrelation mit der Exposition (0.695), was darauf hinweist, dass Regionen mit höherem Einkommen sozial vielfältiger sind. Ebenso besteht eine positive, aber schwächere Verbindung mit der wirtschaftlichen Mobilität (0.342), was darauf schließen lässt, dass wohlhabendere Regionen bessere wirtschaftliche Aufstiegschancen bieten können. Eine schwache Korrelation besteht zwischen dem Median-Haushaltseinkommen und der Bevölkerung (0.288). Negative Korrelationen zeigt das Median-Haushaltseinkommen mit dem Freundschafts-Bias (0.035) und der Einkommensungleichheit (-0.379). Dies legt nahe, dass wohlhabendere Regionen tendenziell geringere soziale Isolation und weniger Einkommensungleichheit aufweisen.

Bevölkerung (2018):

Die Bevölkerungsgröße zeigt generell nur schwache Korrelationen mit den anderen Variablen. Die höchste Korrelation besteht zwischen der Bevölkerung und dem Median-Haushaltseinkommen (0.288), was darauf hinweist, dass größere Regionen tendenziell ein höheres Haushaltseinkommen aufweisen. Die Verbindung zur wirtschaftlichen Mobilität (-0.075) und zum Economic Connectedness Index (0.008) ist sehr schwach, was bedeutet, dass die Bevölkerungsgröße nur einen minimalen Einfluss auf wirtschaftliche Vernetzung oder Aufstiegschancen hat. Interessanterweise zeigt die Bevölkerung eine schwache positive Korrelation mit dem Freundschafts-Bias (0.153) und der Einkommensungleichheit (0.147), was darauf hindeuten könnte, dass größere Regionen tendenziell stärker ausgeprägte soziale Isolation und Disparitäten aufweisen.

Freundschafts-Bias:

Der Freundschafts-Bias zeigt eine moderate negative Korrelation mit dem Economic Connectedness Index (-0.437). Dies bedeutet, dass Regionen mit stärker ausgeprägtem Bias (also Freundschaften innerhalb homogener Gruppen) tendenziell eine geringere wirtschaftliche Vernetzung aufweisen. Ähnlich negativ fällt die Korrelation zwischen Freundschafts-Bias und wirtschaftlicher Mobilität (-0.375) aus, was darauf hindeutet, dass soziale Isolation in homogenen Netzwerken die Aufstiegschancen einschränken könnte. Mit der Exposition besteht eine schwache negative Korrelation (-0.220), während die Verbindung zur Einkommensungleichheit mit 0.312 positiv ist. Dies könnte bedeuten, dass Regionen mit stärker ausgeprägtem Freundschafts-Bias tendenziell ungleicher verteilt sind, was wiederum soziale und wirtschaftliche Chancen einschränken könnte.

Einkommensungleichheit (Gini):

Die Einkommensungleichheit zeigt eine moderate negative Korrelation mit dem Economic Connectedness Index (-0.636), was darauf hinweist, dass stärker vernetzte Regionen tendenziell weniger ungleich sind. Ähnliche Zusammenhänge bestehen mit der wirtschaftlichen Mobilität (-0.599) und der Exposition (-0.603). Dies bedeutet, dass soziale und wirtschaftliche Durchmischung sowie wirtschaftliche Vernetzung wichtige Faktoren zur Verringerung von Einkommensungleichheit sind. Das Median-Haushaltseinkommen weist eine schwächere negative Korrelation (-0.379) auf, was andeutet, dass wohlhabendere Regionen tendenziell weniger ungleich sind. Schließlich zeigt die Einkommensungleichheit eine moderate positive Korrelation mit dem Freundschafts-Bias (0.312), was darauf hindeutet, dass soziale Isolation innerhalb homogener Netzwerke zur Verstärkung von Einkommensungleichheiten beitragen kann.

Fazit:

Die Korrelationsmatrix zeigt deutlich, dass wirtschaftliche Vernetzung, soziale Durchmischung und geringe Einkommensungleichheit zentrale Faktoren für wirtschaftliche Mobilität und regionale Wohlstandsverteilung sind. Regionen, die stärker sozial gemischt und wirtschaftlich vernetzt sind, bieten bessere wirtschaftliche Chancen und zeigen geringere soziale und ökonomische Disparitäten. Negative Einflüsse wie soziale Isolation (Freundschafts-Bias) und hohe Einkommensungleichheit wirken hingegen hemmend auf wirtschaftliche Aufstiegschancen und Vernetzung. Die Bevölkerungsgröße spielt in diesen Dynamiken jedoch eine untergeordnete Rolle.


Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?

12. Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.


Beschreibung:

Die vorliegende Grafik zeigt ein Punktediagramm, das den Zusammenhang zwischen dem Median-Haushaltseinkommen in verschiedenen Landkreisen (x-Achse) und dem Economic Connectedness Index (y-Achse) darstellt. Jeder Punkt repräsentiert einen Landkreis. Ziel dieser Darstellung ist es, zu untersuchen, ob der Einfluss der wirtschaftlichen Vernetzung auf die wirtschaftliche Mobilität in Regionen mit unterschiedlichem Einkommensniveau gleich stark ausgeprägt ist.

Interpretation:

Das Diagramm zeigt einen deutlich positiven Zusammenhang zwischen dem Median-Haushaltseinkommen und dem Economic Connectedness Index. Landkreise mit einem höheren Haushaltseinkommen sind tendenziell stärker wirtschaftlich vernetzt. Auffällig ist auch, dass in einkommensstärkeren Regionen (rechte Seite der x-Achse) und bei hoher wirtschaftlicher Vernetzung (obere Seite der y-Achse) die wirtschaftliche Mobilität besonders hoch ist, was sich in der orange-roten Färbung der Punkte widerspiegelt. In einkommensschwachen Regionen (linke Seite der x-Achse) hingegen bleibt die wirtschaftliche Mobilität auch bei besserer wirtschaftlicher Vernetzung meist moderat, was sich durch die grün-gelbe Färbung zeigt.

Diese Beobachtungen deuten darauf hin, dass der Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität nicht für alle Einkommensgruppen gleich stark ist. Während in einkommensstarken Regionen eine hohe wirtschaftliche Vernetzung die wirtschaftliche Mobilität deutlich verbessert, profitieren einkommensschwächere Regionen weniger stark von einer verbesserten Vernetzung. Dies könnte darauf hindeuten, dass wirtschaftliche Vernetzung erst ab einem bestimmten Einkommensniveau ihre volle Wirkung entfalten kann. In sehr einkommensstarken Regionen scheint jedoch der positive Einfluss der Vernetzung ab einem gewissen Punkt abzunehmen, was auf einen abnehmenden Grenznutzen hinweist.

Fazit:

Insgesamt zeigt die Grafik, dass wirtschaftliche Vernetzung ein wichtiger Faktor für wirtschaftliche Mobilität ist, dieser Effekt jedoch stark vom Einkommensniveau einer Region abhängt. Um die wirtschaftliche Mobilität in einkommensschwachen Regionen zu fördern, könnten daher gezielte Maßnahmen zur Stärkung der wirtschaftlichen Vernetzung notwendig sein.


13. Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.

Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:

  • Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
  • In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
  • Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
  • Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?

Rückwärtskausalität:

Rückwärtskausalität bedeutet, dass nicht die soziale Vernetzung (Economic Connectedness Index) die wirtschaftliche Mobilität beeinflusst, sondern eben ganz umgekehrt: Menschen mit höherer wirtschaftlicher Mobilität könnten in Netzwerken enden, die einen höheren ECI aufweisen. Reiche Familien könnten beispielsweise leichter Zugang zu besser vernetzten sozialen Gruppen haben, was den Anschein erwecken könnte, dass soziale Vernetzung wirtschaftliche Mobilität verursacht, obwohl der tatsächliche Kausalpfad umgekehrt ist.

Selektionseffekt:

Selektionseffekte könnten den Zusammenhang zwischen ECI und wirtschaftlicher Mobilität ebenfalls verzerren. Menschen oder Familien mit besseren wirtschaftlichen Voraussetzungen könnten selektiv in Netzwerke eintreten, die einen höheren ECI haben. Dieser Prozess könnte die tatsächlichen Effekte der sozialen Vernetzung auf die wirtschaftliche Mobilität verschleiern, da die Netzwerkeffekte selbst nicht der entscheidende Faktor sind, sondern die Selektivität von Menschen, die ohnehin bereits wirtschaftlich besser gestellt sind.

Ausgelassene Variablen:

Ausgelassene Variablen sind andere Faktoren, die sowohl die wirtschaftliche Mobilität als auch den ECI beeinflussen könnten, aber nicht in der Analyse berücksichtigt werden. Beispielsweise könnten Bildung, Familienstruktur oder die geografische Lage sowohl die Vernetzung als auch die wirtschaftliche Mobilität beeinflussen. Wenn solche Variablen nicht berücksichtigt werden, könnte dies zu einem scheinbaren Zusammenhang zwischen ECI und Mobilität führen, obwohl die eigentliche Ursache andere Faktoren sind.

Auf den gegebenben Seiten 115 - 120 von Chetty et al. (2022a) zeigen die Autoren mehrere Argumente auf, die dafür sprechen, dass es sich nicht nur um Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen handelt:

Zusätzliche empirische Evidenz wird aufgezeigt:

Die Autoren verwenden mehrere unterschiedliche Datensätze und Methoden, um die Robustheit ihrer Ergebnisse zu testen. Wenn die Korrelationen nur aufgrund von Selektionseffekten oder ausgelassenen Variablen zustande kämen, würden diese Effekte in verschiedenen Datensätzen nicht konsistent auftreten.

Robustheit der Kontrollvariablen:

In ihrer Analyse kontrollieren die Autoren für eine Vielzahl von Variablen, darunter Einkommen, Bildungsniveau und andere demografische Faktoren, um den Einfluss ausgelassener Variablen zu minimieren.

Außerdem stützen sich die Autoren auf natürliche Experimente, wie z.B. den Einfluss von Zwangsumzügen oder Änderungen in der Nachbarschaftsstruktur, um kausale Schlüsse zu ziehen. Solche natürlichen Experimente mindern das Risiko von Rückwärtskausalität, da sie externe Schocks oder Veränderungen ausnutzen.

Die Argumentation der Autoren erscheint mir glaubwürdig, da sie eine Vielzahl an Methoden und Kontrollmechanismen verwenden, um alternative Erklärungen wie Rückwärtskausalität und ausgelassene Variablen auszuschließen. Die Verwendung von natürlichen Experimenten und die Kontrolle für eine breite Palette von Faktoren sind starke Indikatoren dafür, dass die Effekte, die sie beobachten, tatsächlich kausal sein könnten.

Allerdings könnten einige Bedenken bestehen, insbesondere in Bezug auf die Frage, ob alle relevanten Variablen erfasst wurden. Selbst mit einer umfangreichen Anzahl an Kontrollvariablen besteht immer ein Risiko, dass wichtige Faktoren übersehen wurden, die das Ergebnis verzerren könnten. Ein weiterer möglicher Kritikpunkt könnte sein, dass natürliche Experimente nicht immer perfekt randomisiert sind und andere latente Faktoren den Zusammenhang beeinflussen könnten.

Um sicherzustellen, dass man einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität ideal misst, wären folgende Bedingungen ideal:

Zufällige Zuweisung zu Netzwerken:
Um den Einfluss der Selektion zu vermeiden, sollten Individuen zufällig sozialen Netzwerken mit unterschiedlichen ECI-Werten zugeordnet werden. Dies könnte beispielsweise durch gezielte Migrationsprogramme oder Sozialexperimente geschehen.

Langfristige Längsschnittstudien:
Es sollten langfristige Daten erhoben werden, um den zeitlichen Verlauf der sozialen Vernetzung und der wirtschaftlichen Mobilität zu messen. So kann sichergestellt werden, dass die soziale Vernetzung zeitlich der wirtschaftlichen Mobilität vorausgeht.

Erfassung aller relevanten Variablen:
Es sollte eine umfassende Erfassung von Variablen wie Bildung, familiärer Hintergrund, Arbeitsmarktbedingungen und regionale Unterschiede erfolgen, um ausgelassene Variablen zu minimieren.

Exogene Schocks nutzen:
Exogene Schocks, wie z.B. unvorhergesehene politische oder wirtschaftliche Veränderungen, könnten verwendet werden, um die Auswirkungen der sozialen Vernetzung auf die Mobilität zu isolieren. Solche Schocks stellen sicher, dass Veränderungen in der sozialen Vernetzung unabhängig von der wirtschaftlichen Situation der Individuen sind.

Mit diesen optimalen Bedingungen wäre es möglich, einen überzeugenden kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität zu identifizieren.


Einflussfaktoren auf die soziale Vernetzung

Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?

14. Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe Exposition (exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.

Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.

Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?


Die oben generierte Karte stellt die Verteilung der Exposition auf County-Ebene in den USA dar. Sie verwendet eine Farbskala, die von Gelb (niedrige Exposition) bis Rot (hohe Exposition) reicht. Counties mit einer hohen Exposition befinden sich überwiegend in städtischen und wohlhabenderen Regionen, während ländliche, wirtschaftlich schwächere Gebiete tendenziell eine geringere Exposition aufweisen.

Vergleich mit der Karte des Economic Connectedness Index (ECI) (Aufgabe 7):

Hohe Übereinstimmung in urbanen Gebieten:
In urbanen Gebieten wie Kalifornien, der Ostküste (z.B. New York, Boston), Texas und Teilen des Mittleren Westens sind sowohl die Exposition als auch der ECI hoch. Dies deutet darauf hin, dass in diesen Gebieten viele wohlhabende Menschen leben und die soziale Vernetzung stärker ist, was zu einer höheren wirtschaftlichen Mobilität führt.

Niedrige Werte in ländlichen Gebieten:
In ländlichen Gebieten, insbesondere im Westen (wie Wyoming, Montana) und in ländlichen Gebieten des Südostens, sind sowohl die Exposition als auch der ECI niedrig. Dies deutet darauf hin, dass in diesen Regionen wenige wohlhabende Menschen leben, was die soziale Vernetzung mit Personen aus höheren Einkommensschichten erschwert und somit die wirtschaftliche Mobilität geringer sein könnte.

Graue Regionen:
Einige graue Bereiche, in denen keine Daten verfügbar sind, sind sowohl in der ECI- als auch in der Expositionskarte sichtbar. Diese Bereiche sind oft weniger bevölkerte, ländliche Regionen oder besondere Territorien wie Alaska, wo umfassende Daten schwieriger zu erheben sind.

Positive Korrelation zwischen Exposition und ECI: Es fällt auf, dass Gebiete mit einer höheren Exposition tendenziell auch einen höheren ECI aufweisen. Dies deutet darauf hin, dass in diesen Regionen wohlhabendere Personen häufiger präsent sind und somit mehr Möglichkeiten zur sozialen Vernetzung mit diesen bestehen.

Exposition als Treiber der sozialen Vernetzung:
Die Karte stützt die Annahme, dass eine höhere Exposition mit einem höheren Maß an sozialer Vernetzung (und folglich höherer wirtschaftlicher Mobilität) verbunden ist. In Gebieten, in denen die Exposition niedrig ist, wie in ländlichen Regionen, ist auch der ECI tendenziell niedriger, was darauf hindeutet, dass eine eingeschränkte Exposition die wirtschaftliche Mobilität behindern könnte.

Die Annahme, dass die Exposition ein wichtiger Faktor für die soziale Vernetzung und wirtschaftliche Mobilität ist, wird durch den Vergleich der beiden Karten gestützt. Regionen mit hoher Exposition zeigen tendenziell auch eine stärkere soziale Vernetzung (höherer ECI). In ländlichen oder strukturschwachen Regionen, in denen die Exposition gering ist, scheint es auch weniger Möglichkeiten für wirtschaftliche Mobilität durch soziale Vernetzung zu geben.


Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.

15. Um zu untersuchen ob es eine entsprechende Segregation der Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein Punktediagramm erzeugen, welche auf der x-Achse die Exposition (exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihr Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.

Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:

  • Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?

Die Grafik zeigt den Zusammenhang zwischen “Freundschafts-Bias” (auf der y-Achse) und “Exposition” (auf der x-Achse). Auf beiden Achsen werden Daten auf County-Ebene dargestellt. Zwei Counties, “Bronx County, New York” und “San Francisco County, California”, sind in der Grafik hervorgehoben.

Beschreibung der Achsen:

Exposition:
Diese beschreibt den Anteil an Kontakten, den eine Person zu Menschen aus verschiedenen sozioökonomischen Gruppen hat. Ein höherer Expositionswert deutet darauf hin, dass eine Person mit mehr Menschen aus anderen sozialen Schichten in Kontakt tritt.

Freundschafts-Bias:
Dieser misst, inwieweit sich eine Person in ihrer Freundesgruppe innerhalb derselben sozioökonomischen Schicht bewegt. Ein höherer Bias-Wert deutet auf stärkere soziale Homogenität hin, d.h., die Freundschaften bestehen überwiegend aus Personen der gleichen sozialen Gruppe.

Interpretation des Diagramms:

Die Punkte zeigen die Counties und es ist eine große Streuung in der Mitte zu erkennen, was auf eine gewisse Variabilität und Flexibilität in der sozialen Vernetzung zwischen den Counties hinweist. Die zwei hervorgehobenen Punkte zeigen spezifische Counties:

Das Bronx County, New York scheint einen moderaten Freundschafts-Bias und eine relativ mittlere Exposition zu haben. Das San Francisco County, California hat eine geringere Exposition und einen leicht erhöhten Freundschafts-Bias.

Einfluss auf die soziale Vernetzung:

Exposition:
Ein höherer Wert für Exposition deutet darauf hin, dass Menschen häufiger mit Individuen aus verschiedenen sozioökonomischen Gruppen interagieren, was eine positive Wirkung auf die soziale Vernetzung und den Economic Connectedness Index haben könnte. Je größer die Durchmischung, desto mehr Chancen entstehen für Vernetzung zwischen verschiedenen sozialen Schichten.

Freundschafts-Bias:
Ein höherer Freundschafts-Bias kann die soziale Vernetzung einschränken, da Menschen eher dazu neigen, Freundschaften in derselben sozialen Gruppe zu knüpfen. Dies könnte eine Barriere für soziale Mobilität darstellen.

Insgesamt deutet das Diagramm darauf hin, dass eine höhere Exposition tendenziell mit einem niedrigeren Freundschafts-Bias korreliert. Dies würde nahelegen, dass Counties mit höherer sozialer Durchmischung (niedrigerer Bias) tendenziell stärker vernetzt sind und somit den Economic Connectedness Index positiv beeinflussen.


16. Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.


Zusammenfassung der Ergebnisse:

Aufgabe 14:
Hier wurde untersucht, wie der Economic Connectedness Index (ECI) von verschiedenen Faktoren wie dem Median-Haushaltseinkommen beeinflusst wird. Regionen mit höherem Einkommen tendieren dazu, besser vernetzt zu sein, während ärmere Regionen oft isolierter sind, was ihre wirtschaftlichen Chancen verringert.

Aufgabe 15:
Es wurde festgestellt, dass Regionen mit einer höheren Exposition (exposure_grp_mem_county), also mehr Kontakt mit unterschiedlichen sozialen Gruppen, tendenziell eine stärkere soziale Vernetzung aufweisen. Ein hoher Freundschafts-Bias (bias_grp_mem_county), bei dem Freundschaften vor allem innerhalb homogener Gruppen bestehen, hemmt diese Vernetzung. Speziell Regionen wie San Francisco County, California zeigten eine starke Vernetzung und Exposition, während Regionen wie Bronx County, New York eine geringere Vernetzung aufgrund eines höheren Bias aufwiesen.

Politische Maßnahmen zur Förderung der sozialen Vernetzung:

Bildungsprogramme und Schulintegration:

Ergebnisse:
Höhere Exposition fördert die Vernetzung. Bildungsprogramme, die gezielt darauf abzielen, Kinder und Jugendliche aus verschiedenen sozioökonomischen Hintergründen zusammenzubringen, können den Bias reduzieren und die Exposition erhöhen.

Maßnahme:
Regierungen könnten durch Programme zur Schulintegration und bunte Wohnviertel soziale Kontakte über verschiedene Gruppen hinweg fördern. Dazu gehört auch die gezielte Förderung von Ganztagsschulen oder außerschulischen Programmen, die Kindern aus unterschiedlichen Schichten gemeinsame Aktivitäten bieten.

Wohnpolitik:

Ergebnisse:
Der Freundschafts-Bias tritt oft in räumlich segregierten Regionen auf, wo Menschen hauptsächlich mit anderen in Kontakt kommen, die ihnen sozial ähnlich sind.

Maßnahme:
Eine durchdachte Wohnpolitik, die auf gemischte Wohnviertel abzielt, könnte die soziale Durchmischung erhöhen. Insbesondere der Bau von erschwinglichem Wohnraum in wohlhabenderen Gegenden oder die Förderung gemischter Wohnprojekte könnte eine stärkere Vernetzung ermöglichen.

Förderung von sozialen Netzwerken:

Ergebnisse:
Ein hohes Maß an sozialer Vernetzung trägt zu besseren wirtschaftlichen Chancen bei. Dies deutet darauf hin, dass Netzwerke, in denen Menschen verschiedene Ressourcen und Informationen teilen, besonders wichtig sind.

Maßnahme:
Lokale Netzwerktreffen, Mentorenprogramme und Unternehmenspatenschaften könnten gezielt in benachteiligten Regionen gefördert werden, um den Austausch und die Zusammenarbeit zwischen unterschiedlichen sozialen Gruppen zu fördern.

Verbesserung des öffentlichen Verkehrs:

Ergebnisse:
Regionen mit besserer Exposition sind tendenziell stärker vernetzt. Diese Exposition könnte auch durch Mobilität beeinflusst werden, da Menschen in abgelegenen oder schlecht angebundenen Regionen seltener Kontakt zu anderen sozialen Gruppen haben.

Maßnahme:
Investitionen in den öffentlichen Nahverkehr könnten die Erreichbarkeit von Arbeitsplätzen und sozialen Treffpunkten in unterschiedlichen Regionen verbessern und so den Kontakt und die Exposition zwischen Menschen unterschiedlicher Schichten erleichtern.

Förderung digitaler Vernetzung:

Ergebnisse:
In ländlichen und strukturschwachen Regionen ist die physische Exposition oft begrenzt. Hier könnten digitale Plattformen und Technologien eine Brücke zur Vernetzung schaffen.

Maßnahme:
Der Ausbau von Breitbandinternet in ländlichen Regionen sowie die Förderung digitaler Bildungsplattformen und sozialer Netzwerke könnte helfen, Menschen auch virtuell miteinander zu vernetzen.

Soziale Räume und Gemeinschaftsräume:

Ergebnisse:
Orte, an denen Menschen aus verschiedenen Hintergründen zusammenkommen, könnten die Exposition erhöhen und den Bias verringern.

Maßnahme:
Der Ausbau von öffentlichen Räumen und Freizeitangeboten, die Menschen aus unterschiedlichen Gruppen anziehen, könnte die soziale Vernetzung fördern. Dazu gehören Parks, Kulturzentren, Sporteinrichtungen und Veranstaltungen, die den sozialen Austausch fördern.

Fazit:

Die Förderung der sozialen Vernetzung ist eng mit wirtschaftlicher Mobilität verbunden. Maßnahmen, die darauf abzielen, den Kontakt zwischen verschiedenen sozialen Gruppen zu stärken, wie Bildung, Wohnpolitik und der Ausbau von Infrastruktur, können die Chancen der Menschen in benachteiligten Regionen verbessern. Entscheidend ist dabei, räumliche und soziale Barrieren abzubauen, um den Bias zu reduzieren und die Exposition zu erhöhen.


Zusatzaufgabe

17. Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:

Hier können Sie die Daten auf College Ebene herunterladen



18. Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten funktioniert dies mit dem R Paket tidycensus. Für den API Zugang müssen Sie sich erst bei IPUMS registrieren und können danach einen API Key beantragen, welchen Sie dann für den Daten download über das tidycencus Paket hinterlegen müssen.

Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.



19. Stellen Sie den Economic Connectedness Index des Colleges (ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paket leaflet.



20. Erstellen Sie ein Punktediagramm auf College Ebene, welches den Zusammenhang zwischen dem Freundschafts-Bias und der Exposition beleuchtet auf College Ebene näher beleuchtet.

Tragen Sie dafür auf der x-Achse den Anteil von Studierenden mit gut verdienenden Eltern ab (exposure_parent_ses_college) und den Freundschafts-Bias unter den Studierenden (bias_parent_ses_college)

Heben Sie fünf Colleges ihrer Wahl in der Grafik hervor (inkl. Beschriftung).

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die fünf von Ihnen hervorgehobenen Colleges ein.


Das Punktediagramm zeigt den Zusammenhang zwischen dem Freundschafts-Bias und der Exposition auf College-Ebene. Die x-Achse repräsentiert den Anteil von Studierenden mit gut verdienenden Eltern, während die y-Achse den Freundschafts-Bias unter den Studierenden abbildet. Der Freundschafts-Bias misst, inwieweit Studierende eher Freundschaften innerhalb derselben sozioökonomischen Schicht schließen. Eine genauere Analyse des Diagramms sowie der hervorgehobenen Colleges liefert interessante Einblicke.

Allgemeiner Trend:

Die meisten Colleges liegen nahe der x-Achse, was darauf hindeutet, dass der Freundschafts-Bias für viele Hochschulen gering ist. Das bedeutet, dass soziale Beziehungen in diesen Fällen relativ unabhängig von der sozioökonomischen Herkunft der Studierenden sind. Gleichzeitig zeigt das Diagramm, dass es keine klare Korrelation zwischen dem Anteil wohlhabender Studierender und dem Freundschafts-Bias gibt. Diese Ergebnisse verdeutlichen, dass soziale Segregation nicht automatisch mit einem höheren Anteil wohlhabender Studierender zunimmt, sondern durch weitere Faktoren beeinflusst werden könnte.

Betrachtung der hervorgehobenen Colleges:

  1. Miles College Miles College weist sowohl einen niedrigen Anteil an Studierenden aus wohlhabenden Familien als auch einen leicht negativen Freundschafts-Bias auf. Dies könnte darauf hinweisen, dass das College eine relativ homogene sozioökonomische Zusammensetzung hat, die weniger soziale Segregation ermöglicht. Die Studierenden scheinen unabhängig von ihrem Hintergrund gleichermaßen integriert zu sein.

  2. Enterprise State Community College Ähnlich wie Miles College hat das Enterprise State Community College einen niedrigen Anteil wohlhabender Studierender, jedoch einen Freundschafts-Bias nahe Null. Dies deutet darauf hin, dass hier eine ausgewogene soziale Durchmischung stattfindet, wodurch Freundschaften über sozioökonomische Grenzen hinweg gefördert werden.

  3. Troy University Die Troy University liegt näher an der Mitte des Diagramms. Der moderate Anteil wohlhabender Studierender gepaart mit einem nahezu neutralen Freundschafts-Bias zeigt, dass die soziale Diversität auf diesem Campus vergleichsweise hoch ist. Hier scheint weder eine starke Segregation noch eine vollständig homogene soziale Struktur vorzuliegen.

  4. University of Alaska Southeast Die University of Alaska Southeast hat einen höheren Anteil wohlhabender Studierender, aber einen leicht negativen Freundschafts-Bias. Diese Kombination ist bemerkenswert, da sie darauf hinweist, dass trotz einer wohlhabenderen Studierendenschaft keine stärkere soziale Segregation auftritt. Dies könnte auf spezifische soziale oder kulturelle Dynamiken an diesem College zurückzuführen sein.

  5. University of Arizona Im Gegensatz dazu zeigt die University of Arizona sowohl einen hohen Anteil von Studierenden aus gut verdienenden Elternhäusern als auch einen positiven Freundschafts-Bias. Dies legt nahe, dass Studierende mit ähnlichem sozioökonomischen Hintergrund hier bevorzugt Freundschaften schließen. Es könnte darauf hindeuten, dass sozioökonomische Unterschiede an diesem College eine stärkere Rolle in den sozialen Beziehungen spielen.

Fazit:

Die Ergebnisse des Diagramms zeigen, dass sozioökonomische Hintergründe die soziale Dynamik an Colleges beeinflussen, jedoch nicht allein ausschlaggebend sind.

Homogene vs. heterogene Zusammensetzung:
Colleges mit einem niedrigeren Anteil wohlhabender Studierender (z. B. Miles College) zeigen tendenziell weniger sozialen Bias. Dies könnte daran liegen, dass eine homogene sozioökonomische Zusammensetzung weniger Möglichkeiten für Segregation bietet. Soziale Segregation:
Colleges mit einem hohen Anteil wohlhabender Studierender (z. B. University of Arizona) weisen häufiger einen positiven Freundschafts-Bias auf. Dies deutet darauf hin, dass sozioökonomische Unterschiede hier stärker ins Gewicht fallen. Ausnahmen:
Die University of Alaska Southeast zeigt, dass ein hoher Anteil wohlhabender Studierender nicht zwangsläufig zu einem positiven Bias führt.

Insgesamt unterstreicht die Analyse, dass soziale Durchmischung und institutionelle Dynamiken wichtige Rollen bei der Förderung von Integration und dem Abbau von sozialer Segregation spielen. Diese Erkenntnisse könnten für Hochschulen wertvoll sein, um eine sozial integrativere Umgebung zu schaffen.



Literatur

Chetty, R., Friedman, J. N., Hendren, N., Jones, M. R., & Porter, S. R. (2018). The opportunity atlas: Mapping the childhood roots of social mobility (No. w25147). National Bureau of Economic Research. https://doi.org/10.3386/w25147

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital I: measurement and associations with economic mobility. Nature 608, 108–121 (2022a). https://doi.org/10.1038/s41586-022-04996-4

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital II: determinants of economic connectedness. Nature 608, 122–134 (2022b). https://doi.org/10.1038/s41586-022-04997-3