Motivation
In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.
Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer
Vernetzung:
- Exposition: In welchem Ausmaß kommen Menschen aus
verschiedenen sozialen Schichten überhaupt in Kontakt?
- Freundschafts-Bias: Wenn Menschen die Möglichkeit haben, sich mit Personen aus anderen sozialen Schichten anzufreunden – nutzen sie diese Chance auch? Oder bleiben sie lieber in ihrer vertrauten sozialen Umgebung?
Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und
in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu
wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin,
dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit
geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über
soziale Schichten hinweg vernetzt sind, profitieren tendenziell von
besseren wirtschaftlichen Perspektiven.
Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.
Datengrundlage
Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:
- Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?
- Welche Faktoren tragen zur sozialen Ungleichheit bei?
- Welche Maßnahmen könnten die Vernetzung über sozioökonomische Grenzen hinweg fördern?
Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.
Einlesen
Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.
- Lesen Sie den Datensatz
social_capital_county.rdsaus dem Unterordner “Daten” in R ein und nennen diesen Datensatzsocial_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.
Schränken Sie ihren Datensatz auf folgende Variablen ein:
- county
- ec_county
- exposure_gpr_mem_county
- bias_grp_mem_county
- pop2018
Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.
Beantworten Sie auch folgende Fragen:
- Was ist eine Beobachtung?
- Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
- In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?
Eine Beobachtung in diesem Datensatz stellt ein einzelnes County in den USA dar. Für jedes County werden zusammengefasste Statistiken zur sozialen Vernetzung sowie demografische Informationen bereitgestellt, darunter Daten zur sozialen Exposition, zum Freundschafts-Bias und zur Bevölkerungsgröße.
Es sind 3089 Counties im Datensatz vorhanden. Die USA hat 3144 Counties und 100 County-ähnliche Regionen, also insgesamt 3244 Counties/Regionen. In 95.14 Prozent der Fälle liegen Informationen zu allen Variablen einer Beobachtung vor.
Die Variable ec_county beschreibt die soziale Vernetzung
der Personen eines Counties. Konkret ist soziale Vernetzung definiert
als der zweifache Anteil von Freunden mit hohem sozioökonomischen Status
einer Person mit niedrigem sozioökonomischen Status. Diese Größe wird
über alle Personen mit niedrigem sozioökonomischen Status gemittelt.
Die Variable exposure_gpr_mem_county gibt Auskunft über
die durchschnittliche Exposition von Personen mit niedrigem
sozioökonomischen Status zu Personen mit hohem sozioökonomischen Status.
Diese Größe ergibt sich als der zweifache Anteil von Personen mit hohem
sozioökonomischen Status, die in der Facebook-Gruppe einer Person mit
niedrigem sozioökonomischen Status sind, gemittelt über alle Personen
mit niedrigem sozioökonomischen Status.
Schließlich steht die Variable bias_grp_mem_county für
den Freundschafts-Bias. Diese Variable stellt die Tendenz zur
Freundschaftsbildung von Personen mit unterschiedlichem
sozioökonomischen Status dar, die sich bereits in einer gemeinsamen
Facebook-Gruppe befunden haben.
Die Variable pop2018 beinhaltet die Einwohnerzahl des
Counties aus dem Jahr 2018.
- Weiterhin haben wir Ihnen den Datensatz
county_covariates.dtaim Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihncovariates.
Schränken Sie diesen Datensatz auf die folgenden Variablen ein:
- county
- kfr_pooled_pooled_p25
- gini99_simple
Generieren Sie eine neue Variable upward_mobility als
kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die
Variable kfr_pooled_pooled_p25.
Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.
Hinweis: Mit dem haven Paket können Sie .dta
Dateien einlesen
Die replication_package_README.pdf enthält eine detaillierte Beschreibung der Variablen in den verschiedenen Datensätzen, die im Rahmen der Replikation der Ergebnisse von Chetty et al. (2022) verwendet werden.
Landkreisdaten (County-Level Data) Diese Daten umfassen den FIPS-Code, die Commuting Zone (CZ) und deren Namen sowie Indizes zur Einkommens- und Rassensegregation. Weitere Variablen betreffen die Bevölkerung von 2018 und soziale Mobilität, wie den kausalen Einkommensbereich und die Teenager-Geburtenrate.
Postleitzahl-Daten (ZIP Code-Level Data) Auf Postleitzahl-Ebene werden demografische Merkmale wie die Bevölkerung 2018, das Einkommensniveau im 25. Perzentil und die Jobanzahl innerhalb von 5 Meilen erfasst. Diese Daten helfen, geografische Disparitäten und Einkommensmobilität zu analysieren.
Schulbezogene Daten (High School Data) Für jede Schule werden Merkmale wie NCES-Schul-ID, Schülerzahl, der Anteil der Schüler, die kostenlose Mahlzeiten erhalten, sowie die ethnische Zusammensetzung und Programme wie Advanced Placement (AP) erfasst.
Bildungsergebnisse und Abschlussdaten Die Daten umfassen Schülerzahlen in den Jahrgangsstufen 9-12 sowie den Anteil männlicher und weiblicher Schüler und die Teilnahme an speziellen Programmen wie AP oder begabten Programmen.
Weitere ZIP-Code-Daten Aus der American Community Survey werden Informationen zu Haushalteinkommen und Medianwerten für verschiedene Altersgruppen in verschiedenen Postleitzahlgebieten bereitgestellt.
Die wirtschaftliche Mobilität upward_mobility ist ein
Maß für den finanziellen Aufstieg einer Person aus einer ärmeren
Familie. Dieses Maß ist definiert als durchschnittlicher prozentualer
Rang eines Erwachsenen mit ärmeren Eltern in Bezug auf das Einkommen.
Dabei gelten die Eltern als arm, falls sie einkommensmäßig in den
unteren 25 Prozent sind.
Der Gini-Koeffizient gini99_simple misst die
Einkommensungleichheit eines Counties.
- Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.
Lesen sie die Daten County_census_data.shp in R ein und
speichern diesen in R als county_census_shape ab. Neben den
County Namen und und Polygonen enthält dieser Datensatz auch das
geschätzte Median Einkommen pro County für das Jahr 2023
(medincE).
Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren
Deskriptive Analysen
Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.
- Verbinden Sie die Dataframes
county_census_shape,covariatesundsocial_capital_countyzu einem Datensatzanalysis_data.
- Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
- Welcher Datensatz sollte der Hauptdatensatz sein? Warum?
Wir verwenden den Datensatz covariates als
Hauptdatensatz, da dieser alle Beobachtungen enthält, die auch in dem
Datensatz social_capital_county enthalten sind. Bei einem
left_join gehen also keine Beobachtungen aus dem Datensatz
social_capital_county verloren. Um diesem Datensatz noch
die Kartendaten aus dem Datensatz county_census_shape
hinzuzufügen, verwenden wir einen weiteren left_join. Dabei
gehen 11 Beobachtungen des Datensatzes county_census_shape
verloren.
- Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:
- upward_mobility
- ec_county
- exposure_gpr_mem_county
- bias_grp_mem_county
Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:
- Was genau misst die wirtschaftliche Mobilität
(
upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen. - Bitte schauen Sie sich an, wie die sozialen Vernetzung
(
ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
Hinweis: Die genaue Berechnung der sozialen Vernetzung
(ec_county) finden Sie im Dokument
“social_capital_codebo
Die wirtschaftliche Mobilität gibt an, wie einfach es für Menschen ist, aus einer niedrigeren Einkommensklasse in eine höhere zu steigen. In diesem Fall wird sie durch den Wert kfr_pooled_pooled_p25 gemessen, der zeigt, wie wahrscheinlich es ist, dass Leute im unteren Einkommensbereich (25. Perzentil) in ein höheres Einkommensniveau aufsteigen. Dieser Wert wird mit 100 multipliziert, sodass wir die Wahrscheinlichkeit in Prozent bekommen. Eine hohe wirtschaftliche Mobilität bedeutet also, dass es für viele Menschen im unteren Einkommensbereich leichter ist, nach oben aufzusteigen.
Die soziale Vernetzung misst, wie stark Menschen in einem County miteinander vernetzt sind, und zwar über sozioökonomische Grenzen hinweg. In diesem Projekt wird die soziale Vernetzung durch den sogenannten “Economic Connectedness Index” (ec_county) dargestellt. Ein hoher Wert dieses Index bedeutet, dass Menschen in diesem County nicht nur innerhalb ihrer eigenen sozialen Schicht miteinander verbunden sind, sondern auch starke Verbindungen zu Leuten aus anderen Schichten haben. Ein hoher Wert kann den Zugang zu Ressourcen und Chancen erleichtern, was den sozialen Aufstieg fördern könnte.
Wenn Menschen gut vernetzt sind, haben sie besseren Zugang zu Informationen, Jobmöglichkeiten und anderen Ressourcen, die für den Aufstieg wichtig sind. Ein hoher ec_county-Wert bedeutet also, dass die Menschen in einem County voneinander profitieren können, was den sozialen Aufstieg erleichtert. Menschen, die gut vernetzt sind, haben mehr Chancen, von anderen zu lernen und von deren Netzwerken zu profitieren. Zum Beispiel könnten sie von Leuten aus höheren Einkommensschichten erfahren, welche Karrieremöglichkeiten es gibt oder wie man beruflich vorankommen kann. Wenn Menschen in einem County gut über soziale Schichten hinweg vernetzt sind, werden sie wahrscheinlich auch Zugang zu besseren Ressourcen haben. Dies könnte ihren sozialen Aufstieg fördern, da sie dann nicht nur innerhalb ihrer eigenen Schicht agieren, sondern auch Kontakte zu erfolgreichen oder besser vernetzten Gruppen haben.
Der ec_county-Wert gibt an, wie gut Menschen in einem County miteinander vernetzt sind, auch über sozioökonomische Grenzen hinweg. Ein hoher ec_county-Wert bedeutet, dass Leute in diesem County starke Verbindungen zu Menschen aus unterschiedlichen sozialen Schichten haben. Der Index hilft also dabei zu verstehen, wie stark die sozialen Netzwerke innerhalb eines Countys sind und wie sehr diese Netzwerke den Austausch von Ressourcen und Informationen fördern.
Die Exposition zeigt, wie sehr die Menschen in einem County mit anderen sozioökonomischen Gruppen in Kontakt kommen. Wenn Menschen in einem County viel Kontakt mit verschiedenen sozialen Gruppen haben, sollte die soziale Vernetzung auch höher sein.
Der Freundschafts-Bias zeigt, wie stark sich Menschen in einem County eher mit Leuten aus ihrer eigenen sozialen Schicht anfreunden, anstatt Kontakte zu anderen sozialen Gruppen zu knüpfen. Ein hoher Freundschafts-Bias würde also zu einer geringeren sozialen Vernetzung führen, weil die sozialen Netzwerke innerhalb der eigenen Gruppe bleiben und keine Verbindungen zu anderen Schichten bestehen.
Wirtschaftliche Mobilität misst, wie einfach es für Personen ist, von einer niedrigen in eine höhere Einkommensklasse aufzusteigen. Soziale Vernetzung (Economic Connectedness Index, ec_county) bezieht sich auf die Stärke der wirtschaftlichen Verbindungen innerhalb eines Landkreises, basierend auf Facebook-Freundschaften und sozialen Netzwerken.
Ein hoher Wert der sozialen Vernetzung sollte die wirtschaftliche Mobilität fördern. Wenn Menschen gut vernetzt sind, haben sie besseren Zugang zu Ressourcen, Jobmöglichkeiten und wichtigen Informationen, was ihre Chancen auf ökonomischen Aufstieg erhöht. Ein hoher ec_county-Index deutet auf starke Netzwerke hin, die den Austausch von Ressourcen und Chancen erleichtern. Solche Netzwerke sollten die wirtschaftliche Mobilität verbessern.
Exposition beschreibt, wie stark Menschen in einem County bestimmten sozialen oder wirtschaftlichen Gruppen ausgesetzt sind. Eine hohe Exposition zu gut vernetzten Gruppen sollte den Economic Connectedness Index stärken, da mehr Interaktionen zu stärkeren Netzwerken führen. Freundschafts-Bias misst, wie stark sich Menschen mit anderen aus ähnlichen sozialen oder kulturellen Gruppen verbinden. Ein hoher Freundschafts-Bias könnte die Vernetzung innerhalb homogener Gruppen verstärken, während ein niedriger Bias zu breiteren, aber weniger intensiven Netzwerken führen könnte.
- Schauen Sie sich in einem ersten Schritt an, wie die Variablen im
Datensatz
analysis_dataüber alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.
Beschreiben und interpretieren Sie Ihre Tabelle.
Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?
Hinweis: Achten Sie auf eine schöne Darstellung ihrer
Tabelle mittels der Pakete kableExtra oder
gt!
|
Übersicht wichtiger Kenngrößen einiger Variablen
|
|||||||
|---|---|---|---|---|---|---|---|
| Variable | Mittelwert | Standardabweichung | Minimum | Q25 | Median | Q75 | Maximum |
| Gini-Koeffizient | 0.29 | 0.06 | -0.06 | 0.24 | 0.29 | 0.33 | 0.57 |
| wirtschaftliche Mobilität | 42.72 | 6.48 | 12.22 | 38.44 | 41.95 | 46.07 | 68.83 |
| Economic Connectedness | 0.81 | 0.18 | 0.29 | 0.70 | 0.81 | 0.94 | 1.36 |
| Exposition | 0.91 | 0.21 | 0.26 | 0.77 | 0.91 | 1.05 | 1.49 |
| Freundschafts-Bias | 0.06 | 0.05 | -0.11 | 0.03 | 0.06 | 0.10 | 0.33 |
| Einwohnerzahl 2018 | 108010.41 | 337782.56 | 544.00 | 12630.00 | 27887.00 | 72728.50 | 10098052.00 |
| Median Einkommen | 64956.94 | 18342.48 | 16170.00 | 54088.00 | 63125.00 | 73051.00 | 178707.00 |
Der durchschnittliche Gini-Koeffizient liegt bei 0.29, was auf eine moderate Einkommensungleichheit hinweist. Ein negativer Wert von -0.06 ist jedoch ungewöhnlich und könnte auf Datenfehler hindeuten.
Der Mittelwert liegt bei 42.72, aber es gibt große Schwankungen (Minimum 12.22, Maximum 68.83), was auf regionale Unterschiede in der Mobilität hinweist.
Mit einem Mittelwert von 0.81 gibt es eine insgesamt starke soziale Vernetzung, jedoch große Unterschiede (Minimum 0.29, Maximum 1.36).
Der Mittelwert liegt bei 0.91, mit einem breiten Bereich zwischen 0.26 und 1.49, was auf unterschiedliche soziale Integrationen in den Landkreisen hinweist.
Der Wert von 0.06 zeigt einen geringen Bias, jedoch weist das Minimum von -0.11 auf ungewöhnliche Muster hin.
Die durchschnittliche Bevölkerungszahl ist 108.010, aber die große Standardabweichung und das Maximum von 10 Millionen zeigen eine starke Variation in der Größe der Landkreise.
Mit einem Durchschnitt von 65.000 US-Dollar gibt es große Einkommensunterschiede, das Minimum liegt bei 16.170 US-Dollar und das Maximum bei 178.707 US-Dollar.
Zusammenfassend lässt sich sagen, dass es bei einigen Variablen auffällige Ausreißer gibt, wie etwa der negative Wert beim Gini-Koeffizienten und beim Freundschafts-Bias. Diese Ausreißer sollten näher untersucht werden, da sie entweder auf Fehler in den Daten oder auf besondere soziale Dynamiken in den betroffenen Landkreisen hinweisen könnten. Zudem zeigen die Daten eine große Heterogenität zwischen den Landkreisen, insbesondere hinsichtlich der Bevölkerungsgröße und der sozialen Mobilität.
Soziale Vernetzung und wirtschaftliche Mobilität
Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild
über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre
Analyse näheres über die soziale Vernetzung lernen, den Economic
Connectedness Index (ec_county), welcher aus den Facebook
Freundschaften generiert wurde. Die Daten des Economic Connectedness
Index wurden auf County Ebene aggregiert, beruhen jedoch auf
Freundschaftsdaten von individuellen Facebook Nutzern.
- Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.
Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:
Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?
Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt
sich das tigris
Paket und der Befehl shift_geometry() um Alaska, Hawaii
und Puerto Rico schön darstellen zu lassen.
Die Karte zeigt die geographische Verteilung des Economic Connectedness Index (EC-Index) in den USA und stellt die soziale Vernetzung auf County-Ebene dar. Landkreise mit höherem EC-Index sind in dunkleren Farben eingefärbt und weisen eine stärkere soziale Vernetzung auf, während hellere Farben auf eine geringere Vernetzung hinweisen. Dies könnte auf städtische Gebiete mit aktiveren Facebook-Nutzern oder ländliche Regionen mit weniger aktiven Online-Communities hinweisen.
Um gültige Aussagen über den Einfluss des Economic Connectedness Index (EC-Index) auf die wirtschaftliche Mobilität zu treffen, müssen einige Annahmen getroffen werden. Zunächst muss die Kausalität angenommen werden, dass eine stärkere soziale Vernetzung (ein hoher EC-Index) zu einer verbesserten wirtschaftlichen Mobilität führt und nicht umgekehrt, also dass die Vernetzung die Ursache und nicht das Ergebnis der Mobilität ist.
Weiterhin muss die Repräsentativität des EC-Index gewährleistet sein, indem davon ausgegangen wird, dass der EC-Index, der auf Facebook-Freundschaften basiert, die tatsächliche soziale Vernetzung gut abbildet. In ländlichen Gebieten, in denen weniger Menschen Facebook nutzen, könnte dies jedoch zu Verzerrungen führen.
Schließlich ist es notwendig, Störfaktoren wie Bildung, Infrastruktur oder Arbeitsmöglichkeiten zu kontrollieren, um den spezifischen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität isoliert betrachten zu können.
- Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.
Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:
- Median Haushaltseinkommen in dem County (
medincE) - Wirtschaftliche Mobilität in dem County
(
upward_mobility) - Einkommensungleichheit in dem County (gemessen mit dem
Gini-Koeffizient des Counties) (
gini99_simple)
Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.
Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:
- Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.
| County | ECI | Median Haushaltseinkommen | Wirtschaftliche Mobilität | Einkommensungleichheit |
|---|---|---|---|---|
| Rockingham County, New Hampshire | 1.36 | 113927 | 45.31 | 0.23 |
| Douglas County, Colorado | 1.35 | 145737 | 48.24 | 0.12 |
| San Francisco County, California | 1.31 | 141446 | 50.39 | 0.31 |
| Morgan County, Utah | 1.29 | 126092 | 54.12 | 0.15 |
| Madison County, Idaho | 1.28 | 58259 | 51.54 | 0.22 |
| Arlington County, Virginia | 1.27 | 140160 | 46.28 | 0.39 |
| Sussex County, New Jersey | 1.26 | 114316 | 47.04 | 0.18 |
| Wright County, Minnesota | 1.25 | 106666 | 49.54 | 0.18 |
| Gunnison County, Colorado | 1.25 | 77358 | 48.71 | 0.35 |
| Pitkin County, Colorado | 1.24 | 100318 | 45.83 | -0.01 |
| County | ECI | Median Haushaltseinkommen | Wirtschaftliche Mobilität | Einkommensungleichheit |
|---|---|---|---|---|
| Todd County, South Dakota | 0.29 | 39148 | 30.18 | 0.32 |
| Oglala Lakota County, South Dakota | 0.33 | 34769 | 24.84 | NA |
| Terrell County, Georgia | 0.35 | 43812 | 31.17 | 0.36 |
| Bullock County, Alabama | 0.36 | 36723 | 34.57 | 0.31 |
| Allendale County, South Carolina | 0.36 | 31603 | 31.40 | 0.33 |
| Robeson County, North Carolina | 0.36 | 40318 | 32.10 | 0.36 |
| Early County, Georgia | 0.38 | 53750 | 33.83 | 0.46 |
| Marlboro County, South Carolina | 0.38 | 36293 | 32.82 | 0.31 |
| Crisp County, Georgia | 0.39 | 42745 | 32.89 | 0.42 |
| Scotland County, North Carolina | 0.40 | 43500 | 31.08 | 0.39 |
Die beiden Tabellen zeigen die 10 Landkreise mit dem höchsten und niedrigsten Economic Connectedness Index (ECI). Die Variablen, die betrachtet werden, sind das Median-Haushaltseinkommen, die wirtschaftliche Mobilität und die Einkommensungleichheit.
Die Unterschiede in den Variablen zwischen den Landkreisen mit hohem und niedrigem Economic Connectedness Index (ECI) waren aus folgenden Gründen zu erwarten:
Landkreise mit hohem ECI haben in der Regel ein höheres Median-Haushaltseinkommen. In Regionen mit starken sozialen Netzwerken gibt es tendenziell bessere wirtschaftliche Bedingungen, mehr berufliche Chancen und eine höhere Lebensqualität. Zum Beispiel haben Landkreise wie San Francisco und Douglas County hohe Median-Haushaltseinkommen, was auf eine starke wirtschaftliche Basis hindeutet. Solche Regionen ziehen auch mehr Fachkräfte an und bieten bessere berufliche Netzwerke.
In Landkreisen mit hohem ECI ist die wirtschaftliche Mobilität tendenziell höher. Dies kann darauf zurückgeführt werden, dass starke soziale Netzwerke bessere Möglichkeiten für den beruflichen Aufstieg bieten. Wohlhabendere, stärker vernetzte Regionen verfügen über mehr Ressourcen, Bildungseinrichtungen und berufliche Netzwerke, die den sozialen Aufstieg fördern. Landkreise wie Morgan County oder Madison County weisen daher eine hohe wirtschaftliche Mobilität auf.
Auch die Einkommensungleichheit korreliert mit dem ECI. Landkreise mit höherem ECI tendieren zu geringerer Einkommensungleichheit. Eine starke soziale Vernetzung fördert oft eine gerechtere Verteilung von Wohlstand und Ressourcen. In Regionen wie Douglas County oder Rockingham County mit niedrigeren Gini-Koeffizienten zeigt sich eine relativ gerechte Einkommensverteilung. Im Gegensatz dazu haben Landkreise mit niedrigerem ECI, wie Todd County oder Oglala Lakota County, eine höhere Einkommensungleichheit.
Insgesamt entsprechen die Unterschiede in den Variablen den Erwartungen, da eine starke soziale Vernetzung und ein hoher ECI in der Regel mit besseren ökonomischen Bedingungen, höherer Mobilität und gerechterer Einkommensverteilung einhergehen. Auf der anderen Seite führen geringe soziale Vernetzung und niedriger ECI in ärmeren Landkreisen oft zu weniger Chancen, niedrigerer wirtschaftlicher Mobilität und größerer Einkommensungleichheit.
Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?
- In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot)
erstellen, welches die wirtschaftliche Mobilität
(
upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
- In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?
Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen
Die Datenpunkte, welche für die Counties stehen, formen eine Punktewolke, welche sich von südwest bis nordost erststreckt. Es gibt wenige Counties, die nicht diesem beschriebenem Muster folgen, wie zum Beispiel die drei Regionen Hoonah-Angoon Census Area, North Slope Borough und Denali Borough aus Alaska. Diese Regionen weisen trotz hohem ECI (zwischen 1 und 1.2) eine geringe wirtschaftliche Mobilität (circa 25 bis 30 Prozent) auf. Umgekehrt besitzt das Corson County aus South Dakota einen kleinen ECI (etwas mehr als 0.4) aber eine hohe wirtschaftliche Mobilität (fast 50 Prozent). Die beiden Counties mit dem größten ECI (über 1.3) sind Douglas County in Colorado und Rockingham County in New Hampshire weisen eine vergleichsweise eher durchschnittliche wirtschaftliche Mobilität auf (zwischen 45 und 50 Prozent).
Insgesamt entsprich die Grafik jedoch unseren aufgestellten Erwartungen. Eine höhere soziale Vernetzung scheint die wirtschaftliche Mobilität positiv zu beeinflussen, wie es durch den positiven Anstieg der Regressionsgerade visualisiert wird. Ebenso deutet ein Korrelationskoeffizient von 0.72 auf diesen Zusammenhang hin. Diese Beobachtung lässt sich dadurch erklären, dass mehr ärmere Personen in Regionen mit hoher sozialer Vernetzung durch bessere Vermittlung seitens der befreundeten reicheren Personen gutbezahlte Jobs bekommen, was dazu führt, dass die wirtschaftliche Mobilität steigt.
Die Regressionsanalyse erlaubt es sogar, den Einfluss der sozialen Vernetzung zu quantifizieren. Eine Erhöhung des ECI um 0.2 Einheiten, hat zur Folge, dass die wirtschaftliche Mobilität um fast 5 Prozent steigt. Soziale Netzwerke beeinflussen wirtschaftliche Mobilität also deutlich.
- Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
- Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
- Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index
Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:
- San Francisco County, California
- Arlington County, Virginia
- Morgan County, Utah
- New York County, New York
- Bronx County, New York
Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.
Das erste Punktdiagramm stellt den Zusammenhang zwischen sozialer Vernetzung und der Einkommensungleichheit dar. Hierbei ist der ECI auf der x-Achse und der Gini-Koeffizient auf der y-Achse positioniert. Die Punktewolke erstreckt sich von norwest nach südost. Eine hohe soziale Vernetzung ist also mit einer niedrigen Einkommensungleichheit und eine geringe soziale Vernetzung ist mit einer hohen Einkommensungleichheit in Verbindung zu bringen. Dieser aufgezeigte Zusammenhang entspricht unseren Erwartungen. Starkt ausgeprägte soziale Netzwerke innerhalbe einer Region über verschiedene sozioökonomische Gruppen haben zur Folge, dass ärmere Personen aufgrund der Unterstützung ihrer reicheren Freunde eher an besser bezahhlte Jobs kommen, womit sich die Einkommenslücke zwischen ihnen verringert.
Die hervorgehobenen Counties entsprechen zum Teil dem entdeckten Muster. Das Morgan County in Utah weist eine hohe soziale Verbundenheit auf, ebenso wie eine sehr geringe Einkommensungleichheit. Diese Beobachtung stimmt mit dem entdeckten Muster überein. Genauso ins Bild passt das Bronx County in New York. Es hat eine unterdurchschnittliche soziale Vernetzung (circa 0.7) und dafür auch eine höhere Einkommensungleichheit (0.36). Das New York County in New York hingegen hat einen deutlich größeren ECI als Bronx (circa 0.8), fällt aber durch eine besonders hohe Einkommensungleichheit auf. Diese Beobachtung ließe sich unter anderem mit der Anonymität der Großstadt erklären. Personen mit unterschiedlichem sozioökonomischen Status können zwar „Facebook-Freunde“ sein, aber keine echten „Freunde“. Eine unechte Freundschaft zu einer reichen Person ist weniger dienlich, wenn es um wirtschaftlichen Aufstieg geht.
Das Arlington County in Virginia und das San Francisco County in Kalifornien haben sehr hohe soziale Vernetzung (circa 1.3), liegen mit der Einkommensungleichheit aber auf dem selben Niveau wie Bronx (zwischen 0.3 und 0.4). Dies zeigt, dass soziale Vernetzung zwar ein ausschlaggebender Faktor für Einkommensungleichheit ist, aber es auch andere Einflüsse geben muss.
Das zweite Punktdiagramm visualisiert den Zusammenhang zwischen sozialer Vernetzung und dem Median Haushaltseinkommen eines Counties. Der ECI befindet sich erneut auf der x-Achse und das Median Haushaltseinkommen wird auf der y-Achse abgetragen. Die Punktewolke erstreckt sich von südwest nach nordost. Es lässt sich also schließen, dass bei einer hohen sozialen Verbundenheit im Allgemeinen auch mit einem hohen Median Haushaltseinkommen zu rechnen ist. Dies stimmt überein mit unseren Erwartungen. Falls Leute aus verschiedenen sozioökonomischen Schichten eine stärkere soziale Verbindung haben, so erfahren mehr ärmere Leute aufgrund ihrer Freundschaft zu reicheren Personen einen wirtschaftlichen Aufstieg, was zu einem Anstieg des Median Haushaltseinkommens führt.
Alle hervorgehobenen Counties repräsentieren diesen positiven Zusammenhang. Das Bronx County hat die geringste soziale Vernutzung und damit einhergehend auch das geringste Median Haushaltseinkommen. Die drei Counties San Francisco, Arlington und Morgan befinden sich in der oberen rechten Ecke der Punktewolke. Sie weisen eine hohe soziale Verbundenheit, sowie ein hohes Median Haushaltseinkommmen auf.
Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.
- Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
- Economic Connectedness Index (ec_county)
- Wirtschaftliche Mobilität (upward_mobility)
- Median Haushaltseinkommen (medincE)
- Bevölkerung in 2018 (pop2018)
- Einkommensungleichheit (gini99_simple)
- Exposition (exposure_gpr_mem_county)
- Freundschafts-Bias (bias_grp_mem_county)
Beschreiben und interpretieren Sie ihre Korrelationsmatrix.
Die Korrelationsmatrix stellt die Korrelationen zwischen den verschiedenen Variablen übersichtlich dar. Es lässt sich auf den ersten Blick erkennen, dass die Einwohnerzahl mit keiner anderen Variable korreliert. Es ist höchstens eine schwache positive Korrelation (0.29) zu dem Median Einkommen vorhanden. Counties mit mehr Einwohnern übernehmen in der Regel eher die Rolle von Wirtschaftszentren. Dort gibt es also mehr gutbezahlte Arbeitsplätze, wodurch auch das Median Haushaltseinkommen tendenziell höher ist. Die soziale Vernetzung hat eine hohe positive Korrelation mit der wirtschaftlichen Mobilität (0.73). Diesen Effekt haben wir schon in Aufgabe 9 festgestellt. Aus Aufgabe 10 wissen wir auch, dass das Median Haushaltseinkommen eine hohe positive Korrelation (0.63) und dass die Einkommensungleichheit eine hohe negative Korrelation (-0.64) zur sozialen Vernetzung aufweisen. Gründe hierfür haben wir in den Aufgaben 8 und 10 diskutiert. Insbesondere kommen in der Zeile mit dem Gini-Koeffizient hohe negative Korrelationen vor, da ein großer Gini-Koeffizient grundsätzlich als „schlecht“ bezeichnet werden kann, wohingegen große Werte der anderen Variablen „gut“ sind.
Den höchsten Korrelationskoeffizienten besitzen die Variablen der sozialen Vernetzung und der Exposition (0.94). Dies ist keine Überraschung, denn diese beiden Variablen haben eine ähnliche Definition. Die Exposition spiegelt den Anteil an reichen Personen in der „Facebook-Gruppe“ einer armen Person wider, während die soziale Vernetzung den Anteil an reichen Freunden einer armen Person widerspiegelt.
Die Exposition hat auch hohe positve Korrelationswerte mit dem Median Haushaltseinkommen und der wirtschaftlichen Mobilität. Dies folgt aus der Transitivität der Korrelation, da auch die soziale Vernetzung eine hohe positive Korrelation mit den Variablen hat.
Die restlichen Einträge bewegen sich im Bereich zwischen -0.3 und 0.3, was auf eine sehr schwache bis gar keine Korrelation hindeutet.
Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?
- Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.
Das Punktediagramm zeigt den Zusammenhang zwischen dem Median-Haushaltseinkommen (x-Achse) und dem Economic Connectedness Index (y-Achse) für verschiedene Counties. Die Datenpunkte sind nach wirtschaftlicher Mobilität eingefärbt, wodurch Unterschiede zwischen verschiedenen Einkommensgruppen sichtbar werden.
Es ist ein klarer positiver Trend zu erkennen: Counties mit höherem Median-Haushaltseinkommen haben tendenziell auch einen höheren Economic Connectedness Index. Dies deutet darauf hin, dass wohlhabendere Gegenden stärker sozial vernetzt sind, insbesondere im wirtschaftlichen Sinne.
Counties mit niedriger wirtschaftlicher Mobilität (z. B. 30–40, gelb) sind häufiger in Bereichen mit niedrigerem Einkommen und geringerer sozialer Vernetzung zu finden. Höhere wirtschaftliche Mobilität (z. B. >60, pink) tritt eher in Regionen mit höherem Einkommen und starker wirtschaftlicher Vernetzung auf.
Die wirtschaftliche Mobilität scheint in Gegenden mit hohem Einkommen tendenziell höher zu sein, was darauf hindeutet, dass Economic Connectedness dort eine stärkere Rolle spielt. In ärmeren Regionen (linker Bereich der x-Achse) gibt es zwar auch eine gewisse Streuung im Economic Connectedness Index, aber die wirtschaftliche Mobilität ist dort eher niedrig. Dies könnte darauf hinweisen, dass die Vorteile sozialer Vernetzung für wirtschaftliche Mobilität in einkommensschwächeren Gebieten begrenzter sind als in wohlhabenderen Regionen.
Das Diagramm legt nahe, dass wirtschaftliche Vernetzung einen positiven Einfluss auf die wirtschaftliche Mobilität hat, aber dieser Effekt ist nicht für alle Einkommensgruppen gleich stark. In wohlhabenderen Gegenden scheint eine starke soziale Vernetzung stärker mit wirtschaftlicher Mobilität verbunden zu sein als in ärmeren Regionen. Dies könnte darauf hindeuten, dass zusätzliche Faktoren (z. B. Zugang zu Ressourcen, Bildungsangebote oder politische Rahmenbedingungen) eine Rolle spielen.
- Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.
Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:
- Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
- In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
- Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
- Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?
In Bezug auf die Analyse von Chetty et al. (2022) und den Zusammenhang zwischen dem Economic Connectedness Index (ECI) und der wirtschaftlichen Mobilität, lassen sich verschiedene Faktoren identifizieren, die einen scheinbaren Zusammenhang verursachen könnten. Diese beinhalten Rückwärtskausalität, Selektionseffekte und ausgelassene Variablen.
Rückwärtskausalität könnte bedeuten, dass nicht die soziale Vernetzung die wirtschaftliche Mobilität beeinflusst, sondern umgekehrt. In Regionen mit höherer Mobilität sind bessere berufliche Chancen vorhanden, was zu einer besseren sozialen Vernetzung führt.
Selektionseffekte könnten ebenfalls eine Rolle spielen. Menschen, die sich in Regionen mit besserer sozialer Vernetzung aufhalten, sind oft auch diejenigen, die bereits bessere wirtschaftliche Chancen haben. Das bedeutet, dass die sozialen Netzwerke in diesen Regionen eher für Menschen mit bereits höherer Mobilität oder besserem wirtschaftlichen Status zugänglich sind. Es ist möglich, dass die Menschen aufgrund ihrer höheren wirtschaftlichen Möglichkeiten in gut vernetzte Gebiete ziehen, was den Zusammenhang zwischen Mobilität und sozialer Vernetzung erklären könnte.
Die Autoren argumentieren, dass sie in ihrer Analyse eine Vielzahl von potenziellen Variablen berücksichtigt haben, die das Ergebnis verzerren könnten, wie Bildung, Arbeitsmarktbedingungen und andere sozioökonomische Faktoren. Ihre Ergebnisse bleiben auch dann konsistent, wenn diese Faktoren kontrolliert werden, was darauf hindeutet, dass der Zusammenhang nicht durch ausgelassene Variablen erklärt wird.
Chetty et al. (2022) argumentieren, dass ihre Analyse Rückwärtskausalität und Selektionseffekte ausschließt, da der Zusammenhang zwischen sozialer Vernetzung und wirtschaftlicher Mobilität auch nach Kontrolle von Variablen wie Bildung und Arbeitsmarktbedingungen bestehen bleibt. Der Zusammenhang bleibt robust, selbst wenn diese Faktoren berücksichtigt werden, was auf einen echten kausalen Zusammenhang hindeutet.
Die Argumentation der Autoren erscheint überzeugend, insbesondere aufgrund der robusten empirischen Tests. Dennoch könnte die Aggregation von Daten problematisch sein, da individuelle Unterschiede in der sozialen Vernetzung und wirtschaftlichen Mobilität möglicherweise nicht vollständig erfasst werden.
Für die Messung eines kausalen Effekts der sozialen Vernetzung wären randomisierte kontrollierte Studien ideal, da diese Rückwärtskausalität und Selektionseffekte minimieren. Zusätzlich wären längsschnittliche Daten wichtig, um Veränderungen über die Zeit zu erfassen. Die Berücksichtigung einer Vielzahl relevanter Variablen und die Nutzung natürlicher Experimente könnten ebenfalls dazu beitragen, den Zusammenhang genauer zu untersuchen.
Einflussfaktoren auf die soziale Vernetzung
Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?
- Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe
Exposition (
exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.
Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.
Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?
Die Karte aus Aufgabe 14 stellt die Exposition dar, also den Anteil der gut verdienenden Personen in einem County. Je dunkler die Farbe, desto höher der Anteil. Die zweite Karte aus Aufgabe 7 zeigt den Economic Connectedness Index, der misst, wie stark einkommensschwache und einkommensstarke Personen sozial vernetzt sind.
Ein Vergleich beider Karten zeigt, dass Regionen mit hoher Exposition oft auch eine stärkere wirtschaftliche Vernetzung aufweisen. Besonders in wirtschaftlich starken Gebieten an der Ost- und Westküste sind beide Werte tendenziell höher. In ländlichen Regionen, vor allem im Westen und Süden, sind die Werte hingegen oft niedriger. Dennoch gibt es einzelne Counties mit hoher Exposition, die keine entsprechend hohe soziale Vernetzung haben.
Daraus lässt sich ableiten, dass eine hohe Exposition zwar ein wichtiger Faktor für wirtschaftliche Vernetzung sein kann, aber nicht allein entscheidend ist. Möglicherweise spielen auch andere Einflüsse eine Rolle, wie z. B. soziale Strukturen oder Segregation innerhalb der Communities.
Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.
- Um zu untersuchen ob es eine entsprechende Segregation der
Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein
Punktediagramm erzeugen, welche auf der x-Achse die Exposition
(
exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihr Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.
Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:
- Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?
Die Grafik zeigt die Beziehung zwischen Exposition (x-Achse) und Freundschafts-Bias (y-Achse) für verschiedene Counties in den USA. Dabei ist jeder Punkt ein County, dessen Farbe den Grad der sozialen Vernetzung (Economic Connectedness Index) angibt.
Counties mit hoher Exposition (weiter rechts) haben tendenziell einen niedrigeren Freundschafts-Bias (niedrigere y-Werte). Das bedeutet, dass in Regionen mit hoher Exposition (also vielen wohlhabenden Personen) weniger stark nach sozioökonomischem Status segregierte Freundschaften existieren.
Counties mit hoher sozialer Vernetzung (blau/lila) befinden sich eher im Bereich hoher Exposition. Das deutet darauf hin, dass eine höhere Durchmischung wohlhabender und weniger wohlhabender Personen in einer Region mit einer stärkeren wirtschaftlichen Vernetzung zusammenhängt.
San Francisco County, California: Liegt weit rechts mit hoher Exposition und niedrigem Freundschafts-Bias. Das bedeutet, dass dort viele Freundschaften zwischen sozioökonomisch unterschiedlichen Gruppen existieren, was zu einer starken sozialen Vernetzung führt.
Bronx County, New York: Liegt weiter links mit niedrigerer Exposition und höherem Freundschafts-Bias. Dies deutet darauf hin, dass hier stärkere soziale Segregation vorliegt, was möglicherweise die wirtschaftliche Vernetzung hemmt.
Schließlich lässt sich sagen, dass Exposition die soziale Vernetzung stärkt, während ein hoher Freundschafts-Bias sie einschränkt. San Francisco County zeigt hohe Vernetzung durch breite Exposition, während Bronx County mit höherem Bias weniger vernetzt ist. Dies deutet darauf hin, dass soziale Durchmischung die wirtschaftliche Mobilität fördern kann.
- Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.
Um die soziale Vernetzung und wirtschaftliche Chancen in benachteiligten Regionen zu fördern, könnten verschiedene politische Maßnahmen umgesetzt werden.
Wichtig wäre die stärkere Förderung von Bildungseinrichtungen, die sozial gemischt sind. Durch gezielte Schulplatzvergaben oder Stipendienprogramme könnten Kinder aus unterschiedlichen sozialen Schichten frühzeitig miteinander in Kontakt kommen und so Netzwerke aufbauen.
Zudem könnte eine integrative Wohnpolitik helfen, Segregation zu verringern. Sozial gemischte Wohngebiete oder Mietzuschüsse für einkommensschwache Familien würden den Austausch zwischen verschiedenen gesellschaftlichen Gruppen fördern.
Ein weiterer Ansatz wäre die Förderung von Mentoring-Programmen, die benachteiligte Jugendliche mit erfolgreichen Vorbildern vernetzen, um ihnen Zugang zu neuen Möglichkeiten zu verschaffen.
Investitionen in öffentliche Räume und Gemeinschaftszentren könnten zudem dazu beitragen, Orte für soziale Begegnungen zu schaffen. In strukturschwachen Regionen wäre es wichtig, Unternehmen gezielt zu fördern, um neue Arbeitsplätze zu schaffen und Netzwerke auszubauen.
Die Ergebnisse aus den Aufgaben 14 und 15 zeigen, dass Regionen mit hoher Exposition wie San Francisco County stärkere soziale Vernetzung aufweisen, während Orte mit hohem Freundschafts-Bias wie Bronx County tendenziell isolierter sind. Politische Maßnahmen sollten daher den Austausch zwischen sozialen Gruppen fördern, um langfristig die wirtschaftlichen Chancen für alle zu verbessern.
Zusatzaufgabe
- Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:
Hier können Sie die Daten auf College Ebene herunterladen
- Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten
funktioniert dies mit dem R Paket tidycensus. Für
den API Zugang müssen Sie sich erst bei IPUMS registrieren und können
danach einen API Key beantragen, welchen Sie dann für den Daten download
über das
tidycencusPaket hinterlegen müssen.
Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.
Hier bitte ihren Code eintragen
- Stellen Sie den Economic Connectedness Index des Colleges
(
ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paketleaflet.
Hier bitte ihren Code eintragen
- Erstellen Sie ein Punktediagramm auf College Ebene, welches den Zusammenhang zwischen dem Freundschafts-Bias und der Exposition beleuchtet auf College Ebene näher beleuchtet.
Tragen Sie dafür auf der x-Achse den Anteil von Studierenden mit gut
verdienenden Eltern ab (exposure_parent_ses_college) und
den Freundschafts-Bias unter den Studierenden
(bias_parent_ses_college)
Heben Sie fünf Colleges ihrer Wahl in der Grafik hervor (inkl. Beschriftung).
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die fünf von Ihnen hervorgehobenen Colleges ein.
Hier bitte ihren Code und ihre Antwort eintragen
Literatur
Chetty, R., Friedman, J. N., Hendren, N., Jones, M. R., & Porter, S. R. (2018). The opportunity atlas: Mapping the childhood roots of social mobility (No. w25147). National Bureau of Economic Research. https://doi.org/10.3386/w25147
Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital I: measurement and associations with economic mobility. Nature 608, 108–121 (2022a). https://doi.org/10.1038/s41586-022-04996-4
Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital II: determinants of economic connectedness. Nature 608, 122–134 (2022b). https://doi.org/10.1038/s41586-022-04997-3