Motivation
In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.
Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer
Vernetzung:
- Exposition: In welchem Ausmaß kommen Menschen aus
verschiedenen sozialen Schichten überhaupt in Kontakt?
- Freundschafts-Bias: Wenn Menschen die Möglichkeit haben, sich mit Personen aus anderen sozialen Schichten anzufreunden – nutzen sie diese Chance auch? Oder bleiben sie lieber in ihrer vertrauten sozialen Umgebung?
Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und
in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu
wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin,
dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit
geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über
soziale Schichten hinweg vernetzt sind, profitieren tendenziell von
besseren wirtschaftlichen Perspektiven.
Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.
Datengrundlage
Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:
- Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?
- Welche Faktoren tragen zur sozialen Ungleichheit bei?
- Welche Maßnahmen könnten die Vernetzung über sozioökonomische Grenzen hinweg fördern?
Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.
Einlesen
Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.
- Lesen Sie den Datensatz
social_capital_county.rdsaus dem Unterordner “Daten” in R ein und nennen diesen Datensatzsocial_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.
Schränken Sie ihren Datensatz auf folgende Variablen ein:
- county
- ec_county
- exposure_grp_mem_county
- bias_grp_mem_county
- pop2018
Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.
Beantworten Sie auch folgende Fragen:
- Was ist eine Beobachtung?
- Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
- In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?
Beschreibung der Variablen:
county: Dieser 5-stellige FIPS-Code dient als eindeutiger Identifikator
für ein County in den USA.
ec_county: Economic Connectedness (Freundschaften zwischen High- und
Low-SES-Personen).
exposure_grp_mem_county: Durchschnittlicher Anteil von High-SES-Personen
in Gruppen, an denen Low-SES-Personen teilnehmen.
bias_grp_mem_county: Friending Bias (zeigt, wie stark Low-SES-Personen
High-SES-Freunde machen, relativ zur Gruppenzugehörigkeit).
pop2018: Geschätzte Bevölkerung des Countys (2018, basierend auf
Volkszählungsdaten).
Beantwortung der Fragen:
Eine Beobachtung ist ein County (Verwaltungseinheit). Man sieht
unteranderem auch noch zahlen zu der Wirtschaftlichen Konnektivität,
Exposition gegenüber sozioökonomisch höhergestellten Personen, die
Präferenzen für Freundschaften innerhalb der eigenen sozioökonomischen
Gruppe und die Bevölkerung in dem Jahr 2018. Der Datensatz enthält
Informationen zu allen Counties, die den Mindestanforderungen (zum
Beispiel mindestens 100 Facebook-Nutzer je SES-Gruppe) genügen. Die
Anzahl der im Datensatz befindlichen Counties beträgt 3089. Die USA hat
insgesamt 3.142 Counties.
In 95,14% der Fälle gibt es Informationen zu allen Variablen einer Beobachtung im vorliegenden Datensatz.
- Weiterhin haben wir Ihnen den Datensatz
county_covariates.dtaim Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihncovariates.
Schränken Sie diesen Datensatz auf die folgenden Variablen ein:
- county
- kfr_pooled_pooled_p25
- gini99_simple
Generieren Sie eine neue Variable upward_mobility als
kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die
Variable kfr_pooled_pooled_p25.
Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.
Hinweis: Mit dem haven Paket können Sie .dta
Dateien einlesen
county: Dieser 5-stellige FIPS-Code dient als eindeutiger
Identifikator für ein County in den USA.
kfrpooledpooledp25: Ursprünglich die durchschnittliche
Einkommensposition (Perzentil) im Erwachsenenalter für ein Kind mit
Eltern im 25. Einkommensperzentil. Nach der Umwandlung wird diese
Information in upwardmobility gespeichert.
upwardmobility: Eine skalierte Version von
kfrpooledpooledp25, die die Mobilitätsmöglichkeiten im
Einkommensbereich verdoppelt, gemessen am mittleren prozentualen
Einkommensrückgang oder -anstieg.
gini99_simple: Dieser Wert gibt den Einkommenstrennungskoeffizienten
(Gini) eines Countys an und dient als Maß für die
Einkommensungleichheit.
- Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.
Lesen sie die Daten County_census_data.shp in R ein und
speichern diesen in R als county_census_shape ab. Neben den
County Namen und und Polygonen enthält dieser Datensatz auch das
geschätzte Median Einkommen pro County für das Jahr 2023
(medincE).
Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren
- Verbinden Sie die Dataframes
county_census_shape,covariatesundsocial_capital_countyzu einem Datensatzanalysis_data.
- Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
- Welcher Datensatz sollte der Hauptdatensatz sein? Warum?
Join-Typ: Wir verwenden inner_join, um sicherzustellen,
dass nur die Datensätze kombiniert werden, die in allen drei
ursprünglichen Datensätzen eine Übereinstimmung in der
county Variable haben. Dies sichert, dass wir Daten haben,
die für alle relevanten Counties vollständig sind und keine Redundanzen
oder fehlenden Werte entstehen, die durch ungleiche Coverage in jedem
Satz auftreten könnten.
Hauptdatensatz: county_census_shape wird als Hauptdatensatz
gewählt, da er die geographische Komponente enthält, die bei der
Visualisierung von Daten zentral ist, insbesondere für die Erstellung
von Karten und die Analyse von Einkommen über geografische Regionen
hinweg.
- Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:
- upward_mobility
- ec_county
- exposure_gpr_mem_county
- bias_grp_mem_county
Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:
- Was genau misst die wirtschaftliche Mobilität
(
upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen. - Bitte schauen Sie sich an, wie die sozialen Vernetzung
(
ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
Hinweis: Die genaue Berechnung der sozialen Vernetzung
(ec_county) finden Sie im Dokument
“social_capital_codebook.pdf”
Wirtschaftliche Mobilität (upward_mobility):
Diese Variable misst, wie wahrscheinlich es ist, dass Individuen aus
wirtschaftlich schwächeren Verhältnissen in wohlhabendere Schichten
aufsteigen. Ein hoher Wert deutet darauf hin, dass Kinder aus
einkommensärmeren Quartilen im Erwachsenenalter höhere Einkommen
erzielen können.
Soziale Vernetzung (ec_county):
Diese misst die Verbindungen und Beziehungen zwischen Individuen
verschiedener sozioökonomischer Schichten innerhalb eines Countys. Ein
hoher Wert signalisiert, dass Menschen unterschiedlicher
wirtschaftlicher Hintergründe miteinander interagieren und soziale
Netzwerke teilen.
Warum sollten hohe soziale Vernetzung gute ökonomische
Aufstiegschancen bieten?
Begründung:
Hohe soziale Vernetzung kann zu einem besseren Zugang zu Ressourcen,
Informationen und Gelegenheiten führen, was den sozialen und beruflichen
Aufstieg erleichtert. Netzwerke können z.B. Arbeitschancen eröffnen oder
den Zugang zu Bildung verbessern.
Annahmen:
Es wird angenommen, dass durch gemischte Netzwerke (zwischen High-SES
und Low-SES) Informationen und Chancen gleichmäßiger verteilt werden.
Inklusion und Integration in soziale Netzwerke ermöglichen gegenseitigen
Nutzen und unterstützen das soziale Kapitalkapital.
Exposition (exposure_gpr_mem_county):
Erwartung: Höhere Exposition bedeutet, dass Individuen häufiger mit
Personen höherer SES in Gruppen interagieren, was die soziale Vernetzung
erhöht.
Annahmen: Regelmäßige Interaktionen führen zu stärkeren Bindungen und
Netzwerken, die durch Exposition über soziale Gruppierungen aufgebaut
werden.
Freundschafts-Bias (bias_grp_mem_county):
Erwartung: Ein höheres Freundschafts-Bias deutet darauf hin, dass
Low-SES-Personen weniger hochrangige SES-Freunde im Vergleich zur
Gruppenzugehörigkeit haben, was die soziale Vernetzung verringern
könnte.
Annahmen: Echter sozialer Austausch und Integration sind bei starkem
Bias weniger wahrscheinlich, da Verbindungen innerhalb der selben
SES-Schichten belassen werden.
Deskriptive Analysen
Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.
- Schauen Sie sich in einem ersten Schritt an, wie die Variablen im
Datensatz
analysis_dataüber alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.
Beschreiben und interpretieren Sie Ihre Tabelle.
Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?
Hinweis: Achten Sie auf eine schöne Darstellung ihrer
Tabelle mittels der Pakete kableExtra oder
gt!
| Variable | Mittelwert | Median | Minimum | Maximum | Standardabweichung | 25%-Quantil | 75%-Quantil |
|---|---|---|---|---|---|---|---|
| Median Einkommen 2023 | 66014.56 | 63651.00 | 25425.00 | 178707.00 | 17263.39 | 55060.00 | 73474.75 |
| Gini Koeffizient | 0.29 | 0.29 | -0.06 | 0.57 | 0.06 | 0.24 | 0.33 |
| Aufstiegschancen | 42.93 | 42.12 | 21.59 | 68.83 | 6.14 | 38.64 | 46.13 |
| Grad an sozialer Durchmischung | 0.81 | 0.81 | 0.29 | 1.36 | 0.18 | 0.69 | 0.94 |
| Durchschnittlicher Kontakt von low-SES mit high-SES | 0.91 | 0.91 | 0.26 | 1.49 | 0.21 | 0.76 | 1.05 |
| Freundschaftsbias nach SES | 0.06 | 0.06 | -0.11 | 0.33 | 0.05 | 0.03 | 0.10 |
| Bevölkerung 2018 | 107129.87 | 27837.50 | 544.00 | 10098052.00 | 337331.88 | 12618.75 | 71974.50 |
Die Tabelle gibt einen Überblick über die Verteilung verschiedener
soziodemografischer Variablen über alle Counties hinweg. Auffällig sind
große Unterschiede beim Median-Einkommen 2023, das zwischen 25.425 und
178.707 liegt. Der Mittelwert von etwa 66.015 ist höher als der Median
von 63.651, was auf einige Counties mit besonders hohem Einkommen
hinweist. Auch bei der Bevölkerung 2018 zeigt sich eine starke Streuung:
Während der Median bei 27.837 liegt, hebt das Maximum von über 10
Millionen den Mittelwert deutlich auf 107.130 an. Dies deutet auf einige
stark urbanisierte Regionen als Ausreißer hin.
Der Grad an sozialer Durchmischung und der Kontakt zwischen
sozioökonomischen Gruppen sind im Durchschnitt relativ hoch, variieren
jedoch stark. So gibt es Counties mit sehr niedrigem Grad an sozialer
Durchmischung (Minimum 0,29) oder geringem Kontakt zwischen Low-SES- und
High-SES-Gruppen (Minimum 0,26). Die Aufstiegschancen sind
vergleichsweise symmetrisch verteilt, mit moderater Streuung und Werten
zwischen 21,59 und 68,83.
Unplausibel erscheinen hingegen negative Werte beim Gini-Koeffizienten
(-0,06) und beim Freundschaftsbias (-0,11), die in der Realität nicht
vorkommen sollten. Dies deutet auf mögliche Datenfehler hin, die
bereinigt werden müssten. Insgesamt zeigen die Daten starke regionale
Unterschiede in Einkommen, sozialer Durchmischung und Bevölkerung, mit
potenziellen Ausreißern in stark urbanisierten Gebieten.
Soziale Vernetzung und wirtschaftliche Mobilität
Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild
über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre
Analyse näheres über die soziale Vernetzung lernen, den Economic
Connectedness Index (ec_county), welcher aus den Facebook
Freundschaften generiert wurde. Die Daten des Economic Connectedness
Index wurden auf County Ebene aggregiert, beruhen jedoch auf
Freundschaftsdaten von individuellen Facebook Nutzern.
- Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.
Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:
Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?
Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt
sich das tigris
Paket und der Befehl shift_geometry() um Alaska, Hawaii
und Puerto Rico schön darstellen zu lassen.
In dieser Grafik sehen wir eine Karte der USA, die in die einzelnen Countys unterteilt wurde. Jedem der Countys wurde der dazugehörige ECI-Wert (Economic Connectedness Index) zugeordnet. Dieser Wert reicht von dunklen Farben, die für einen niedrigen Wert stehen und somit auch für wenig Austausch zwischen Menschen mit unterschiedlichen wirtschaftlichen Hintergründen, bis hin zu sehr hellen Farben, die für einen hohen Wert stehen und somit für viel Austausch zwischen Menschen mit unterschiedlichen wirtschaftlichen Hintergründen. Die Farbe Grün steht dafür, dass kein Wert vorhanden ist, was vor allem Puerto Rico und vereinzelt auch Countys auf dem amerikanischen Festland betrifft. Was als Erstes auffällt, ist ein leichtes Nord-Süd-Gefälle. Vor allem im Norden der USA kann man flächendeckend einen niedrigeren ECI-Wert als im Süden feststellen. Besonders niedrige ECI-Werte kann man an der Grenze von Arizona und New Mexico feststellen, im unteren Teil von Texas und im unteren rechten Eck der USA (Florida, Mississippi, Alabama, Georgia, South Carolina, North Carolina, Tennessee). Doch auch im Süden gibt es Countys mit eher mittleren ECI-Werten. Diese liegen vor allem an den Rändern, sowohl im Osten als auch im Westen. Auffallend ist, dass im Süden umso mehr in der Mitte die Countys mit hohen ECI-Werten vorkommen und nur noch vereinzelt Countys mit sehr niedrigen ECI-Werten auftauchen. Ein möglicher Erklärungsansatz könnte mit der Bevölkerungsdichte und der Anzahl an Großstädten in den verschiedenen Bundesstaaten zu tun haben. So befinden sich nämlich die Countys mit niedrigem ECI-Wert hauptsächlich in den bevölkerungsreichen US-Staaten, die auch den Großteil an Großstädten haben. Eine mögliche Erklärung für diesen Zusammenhang wäre, dass man durch die große Auswahl an potenziellen Freunden eher Gleichgesinnte mit ähnlichen Interessen finden kann als in bevölkerungsarmen Countys. Menschen neigen dazu, Freundschaften innerhalb ihrer eigenen Berufsgruppe zu schließen, weil sie oft gemeinsame Interessen und Erfahrungen teilen, die durch ähnliche tägliche Herausforderungen, Aufgaben und Ziele in ihrer Arbeit geprägt sind. Insbesondere in spezialisierten Branchen wie der Finanzbranche fördern gemeinsame berufliche Neigungen, Netzwerkmöglichkeiten und oft intensiver Arbeitsrhythmus natürlichere und stärkere soziale Bindungen unter Berufskollegen. So entstehen dann eigene Bubbles aus unterschiedlichen sozioökonomischen Schichten. In bevölkerungsarmen Countys ist es aufgrund der geringeren Anzahl an Menschen mit ähnlichen Interessen schwieriger, solche Bubbles zu bilden, was dazu führt, dass man sich mit Freunden aus unterschiedlichen Interessenbereichen auseinandersetzt, wodurch sich dann auch Menschen aus unterschiedlichen sozioökonomischen Schichten eher vernetzen. Um gültige Aussagen über den Einfluss des Economic Connectedness Index (ECI) auf die wirtschaftliche Mobilität zu machen und fundierte Erkenntnisse über Freundschaftsnetzwerke zu gewinnen, sind mehrere Annahmen notwendig. Zunächst ist es wichtig anzunehmen, dass die Facebook-Daten, die dem ECI zugrunde liegen, die gesamte Bevölkerung eines Countys repräsentieren und somit genaue Rückschlüsse auf die soziodemografische Realität ermöglichen. Darüber hinaus sollte ein kausaler Zusammenhang zwischen einem höheren ECI und verbesserter wirtschaftlicher Mobilität bestehen, anstatt nur einer einfachen Korrelation. Diese Vernetzung muss stabil genug sein, um langfristige wirtschaftliche Effekte zu erzielen, da kurzfristige Verbindungen weniger bedeutend sein könnten. Zudem darf der Einfluss von Netzwerken nicht stark durch andere Variablen wie Bildung oder geografische Barrieren verzerrt werden, um den wahren Einfluss der sozialen Netzwerke isolieren zu können. Schließlich sollten die durch den ECI gemessenen Vernetzungen direkten Nutzen durch erweiterten Zugang zu Beschäftigung, Bildung und Ressourcen bieten. Diese Annahmen sind entscheidend, um sicherzustellen, dass Analysen des ECI relevante Aspekte der wirtschaftlichen Mobilität durch soziale Vernetzung widerspiegeln..
- Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.
Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:
- Median Haushaltseinkommen in dem County (
medincE) - Wirtschaftliche Mobilität in dem County
(
upward_mobility) - Einkommensungleichheit in dem County (gemessen mit dem
Gini-Koeffizient des Counties) (
gini99_simple)
Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.
Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:
- Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.
| County | Economic Connectedness Index | Medianeinkommen | Wirtschaftliche Mobilität | Einkommensungleichheit |
|---|---|---|---|---|
| Rockingham County, New Hampshire | 1.35970 | 113927 | 45.31415 | 0.22538 |
| Douglas County, Colorado | 1.35327 | 145737 | 48.24337 | 0.11621 |
| San Francisco County, California | 1.31244 | 141446 | 50.38885 | 0.30963 |
| Morgan County, Utah | 1.29125 | 126092 | 54.12398 | 0.15350 |
| Madison County, Idaho | 1.28088 | 58259 | 51.53670 | 0.22434 |
| Arlington County, Virginia | 1.27232 | 140160 | 46.28139 | 0.38696 |
| Sussex County, New Jersey | 1.25775 | 114316 | 47.03977 | 0.18298 |
| Wright County, Minnesota | 1.25228 | 106666 | 49.54441 | 0.18420 |
| Gunnison County, Colorado | 1.24836 | 77358 | 48.71070 | 0.34658 |
| Pitkin County, Colorado | 1.24364 | 100318 | 45.83353 | -0.01002 |
| County | Economic Connectedness Index | Medianeinkommen | Wirtschaftliche Mobilität | Einkommensungleichheit |
|---|---|---|---|---|
| Todd County, South Dakota | 0.29469 | 39148 | 30.17850 | 0.32266 |
| Oglala Lakota County, South Dakota | 0.33048 | 34769 | 24.84036 | NA |
| Terrell County, Georgia | 0.34741 | 43812 | 31.16523 | 0.36427 |
| Bullock County, Alabama | 0.35515 | 36723 | 34.56590 | 0.31482 |
| Allendale County, South Carolina | 0.36095 | 31603 | 31.40409 | 0.33154 |
| Robeson County, North Carolina | 0.36258 | 40318 | 32.09524 | 0.36248 |
| Early County, Georgia | 0.37960 | 53750 | 33.82838 | 0.45567 |
| Marlboro County, South Carolina | 0.38475 | 36293 | 32.81837 | 0.30707 |
| Crisp County, Georgia | 0.38777 | 42745 | 32.88780 | 0.42409 |
| Scotland County, North Carolina | 0.39580 | 43500 | 31.07868 | 0.38709 |
In dieser Aufgabe betrachten wir zwei Tabellen. Die erste zeigt die “Top 10 Counties nach Economic Connectedness Index” und die zweite die “Bottom 10 Counties nach Economic Connectedness Index”. Diese werden anhand der Variablen “Economic Connectedness Index”, “Medianeinkommen”, “wirtschaftliche Mobilität” und “Einkommensungleichheit” miteinander verglichen. Was als Erstes auffällt, ist, dass drei der Top-10-Counties aus Colorado stammen. Dies steht im Einklang mit der Beobachtung aus Aufgabe 7, da Colorado in einem Gebiet liegt, das hauptsächlich durch Counties mit hohem ECI-Wert geprägt ist. Die Spanne des ECI liegt bei den Top-10-Counties zwischen 1,35970 (Rockingham County) und 1,24364 (Pitkin County). Beim Medianeinkommen ist Douglas County mit 145.737 Dollar an der Spitze, während Madison County mit 58.259 Dollar das Schlusslicht bildet. Hierbei ist auffällig, dass bis auf Madison County und Gunnison County alle ein Medianeinkommen von mindestens 100.000 Dollar verzeichnen, und nur diese beiden Counties das Schlusslicht bilden. Bei der wirtschaftlichen Mobilität bewegen sich die Top-10-Counties zwischen 54,123 (Morgan County) und 45,31415 (Rockingham County). Die Einkommensungleichheit ist mit einem Wert von 0,38696 in Arlington am größten und in Douglas County mit 0,11621 am geringsten. Nur Pitkin County ist mit einem Wert von -0,01002 noch niedriger. Da der Gini-Koeffizient (Einkommensungleichheit) nur von 0 bis 1 geht, ist dieser Wert vermutlich auf einen Statistikfehler zurückzuführen. In der zweiten Tabelle sehen wir die “Bottom 10 Counties nach Economic Connectedness Index”. Bei diesen liegt der ECI-Wert zwischen 0,29469 in Todd County und 0,39580 in Scotland County. In dieser Tabelle ist besonders auffällig, dass sowohl South als auch North Carolina mit jeweils zwei Nennungen und Georgia mit drei Nennungen unter die Bottom 10 kommen. Außerdem kommt auch Alabama einmal vor; alle liegen am unteren linken Rand der USA. Das Medianeinkommen der Bottom-10-Counties liegt zwischen 31.603 Dollar in Allendale County und 53.750 Dollar in Early County. Die wirtschaftliche Mobilität liegt zwischen 24,84036 in Oglala County und 34,56590 in Bullock County. Die Einkommensverteilung liegt zwischen den Werten 0,31482 in Bullock County und 0,45567 in Early County. Bei Oglala Lakota County wurden in diesem Bereich keine Daten erhoben. Zieht man einen Vergleich zwischen den beiden Tabellen, fällt Folgendes auf: Das Medianeinkommen ist bei den Top-10-Counties in jedem Fall höher als bei den Bottom-10-Counties, in den meisten Fällen sogar zwei- bis dreimal höher, was auf starke Einkommensunterschiede hinweist. Auch bei der wirtschaftlichen Mobilität sind starke Unterschiede zu erkennen. Auch hier sind die Werte der Top-10-Counties deutlich höher als bei den Bottom-10-Counties, was von guten Aufstiegschancen zeugt. Interessanterweise kann man feststellen, dass die Einkommen in den Bottom-10-Counties ungleicher verteilt sind als in den Top-10-Counties. Die Unterschiede sind zwar nicht extrem, aber ein Trend ist zu erkennen. Die Unterschiede waren teilweise unerwartet. Zwar habe ich vermutet, dass die Werte für Medianeinkommen und wirtschaftliche Mobilität besser ausfallen als in den Bottom-10-Counties, aber so extreme Unterschiede hatte ich nicht erwartet. Bei der Einkommensverteilung hätte ich eher vermutet, dass die Top-10-Counties ungleicher verteilt wären, da es dort ein viel höheres Medianeinkommen gibt, was mich darauf schließen ließ, dass dies gute Gegenden sind und deswegen auch viele Superreiche anziehen.
Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?
- In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot)
erstellen, welches die wirtschaftliche Mobilität
(
upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
- In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?
Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen
In diesem Scatterplot-Diagramm kann man den Zusammenhang zwischen wirtschaftlicher Mobilität und dem ECI ablesen. Ganz klar ist hier eine positive Korrelation zwischen den beiden Variablen zu erkennen. Auffallend sind viele vereinzelte Punkte, die trotz verhältnismäßig hohem ECI einen unerwartet niedrigen wirtschaftlichen Mobilitätswert aufweisen. Diese Punkte stehen hauptsächlich für Countys aus Alaska. Dies könnte eventuell daran liegen, dass Alaska so isoliert liegt und es nur begrenzte Arbeitsplatzmöglichkeiten gibt, was dazu führt, dass weniger Durchmischung bei den Arbeitsplätzen existiert. Auf der anderen Seite gibt es auch Ausschläge nach oben. So gibt es auch Countys, die höhere Werte bei der wirtschaftlichen Mobilität haben als durch den ECI-Wert zu erwarten wäre. Diese liegen hauptsächlich in North Dakota. Dies könnte an der starken Ölbranche und den guten Bildungsmöglichkeiten liegen. Der Staat fördert mit Initiativen Bildung, hat gute Hochschulen und einen boomenden Ölsektor, welcher gut bezahlte Arbeitsmöglichkeiten bietet. Ja, der Zusammenhang entspricht den Erwartungen aus Aufgabe 5. Dies zeigt eindeutig einen positiven Trend zwischen dem ECI-Wert und den ökonomischen Aufstiegschancen. Man kann festhalten, dass soziale Netzwerke einen nachweisbaren Einfluss auf die wirtschaftliche Mobilität haben. Allerdings muss man sagen, dass soziale Netzwerke eher eine Hilfestellung als eine Garantie für wirtschaftlichen Aufstieg sind. Vor allem an den Staaten Alaska und North Dakota kann man erkennen, dass auch Wohnort, Bildung und die Anzahl und Qualität der Arbeitsplätze eine entscheidende Rolle spielen. So kann man extrem gut vernetzt sein, aber aufgrund von Mangel an gut bezahlten Arbeitsplätzen nicht wirtschaftlich aufsteigen, oder man hat aufgrund von mehr Nachfrage auf dem Arbeitsmarkt mehr Chancen auf wirtschaftlichen Aufstieg.
- Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
- Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
- Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index
Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:
- San Francisco County, California
- Arlington County, Virginia
- Morgan County, Utah
- New York County, New York
- Bronx County, New York
Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.
Im ersten Diagramm wird Einkommensungleichheit mit dem ECI-Wert
verglichen. Dort ist ebenfalls eine eindeutige negative Korrelation zu
erkennen. Besonders Augenmerk legen wir auf die fünf Counties: San
Francisco County, California; Arlington County, Virginia; Morgan County,
Utah; New York County, New York; und Bronx County, New York. Diese
wurden daher farblich hervorgehoben. Dabei fällt besonders New York City
auf. Diese Region hat einen niedrigen ECI-Wert, aber einen
überproportionalen Gini-Koeffizienten. Dies liegt vermutlich daran, dass
New York City bei Millionären und Milliardären mit hohem Einkommen sehr
beliebt ist, was zu einer großen Einkommensunverteilung führt. Der
niedrige ECI-Wert könnte an der Größe und Vielfalt der Stadt liegen. Man
interagiert eher weniger mit seinen Nachbarn, sondern bewegt sich in
seiner eigenen Bubble, beispielsweise der Künstler-Bubble oder der
Finanz-Bubble. Auch Arlington und San Francisco haben höhere
Gini-Koeffizienten als erwartet. In San Francisco kann dies darauf
zurückzuführen sein, dass viele Technologieunternehmen angesiedelt sind,
die ihre Mitarbeiter gut bezahlen. In Arlington könnte die Nähe zu
Washington und damit die Nähe zur Macht und zum Geld entscheidend
sein.
Im zweiten Scatterplot-Diagramm wird der ECI-Wert mit dem
Medianeinkommen verglichen. Hier kann man nun eine positive Korrelation
zwischen den beiden Variablen erkennen. Außerdem fällt auf, dass es bei
den farblich markierten Countys nicht so starke Ausreißer gibt wie im
ersten Diagramm. Zu beobachten ist, dass die Bronx einen niedrigen
ECI-Wert hat, was wieder an der städtischen Lage liegt, und auch ein
niedriges Medianeinkommen aufweist. Da die Bronx eher als sozial
schwächerer Stadtteil von New York gilt, ist dies nicht verwunderlich.
New York County hingegen weist einen leicht höheren ECI-Wert auf,
befindet sich aber im Gegensatz zur Bronx eher weiter oben beim
Medianeinkommen, bleibt jedoch in einem laut Grafik erwartbaren Bereich.
Morgan County, San Francisco und Arlington haben alle einen hohen
ECI-Wert und ein hohes Medianeinkommen. Deswegen kann man behaupten,
dass bei allen Countys die erwartete Korrelation zwischen ECI-Wert und
Medianeinkommen eingetroffen ist.
Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.
- Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
- Economic Connectedness Index (ec_county)
- Wirtschaftliche Mobilität (upward_mobility)
- Median Haushaltseinkommen (medincE)
- Bevölkerung in 2018 (pop2018)
- Einkommensungleichheit (gini99_simple)
- Exposition (exposure_gpr_mem_county)
- Freundschafts-Bias (bias_grp_mem_county)
Beschreiben und interpretieren Sie ihre Korrelationsmatrix.
Die Korrelationsmatrix bietet uns Informationen zu den Variablen:
Economic Connectedness Index, Wirtschaftliche Mobilität, Median
Haushaltseinkommen, Bevölkerung in 2018, Einkommensungleichheit,
Exposition und Freundschafts-Bias. Wenn es sich um eine positive
Korrelation handelt ist das Feld Grün, bei der Negativen Korrelation Rot
und bei einer schwachen oder keiner Korrelation weiß. Population_2018
korreliert nur mit sich selber positiv, was auch sinn macht da dies nur
die Bevölkerung in einem Jahr darstellt und es somit keine Korrelation
mit den anderen Variablen aufweisen sollte. Jede Variable Korreliert
natürlich auch positiv mit sich selber. Income Inequality Gini also die
Einkommensungleichheit korreliert negativ mit Economic Connectedness
Index, da Regionen mit geringerer wirtschaftlicher Vernetzung
tendenziell höhere Einkommensungleichheiten aufweisen. Ebenso korreliert
es negativ mit Wirtschaftlicher Mobilität und Exposition. Ein schwacher
negativer Zusammenhang besteht auch mit dem Median Haushaltseinkommen.
Mit Freundschafts-Bias korreliert es leicht positiv. Diese Zusammenhänge
verdeutliche, dass Regionen mit höherer Einkommensungleichheit weniger
wirtschaftlich verbunden und weniger sozial mobil sind, während ein
stärkerer Freundschafts-Bias leicht mit einer größeren Ungleichheit
einhergeht. Exposition korreliert positiv mit dem Economic Connectedness
Index, Wirtschaftlicher Mobilität und dem Median Haushaltseinkommen. Es
zeigt eine leichte negative Korrelation mit dem Freundschafts-Bias. Dies
deutet darauf hin, dass die Durchmischung von sozioökonomischen Gruppen
entscheiden für die wirtschaftliche Vernetzung ist und auch zu mehr
wirtschaftlicher Mobilität und einem höheren Einkommen beiträgt.
Gleichzeitig wirkt ein höherer Freundschafts-Bias hemmend auf diese
Durchmischung. Freundschafts-Bias korreliert negativ mit dem Economic
Connectedness Index, Wirtschaftlicher Mobilität und zeigt nahezu keine
Korrelation mit dem Median Haushaltseinkommen. Ein stärkerer
Freundschafts-Bias, d.h. die Tendenz, Freundschaften innerhalb der
eigenen sozialen Gruppen zu bilden, reduziert die wirtschaftliche
Vernetzung und behindert den sozialen Aufstieg, während er kaum Einfluss
auf das durchschnittliche Einkommen zu haben scheint. Das Median
Haushaltseinkommen korreliert positiv mit dem Economic Connectedness
Index, sowie mit Wirtschaftlicher Mobilität. In Regionen mit einem
höheren durchschnittlichen Haushaltseinkommen sind tendenziell besser
wirtschaftlich vernetzt und bieten mehr soziale Aufstiegsmöglichkeiten.
Der Economic Cennectedness Index korreliert positiv mit Wirtschaftlicher
Mobilität und Exposition und negativ mit Einkommensungleichheit. Ein
stärkere Wirtschaftliche Vernetzung, die oft durch soziale Netze
gefördert wird, geht mit mehr sozialer Mobilität einher, während
Regionen mit mehr wirtschaftlicher Verbund Heit tendenziell weniger
Einkommensungleichheit aufweisen.
Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?
- Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.
Das Punktediagramm zeigt den Zusammenhang zwischen Economic Connectedness Index und Median Haushaltseinkommen,auf der X-Achse wird das Median Hauseinkommen in $ dargestellt und auf der Y-Achse der Economic Connenctedness Index. Hierbei stellt jeder einzelne Punkt einen Countie dar. Wenn ein Punkt (Countie) blau ist bedeutet dies eine gernige Wirtschaftliche Mobilität, je mehr die Farbe in Rot übergeht steigert sich die Wirtschaftliche Mobilität. Zwischen 0,25 und 0,75 ist die Wirtschaftliche Mobilität noch meist gering und weißt Werte im Bereich von 25 bis ung 43 auf. Ab 0,75 bis 1,0 ist die WM dann bei 43-53 und ab eine EcI von 1 ist die höchste WM mit bis zu 60. Was auffällt ist die Positive Korrelation zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index: Counties mit höherem Einkommen tendieren dazu, auch einen höheren Connectedness Index aufzuweisen. Counties mit höherer Wirtschaftlicher Mobilität (in Rot) konzentrieren sich tendenziell in Bereich mit hohem ECI und Einkommen. Eine bessere Vernetzung ist meist fördernd für wirtschaftliche Chancen, da man dadurch potenzielle Wichtige Beziehungen im Berufsleben erlangt, die z.B. zu einem besseren Job verhelfen. In Regionen mit niedrigerem Haushaltseinkommen und niedrigerem ECI (links unten) ist die wirtschaftliche Mobilität oft gering (blau). Somit weißt dies auf systemische Hindernisse für den sozialen Aufstieg in wirtschaftlich benachteiligten Counties. Trotz des allgemeinen Trends gibt es eine Streuung. Einige Regionen mit relativ niedrigem Haushaltseinkommen könne eine moderate bis hohe ökonomische Vernetzung aufweisen, und umgekehrt.
- Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.
Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:
- Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
- In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
- Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
- Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?
Rückwärtskausalität, Selektionseffekte und ausgelassene Variablen können einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen. Rückwärtskausalität bedeutet, dass höhere wirtschaftliche Mobilität selbst zu einer stärkeren sozialen Vernetzung führen könnte. In wirtschaftlich dynamischen Regionen interagieren Personen mit niedrigem sozioökonomischen Status (SES) häufiger mit solchen aus höheren SES-Gruppen, da sie selbst wirtschaftlich aufsteigen und Verbindungen knüpfen. Der Selektionseffekt besagt, dass Familien mit spezifischen Eigenschaften, wie höherer Bildung oder Ambition, bewusst in Regionen mit besserer wirtschaftlicher Mobilität ziehen und diese Eigenschaften unabhängig von der sozialen Vernetzung zu besseren Ergebnissen führen könnten. Ausgelassene Variablen, wie die Qualität von Schulen, Arbeitsmarktmöglichkeiten oder Wohnraumverfügbarkeit, könnten sowohl die soziale Vernetzung als auch die wirtschaftliche Mobilität beeinflussen, was den Eindruck eines direkten Zusammenhangs erwecken würde.
Die Autoren bringen mehrere Argumente vor, die gegen diese Faktoren sprechen. Bezüglich der Rückwärtskausalität zeigen sie, dass Freundschaften zwischen niedrigem und hohem SES häufig bereits in der Kindheit entstehen, also bevor Personen in den Arbeitsmarkt eintreten. Das spricht dagegen, dass Mobilität die Ursache für diese Verbindungen ist. Zum Selektionseffekt argumentieren die Autoren, dass quasi-experimentelle Studien belegen, dass Kinder, die zufällig in Regionen mit hoher sozialer Vernetzung aufwachsen, bessere wirtschaftliche Ergebnisse erzielen. Gegen ausgelassene Variablen spricht, dass der Zusammenhang zwischen sozialer Vernetzung und Mobilität auch dann bestehen bleibt, wenn Kontrollvariablen wie Einkommen, Bildung oder Segregation berücksichtigt werden.
Die Argumentation der Autoren erscheint übermäßig glaubhaft, da sie empirische Belege, wie die Analyse von Kindheitsnetzwerken und quasi-experimentelle Designs, anführen. Allerdings gibt es durchaus Einschränkungen: Die Nutzung von Facebook-Daten könnte die Ergebnisse verzerren, da nicht alle Bevölkerungsgruppen gleichmäßig repräsentiert sind. Zudem bleiben schwer messbare Faktoren, wie kulturelle Normen oder regionale Besonderheiten, möglicherweise unberücksichtigt.
Um einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität unter optimalen Bedingungen zu messen, wären mehrere Maßnahmen notwendig. Eine randomisierte Zuweisung von Familien zu Regionen mit unterschiedlichen Vernetzungsgraden könnte Selektionseffekte ausschließen. Eine langfristige Datenerfassung über mehrere Generationen wäre wichtig, um die Wirkung der sozialen Vernetzung auf Mobilität über die Zeit zu messen. Außerdem sollten zusätzliche Kontrollvariablen wie kultureller Einfluss, die Qualität des Bildungssystems und Arbeitsmarktdynamiken erfasst werden, um den Einfluss ausgelassener Variablen zu minimieren. Solche Bedingungen würden eine präzise Untersuchung des kausalen Zusammenhangs dementsprechend ermöglichen.
Einflussfaktoren auf die soziale Vernetzung
Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?
- Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe
Exposition (
exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.
Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.
Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?
Diese Karte zeigt die Exposition in den Counties der USA, also den
Anteil gut verdienender Personen (exposure_grp_mem_county).
Die Farbskala reicht von knapp unter 0.5 (gering) bis etwas über 1.25
(hoch). Auffällig ist, dass urbane Regionen wie die Ost- und Westküste
sowie Ballungsräume wie Chicago oder Texas eine höhere Exposition
aufweisen, während ländliche Gebiete, insbesondere im mittleren Westen
und Süden, niedrigere Werte zeigen. Diese Unterschiede spiegeln die
wirtschaftliche Aktivität und den Wohlstand der Regionen wider.
Insgesamt zeigt die Karte, dass die Exposition stark mit urbanen und
wirtschaftlich starken Gebieten korreliert ist, während ländliche
Regionen tendenziell benachteiligt sind.
Vergleicht man die Karte aus Aufgabe 14 mit der aus Aufgabe 7, die den Economic Connectedness Index (EC Index) darstellt, lassen sich klare Parallelen erkennen. Beide Karten zeigen, dass urbane und wirtschaftlich starke Regionen, wie die Ost- und Westküste sowie große Ballungsräume, sowohl eine höhere Exposition als auch einen höheren EC Index aufweisen. Dies legt nahe, dass eine hohe Exposition – also der Anteil gut verdienender Personen in einer Region – eng mit der sozialen Vernetzung korreliert. Insbesondere in ländlichen Regionen mit geringer Exposition zeigt sich, dass auch die Werte des EC Index deutlich niedriger sind.
Die Annahme, dass eine hohe Exposition die soziale Vernetzung fördert, scheint somit zuzutreffen. In Regionen mit wenigen gut verdienenden Personen sind die Möglichkeiten, Kontakte zu höherem Einkommensdezilen aufzubauen, stark eingeschränkt. Gleichzeitig gibt es in urbanen Regionen mit hoher Exposition mehr Gelegenheiten, soziale Verbindungen zu wirtschaftlich besser gestellten Personen zu knüpfen. Dennoch könnten in Ausnahmefällen auch andere Faktoren, wie etwa regionale Besonderheiten oder wirtschaftliche Cluster, die soziale Vernetzung beeinflussen.
Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.
- Um zu untersuchen ob es eine entsprechende Segregation der
Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein
Punktediagramm erzeugen, welche auf der x-Achse die Exposition
(
exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihr Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.
Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:
- Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?
Die Grafik zeigt ein Punktediagramm, das die Exposition
(exposure_grp_mem_county) auf der x-Achse und den
Freundschafts-Bias (bias_grp_mem_county) auf der y-Achse
darstellt. Jeder Punkt repräsentiert ein County in den USA, wobei die
Farbe der Punkte die Stärke der sozialen Vernetzung (den Economic
Connectedness Index, EC Index) angibt. Gelb steht für eine hohe soziale
Vernetzung, während Violett niedrige Werte darstellt. Die Counties “San
Francisco County, California” und “Bronx County, New York” sind explizit
hervorgehoben.
Ein Blick auf die Verteilung der Punkte zeigt, dass es keine eindeutige lineare Beziehung zwischen Exposition und Freundschafts-Bias gibt. Während höhere Exposition (rechte Seite) oft mit einem geringen Freundschafts-Bias verbunden ist (z. B. San Francisco County), finden sich auch Counties mit niedriger Exposition (linke Seite), die ebenfalls einen geringen Bias aufweisen. Die Punkte verteilen sich daher weitgehend horizontal im Diagramm.
Die Farbgebung macht deutlich, dass sowohl Exposition als auch Freundschafts-Bias Einfluss auf die soziale Vernetzung haben. Counties mit hoher Exposition tendieren dazu, eine stärkere soziale Vernetzung zu zeigen, was sich in der gelben Farbgebung rechts im Diagramm widerspiegelt. Gleichzeitig ist ein niedriger Freundschafts-Bias entscheidend, da er auf soziale Durchmischung hindeutet. Counties mit hohem Bias (oberer Bereich) haben oft dunklere Farben, was zeigt, dass soziale Exklusivität und fehlende Durchmischung die soziale Vernetzung behindern.
Ein Vergleich der hervorgehobenen Counties unterstreicht diese Zusammenhänge. San Francisco County liegt rechts unten im Diagramm und weist eine hohe Exposition sowie einen niedrigen Freundschafts-Bias auf. Die gelbe Farbgebung zeigt, dass hier eine starke soziale Vernetzung besteht. In San Francisco scheint es besser zu gelingen, soziale Verbindungen über Einkommensgrenzen hinweg zu knüpfen. Im Gegensatz dazu liegt Bronx County zentral im Diagramm mit einer mittleren Exposition, jedoch einem höheren Freundschafts-Bias. Die violette Farbe verdeutlicht, dass die soziale Vernetzung hier schwächer ausgeprägt ist. Dies deutet darauf hin, dass soziale Segregation innerhalb des Countys die wirtschaftliche Mobilität begrenzt.
Zusammenfassend zeigt die Grafik, dass eine hohe Exposition allein nicht ausreicht, um eine starke soziale Vernetzung zu fördern. Ein niedriger Freundschafts-Bias ist ebenso entscheidend, da er soziale Durchmischung ermöglicht. San Francisco County verdeutlicht, dass die Kombination aus hoher Exposition und niedrigem Bias eine starke Vernetzung begünstigt, während in der Bronx ein höherer Bias die Vernetzung trotz moderater Exposition hemmt. Die Ergebnisse unterstreichen, dass wirtschaftliche Mobilität nicht nur von der Präsenz wohlhabender Personen, sondern auch von sozialen Interaktionen zwischen Einkommensgruppen abhängt.
- Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.
Basierend auf den Erkenntnissen aus den Aufgaben 14 und 15 ergeben
sich verschiedene politische Maßnahmen, um die soziale Vernetzung und
wirtschaftliche Chancen in benachteiligten Regionen zu verbessern.
Zunächst zeigt die Analyse, dass eine erhöhte Exposition von gut
verdienenden Personen die soziale Vernetzung stärken kann. Um dies zu
erreichen, könnten Anreize für Unternehmen und qualifizierte Fachkräfte
geschaffen werden, um sich in ländlichen oder wirtschaftlich schwächeren
Gebieten niederzulassen. Solche Anreize könnten Steuervergünstigungen,
direkte Subventionen oder Investitionen in die lokale Infrastruktur
umfassen, um attraktivere Bedingungen für den Zuzug von wirtschaftlich
starken Akteuren zu schaffen.
Weiterhin ist der Freundschafts-Bias ein entscheidender Faktor für die
soziale Durchmischung. Ein niedriger Bias deutet darauf hin, dass
soziale Netzwerke über Einkommensgrenzen hinweg effektiv bestehen.
Bildungs- und Austauschprogramme könnten gefördert werden, die
Begegnungen zwischen verschiedenen sozioökonomischen Gruppen ab der
Schulzeit unterstützen. Solche Maßnahmen könnten kulturellen Austausch
fördern und Vorurteile abbauen.
Infrastrukturmaßnahmen könnten ebenfalls eine bedeutende Rolle spielen.
Die Schaffung und Förderung von öffentlichen Räumen und
Gemeinschaftszentren, die sozial durchmischte Aktivitäten unterstützen,
kann den gesellschaftlichen Zusammenhalt stärken. Diese Orte bieten
Gelegenheiten, regelmäßige soziale Interaktionen zu fördern, die über
verschiedene Schichten hinweg stattfinden.
Zusätzlich zur sozialen Vernetzung unterstützen gezielte Bildungs- und
Ausbildungsprogramme die wirtschaftliche Mobilität direkt. Besonders
Programme, die für sozial benachteiligte Gruppen konzipiert sind, können
zur Qualifizierung beitragen und Chancen für Aufstieg und Integration in
den Arbeitsmarkt verbessern.
Letztendlich könnte eine Kombination dieser Maßnahmen zu einer besseren
sozialen Durchmischung und stärkeren Vernetzung über sozioökonomische
Grenzen hinweg führen, was zunehmend gleiche wirtschaftliche Chancen
fördern kann. Ein gezieltes Ineinandergreifen dieser Strategien könnte
somit regionale Disparitäten abmildern und den sozialen sowie
wirtschaftlichen Aufstieg erleichtern.
Zusatzaufgabe
- Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:
Hier können Sie die Daten auf College Ebene herunterladen
Hier bitte ihren Code eintragen
- Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten
funktioniert dies mit dem R Paket tidycensus. Für
den API Zugang müssen Sie sich erst bei IPUMS registrieren und können
danach einen API Key beantragen, welchen Sie dann für den Daten download
über das
tidycencusPaket hinterlegen müssen.
Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.
Hier bitte ihren Code eintragen
- Stellen Sie den Economic Connectedness Index des Colleges
(
ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paketleaflet.
Hier bitte ihren Code eintragen
- Erstellen Sie ein Punktediagramm auf College Ebene, welches den Zusammenhang zwischen dem Freundschafts-Bias und der Exposition beleuchtet auf College Ebene näher beleuchtet.
Tragen Sie dafür auf der x-Achse den Anteil von Studierenden mit gut
verdienenden Eltern ab (exposure_parent_ses_college) und
den Freundschafts-Bias unter den Studierenden
(bias_parent_ses_college)
Heben Sie fünf Colleges ihrer Wahl in der Grafik hervor (inkl. Beschriftung).
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die fünf von Ihnen hervorgehobenen Colleges ein.
Hier bitte ihren Code und ihre Antwort eintragen
Literatur
Chetty, R., Friedman, J. N., Hendren, N., Jones, M. R., & Porter, S. R. (2018). The opportunity atlas: Mapping the childhood roots of social mobility (No. w25147). National Bureau of Economic Research. https://doi.org/10.3386/w25147
Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital I: measurement and associations with economic mobility. Nature 608, 108–121 (2022a). https://doi.org/10.1038/s41586-022-04996-4
Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital II: determinants of economic connectedness. Nature 608, 122–134 (2022b). https://doi.org/10.1038/s41586-022-04997-3