Motivation
In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.
Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer
Vernetzung:
- Exposition: In welchem Ausmaß kommen Menschen aus
verschiedenen sozialen Schichten überhaupt in Kontakt?
- Freundschafts-Bias: Wenn Menschen die Möglichkeit haben, sich mit Personen aus anderen sozialen Schichten anzufreunden – nutzen sie diese Chance auch? Oder bleiben sie lieber in ihrer vertrauten sozialen Umgebung?
Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und
in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu
wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin,
dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit
geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über
soziale Schichten hinweg vernetzt sind, profitieren tendenziell von
besseren wirtschaftlichen Perspektiven.
Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.
Datengrundlage
Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:
- Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?
- Welche Faktoren tragen zur sozialen Ungleichheit bei?
- Welche Maßnahmen könnten die Vernetzung über sozioökonomische Grenzen hinweg fördern?
Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.
Einlesen
Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.
- Lesen Sie den Datensatz
social_capital_county.rdsaus dem Unterordner “Daten” in R ein und nennen diesen Datensatzsocial_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.
Schränken Sie ihren Datensatz auf folgende Variablen ein:
- county
- ec_county
- exposure_grp_mem_county
- bias_grp_mem_county
- pop2018
Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.
Beantworten Sie auch folgende Fragen:
- Was ist eine Beobachtung?
- Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
- In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?
Beschreibung der Variablen
County: 5-stelliger County FIPS Code, welcher als
eindeutiger Identifikator für das jeweilige County dient.
ec_county: Steht für die Economic Connectedness. Misst
also, die Stärke der sozialen Vernetzung zwischen Menschen mit
sozioökonomischen niedrigem Status (low-SES) und Menschen mit
sozioökonomisch hohem Status(high-SES). Ein hoher Wert von ec_county
sagt aus, dass beide Personengruppen gut vernetzt sind, was in besseren
wirtschaftlichen Aufsteigschancen resultiert.
exposure_grp_mem_county: Hier wird der durschnittliche
allgemeine Kontakt in den jeweiligen sozialen Gruppen gemessen, den
low-SES Personen in einem County mit High-SES Personen haben.
bias_grp_mem_county: Steht für den sogenannten
Freundschafts-Bias. Dieser misst, in wie weit low-SES Personen dazu
neigen, weniger Freundschaften mit high-SES personen zu schließen. Also
wie viel Freundschaften aus den allgemeinen Kontakten vorherrschen.
pop2018: Zeigt die Bevölerungsgröße im Jahr 2018.
Was ist eine Beobachtung:
Eine Beobachtung in
diesem Datensatz ist ein einzelnes County in den USA. Jede Zeile stellt
ein County dar und enthält Informationen zu wirtschaftlicher Vernetzung,
Exposition, Freundschafts-Bias und Bevölkerung.
Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?:
| Beschreibung | Anzahl |
|---|---|
| Counties im Datensatz | 3089 |
| Gesamtanzahl der Counties in den USA | 3143 |
Prozentualer Anteil, dass man Informationen zu allen
Variablen hat:
In 95.14 % der Fälle liegen die Daten
vollständig vor.
- Weiterhin haben wir Ihnen den Datensatz
county_covariates.dtaim Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihncovariates.
Schränken Sie diesen Datensatz auf die folgenden Variablen ein:
- county
- kfr_pooled_pooled_p25
- gini99_simple
Generieren Sie eine neue Variable upward_mobility als
kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die
Variable kfr_pooled_pooled_p25.
Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.
Hinweis: Mit dem haven Paket können Sie .dta
Dateien einlesen
Beschreibung der Variablen:
county: Auch hier stellen die Zahlen ein FIPS Code dar,
welcher ein eindeutiger Identifikator für die jeweiligen Counties sind
upward_mobility: Die wirtschaftliche Mobilität
wurde generiert, indem man “kfr_pooled_pooled_p25” mit 100 multipliziert
hat. Sie zeigt die Höhe von Erwachsenen, welche in ihrer Kindheit,
Eltern hatten, die eher niedriges Einkommen hatten. Ein höherer Wert der
upward mobility zeigt, dass Kinder in diesem County im Leben bessere
Aufstiegschancen haben.
gini99_simple: Zeigt, wie
ungleich das Einkommen in einem County verteilt ist. Größere
Unterschiede zwischen Arm und Reich spiegeln sich in einem höheren Wert
der Variable wider. Der Wert ist so angepasst, dass der Anteil des
Einkommens der reichsten 1% herausgerechnet wurde.
- Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.
Lesen sie die Daten County_census_data.shp in R ein und
speichern diesen in R als county_census_shape ab. Neben den
County Namen und und Polygonen enthält dieser Datensatz auch das
geschätzte Median Einkommen pro County für das Jahr 2023
(medincE).
Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren
- Verbinden Sie die Dataframes
county_census_shape,covariatesundsocial_capital_countyzu einem Datensatzanalysis_data.
- Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
- Welcher Datensatz sollte der Hauptdatensatz sein? Warum?
Welche Art von Join sollten sie hierbei verwenden? Warum
gerade diesen Join?
Mit einem Left Join bleiben alle Counties aus county_census_shape erhalten, selbst wenn für einige keine entsprechenden Daten in covariates oder social_capital_county vorhanden sind, und die fehlenden Daten werden als NA angezeigt.
Welcher Datensatz sollte der Hauptdatensatz sein?
Warum?
Der Hauptdatensatz sollte county_census_shape sein, weil dieser die vollständigen geografischen Informationen und die grundlegenden Identifikatoren (wie GEOID) enthält. Andere Datensätze (wie covariates und social_capital_county) liefern zusätzliche Variablen, die zu den geografischen Daten hinzugefügt werden sollen, ohne diese zu verlieren.
- Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:
- upward_mobility
- ec_county
- exposure_grp_mem_county
- bias_grp_mem_county
Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:
- Was genau misst die wirtschaftliche Mobilität
(
upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen. - Bitte schauen Sie sich an, wie die sozialen Vernetzung
(
ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
Hinweis: Die genaue Berechnung der sozialen Vernetzung
(ec_county) finden Sie im Dokument
“social_capital_codebook.pdf”
Was misst die wirtschaftliche Mobilität?: Die
Wahrscheinlichkeit, dass ärmere Kindern (also im unteren Viertel der
Einkommensverteilung) im Erwachsenen-Alter ein höheres Einkommen
erziehelen. Kurz: die Chancen sich wirtschaftlich zu verbessern.
Was misst die soziale Vernetzung?: Wie stark Menschen
mit mit niedrigem sozioökonomischen Status (low-SES) und Menschen mit
hohem sozioökonomischen Status (high-SES) vernetzt sind. Aus einem hohen
Wert geht hervor, dass es viele Freundschaften zwischen diesen Gruppen
gibt.
Warum eine hohe soziale Vernetzung zu einer hohen
wirtschaftlichen Mobilität führt:
1.
Ärmere Kinder können von Freundschaften mit Menschen aus höheren
Einkommensgruppen profitieren. Es könnte zu besseren Jobmöglichkeiten,
Bildungsmöglichkeiten und eventuellen Praktika führen. Menschen aus
höheren Einkommensgruppen haben oft mehr Wissen dazu und können dieses
teilen. Hier sollte angenommen werden, dass soziale Netzwerke wie
Facebook genutzt werden, um beruflich oder finanziell voranzukommen.
2. Motivation durch den Kontakt mit Personen aus
den höheren Einkoommensgruppen. Kinder aus ärmeren Haushalten sehen die
Möglichkeiten und streben Ähnliches an.
3. Direkte
Unterstützung durch die wohlhabenderen Personen durch Empfehlungen bei
Bewerbungen oder finanzieller Unterstützung. Angenommen die
Freundschaften sind echt und nicht nur oberflächlich.
Berechnung der sozialen Vernetzung: Für jede Person mit
niedrigen sozioökonomischen Status wird geschaut, wie viele ihrer
Freundschaften zu Menschen mit hohem SES gehören. Dazu teilt man diese
Anzahl durch die Anzahl der gesamten Freunde dieser Person. Dann wird
der Durchschnitt aller Personen in einem County berechnet, welcher dann
angibt wie stark die beiden sozialen Gruppen insgesamt miteinander
vernetzt sind.
Wie Exposition und Freundschafts-Bias die
soziale Vernetzung beeinflusst: Exposition gibt an, wie viele
Menschen aus höheren Schichten in einem County für ärmere Menschen
potenziell als Freunde zur Verfügung stehen. Eine hohe Exposition sollte
daher die soziale Vernetzung positiv beeinflussen. Die
Wahrscheinlichkeit Freundschaften mit high-SES Personen steigt, wenn
mehr von diesen zur Verfügung stehen. Angenommen die Exposition führt zu
tatsächlichen Interaktionen und Freundschaften. Der Freundschafts-Bias
misst, in wie weit Personen aus einer Gruppe es bevorzugen
Freundschaften innerhalb ihrer eigenen sozialen Gruppe zu bilden. Ein
hoher Wert wirkt sich also negativ auf die soziale Vernetzung aus. Wenn
mehr low-SES bevorzugt nur Freundschaften mit low-SES Personen bilden
wollen oder umgekehrt, sinkt die wahrscheinlichkeit von low-SES und
high-SES Freundschaften.
Deskriptive Analysen
Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.
- Schauen Sie sich in einem ersten Schritt an, wie die Variablen im
Datensatz
analysis_dataüber alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.
Beschreiben und interpretieren Sie Ihre Tabelle.
Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?
Hinweis: Achten Sie auf eine schöne Darstellung ihrer
Tabelle mittels der Pakete kableExtra oder
gt!
| Median Haushalts- einkommen | Einkommens- ungleichheit | Wirtschaftliche Mobilität | Economic Connectedness Index | Exposition | Freundschafts-Bias | Bevölkerung in 2018 | |
|---|---|---|---|---|---|---|---|
| Mittelwert | 65.046,65 | 0,29 | 42,72 | 0,81 | 0,91 | 0,06 | 107.129,87 |
| Median | 63.161,50 | 0,29 | 41,96 | 0,81 | 0,91 | 0,06 | 27.837,50 |
| Minimum | 16.170,00 | -0,06 | 12,22 | 0,29 | 0,26 | -0,11 | 544,00 |
| Maximum | 178.707,00 | 0,57 | 68,83 | 1,36 | 1,49 | 0,33 | 10.098.052,00 |
| Standardabweichung | 18.388,68 | 0,06 | 6,49 | 0,18 | 0,21 | 0,05 | 337.331,88 |
| 25%-Quantil | 54.113,25 | 0,24 | 38,43 | 0,69 | 0,76 | 0,03 | 12.618,75 |
| 75%-Quantil | 73.216,25 | 0,33 | 46,11 | 0,94 | 1,05 | 0,10 | 71.974,50 |
Beschreibung:
Die vorliegende Tabelle stellt
Informationen zu den verschiedenen Variablen aus dem Datensatz zur
Verfügung. Mittelwert, Median, Minimum und Maximum, Standardabweichung
und das 25%ige und 75%ige Quantil.
Interpretation:
Auffälligkeiten gibt es zum
einen in der Variable pop2018 also bei der Population der Counties 2018.
Dort ist die Spannweite also Entfernung von Minimum zu Maximum extrem
groß. Dies deutet daraufhin, dass es massive Unterschiede in vermutlich
ländlichen Counties zu städtischen Counties gibt. Dass es viele kleine
Counties und wenige sehr große Counties gibt, lässt sich aus dem Median
von pop2018 ableiten, dieser ist deutlich unter dem Mittelwert. Die
Spannweite der exposure Variable (zwischen 0.2 und 1.4) zeigt, dass es
keine extremen Ausreißer gibt. Der Freundschafts-Bias ist in vielen
Counties gering aber es gibt auch einige negative Werte. Diese könnten
in Regionen auftreten, wo Menschengruppen noch stark seggregiert sind
(siehe Interpretation in Aufgabe 7). Dass ec_county keine nennenswerten
Ausreißer hat, deutet darauf hin, soziale Netzwerke in den meisten
Counties relativ ähnlich sind. Das niedrigste Median Einkommen liegt bei
16.170 USD und das Maximum bei 178.707 USD. Die große Different zeigt,
die unterschiedlichen wirtschaftlichen Verhältnisse der Regionen und
vorallem die extrem unterschiedlichen Lebendbedingungen in den USA. Der
Mitelwert ist leicht höher als das 75% Quantil was bedeutet, dass einige
reiche Counties den Durchschnitt nach oben ziehen.
Soziale Vernetzung und wirtschaftliche Mobilität
Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild
über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre
Analyse näheres über die soziale Vernetzung lernen, den Economic
Connectedness Index (ec_county), welcher aus den Facebook
Freundschaften generiert wurde. Die Daten des Economic Connectedness
Index wurden auf County Ebene aggregiert, beruhen jedoch auf
Freundschaftsdaten von individuellen Facebook Nutzern.
- Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.
Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:
Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?
Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt
sich das tigris
Paket und der Befehl shift_geometry() um Alaska, Hawaii
und Puerto Rico schön darstellen zu lassen.
Beschreibung:
Die erstellte Karte enthält
Informationen zu dem Economic Conectedness Index (ECI) auf US-County
Ebene dar. Violett bezeichnet einen geringen ECI bis zu Gelb, was einen
hohen ECI widerspiegelt. Der Index umfasst Werte von etwa 0.50 bis 1.25.
Entlang der Ostküste und im nürdlichen Zentrum der USA sieht man viele
gelbe countys. Also eine hohe soziale Vernetzung. Die eher niedrigeren
Werte treten vor allem im mittleren Westen und im Süden der USA auf.
Einige Sonderfälle haben keine Werte (grau). Wir haben ja schon gesehen,
dass es mehr counties gibt als wir in unseren Daten haben.
Interpretation:
Anhand der Karte stellen wir
fest, dass es enorme regionale Unterschiede in der economic conectedness
gibt. Der Osten ist durch Metropolen wie New York, Boston, Washington
D.C dichter besiedelt und urbanisiert könnte deshalb ein dichtes Netz an
kulturellen und wirtschaftlichen Netzwerken bieten. Schon bei der
Gründung der USA und während der industriellen Revolution spielten die
Gebite im Osten und Norden der USA eine wichtige Rolle, weshalb sie noch
heute sehr bedeutend sind (siehe Wirtschafts- und Bankwesen, welche
mehrheitlich im Norden und Osten angesiedelt sind). Auch sind die
meisten guten Universitäten (ivy-league) im Osten, algemein gibt es dort
mehr Konzentration auf Bildungseinrichtungen. All diese Punkte wirken
sich positiv auf den ECI aus.
Der Süden der USA hat eher eine
Historie welche auf Trennungen und Segregation basierte siehe Jim Crow
Era im späten 19 bis zum frühen 20 Jahrhundert. Diese Ungleichheiten
zwischen Bevökerungsgruppen führen noch heute zu Konsequenzen, welche
sich negativ auf die soziale Venetzung auswirken. Auch ist der Süden
eher ländlicher, dort gibt es weniger dicht besiedelte Gebiete, weniger
wirtschaftlich ausgerichtete Einrichtungen und weniger
Bildungsinvesitionen, was zu kleineren Netzwerken führt.
Welche Annahme müssen Sie machen, damit Sie gültige Aussagen
zum Einfluss des Economic Connectedness Index auf die wirtschaftliche
Mobilität tätigen können und Sie tatsächlich etwas über
Freundschaftsnetzwerke lernen können?
Der ECI sollte eine
tatsächliche Ursache für die wirtschftliche Mobilität haben und nicht
nur zufällig damit zusammenhängen. Der ECI sollte ein gutes Maß dafür
sein, wie stark die Menschen miteinander vernetzt sind. Er muss zeigen,
ob Leute aus verschiedenen sozialen Schichten wirklich miteinander in
Kontakt stehen und Freunschaften bilden. Die Daten solltenn richtig
sein, Verzerrungen führen zu falschen Schlussfolgerungen.
- Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.
Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:
- Median Haushaltseinkommen in dem County (
medincE) - Wirtschaftliche Mobilität in dem County
(
upward_mobility) - Einkommensungleichheit in dem County (gemessen mit dem
Gini-Koeffizient des Counties) (
gini99_simple)
Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.
Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:
- Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.
| County-Name | Rank | Economic Connectedness Index | Median Haushalts- einkommen | Wirtschaftliche Mobilität | Einkommens- ungleichheit |
|---|---|---|---|---|---|
| Top Counties | |||||
| 1 | 1,36 | 113.927 | 45,31 | 0,23 | |
| 2 | 1,35 | 145.737 | 48,24 | 0,12 | |
| 3 | 1,31 | 141.446 | 50,39 | 0,31 | |
| 4 | 1,29 | 126.092 | 54,12 | 0,15 | |
| 5 | 1,28 | 58.259 | 51,54 | 0,22 | |
| 6 | 1,27 | 140.160 | 46,28 | 0,39 | |
| 7 | 1,26 | 114.316 | 47,04 | 0,18 | |
| 8 | 1,25 | 106.666 | 49,54 | 0,18 | |
| 9 | 1,25 | 77.358 | 48,71 | 0,35 | |
| 10 | 1,24 | 100.318 | 45,83 | -0,01 | |
| Bottom Counties | |||||
| 1 | 0,29 | 39.148 | 30,18 | 0,32 | |
| 2 | 0,33 | 34.769 | 24,84 | NA | |
| 3 | 0,35 | 43.812 | 31,17 | 0,36 | |
| 4 | 0,36 | 36.723 | 34,57 | 0,31 | |
| 5 | 0,36 | 31.603 | 31,40 | 0,33 | |
| 6 | 0,36 | 40.318 | 32,10 | 0,36 | |
| 7 | 0,38 | 53.750 | 33,83 | 0,46 | |
| 8 | 0,38 | 36.293 | 32,82 | 0,31 | |
| 9 | 0,39 | 42.745 | 32,89 | 0,42 | |
| 10 | 0,40 | 43.500 | 31,08 | 0,39 | |
Beschreibung:
Die Tabelle enthält das Ranking
der 10 Counties mit der höchsten sozialen Vernetzung und die 10 Counties
mit der niedrigsten sozialen Vernetzung. Platz 1 hat eine economic
connectedeness von 1,36 (Rockingham County in New Hampshire und der
schlechteste County ist Scotland County in North Carolina mit 0.40
economic connectedness. Ebenfalls enthält die Tabelle Daten über das
Median-Haushaltseinkommen in Spalte 4(höchstes: 145.737; niedrigstes:
31.603), über die wirtschaftliche Mobilität (höchste: 54,12 ;
niedgriste: 24,84) in Spalte 5 und über die Einkommensungleichheit in
der letzten Spalte.
Interpretation:
In den
Top 10 Counties sieht man den Trend, dass diese jeweils ein hohes
Haushaltseinkommen im Median haben, welches von 58.259 USD bis hin zu
145.737 USD reicht. Die Einkommensungleichheit in den Counties sind
relativ gering bis auf ein paar Auschläge in Gunnison County, Arlington
County und San Francisco County. Auch weisen alle 10 Counties eine hohe
wirtschaftliche Mobilität auf. Sie haben einen economic Index von 1,24
bis 1,36. Bei den jeweils niedrigsten Counties ist es das Gegenteil. Der
economic Index liegt hier zwischen 0,29 und 0,40. Sie sind betroffen von
neidrigen Haushaltseinkommen im Median, weches von 31.603 USD (Allendale
County, South Carolinia) bis maximal 53.750 USD (Early County, Georgia)
geht. Das maximale durchschnittliche Haushaltseinkommen liegt unter dem
minimum der Top 10 Counties. Es herrscht eine hohe
Einkommensungleichheit von 0,31 bis 0,46 und die wirtschaftliche
Mobilität ist ebnfalls gering mit einem Tief von 24,84 in Oglala Lakota
County, South Dakota und einem maximalen Hoch von 34,57 in Bullock
County, Georgia.
Haben wir die Unterschiede
erwartet?
Ja die Unterschiede waren erwartbar. Es war zu
erwarten, dass ein hohes Haushaltseinkommen mit einer hohen sozialen
Vernetzung korreliert. Hohe soziale Vernetzung zwischen den Gruppen
führt zu mehr Austausch von Wissen und Ressourcen was zu mehr
Wirtschaftlichkeit führt. Dies spiegelt sich dann in der Förderung des
durchschnittlichen Einkommen wieder. Auch war es zu erwarten, dass
dieser Austausch zu mehr Möglichkeiten/Chancen führt, was in einer
höheren wirtschaftlichen Mobilität endet. Eine höheree economic
connectednness führt demnach auch zu weniger Einkommensungleichheit.
Ebenfalls die Lage der Counties spielt eine Rolle. Counties in den Top
10 liegen in wirtschaftlich stärkeren Regionen und in der Nähe von
Metropolen z.B San Francisco oder Washington D.C. Es gibt mehr
Vernetzung und Chancen für LOW-SES. Die Bottom Counties liegen eher in
ländlichen Regionen im Süden der USA, was wir auch in der Aufgabe 7
gesehen haben. Sie sind eher von wirtschaftlichen schwachen Regionen
umgeben.
Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?
- In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot)
erstellen, welches die wirtschaftliche Mobilität
(
upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
- In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?
Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen
Beschreibung:
Aus der Grafik entnimmt man den
Zusammenhang zwischen dem Economic Connectedness Index auf der X-Achse
und der wirtschaftlichen Mobilität auf der Y-Achse (upward_mobility).
Jeder Punkt im vorliegenden Streudiagramm repräsentiert einen County in
den USA. Die rote Linie zeigt die lineare Regressionsgerade. Der
Korrelationswert beträgt 0,72 also eine starke positive Korrelation.
Aktuell haben Sie in einer univariaten Analyse viel über die
soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat
der Economic Connectedness Index mit tatsächlicher
Entwicklungsmöglichkeit auf sich?
Anhand der Grafik sehen
wir, dass es einen positiven Zusammenhang zwischen sozialer Vernetzung
und wirtschaftlicher Mobilität gibt. Counties mit höherer economic
connectedness haben eher eine höhere wirtschaftliche Mobilität.
Entspricht der Zusammenhang zwischen den zwei Variablen ihren
Erwartungen aus Aufgabe 5?
Ja, der Zusammenhang entspricht
den Erwartungen aus Aufgabe 5. Soziale Netzwerke insbesondere zwischen
Menschen mit hohen und niedrigem sozioökonomischen Status, können die
wirtschaftliche Mobilität fördern.
In wie weit können Sie mit dieser Grafik die Frage “Wie stark
beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der
Motivation beantworten?
Am stark positiven
Korrelationswert von 0,72 sieht man, dass soziale Vernetzung ein
wichtiger Faktor für die wirtschaftliche Mobilität ist. Allerdings
sollte auch der Einfluss anderer Faktoren wie Bildungszugang,
Arbeitsmarksituation etc. berücksichtigt werden, um den Anteil des
Einflusses der sozialen Vernetzung genauer zu bestimmen.
- Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
- Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
- Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index
Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:
- San Francisco County, California
- Arlington County, Virginia
- Morgan County, Utah
- New York County, New York
- Bronx County, New York
Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.
Beschreibung:
Das erste Punktediagramm stellt
die Verbindungen zwischen der Einkommensungleichheit und der sozialen
Vernetzung dar. Auf der X-Achse die Einkommensungleichheit gemessen mit
dem Gini-Koeffizient und auf der Y-Achse der Economic Connectedness
Index. Die rote Linie zeigt die Korrelation welche hier -0.67 beträgt.
Das zweite Diagramm zeigt den Zusammenhang von dem Economic
Connectedness Index auf der Y-Achse und dem durchschnittlichen
Haushaltseinkommen auf der X-Achse.Hier beträgt die Korrelation gemessen
an der roten Linie 0.72. Eine weitere Anmerkung sollte sein, dass das
County Morgan County, Utah eigentlich nicht zu den 500 größten Counties
gehört, weshalb hier die 500 größten Counties (nach Population) und
Morgan County, Utah dargestellt sind.
Interpretation:
Aus der ersten Grafik liest
man, dass in Regionen mit höherer Einkommensungleichheit, die soziale
Vernetzung niedriger ist. San Francisco liegt in einem Bereich mit
mittlerer Einkommensungleichheit weisst allerdings einen hohen economic
connectedness Index auf. Dies liegt vermutlich an der Vernetzung und
Möglichkeiten z.B durch den Silicon Valley. New York County, NY hat eine
der höchsten Einkommensungleichhheiten. Hier ist die Trennung von Arm
und Reich sehr hoch. Economic connectedness ist eher mittelmäßig.
Die zweite Grafik zeigt, dass die soziale Vernetzung zunimmt mit
steigendem durchschnittlichem Haushaltseinkommen. Wohlhabende Counties
wie Douglas County und San Francisco neigen dazu, wohlhabend zu sein und
sind deshalb besser vernetzt. Wirtschaftlicher Wohlstand durch das
Silicon Valley. New York County zeigt durch sein hohes
Median-Haushaltseinkommen, aber auch einem etwas niedrigeren EC-Index,
dass es innerhalb des Counties soziale Ungleichheiten gibt. Bronx County
in New York hat sowohl ein niedrigeres Haushaltseinkommen als auch eine
niedrigere soziale Vernetzung. Dies könnte durch auf soziale und
wirtschaftliche Ungleichheiten hindeuten. Die Beobachtungen bestätigen
den Erwartungen, da wir bereits in Aufgabe 5 angenommen haben, dass
höhere wirtschaftliche Ressourcen (z. B. Einkommen) die soziale
Vernetzung fördern können. Allerdings gibt es auch Außnahmen, wie in New
York County, wo trotz hohen Einkommens die Vernetzung niedriger ist.
Dies war allerdings auch zu erwarten, da man weiß die Segregation in New
York ist heute noch relativ hoch.
Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.
- Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
- Economic Connectedness Index (ec_county)
- Wirtschaftliche Mobilität (upward_mobility)
- Median Haushaltseinkommen (medincE)
- Bevölkerung in 2018 (pop2018)
- Einkommensungleichheit (gini99_simple)
- Exposition (exposure_gpr_mem_county)
- Freundschafts-Bias (bias_grp_mem_county)
Beschreiben und interpretieren Sie ihre Korrelationsmatrix.
Beschreibung:
Die Matrix zeigt die Korrelation
zwischen sieben Variablen mit Hilfe von Feldern. Die Korrelation reich
von -1 (starke negative Korrelation) bis hin zu 1 (starke positive
Korrelation), wobei 0 keine Korrelation bedeutet. Je dunkler das Feld
blau ist, desto stärker korrelieren die Variablen positiv und je dunkler
das Feld rot ist, desto stärker korrelieren die Variablen negativ.
Interpretation:
Wir wollen uns jetzt die
interessanten Variablen genauer anschauen.
1.Economic
Connectedness Index: Er hat eine starke positive Korrelation
von 0.73 mit der wirtschaftlichen Mobilität. Durch stärkere soziale
Vernetzung steigen also die Chancen für wirtschaftlichen Aufstieg. In
wirtschaftlich guten Regionen wie Silicon Valley oder Arlington County
gibt es eine hohe Vernetzung zwischen Gruppen, die es Haushalten
ermöglicht, ihre Einkommen zu steigern. Desweiteren hat er einen
positiven Zusammenhang mit dem Haushaltseinkommen im Median von 0.63.
Wohlhabendere Counties spiegeln sich also in einer besseren sozialen
Vernetzung wider. Der EC-Index korreliert stark negativ mit
Einkommensungleichheit. Starke Einkommensungleichheit fördert
Segregation und erschwert sozialen Austausch. Auch mit der Exposition
von High-SES Personen korreliert er stark positiv (0.94). Mehr Kontakt
zu wohlhabenderen Schichten führt also zu einer höheren sozialen
Vernetzung.
2.Upward Mobility: Wirtschaftliche
Mobilität korreliert positiv mit dem durchschnittlichen
Haushaltseinkommen (0.71). Höheres Einkommen fördert also die
Aufstiegschancen. Einkommensungleichheit mindert diese jedoch (-0.60)
3.Freundschafts-Bias: Dieser korreliert jeweils
negativ mit dem EC-Index (-0.38) und mit der Exposition (-0.18). Sozial
seggregierte Regionen verhindern also eine soziale vernetzung.
4.Exposition: Sehr starke Korrelation mit dem EC-Index.
Eine der stärksten Korrelationen in der Matrix. Zeigt also, der Kontakt
und die Exposition mit wirtschaftlich besser gestellten Personen ist
fast vollständig mit dem EC-Index verknüpft. Sie ist also eine der
wichtigsten Variablen für eine gute soziale Vernetzung. in denen
einkommensschwache Menschen Zugang zu besseren Schulen, Jobs oder
Nachbarschaften haben (hohe Exposition), erreichen automatisch höhere
Werte im EC-Index. Stark negativ korreliert die Exposition mit
Einkommensungleichheit (-0.60). Counties mit hoher Exposition haben
häufiger geringere Einkommensungleichheit, da hier die Regionen weniger
seggregiert sind.
Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?
- Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.
Beschreibung:
Diese Grafik zeigt den Zusammenhang
von Median Haushaltseinkommen auf der X-Achse und Economic Connectedness
Index auf der Y-Achse. Die Counties sind farblich und gemessen in der
wirtschaftlichen Mobilität. Gelb bedeutet weniger wirtschaftliche
Mobililität und Blau bedeutet hohe wirtschaftliche Mobilität. Die
meisten Counties verteilen sich im Bereich bei einem Haushaltseinkommen
von 40.000 und 80.000 USD und einem EC-Index von 0,5 und 1,0. Im unteren
Einkommensbereich finden sich einige Counties mit relativ hohem
EC-Index. So gibt es aber auch in einem Bereich mit hohem Einkommen
Counties mit geringem EC-Index.
Interpretation:
Je höher das Median
Haushaltseinkommen desto höher auch der EC-Index. Wohlhabende Regionen
sind stärker und besser Vernetzt. Dies ermöglicht bessere Chancen für
soziale und wirtschaftliche Mobilität. Allerdings gibt es auch
vereinzelte Counties, welche trotz hohem Haushaltseinkommen und hohem
EC-Index wenig wirtschaftliche Mobilität haben. Dies deutet auf mögliche
Segregation hin, bei der einkommensstarke Gruppen isoliert bleiben und
keine Vorteile erhalten. Regionen mit niedrigem EC-Index und niedrigem
Haushaltseinkommen weissen vermutlich starke Seggregation und wenig
Wirtschaft auf. Diese Counties könnten eher ländlich sein. Die Ausreißer
die trotz moderatem EC-Index und niedrigem Haushaltseinkommen hohe
wirtschaftliche Mobilität aufweisen, verdanken dies vermutlich
politischen Initiativen und Förderungen (z.B von Bildung).
- Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.
Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:
- Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
- In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
- Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
- Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?
Rückwärtskausalität: Bedeutet, dass man annimmt die
soziale Vernetzung beeinflusst die wirtschaftliche Mobilität eigentlich
ist es aber andersrum. Die Autoren argumentieren, dass der EC-Index
durch Freundschaftsmuster in der Jugend bestimmt wird, lange bevor
wirtschaftliche Mobilität stattfinden kann. Deshalb wird
Rückwärtskausalität ausgeschlossen.
Selektionseffekte: Tritt auf, wenn bestimmte Individuen
oder Haushalte aktiv entscheiden, in Regionen mit besserer sozialer
Vernetzung zu ziehen. Dadurch entsteht eine Verzerrung im Zusammenhang
zwischen EC-Index und Mobilität. Laut Studie blebit der Effekt stabil,
selbst wenn migrationsbedingte Selektionseffekte berücksichtigt werden.
Ausgelassene Variablen: Es könnte unbeobachtete
oder nicht gemessene Variablen geben, die sowohl die wirtschaftliche
Mobilität als auch die soziale Vernetzung beeinflussen, wodurch der
Zusammenhang zwischen den beiden nur scheinbar kausal ist. Z.b Bildung,
Politik oder Kultur. Die Autoren nutzen robuste Kontrollvariablen wie
Bildungsgrad, ethnische Vielfalt und wirtschaftliche Struktur, um den
Einfluss potenzieller ausgelassener Variablen zu minimieren.
Glaubhaftigkeit der Argumentation: Die Argumente der
Autoren, insbesondere die Nutzung von Freundschaftsnetzwerken in der
Jugend als Messgröße für den EC-Index, wirken überzeugend. Dies
reduziert das Risiko von Rückwärtskausalität erheblich. Es bleibt
unklar, wie vollständig und repräsentativ die Daten über
Freundschaftsnetzwerke sind. Eventuell wurden wichtige Aspekte sozialer
Beziehungen nicht berücksichtigt. Desweiteren könnten Freundschaften
kulturell unterschiedlich interpretiert werden, was die Ergebnisse
verzerrt. Insgesamt ist die Argumentation schlüssig und gut abgesichert,
jedoch nicht vollständig wasserdicht. Es bleibt Raum für Zweifel an
nicht erfassten Variablen und der Messmethodik.
Optimale
Bedingungen zur Messung eines kausalen Effekts:
1.Experimentelle Daten: Randomisiertes
Kontrollgruppendesign wäre ideal, bei dem Menschen zufällig in Regionen
mit unterschiedlichem EC-Index zugewiesen werden.
2.Langfristige Beobachtungsstudien: Daten über
Freundschaftsnetzwerke, wirtschaftliche Entwicklung und Mobilität
müssten über Jahrzehnte hinweg gesammelt werden, um zeitliche Abfolgen
genau zu bestimmen.
3.Kontrolle von Störfaktoren:
Es sollten möglichst umfassende Daten über potenzielle Störvariablen wie
Bildung, Kultur, lokale Wirtschaftspolitik und Migration erfasst werden.
4.Simulationsmodelle: Kombiniert mit empirischen
Daten könnten Simulationsmodelle genutzt werden, um den Einfluss von
Netzwerken auf wirtschaftliche Mobilität unter verschiedenen Szenarien
zu testen.
Einflussfaktoren auf die soziale Vernetzung
Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?
- Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe
Exposition (
exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.
Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.
Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?
Beschreibung:
Wie in Aufgabe 7 sehen wir eine
Karte der USA auf County-Ebene. Diesmal zeigt die Karte die Exposition
in den jeweiligen Counties. Die Farbcodierung reicht von Gelb (hohe
Exposition) über Orange bis Lila (niedrige Exposition). Hohe Exposition
(Gelb) vorallem in Küstenstaaten (Kalifornien, New York, Boston).
Lilatöne besonders im Süden und einigen regionen des mittleren Westens.
Alaska und Hawaii zeigen gemischte Muster
Vergleich:
Die Karte weißt Ähnlichkeiten zu der
Karte aus Aufgabe 7 (wirtschaftsliche Mobilität) auf. Regionen mit hoher
wirtschaftlicher Mobilität (z. B. urbane und wirtschaftlich entwickelte
Gebiete an der Ost- und Westküste) weisen auch tendenziell eine hohe
Exposition auf. Ländliche Gebiete mit geringer wirtschaftlicher
Mobilität (vorallem im Süden) zeigen ebenfalls niedrige Exposition.
Einige ländliche Gebiete mit moderater Mobilität zeigen eine
überraschend niedrige Exposition, was darauf hindeutet, dass andere
Mechanismen (z. B. Bildung oder kulturelle Faktoren) die Mobilität dort
unterstützen könnten. Die Annahme, dass die Exposition eine Rolle für
die soziale Vernetzung und somit für die wirtschaftliche Mobilität
spielt, wird größtenteils durch die Karte gestützt. Regionen mit hoher
Exposition bieten mehr Möglichkeiten für Kontakte zwischen
Einkommensgruppen, was die soziale Vernetzung fördert.
Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.
- Um zu untersuchen ob es eine entsprechende Segregation der
Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein
Punktediagramm erzeugen, welche auf der x-Achse die Exposition
(
exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihr Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.
Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:
- Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?
Beschreibung:
Die Grafik zeigt den Zusammenhang zwischen Exposition (x-Achse),
Freundschafts-Bias (y-Achse) und der sozialen Vernetzung (Economic
Connectedness Index, dargestellt durch die Farbskala gelb bis blau).
Zusätzlich sind die Counties “San Francisco County, California” und
“Bronx County, New York” hervorgehoben. Steigende Werte auf der x-Achse
bedeuten eine höhere Exposition, also einen höheren Anteil
gutverdienender Personen in einem County. Höhere Werte auf der y-Achse
deuten auf einen stärkeren Freundschafts-Bias hin. Gelb zeigt einen
niedrigen Economic Connectedness Index und Blau zeigt einen hohen
EC-Index.
Interpretation: Counties mit höherer
Exposition zeigen tendenziell eine höhere soziale Vernetzung (bläuliche
Farben). Dies deutet darauf hin, dass ein höherer Anteil gutverdienender
Personen in einem County die Wahrscheinlichkeit erhöht, dass Menschen
Freundschaften mit Personen aus höheren Einkommensgruppen schließen
können. Counties mit höherem Freundschafts-Bias weisen eine geringere
soziale Vernetzung (gelbe Farbtöne) auf. Ein hoher Bias schränkt die
Verbindung zwischen Einkommensgruppen ein, selbst wenn die Exposition
hoch ist. Hohe Exposition und ein niedriger Freundschafts-Bias maximiert
die soziale Vernetzung. Beispiele wie San Francisco zeigen, dass eine
moderate bis hohe Exposition kombiniert mit einem geringen
Freundschafts-Bias zu einem hohen ECI führt. Hohe Exposition und ein
hoher Freundschafts-Bias führt zu einer eingeschränkten sozialen
Vernetzung trotz hoher Exposition, da die Trennung zwischen
Einkommensgruppen stark ist. Bronx County ist ein Beispiel dafür. Der
ECI steigt also tendenziell in Counties mit hoher Exposition und
niedrigem Bias.
- Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.
Maßnahmen für höhere Exposition:
1.Steueranreize für Diversität: Steuervergünstigungen
für private Investoren könnten den Bau von Wohnraum in wohlhabenden
Regionen fördern. Dies könnte zu einer stärkeren sozialen und
wirtschaftlichen Durchmischung führen.
2.Stärkung
öffentlicher Verkehrsmittel: Bessere Mobilität zwischen
einkommensschwachen und einkommensstarken Regionen durch gut ausgebaute
öffentliche Verkehrsmittel, um den Zugang zu Arbeitsplätzen,
Bildungseinrichtungen und sozialen Netzwerken zu erleichtern.
Maßnahmen zur Reduzierung des Freundschafts-Bias:
1.Bildungsprogramme: Soziale und wirtschaftliche
Diversität in Schulen fördern, eventuell auch gemischte Schulbezirke.
Schulaustausche zwischen Schulen aus einkommensschwachen und
einkommensstarken Gegenden.
2.Inklusive
Gemeinschaftsprojekte: Förderung von lokalen Vereinen,
Sportclubs oder gemeinnützigen Projekten, die den Austausch zwischen
verschiedenen sozialen Gruppen fördern. Veranstaltungen und Programme,
die gezielt auf die Vernetzung von Menschen aus unterschiedlichen
Einkommensgruppen abzielen. Institutionen wie Vereine, Schulen oder
lokale Netzwerke können dazu beitragen, den Freundschafts-Bias zu
reduzieren und die soziale Vernetzung zu stärken. Deshalb auch
finanzielle Förderung von Institutionen, die sich für soziale
Integration und Chancengleichheit einsetzen.
Förderung von
beruflicher und sozialer Mobilität:
1.Unterstützung von Start-ups in benachteiligten
Regionen: Startkapital und Mentoring für lokale Unternehmer, um
wirtschaftliche Aktivität und Vernetzung zu fördern.
Zusatzaufgabe
- Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:
Hier können Sie die Daten auf College Ebene herunterladen
- Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten
funktioniert dies mit dem R Paket tidycensus. Für
den API Zugang müssen Sie sich erst bei IPUMS registrieren und können
danach einen API Key beantragen, welchen Sie dann für den Daten download
über das
tidycencusPaket hinterlegen müssen.
Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.
- Stellen Sie den Economic Connectedness Index des Colleges
(
ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paketleaflet.