Motivation
In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.
Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer
Vernetzung:
- Exposition: In welchem Ausmaß kommen Menschen aus
verschiedenen sozialen Schichten überhaupt in Kontakt?
- Freundschafts-Bias: Wenn Menschen die Möglichkeit haben, sich mit Personen aus anderen sozialen Schichten anzufreunden – nutzen sie diese Chance auch? Oder bleiben sie lieber in ihrer vertrauten sozialen Umgebung?
Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und
in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu
wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin,
dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit
geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über
soziale Schichten hinweg vernetzt sind, profitieren tendenziell von
besseren wirtschaftlichen Perspektiven.
Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.
Datengrundlage
Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:
- Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?
- Welche Faktoren tragen zur sozialen Ungleichheit bei?
- Welche Maßnahmen könnten die Vernetzung über sozioökonomische Grenzen hinweg fördern?
Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.
Einlesen
Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.
1. Lesen Sie den Datensatz
social_capital_county.rds aus dem Unterordner “Daten” in R
ein und nennen diesen Datensatz social_capital_county.
Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und
die Freundschaftsverbindungen einzelner Personen untereinander
(aggregiert auf County-Ebene) darstellen.
Schränken Sie ihren Datensatz auf folgende Variablen ein:
- county
- ec_county
- exposure_gpr_mem_county
- bias_grp_mem_county
- pop2018
Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.
Beantworten Sie auch folgende Fragen:
- Was ist eine Beobachtung?
- Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
- In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?
| county | ec_county | exposure_grp_mem_county | bias_grp_mem_county | pop2018 |
|---|---|---|---|---|
| 1001 | 0.72077 | 0.81740 | 0.05526 | 55200 |
| 1003 | 0.74313 | 0.78532 | 0.02950 | 208107 |
| 1005 | 0.41366 | 0.41513 | 0.13457 | 25782 |
| 1007 | 0.63152 | 0.71012 | 0.04108 | 22527 |
| 1009 | 0.72562 | 0.79758 | 0.00217 | 57645 |
| 1011 | 0.35515 | 0.26952 | 0.07974 | 10352 |
Der Datensatz social_capital_county enthält wichtige
Kennzahlen zur sozialen Vernetzung auf County-Ebene in den USA. Die
enthaltenen Variablen basieren größtenteils auf Facebook-Daten und
liefern Einblicke in soziale Strukturen und Verbindungen zwischen
Personen mit unterschiedlichem sozioökonomischem Status (SES).
Beschreibung der Variablen:
Die Variable county stellt den 5-stelligen FIPS-Code
dar, der jedes County eindeutig identifiziert. Dieser Code ist eine
standardisierte geografische Kennzahl und dient der Zuordnung und
Analyse regionaler Daten.
Die Variable ec_county beschreibt die ökonomische
Verbundenheit innerhalb eines Countys. Sie misst, in welchem Ausmaß
Menschen mit niedrigem SES mit Personen mit hohem SES vernetzt sind.
Konkret wird der doppelte Anteil von Hoch-SES-Freundschaften unter
Low-SES-Personen berechnet und über alle Low-SES-Personen im County
gemittelt. Zum Schutz der Privatsphäre wurde den Daten ein statistisches
Rauschen hinzugefügt.
Die Variable exposure_grp_mem_county erfasst die
durchschnittliche Exposition von Personen mit niedrigem SES gegenüber
Hoch-SES-Personen innerhalb sozialer Gruppen. Dies wird ebenfalls durch
den doppelten Anteil von Hoch-SES-Mitgliedern in den Gruppen von
Low-SES-Nutzern bestimmt. Die Gruppenzuordnung erfolgt basierend auf
Facebook-Daten, wie in Chetty et al. (2022b) beschrieben. Diese Kennzahl
gibt Aufschluss darüber, wie durchmischt soziale Gruppen in Bezug auf
den sozioökonomischen Status sind.
Die Variable bias_grp_mem_county misst die Verzerrung in
der sozialen Vernetzung. Sie zeigt, inwiefern sich tatsächliche
Freundschaftsverbindungen von der bloßen Exposition gegenüber
Hoch-SES-Personen unterscheiden. Ein höherer Wert deutet darauf hin,
dass trotz hoher Exposition nur wenige tatsächliche Verbindungen zu
Hoch-SES-Personen bestehen, was auf soziale Segregation hindeutet.
Abschließend enthält die Variable pop2018 die
Gesamtbevölkerung des Countys im Jahr 2018. Diese Zahl stammt aus
öffentlich zugänglichen Daten des US Census Bureau (American Community
Survey) und wurde unabhängig von den Facebook-Daten erhoben.
Insgesamt liefern diese Variablen wertvolle Einblicke in die soziale Vernetzung.
Was ist eine Beobachtung?
In diesem Datensatz entspricht eine Beobachtung einem County in den USA. Jede Zeile im Datensatz stellt demnach die sozialen Netzwerkdaten und Bevölkerungsinformationen für genau ein County dar. Die Spalten enthalten verschiedene Kennzahlen, wie z.B. die ökonomische Verbundenheit, Exposition gegenüber Hoch-SES-Personen und die Bevölkerungsgröße.
Wie viele Counties sind in diesem Datensatz vorhanden?
| Anzahl der Counties im Datensatz |
|---|
| 3089 |
In diesem Datensatz sind 3089 Counties gegeben.
Wie viele Counties hat die USA?
Laut der offiziellen Website des U.S. Census Bureau (https://www.census.gov/newsroom/press-releases/2024/population-estimates-more-counties-population-gains-2023.html#) hat die USA 3.144 Counties.
| Anzahl der beobachteten Counties im Vergleich zur Gesamtanzahl in %: |
|---|
| 98.25 |
In unserem Datensatz sind 98,25% aller Counties gegeben.
In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?
| Fälle mit Informationen zu allen Variablen in %: |
|---|
| 95.14 |
In 95.14% der Fälle sind Informationen zu allen Variabelen einer Beobachtung gegeben.
2. Weiterhin haben wir Ihnen den Datensatz
county_covariates.dta im Unterordner “Daten”
bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält
und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R
ein und nennen Sie ihn covariates.
Schränken Sie diesen Datensatz auf die folgenden Variablen ein:
- county
- kfr_pooled_pooled_p25
- gini99_simple
Generieren Sie eine neue Variable
upward_mobility als
kfr_pooled_pooled_p25*100.
Löschen Sie weiterhin die Variable
kfr_pooled_pooled_p25.
Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.
Hinweis: Mit dem haven Paket können Sie .dta
Dateien einlesen
Beschreibung der Variablen:
Der Datensatz enthält mehrere Variablen, die wichtige Informationen
zur sozialen und ökonomischen Struktur in den US-Countys liefern. Eine
der Variablen ist der county-Code, der den 5-stelligen
County FIPS-Code darstellt. Dieser Code ist eine standardisierte
Kennung, die verwendet wird, um Countys in den USA eindeutig zu
identifizieren. Der FIPS-Code ermöglicht es, Counties in verschiedenen
Datensätzen und Quellen miteinander zu vergleichen und sie geographisch
korrekt zuzuordnen.
Eine weitere wichtige Variable im Datensatz ist
gini99_simple, die den Gini-Koeffizienten für das Jahr 1999
darstellt. Dieser wurde unter Verwendung von Steuerdaten berechnet und
um den Einkommensanteil der obersten 1% der Einkommensverteilung
bereinigt. Der Gini-Koeffizient ist ein Maß für die
Einkommensungleichheit innerhalb eines Countys: Ein Wert von 0 deutet
auf vollständige Einkommensgleichheit hin, während ein Wert von 1 eine
maximale Einkommensungleichheit anzeigt.
Die dritte Variable ist die upward_mobility, die die
Aufwärtsmobilität misst. Diese Variable wird berechnet, indem das
‘kfr_pooled_pooled_p25’ - Maß mit 100 multipliziert wird. Das
‘kfr_pooled_pooled_p25’ misst das mittlere Einkommenspercentil im
Erwachsenenalter für Kinder, die von Eltern stammen, die im 25.
Einkommenspercentil der Verteilung angesiedelt sind. Mit anderen Worten,
diese Variable zeigt, inwieweit Kinder aus einkommensschwachen Familien
im Vergleich zu ihren Eltern im Erwachsenenalter sozial und ökonomisch
aufsteigen. Die upward_mobility stellt somit einen
wichtigen Indikator für die soziale Mobilität und die Chancen auf
ökonomischen Aufstieg dar.
3. Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.
Lesen sie die Daten County_census_data.shp in R
ein und speichern diesen in R als county_census_shape
ab. Neben den County Namen und und Polygonen enthält dieser
Datensatz auch das geschätzte Median Einkommen pro County für das Jahr
2023 (medincE).
Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren
4. Verbinden Sie die Dataframes
county_census_shape, covariates und
social_capital_county zu einem Datensatz
analysis_data.
- Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
- Welcher Datensatz sollte der Hauptdatensatz sein? Warum?
Wir verwenden hier einen left Join, um sicherzustellen, dass alle Einträge des Dataframes census_county_shape im finalen Datensatz vorhanden sind, Einträge aus covariates und social_capital_county werden nur dann hinzugefügt, wenn ein passender county_id-Eintrag vorhanden ist. county_census_shape ist der Hauptdatensatz, weil er die Grundstruktur der Counties enthält. Der Left Join stellt sicher, dass die vollständigen Einträge aus diesem Datensatz erhalten bleiben.
5. Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:
- upward_mobility
- ec_county
- exposure_gpr_mem_county
- bias_grp_mem_county
Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:
- Was genau misst die wirtschaftliche Mobilität
(
upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen. - Bitte schauen Sie sich an, wie die sozialen Vernetzung
(
ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
Hinweis: Die genaue Berechnung der sozialen Vernetzung
(ec_county) finden Sie im Dokument
“social_capital_codebook.pdf”
Die Variable upward_mobility misst die
Wahrscheinlichkeit, dass Kinder, die in einkommensschwachen Haushalten
(im 25. Einkommenspercentil) aufwachsen, im Erwachsenenalter sozial und
ökonomisch aufsteigen. Ein hoher Wert deutet darauf hin, dass in dieser
Region eine höhere Wahrscheinlichkeit besteht, dass Kinder aus ärmeren
Familien bessere Einkommenspositionen im Erwachsenenalter erreichen.
Soziale Vernetzung: ec_county
Die Variable ec_county misst die ökonomische
Verbundenheit innerhalb eines Countys, insbesondere die Stärke der
Verbindungen zwischen Menschen mit niedrigem sozioökonomischen Status
(SES) und Menschen mit hohem SES. Es geht dabei konkret um die Anzahl
und Stärke von Freundschaften, die Menschen mit unterschiedlichem
wirtschaftlichen Hintergrund zueinander haben.
Warum sollte soziale Vernetzung zu wirtschaftlicher Mobilität führen?
Ein hoher Wert der sozialen Vernetzung (ec_county)
könnte zu höherer wirtschaftlicher Mobilität
(upward_mobility) führen, weil:
Soziales Kapital:
Soziale Netzwerke bieten Zugang zu Informationen, Ressourcen und
Gelegenheiten. Menschen mit niedrigem SES, die in Netzwerke mit Personen
höherer SES eingebunden sind, können wertvolle Informationen und
Unterstützung erhalten, z.B. in Bezug auf Bildung, Jobs, Karrieretipps
oder finanzielle Beratung. Annahme: Personen mit breiteren Netzwerken
(einschließlich hoch-SES-Freundschaften) haben Zugang zu mehr
wirtschaftlichen Ressourcen und sozialen Aufstiegsmöglichkeiten.
Mentoring und Rollenvorbilder:
Menschen, die engen Kontakt zu Personen mit hohem SES haben, sehen
möglicherweise Rollenvorbilder, die zu höheren Bildungsabschlüssen und
besseren Jobs führen. Diese Art von Einfluss kann besonders stark auf
die Kinder aus einkommensschwachen Haushalten wirken. Annahme: Durch den
Zugang zu positiven Rollenvorbildern und Mentoring erfahren Kinder aus
armen Familien, welche Schritte notwendig sind, um wirtschaftlich
aufzusteigen. Netzwerk-Effekte bei Jobmöglichkeiten: Menschen mit hohem
SES haben oft Zugang zu besseren Jobmöglichkeiten. Verbindungen zu
diesen Menschen können zu Empfehlungen und Zugängen zu besser bezahlten
Arbeitsplätzen führen. Annahme: Soziale Vernetzung bietet Zugang zu
hochwertigen beruflichen Möglichkeiten, die direkt zu höheren Einkommen
führen können.
Berechnung der sozialen Vernetzung (ec_county):
Die soziale Vernetzung (ec_county) wird als Anteil der
Freundschaften zwischen Personen mit niedrigem SES und Personen mit
hohem SES im County gemessen. Sie stellt die ökonomische Integration
durch Freundschaften dar. Exposition:
exposure_gpr_mem_county
Die Exposition misst, wie häufig Personen mit niedrigem SES
Personen mit hohem SES begegnen, insbesondere in sozialen Gruppen oder
Umfeldern. Es geht darum, inwieweit Menschen unterschiedlichen SES in
ihrem Alltag (z.B. Schulen, Arbeitsplätze) ausgesetzt sind, unabhängig
davon, ob diese Begegnungen tatsächlich zu Freundschaften führen.
Freundschafts-Bias: bias_grp_mem_county
Der Freundschafts-Bias misst, inwieweit sich Menschen mit niedrigem SES trotz hoher Exposition gegenüber Personen mit hohem SES dazu entscheiden, Freundschaften innerhalb ihres eigenen SES zu knüpfen. Ein hoher Bias-Wert bedeutet, dass trotz der Möglichkeit, Verbindungen mit Personen aus einem höheren SES zu knüpfen, solche Freundschaften nicht gebildet werden. Erwartungen zum Zusammenhang
Einfluss der Exposition auf die soziale Vernetzung:
Eine hohe Exposition gegenüber Menschen mit hohem SES sollte theoretisch zu einer höheren sozialen Vernetzung führen, da Menschen mit niedrigem SES öfter die Möglichkeit haben, Freundschaften mit Menschen aus wohlhabenderen Schichten zu bilden. Annahme: Je häufiger Menschen mit niedrigem SES Menschen mit hohem SES begegnen, desto höher ist die Wahrscheinlichkeit, dass Freundschaften entstehen und damit die soziale Vernetzung verbessert wird.
Einfluss des Freundschafts-Bias auf die soziale Vernetzung:
Ein hoher Freundschafts-Bias deutet darauf hin, dass Menschen mit niedrigem SES trotz der Möglichkeit, Freundschaften mit Menschen mit hohem SES zu knüpfen, dazu neigen, in ihren eigenen sozialen Schichten zu bleiben. Dies sollte zu einer geringeren sozialen Vernetzung führen, da weniger intersoziale Freundschaften gebildet werden. Annahme: Ein höherer Freundschafts-Bias reduziert die soziale Vernetzung, da Personen in ihrer eigenen sozioökonomischen Schicht verbleiben und weniger Verbindungen zu Menschen aus anderen Schichten eingehen.
Deskriptive Analysen
Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.
6. Schauen Sie sich in einem ersten Schritt an, wie die
Variablen im Datensatz analysis_data über alle Counties
verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche
Informationen zu allen numerischen Variablen in ihrem Datensatz
darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median,
das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das
75%- Quantil bezogen auf alle Counties.
Beschreiben und interpretieren Sie Ihre Tabelle.
Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?
Hinweis: Achten Sie auf eine schöne Darstellung ihrer
Tabelle mittels der Pakete kableExtra oder
gt!
| Variable | Mittelwert | Standardabweichung | Minimum | 25%-Quantil | Median | 75%-Quantil | Maximum |
|---|---|---|---|---|---|---|---|
| Economic Connectedness Index | 0.814 | 0.177 | 0.295 | 0.695 | 0.807 | 0.935 | 1.360 |
| Exposition | 0.906 | 0.212 | 0.255 | 0.765 | 0.905 | 1.052 | 1.486 |
| Wirtschaftliche Mobilität | 42.719 | 6.491 | 12.217 | 38.431 | 41.956 | 46.106 | 68.828 |
| Median Haushaltseinkommen | 65,046.649 | 18,388.683 | 16,170.000 | 54,113.250 | 63,161.500 | 73,216.250 | 178,707.000 |
| Bevölkerung 2018 | 107,129.871 | 337,331.878 | 544.000 | 12,618.750 | 27,837.500 | 71,974.500 | 10,098,052.000 |
| Freundschafts-Bias | 0.064 | 0.051 | -0.108 | 0.031 | 0.064 | 0.095 | 0.335 |
| Einkommensungleichheit (Gini) | 0.288 | 0.062 | -0.056 | 0.244 | 0.286 | 0.328 | 0.573 |
Die oben generierte Tabelle zeigt die statistische Kennzahlen für die numerischen Variablen im Datensatz analysis_data. Diese Kennzahlen umfassen Mittelwert, Median, Minimum, Maximum, Standardabweichung, sowie das Obere(75%) und Untere(25%) Quantil. Die Analyse der Variablen lautet wie folgt:
Economic Connectedness Index:
Der Mittelwert des Economic Connectedness Index beträgt 0.814 und liegt nahe am Median von 0.807, was auf eine relativ symmetrische Verteilung hinweist. Die Werte reichen von 0.295 bis 1.360, was deutliche Unterschiede in der sozialen Vernetzung zwischen den Counties zeigt. Eine Standardabweichung von 0.177 verdeutlicht eine moderate Streuung, was auf regionale Unterschiede in der Stärke der sozialen Vernetzung hinweist. Die Quartilswerte (0.695 und 0.935) bestätigen, dass der Großteil der Counties ähnliche Werte aufweist, aber einige Ausnahmen existieren.
Exposition:
Mit einem Mittelwert von 0.906 und einem Median von 0.905 weist die Exposition eine symmetrische Verteilung auf. Die Werte variieren von 0.255 bis 1.486, was auf erhebliche Unterschiede in der sozialen Durchmischung zwischen den Counties hinweist. Die Standardabweichung von 0.212 deutet auf eine moderate Streuung hin, wobei die Quartilswerte (0.765 und 1.052) die Variabilität in den mittleren 50% der Counties beschreiben.
Wirtschaftliche Mobilität:
Die wirtschaftliche Mobilität zeigt einen Mittelwert von 42.719 und einen Median von 41.956, was auf eine annähernd normale Verteilung hindeutet. Die Werte reichen von 12.217 bis 68.828, wobei die Standardabweichung von 6.491 auf erhebliche regionale Unterschiede hinweist. Die Quartilswerte (38.431 und 46.106) verdeutlichen, dass sich die wirtschaftliche Mobilität der meisten Counties in einem engen Bereich befindet.
Median Haushaltseinkommen:
Das Median Haushaltseinkommen hat einen Mittelwert von 65,046.649 und einen Median von 63,161.500, was eine leichte Linksschiefe in der Verteilung andeutet. Die Werte reichen von 16,170.000 bis 178,707.000, was auf enorme Einkommensunterschiede zwischen den Counties hinweist. Die Standardabweichung von 18,388.683 verdeutlicht eine hohe Variabilität, wobei die Quartilswerte (54,113.250 und 73,216.250) die mittlere Verteilung der Daten beschreiben.
Bevölkerung 2018:
Die Bevölkerung hat einen Mittelwert von 107,129.871, der deutlich über dem Median von 27,837.500 liegt. Dies deutet auf eine rechtsschiefe Verteilung hin, wobei der Maximalwert von 10,098,052,000 weit vom Minimalwert (544.000) entfernt ist. Die Standardabweichung von 337,331,878 bestätigt die enormen Unterschiede zwischen großen und kleinen Counties. Die Quartilswerte (12,618.750 und 71,974.500) verdeutlichen, dass die meisten Counties eine kleinere Bevölkerung aufweisen, während einige wenige sehr groß sind.
Freundschafts-Bias:
Der Mittelwert und Median des Freundschafts-Bias sind identisch (0.064), was auf eine symmetrische Verteilung hinweist. Die Werte reichen von -0.108 bis 0.335, wobei die Standardabweichung mit 0.051 relativ gering ist. Die Quartilswerte (0.031 und 0.095) zeigen, dass sich der Großteil der Werte in einem engen Bereich befindet, was auf geringe Unterschiede zwischen den Counties hinweist.
Einkommensungleichheit (Gini):
Die Einkommensungleichheit weist einen Mittelwert von 0.288 und einen Median von 0.286 auf, was eine symmetrische Verteilung andeutet. Die Werte liegen zwischen -0.056 und 0.573. Die Standardabweichung von 0.062 deutet auf eine relativ geringe Streuung hin. Die Quartilswerte (0.244 und 0.328) zeigen, dass sich die meisten Counties in einem moderaten Bereich befinden.
Auffälligkeiten und Ausreißer:
Einige Variablen weisen klare Ausreißer und Auffälligkeiten auf. Insbesondere die Bevölkerung 2018 zeigt extreme Werte, da der Maximalwert weit über dem Median und 75%-Quantil liegt, was auf einige wenige sehr bevölkerungsreiche Counties hinweist. Ebenso zeigt das Median Haushaltseinkommen große Unterschiede zwischen den Counties, mit einem Maximalwert von 178,707.000, der die übrigen Werte weit überragt. Der Economic Connectedness Index und die Exposition haben ebenfalls ungewöhnlich hohe Maximalwerte, die als Ausreißer betrachtet werden könnten. Ein negativer Wert in der Einkommensungleichheit (Gini) ist auffällig und deutet auf mögliche Fehler in den Daten hin. Die wirtschaftliche Mobilität zeigt eine relativ große Streuung, wobei jedoch keine extremen Ausreißer erkennbar sind.
Soziale Vernetzung und wirtschaftliche Mobilität
Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild
über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre
Analyse näheres über die soziale Vernetzung lernen, den Economic
Connectedness Index (ec_county), welcher aus den Facebook
Freundschaften generiert wurde. Die Daten des Economic Connectedness
Index wurden auf County Ebene aggregiert, beruhen jedoch auf
Freundschaftsdaten von individuellen Facebook Nutzern.
7. Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.
Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:
Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?
Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt
sich das tigris
Paket und der Befehl shift_geometry() um Alaska, Hawaii
und Puerto Rico schön darstellen zu lassen.
## | | | 0% | | | 1% | |= | 1% | |= | 2% | |== | 2% | |== | 3% | |=== | 4% | |=== | 5% | |==== | 5% | |==== | 6% | |===== | 7% | |===== | 8% | |====== | 8% | |====== | 9% | |======= | 10% | |======== | 11% | |======== | 12% | |========= | 12% | |========= | 13% | |========= | 14% | |========== | 14% | |========== | 15% | |=========== | 15% | |=========== | 16% | |============ | 17% | |============ | 18% | |============= | 18% | |============= | 19% | |============== | 19% | |============== | 20% | |============== | 21% | |=============== | 21% | |=============== | 22% | |================ | 22% | |================ | 23% | |================= | 24% | |================= | 25% | |================== | 26% | |=================== | 27% | |=================== | 28% | |==================== | 28% | |==================== | 29% | |===================== | 30% | |====================== | 31% | |====================== | 32% | |======================= | 33% | |======================== | 34% | |======================== | 35% | |========================= | 35% | |========================= | 36% | |========================== | 37% | |=========================== | 39% | |============================ | 40% | |============================= | 41% | |============================= | 42% | |============================== | 42% | |============================== | 43% | |=============================== | 44% | |================================ | 45% | |================================ | 46% | |================================= | 47% | |================================= | 48% | |================================== | 48% | |=================================== | 49% | |=================================== | 51% | |==================================== | 51% | |==================================== | 52% | |===================================== | 53% | |====================================== | 54% | |====================================== | 55% | |======================================= | 56% | |======================================== | 56% | |======================================== | 57% | |========================================= | 58% | |========================================= | 59% | |========================================== | 60% | |=========================================== | 61% | |=========================================== | 62% | |============================================ | 63% | |============================================= | 64% | |============================================== | 65% | |============================================== | 66% | |=============================================== | 67% | |================================================= | 69% | |================================================= | 70% | |================================================= | 71% | |================================================== | 72% | |=================================================== | 73% | |==================================================== | 75% | |===================================================== | 76% | |====================================================== | 78% | |======================================================= | 79% | |======================================================== | 80% | |========================================================= | 82% | |=========================================================== | 84% | |============================================================ | 85% | |============================================================ | 86% | |============================================================= | 87% | |============================================================== | 89% | |=============================================================== | 90% | |=============================================================== | 91% | |================================================================= | 92% | |================================================================== | 94% | |================================================================== | 95% | |=================================================================== | 96% | |==================================================================== | 97% | |==================================================================== | 98% | |===================================================================== | 99% | |======================================================================| 100%
Die Karte zeigt den Economic Connectedness Index für jedes County in den USA, wobei die Farben von grün (niedrige Werte) bis rot (hohe Werte) reichen.
Gelb: Diese Regionen weisen wahrscheinlich eine geringe soziale Vernetzung zwischen den sozioökonomischen Schichten auf. Es könnte also sein, dass die Bewohner sozial isolierter leben und weniger Zugang zu unterschiedlichen sozialen Netzwerken haben, was sich negativ auf die Chancen für wirtschaftliche Mobilität auswirken könnte.
Rot: Diese Regionen sind besser vernetzt, was bedeutet, dass Menschen aus verschiedenen sozioökonomischen Schichten besser miteinander in Kontakt treten können. Dies könnte den Austausch von Informationen und Ressourcen begünstigen und so die Aufstiegschancen für Menschen mit niedrigerem sozioökonomischen Status erhöhen.
Graubereiche: Diese Regionen stellen Gebiete dar, für die keine Daten zum Economic Connectedness Index vorliegen. Mögliche Gründe könnten das Fehlen ausreichender Datenquellen oder eine zu geringe Anzahl an Beobachtungen sein.
Annahmen für gültige Aussagen:
Kausalität zwischen ECI und wirtschaftlicher
Mobilität:
Um gültige Aussagen darüber zu treffen, wie der Economic Connectedness
Index die wirtschaftliche Mobilität beeinflusst, müssen wir
sicherstellen, dass die Annahme der Kausalität zutrifft. Es ist wichtig
zu berücksichtigen, dass eine starke soziale Vernetzung in einer Region
nicht zwangsläufig zu mehr wirtschaftlicher Mobilität führt. Es könnte
auch umgekehrt sein, dass Regionen mit höherer wirtschaftlicher
Mobilität bessere Bedingungen für starke Netzwerke schaffen.
Soziale Netzwerke und ihre Wirkung auf Freundschaften:
Wir müssen annehmen, dass der ECI auch tatsächlich die Qualität der
sozialen Beziehungen widerspiegelt und nicht nur die Quantität, um etwas
über die Freundschaftsnetzwerke aussagen zu können. Der ECI basiert auf
Facebook-Freundschaften, die möglicherweise nicht die gleichen
Freundschaften widerspiegeln, die in der realen Welt für wirtschaftliche
Mobilität und sozialen Aufstieg entscheidend sind. Es könnte auch sein,
dass online Freundschaften nicht die gleiche Stärke oder Relevanz wie
offline Freundschaften haben.
Berücksichtigung anderer Faktoren:
Um den Einfluss des ECI auf die wirtschaftliche Mobilität zu verstehen,
müssen auch andere Faktoren wie Bildung, Arbeitsmarktbedingungen,
Politik und regionale Wirtschaftsstrukturen berücksichtigt werden. Der
ECI allein kann keine vollständige Erklärung für wirtschaftliche
Aufstiegsmöglichkeiten liefern.
Zugang zu Ressourcen:
Ein weiteres wichtiges Element ist der Zugang zu Ressourcen in gut
vernetzten Regionen. Starke Netzwerke könnten in bestimmten Regionen den
Zugang zu Arbeitsplätzen, Bildung und anderen wichtigen wirtschaftlichen
Ressourcen verbessern. Dies könnte die Aufstiegschancen in diesen
Regionen erhöhen und somit die wirtschaftliche Mobilität
begünstigen.
8. Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.
Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:
- Median Haushaltseinkommen in dem County (
medincE) - Wirtschaftliche Mobilität in dem County
(
upward_mobility) - Einkommensungleichheit in dem County (gemessen mit dem
Gini-Koeffizient des Counties) (
gini99_simple)
Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.
Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:
- Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.
| County | Economic Connectedness Index | Median Haushaltseinkommen | Wirtschaftliche Mobilität | Gini-Koeffizient |
|---|---|---|---|---|
| Highest EC | ||||
| Rockingham County, New Hampshire | 1.35970 | 113927 | 45.314 | 0.225 |
| Douglas County, Colorado | 1.35327 | 145737 | 48.243 | 0.116 |
| San Francisco County, California | 1.31244 | 141446 | 50.389 | 0.310 |
| Morgan County, Utah | 1.29125 | 126092 | 54.124 | 0.154 |
| Madison County, Idaho | 1.28088 | 58259 | 51.537 | 0.224 |
| Arlington County, Virginia | 1.27232 | 140160 | 46.281 | 0.387 |
| Sussex County, New Jersey | 1.25775 | 114316 | 47.040 | 0.183 |
| Wright County, Minnesota | 1.25228 | 106666 | 49.544 | 0.184 |
| Gunnison County, Colorado | 1.24836 | 77358 | 48.711 | 0.347 |
| Pitkin County, Colorado | 1.24364 | 100318 | 45.834 | -0.010 |
| Lowest EC | ||||
| Scotland County, North Carolina | 0.39580 | 43500 | 31.079 | 0.387 |
| Crisp County, Georgia | 0.38777 | 42745 | 32.888 | 0.424 |
| Marlboro County, South Carolina | 0.38475 | 36293 | 32.818 | 0.307 |
| Early County, Georgia | 0.37960 | 53750 | 33.828 | 0.456 |
| Robeson County, North Carolina | 0.36258 | 40318 | 32.095 | 0.362 |
| Allendale County, South Carolina | 0.36095 | 31603 | 31.404 | 0.332 |
| Bullock County, Alabama | 0.35515 | 36723 | 34.566 | 0.315 |
| Terrell County, Georgia | 0.34741 | 43812 | 31.165 | 0.364 |
| Oglala Lakota County, South Dakota | 0.33048 | 34769 | 24.840 | NA |
| Todd County, South Dakota | 0.29469 | 39148 | 30.178 | 0.323 |
Die Tabelle zeigt einen Vergleich zwischen den 10 Counties mit dem höchsten und den 10 Counties mit dem niedrigsten Economic Connectedness Index (ECI). Für jedes County werden das Median Haushaltseinkommen, die wirtschaftliche Mobilität und der Gini-Koeffizient dargestellt, gerundet auf drei Stellen nach dem Komma.
Counties mit hohem Economic Connectedness Index (Highest EC):
Median Haushaltseinkommen:
Die Counties mit einem hohen ECI haben tendenziell ein hohes
Median-Haushaltseinkommen. Der höchste Wert (Douglas County, Colorado)
liegt bei über 145.000 USD, was darauf hindeutet, dass diese Regionen
eine wohlhabendere Bevölkerung haben.
Wirtschaftliche Mobilität:
Auch die wirtschaftliche Mobilität ist in diesen Regionen relativ hoch,
was sich in den Werten der Variablen „upward_mobility“ widerspiegelt.
Diese Werte liegen überwiegend zwischen 45 und 54, was auf ein hohes
Potenzial für wirtschaftlichen Aufstieg hinweist.
Gini-Koeffizient:
Die Einkommensungleichheit in diesen Counties zeigt einen interessanten
Trend. Obwohl die meisten Counties mit hohem ECI eine moderate
Einkommensungleichheit aufweisen (Gini-Koeffizient zwischen 0,1 und
0,3), gibt es auch einige Ausreißer wie Arlington County, Virginia, mit
einem höheren Gini-Wert (0,387), was eine größere Einkommensungleichheit
bedeutet. Es gibt jedoch auch ein County wie Pitkin County, Colorado,
das einen Gini-Koeffizienten von -0,01 hat, was möglicherweise auf
ungewöhnliche Daten oder eine sehr homogene Gesellschaft hinweist.
Counties mit niedrigem Economic Connectedness Index (Lowest EC):
Median Haushaltseinkommen:
In den Counties mit niedrigem ECI sind die Median-Haushaltseinkommen
deutlich niedriger, mit Werten, die häufig unter 50.000 USD liegen. Das
deutet darauf hin, dass diese Regionen eine ärmere Bevölkerung
haben.
Wirtschaftliche Mobilität:
Die wirtschaftliche Mobilität in diesen Counties ist ebenfalls gering,
mit Werten der „upward_mobility“-Variablen, die größtenteils unter 35
liegen. Diese Werte deuten darauf hin, dass die Chancen für den sozialen
Aufstieg in diesen Regionen relativ begrenzt sind.
Gini-Koeffizient:
Die Einkommensungleichheit ist in diesen Counties oft höher, mit vielen
Gini-Werten über 0,3. Das bedeutet, dass es eine größere
Einkommensungleichheit in den weniger gut vernetzten Regionen gibt, was
potenziell die Chancen für wirtschaftliche Mobilität beeinträchtigen
könnte.
Interpretation der Unterschiede:
Erwartete Unterschiede:
Ja, die Unterschiede in den Variablen zwischen den Counties mit hohem
und niedrigem ECI entsprechen weitgehend den Erwartungen. In Regionen
mit höherer sozialer Vernetzung (also höherem ECI) gibt es tendenziell
auch höhere Median-Haushaltseinkommen und bessere Chancen auf
wirtschaftliche Mobilität. Dies könnte darauf hinweisen, dass eine
starke soziale Vernetzung den Austausch von Informationen und Ressourcen
fördert, was für den wirtschaftlichen Aufstieg vorteilhaft ist.
Gini-Koeffizient:
Es ist jedoch interessant zu bemerken, dass es auch in den hoch
vernetzten Counties eine gewisse Einkommensungleichheit gibt. Der
Gini-Koeffizient ist in einigen der hoch vernetzten Counties relativ
hoch, was darauf hindeutet, dass auch in gut vernetzten Regionen
Einkommensungleichheit existieren kann, aber die sozialen Netzwerke
könnten dennoch positive Auswirkungen auf die wirtschaftliche Mobilität
haben. Umgekehrt sind die schlecht vernetzten Counties (niedriger ECI)
auch durch höhere Einkommensungleichheit und niedrigere wirtschaftliche
Mobilität gekennzeichnet.
Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?
9. In dieser Aufgabe sollten Sie eine Punktdiagramm
(Scatter-Plot) erstellen, welches die wirtschaftliche Mobilität
(upward_mobility) gegenüber dem Economic Connectedness
Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret
sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im
Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der
zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die
Punktewolke.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
- In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?
Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen
Interpretation und Beschreibung:
Das Diagramm zeigt einen deutlichen positiven Zusammenhang zwischen dem Economic Connectedness Index (ECI) und der wirtschaftlichen Mobilität (upward_mobility). Die Punkte im Streudiagramm repräsentieren einzelne Counties, und die eingezeichnete Regressionsgerade verdeutlicht, dass mit steigender ökonomischer Verbundenheit auch die Wahrscheinlichkeit zunimmt, dass Personen aus einkommensschwachen Haushalten sozial und wirtschaftlich aufsteigen. Der Korrelationskoeffizient von 0.72, der in der Grafik angegeben ist, weist auf eine starke positive Korrelation zwischen diesen beiden Variablen hin, was die Bedeutung dieses Zusammenhangs statistisch untermauert.
Diese Beobachtungen stimmen mit den theoretischen Annahmen überein, die in Aufgabe 5 aufgestellt wurden. Es wurde argumentiert, dass eine höhere soziale Vernetzung – insbesondere die Stärke von Verbindungen zwischen Personen mit niedrigem sozioökonomischen Status (SES) und solchen mit hohem SES – die wirtschaftliche Mobilität fördern könnte. Diese sozialen Verbindungen können mehrere Mechanismen in Gang setzen, die für Menschen aus einkommensschwachen Haushalten von Vorteil sind. Erstens bieten soziale Netzwerke soziales Kapital, indem sie den Zugang zu Informationen, Ressourcen und beruflichen Möglichkeiten erweitern. Menschen mit niedrigem SES könnten durch Kontakte zu Personen mit hohem SES beispielsweise von Karrieremöglichkeiten, Jobempfehlungen oder hilfreichen Ratschlägen profitieren. Zweitens können Netzwerke als Plattform für Mentoring und Rollenvorbilder dienen. Kinder aus einkommensschwachen Haushalten könnten durch den Kontakt zu erfolgreichen Vorbildern motiviert werden und besser verstehen, welche Schritte notwendig sind, um wirtschaftlich aufzusteigen. Drittens ermöglichen Netzwerkeffekte eine bessere berufliche Integration, da Personen mit hohem SES oft Zugang zu qualitativ hochwertigeren Arbeitsmöglichkeiten haben. Durch Empfehlungen und Kontakte könnten sie diesen Zugang auch für Menschen mit niedrigerem SES eröffnen. Die starke Korrelation in der Grafik unterstützt diese theoretischen Überlegungen, indem sie zeigt, dass Counties mit einer stärkeren ökonomischen Vernetzung zwischen Menschen unterschiedlicher sozioökonomischer Hintergründe tendenziell höhere Werte für wirtschaftliche Mobilität aufweisen. Gleichzeitig verdeutlichen die Streuung der Datenpunkte und die Abweichungen einzelner Counties von der Regressionsgeraden, dass diese Beziehung nicht deterministisch ist und andere Faktoren ebenfalls eine Rolle spielen könnten.
Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?
Das Punktdiagramm liefert eine solide Grundlage, um diese Frage zu beantworten. Sie zeigt, dass soziale Netzwerke, gemessen am Economic Connectedness Index, einen deutlichen und messbaren Einfluss auf die wirtschaftliche Mobilität haben. Die enge Korrelation zwischen ECI und upward_mobility deutet darauf hin, dass der Grad der sozialen Integration zwischen sozioökonomischen Gruppen ein zentraler Faktor für den sozialen und wirtschaftlichen Aufstieg von Individuen ist. Soziale Netzwerke wirken dabei wie ein Multiplikator von Möglichkeiten, insbesondere für Menschen aus einkommensschwachen Haushalten. Durch Kontakte zu Personen mit höherem SES können sie nicht nur Zugang zu Karrieremöglichkeiten oder Bildungschancen erhalten, sondern auch in ihrer persönlichen und beruflichen Entwicklung gefördert werden. Soziale Netzwerke erleichtern den Austausch von Informationen und Ressourcen und schaffen damit Verbindungen, die wirtschaftliche und soziale Barrieren überwinden können. Trotz dieser klaren Tendenz zeigt die Streuung der Punkte in der Grafik, dass der Economic Connectedness Index allein nicht die gesamte Variation in der wirtschaftlichen Mobilität erklären kann. Dies weist darauf hin, dass auch andere Faktoren die wirtschaftliche Mobilität beeinflussen. Zu diesen könnten unter anderem die Qualität des Bildungssystems, der Zugang zu hochwertiger medizinischer Versorgung, lokale wirtschaftliche Bedingungen oder politische Maßnahmen gehören, die Ungleichheiten abbauen und Chancengleichheit fördern. Insbesondere regionale Unterschiede, wie wirtschaftliche Stärke oder Arbeitsmarktbedingungen, könnten ebenfalls dazu beitragen, die Streuung zu erklären. Zusammenfassend deutet die Grafik darauf hin, dass soziale Netzwerke eine entscheidende Rolle bei der Förderung der wirtschaftlichen Mobilität spielen. Gleichzeitig bleibt offen, wie andere Faktoren diesen Prozess beeinflussen und welche Maßnahmen gezielt eingesetzt werden könnten, um die positive Wirkung sozialer Vernetzung zu maximieren.
10. Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
- Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
- Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index
Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:
- San Francisco County, California
- Arlington County, Virginia
- Morgan County, Utah
- New York County, New York
- Bronx County, New York
Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.
Beschreibung und Interpretation der Diagramme:
Die beiden Punktdiagramme untersuchen die Zusammenhänge zwischen dem Economic Connectedness Index (ECI) und zwei zentralen sozioökonomischen Indikatoren: der Einkommensungleichheit, gemessen durch den Gini-Koeffizienten, sowie dem Median-Haushaltseinkommen. Die Betrachtung konzentriert sich dabei auf die 500 bevölkerungsreichsten Counties.
Economic Connectedness Index
vs. Einkommensungleichheit:
Das erste Punktdiagramm zeigt einen klaren negativen Zusammenhang
zwischen der Einkommensungleichheit und dem ECI. Regionen mit einer
höheren Einkommensungleichheit weisen tendenziell niedrigere Werte im
Economic Connectedness Index auf. Diese Beziehung wird durch eine
gestrichelte Regressionslinie visualisiert, die den allgemeinen Trend
verdeutlicht.
In der Praxis bedeutet dies, dass soziale und wirtschaftliche Vernetzung in Regionen mit größerer Ungleichheit eingeschränkt ist. Dies lässt sich darauf zurückführen, dass höhere Einkommensunterschiede häufig mit größeren sozialen und wirtschaftlichen Barrieren zwischen verschiedenen Einkommensgruppen einhergehen, was die Bildung von Verbindungen erschwert. Beispiele hierfür können geringere interpersonelle Kontakte zwischen Haushalten mit höherem und niedrigerem Einkommen sein oder verschiedene Zugänge zu sozialen und beruflichen Netzwerken.
Die hervorgehobenen Counties illustrieren diesen Zusammenhang deutlich: Morgan County, Utah, sticht als ein Gebiet mit niedriger Einkommensungleichheit und einem hohen ECI hervor, während Bronx County, New York, das gegenteilige Bild zeigt, mit hoher Ungleichheit und niedrigem ECI. Besonders bemerkenswert ist der Kontrast zwischen Bronx County und New York County (Manhattan). Obwohl beide räumlich nah beieinander liegen, zeigt New York County trotz hoher Einkommensungleichheit einen relativ hohen ECI. Dies deutet darauf hin, dass zusätzliche regionale Faktoren wie wirtschaftliche oder kulturelle Knotenpunkte eine Rolle spielen können, die trotz Ungleichheit Verbindungen fördern.
Economic Connectedness Index
vs. Median-Haushaltseinkommen:
Das zweite Punktdiagramm beleuchtet die Beziehung zwischen dem
Median-Haushaltseinkommen und dem Economic Connectedness Index. Hier
zeigt sich ein positiver Zusammenhang: Höhere Median-Haushaltseinkommen
gehen mit einem höheren ECI einher. Die positive Korrelation deutet
darauf hin, dass wirtschaftlicher Wohlstand in einer Region bessere
Voraussetzungen für soziale und wirtschaftliche Vernetzung schafft. Ein
höheres Median-Einkommen könnte ein Indikator für besseren Zugang zu
Bildung, beruflichen Netzwerken und Ressourcen sein, die die Interaktion
und den Austausch zwischen verschiedenen sozialen Gruppen fördern.
Hervorgehobene Counties wie San Francisco County, Kalifornien, und Arlington County, Virginia, zeigen diesen Trend klar auf. Bronx County, New York, repräsentiert hingegen den gegenteiligen Fall mit niedrigem Einkommen und niedrigem ECI. Auch hier gibt es bemerkenswerte Ausnahmen: Morgan County, Utah, weist trotz eines nur moderat hohen Einkommensniveaus einen sehr hohen ECI auf. Dies könnte auf besondere lokale Bedingungen wie starken sozialen Zusammenhalt oder regional ausgeprägte Netzwerke zurückzuführen sein, die die Vernetzung in der Region fördern.
Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
Economic Connectedness Index
vs. Einkommensungleichheit:
Der negative Zusammenhang zwischen der Einkommensungleichheit und dem
Economic Connectedness Index entspricht den Erwartungen, dass höhere
Einkommensungleichheit den Aufbau von sozialen und wirtschaftlichen
Verbindungen erschwert. Regionen mit größerer Ungleichheit stehen vor
sozialen Barrieren, die oft durch eine Fragmentierung zwischen
verschiedenen Einkommensgruppen geprägt sind. Diese Fragmentierung kann
die Möglichkeit reduzieren, dass Menschen aus unterschiedlichen
sozioökonomischen Hintergründen miteinander interagieren, was sich
negativ auf die Vernetzung auswirkt. Der klare Unterschied zwischen
Bronx County und New York County unterstützt diese Annahme, während
Manhattan als Ausnahme die Bedeutung zusätzlicher Faktoren wie
kultureller und wirtschaftlicher Zentren verdeutlicht.
Economic Connectedness Index
vs. Median-Haushaltseinkommen:
Der positive Zusammenhang zwischen dem Median-Haushaltseinkommen und dem
Economic Connectedness Index bestätigt die Annahme, dass
wirtschaftlicher Wohlstand eine wichtige Grundlage für stärkere soziale
und wirtschaftliche Vernetzungen darstellt. Ein höheres Median-Einkommen
korreliert oft mit besseren Möglichkeiten für Bildung und berufliche
Netzwerke, die sich positiv auf die Verbindungen innerhalb und zwischen
sozioökonomischen Gruppen auswirken. Auch hier bestätigen die
beobachteten Daten diesen Zusammenhang. Ausnahmefälle wie Morgan County
verdeutlichen jedoch, dass sozialer Zusammenhalt oder andere lokale
Gegebenheiten ebenfalls einen starken Einfluss auf den ECI haben
können.
Zusammenfassung:
Insgesamt stützen die Ergebnisse aus den Punktdiagrammen die theoretischen Erwartungen aus Aufgabe 5, indem sie die zentralen Hypothesen zu den Beziehungen zwischen Einkommensungleichheit, wirtschaftlichem Wohlstand und sozialer Vernetzung in den untersuchten Regionen bestätigen. Gleichzeitig zeigen die Diagramme die Bedeutung regionaler Besonderheiten und Ausnahmen wie New York County und Morgan County auf, die verdeutlichen, dass zusätzliche Faktoren wie soziale Dynamiken und regionale Netzwerke eine Rolle spielen können.
Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.
11. Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
- Economic Connectedness Index (ec_county)
- Wirtschaftliche Mobilität (upward_mobility)
- Median Haushaltseinkommen (medincE)
- Bevölkerung in 2018 (pop2018)
- Einkommensungleichheit (gini99_simple)
- Exposition (exposure_gpr_mem_county)
- Freundschafts-Bias (bias_grp_mem_county)
Beschreiben und interpretieren Sie ihre Korrelationsmatrix.
| Variable | Economic Connectedness Index | Exposition | Wirtschaftliche Mobilität | Median Haushaltseinkommen | Bevölkerung 2018 | Freundschafts-Bias | Einkommensungleichheit (Gini) |
|---|---|---|---|---|---|---|---|
| Economic Connectedness Index | NA | NA | NA | NA | NA | NA | NA |
| Exposition | 0.929 | NA | NA | NA | NA | NA | NA |
| Wirtschaftliche Mobilität | 0.723 | 0.672 | NA | NA | NA | NA | NA |
| Median Haushaltseinkommen | 0.597 | 0.695 | 0.342 | NA | NA | NA | NA |
| Bevölkerung 2018 | 0.008 | 0.079 | -0.075 | 0.288 | NA | NA | NA |
| Freundschafts-Bias | -0.437 | -0.220 | -0.375 | 0.035 | 0.153 | NA | NA |
| Einkommensungleichheit (Gini) | -0.636 | -0.603 | -0.599 | -0.379 | 0.147 | 0.312 | NA |
Die vorliegende Korrelationsmatrix zeigt den Zusammenhang zwischen verschiedenen Variablen. Untersucht werden der ‘Economic Connectedness Index’ (ec_county), die Exposition gegenüber Gruppenmitgliedschaften (exposure_grp_mem_county), die wirtschaftliche Mobilität (upward_mobility), das mediane Haushaltseinkommen (medincE), die Bevölkerung im Jahr 2018 (pop2018), der Freundschafts-Bias (bias_grp_mem_county) sowie die Einkommensungleichheit (gini99_simple). Die Korrelationen zwischen diesen Variablen geben Aufschluss darüber, wie stark und in welche Richtung diese Faktoren miteinander zusammenhängen.
Economic Connectedness Index:
Der Economic Connectedness Index zeigt eine starke positive Korrelation mit der wirtschaftlichen Mobilität (0.723). Dies weist darauf hin, dass Regionen, in denen Menschen besser wirtschaftlich vernetzt sind, auch bessere Bedingungen für wirtschaftlichen Aufstieg bieten. Eine hohe wirtschaftliche Vernetzung fördert den Zugang zu Ressourcen, Wissen und Netzwerken, die entscheidend für individuelle Chancen auf sozialen und ökonomischen Aufstieg sind. Gleichzeitig besteht eine sehr hohe Korrelation (0.929) zwischen dem Economic Connectedness Index und der Exposition, was darauf hindeutet, dass eine stärkere soziale Durchmischung eng mit einer besseren wirtschaftlichen Vernetzung verknüpft ist. Negative Zusammenhänge zeigt der Economic Connectedness Index mit dem Freundschafts-Bias (-0.437) und der Einkommensungleichheit (-0.636). Regionen mit homogeneren sozialen Netzwerken und größerer Einkommensungleichheit weisen tendenziell eine geringere wirtschaftliche Vernetzung auf, was den Zugang zu ökonomischen Möglichkeiten begrenzen könnte.
Exposition:
Die Exposition zeigt eine sehr hohe positive Korrelation (0.929) mit dem Economic Connectedness Index, was die enge Verbindung zwischen sozialer Durchmischung und wirtschaftlicher Vernetzung verdeutlicht. Je stärker Menschen in einer Region mit anderen sozialen und ökonomischen Gruppen in Kontakt treten, desto besser scheint die wirtschaftliche Vernetzung zu sein. Außerdem besteht eine moderate positive Korrelation zwischen Exposition und wirtschaftlicher Mobilität (0.672). Dies deutet darauf hin, dass eine stärkere soziale Durchmischung auch wirtschaftliche Aufstiegschancen begünstigen kann. Die Exposition weist zudem eine positive Verbindung mit dem Median-Haushaltseinkommen (0.695) auf, was darauf hindeutet, dass sozial gemischte Regionen tendenziell wohlhabender sind. Negative Korrelationen bestehen hingegen mit dem Freundschafts-Bias (-0.220) und der Einkommensungleichheit (-0.603). Dies deutet darauf hin, dass sozial isolierte Netzwerke und hohe Einkommensungleichheit tendenziell mit einer geringeren Exposition einhergehen.
Wirtschaftliche Mobilität:
Die wirtschaftliche Mobilität zeigt eine starke positive Korrelation mit dem Economic Connectedness Index (0.723). Dies unterstreicht die Bedeutung wirtschaftlicher Vernetzung für die Chancen, sich wirtschaftlich verbessern zu können. Auch die moderate positive Korrelation mit der Exposition (0.672) deutet darauf hin, dass soziale Durchmischung eine wichtige Rolle für wirtschaftlichen Aufstieg spielt. Die Verbindung mit dem Median-Haushaltseinkommen ist ebenfalls positiv, jedoch schwächer ausgeprägt (0.342). Dies legt nahe, dass ein höheres Haushaltseinkommen in einer Region die wirtschaftliche Mobilität begünstigen kann, jedoch nicht der dominierende Faktor ist. Negative Korrelationen zeigt die wirtschaftliche Mobilität mit dem Freundschafts-Bias (-0.375) und der Einkommensungleichheit (-0.599), was darauf schließen lässt, dass soziale Isolation und hohe Disparitäten hinderlich für wirtschaftlichen Aufstieg sind.
Median-Haushaltseinkommen:
Das Median-Haushaltseinkommen zeigt eine moderate positive Korrelation mit der Exposition (0.695), was darauf hinweist, dass Regionen mit höherem Einkommen sozial vielfältiger sind. Ebenso besteht eine positive, aber schwächere Verbindung mit der wirtschaftlichen Mobilität (0.342), was darauf schließen lässt, dass wohlhabendere Regionen bessere wirtschaftliche Aufstiegschancen bieten können. Eine schwache Korrelation besteht zwischen dem Median-Haushaltseinkommen und der Bevölkerung (0.288). Negative Korrelationen zeigt das Median-Haushaltseinkommen mit dem Freundschafts-Bias (0.035) und der Einkommensungleichheit (-0.379). Dies legt nahe, dass wohlhabendere Regionen tendenziell geringere soziale Isolation und weniger Einkommensungleichheit aufweisen.
Bevölkerung (2018):
Die Bevölkerungsgröße zeigt generell nur schwache Korrelationen mit den anderen Variablen. Die höchste Korrelation besteht zwischen der Bevölkerung und dem Median-Haushaltseinkommen (0.288), was darauf hinweist, dass größere Regionen tendenziell ein höheres Haushaltseinkommen aufweisen. Die Verbindung zur wirtschaftlichen Mobilität (-0.075) und zum Economic Connectedness Index (0.008) ist sehr schwach, was bedeutet, dass die Bevölkerungsgröße nur einen minimalen Einfluss auf wirtschaftliche Vernetzung oder Aufstiegschancen hat. Interessanterweise zeigt die Bevölkerung eine schwache positive Korrelation mit dem Freundschafts-Bias (0.153) und der Einkommensungleichheit (0.147), was darauf hindeuten könnte, dass größere Regionen tendenziell stärker ausgeprägte soziale Isolation und Disparitäten aufweisen.
Freundschafts-Bias:
Der Freundschafts-Bias zeigt eine moderate negative Korrelation mit dem Economic Connectedness Index (-0.437). Dies bedeutet, dass Regionen mit stärker ausgeprägtem Bias (also Freundschaften innerhalb homogener Gruppen) tendenziell eine geringere wirtschaftliche Vernetzung aufweisen. Ähnlich negativ fällt die Korrelation zwischen Freundschafts-Bias und wirtschaftlicher Mobilität (-0.375) aus, was darauf hindeutet, dass soziale Isolation in homogenen Netzwerken die Aufstiegschancen einschränken könnte. Mit der Exposition besteht eine schwache negative Korrelation (-0.220), während die Verbindung zur Einkommensungleichheit mit 0.312 positiv ist. Dies könnte bedeuten, dass Regionen mit stärker ausgeprägtem Freundschafts-Bias tendenziell ungleicher verteilt sind, was wiederum soziale und wirtschaftliche Chancen einschränken könnte.
Einkommensungleichheit (Gini):
Die Einkommensungleichheit zeigt eine moderate negative Korrelation mit dem Economic Connectedness Index (-0.636), was darauf hinweist, dass stärker vernetzte Regionen tendenziell weniger ungleich sind. Ähnliche Zusammenhänge bestehen mit der wirtschaftlichen Mobilität (-0.599) und der Exposition (-0.603). Dies bedeutet, dass soziale und wirtschaftliche Durchmischung sowie wirtschaftliche Vernetzung wichtige Faktoren zur Verringerung von Einkommensungleichheit sind. Das Median-Haushaltseinkommen weist eine schwächere negative Korrelation (-0.379) auf, was andeutet, dass wohlhabendere Regionen tendenziell weniger ungleich sind. Schließlich zeigt die Einkommensungleichheit eine moderate positive Korrelation mit dem Freundschafts-Bias (0.312), was darauf hindeutet, dass soziale Isolation innerhalb homogener Netzwerke zur Verstärkung von Einkommensungleichheiten beitragen kann.
Fazit:
Die Korrelationsmatrix zeigt deutlich, dass wirtschaftliche Vernetzung, soziale Durchmischung und geringe Einkommensungleichheit zentrale Faktoren für wirtschaftliche Mobilität und regionale Wohlstandsverteilung sind. Regionen, die stärker sozial gemischt und wirtschaftlich vernetzt sind, bieten bessere wirtschaftliche Chancen und zeigen geringere soziale und ökonomische Disparitäten. Negative Einflüsse wie soziale Isolation (Freundschafts-Bias) und hohe Einkommensungleichheit wirken hingegen hemmend auf wirtschaftliche Aufstiegschancen und Vernetzung. Die Bevölkerungsgröße spielt in diesen Dynamiken jedoch eine untergeordnete Rolle.
Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?
12. Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.
Beschreibung:
Die vorliegende Grafik zeigt ein Punktediagramm, das den Zusammenhang zwischen dem Median-Haushaltseinkommen in verschiedenen Landkreisen (x-Achse) und dem Economic Connectedness Index (y-Achse) darstellt. Jeder Punkt repräsentiert einen Landkreis. Ziel dieser Darstellung ist es, zu untersuchen, ob der Einfluss der wirtschaftlichen Vernetzung auf die wirtschaftliche Mobilität in Regionen mit unterschiedlichem Einkommensniveau gleich stark ausgeprägt ist.
Interpretation:
Das Diagramm zeigt einen deutlich positiven Zusammenhang zwischen dem Median-Haushaltseinkommen und dem Economic Connectedness Index. Landkreise mit einem höheren Haushaltseinkommen sind tendenziell stärker wirtschaftlich vernetzt. Auffällig ist auch, dass in einkommensstärkeren Regionen (rechte Seite der x-Achse) und bei hoher wirtschaftlicher Vernetzung (obere Seite der y-Achse) die wirtschaftliche Mobilität besonders hoch ist, was sich in der orange-roten Färbung der Punkte widerspiegelt. In einkommensschwachen Regionen (linke Seite der x-Achse) hingegen bleibt die wirtschaftliche Mobilität auch bei besserer wirtschaftlicher Vernetzung meist moderat, was sich durch die grün-gelbe Färbung zeigt.
Diese Beobachtungen deuten darauf hin, dass der Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität nicht für alle Einkommensgruppen gleich stark ist. Während in einkommensstarken Regionen eine hohe wirtschaftliche Vernetzung die wirtschaftliche Mobilität deutlich verbessert, profitieren einkommensschwächere Regionen weniger stark von einer verbesserten Vernetzung. Dies könnte darauf hindeuten, dass wirtschaftliche Vernetzung erst ab einem bestimmten Einkommensniveau ihre volle Wirkung entfalten kann. In sehr einkommensstarken Regionen scheint jedoch der positive Einfluss der Vernetzung ab einem gewissen Punkt abzunehmen, was auf einen abnehmenden Grenznutzen hinweist.
Fazit:
Insgesamt zeigt die Grafik, dass wirtschaftliche Vernetzung ein wichtiger Faktor für wirtschaftliche Mobilität ist, dieser Effekt jedoch stark vom Einkommensniveau einer Region abhängt. Um die wirtschaftliche Mobilität in einkommensschwachen Regionen zu fördern, könnten daher gezielte Maßnahmen zur Stärkung der wirtschaftlichen Vernetzung notwendig sein.
13. Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.
Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:
- Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
- In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
- Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
- Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?
Rückwärtskausalität:
Rückwärtskausalität bedeutet, dass nicht die soziale Vernetzung (Economic Connectedness Index) die wirtschaftliche Mobilität beeinflusst, sondern eben ganz umgekehrt: Menschen mit höherer wirtschaftlicher Mobilität könnten in Netzwerken enden, die einen höheren ECI aufweisen. Reiche Familien könnten beispielsweise leichter Zugang zu besser vernetzten sozialen Gruppen haben, was den Anschein erwecken könnte, dass soziale Vernetzung wirtschaftliche Mobilität verursacht, obwohl der tatsächliche Kausalpfad umgekehrt ist.
Selektionseffekt:
Selektionseffekte könnten den Zusammenhang zwischen ECI und wirtschaftlicher Mobilität ebenfalls verzerren. Menschen oder Familien mit besseren wirtschaftlichen Voraussetzungen könnten selektiv in Netzwerke eintreten, die einen höheren ECI haben. Dieser Prozess könnte die tatsächlichen Effekte der sozialen Vernetzung auf die wirtschaftliche Mobilität verschleiern, da die Netzwerkeffekte selbst nicht der entscheidende Faktor sind, sondern die Selektivität von Menschen, die ohnehin bereits wirtschaftlich besser gestellt sind.
Ausgelassene Variablen:
Ausgelassene Variablen sind andere Faktoren, die sowohl die wirtschaftliche Mobilität als auch den ECI beeinflussen könnten, aber nicht in der Analyse berücksichtigt werden. Beispielsweise könnten Bildung, Familienstruktur oder die geografische Lage sowohl die Vernetzung als auch die wirtschaftliche Mobilität beeinflussen. Wenn solche Variablen nicht berücksichtigt werden, könnte dies zu einem scheinbaren Zusammenhang zwischen ECI und Mobilität führen, obwohl die eigentliche Ursache andere Faktoren sind.
Auf den gegebenben Seiten 115 - 120 von Chetty et al. (2022a) zeigen die Autoren mehrere Argumente auf, die dafür sprechen, dass es sich nicht nur um Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen handelt:
Zusätzliche empirische Evidenz wird aufgezeigt:
Die Autoren verwenden mehrere unterschiedliche Datensätze und Methoden, um die Robustheit ihrer Ergebnisse zu testen. Wenn die Korrelationen nur aufgrund von Selektionseffekten oder ausgelassenen Variablen zustande kämen, würden diese Effekte in verschiedenen Datensätzen nicht konsistent auftreten.
Robustheit der Kontrollvariablen:
In ihrer Analyse kontrollieren die Autoren für eine Vielzahl von Variablen, darunter Einkommen, Bildungsniveau und andere demografische Faktoren, um den Einfluss ausgelassener Variablen zu minimieren.
Außerdem stützen sich die Autoren auf natürliche Experimente, wie z.B. den Einfluss von Zwangsumzügen oder Änderungen in der Nachbarschaftsstruktur, um kausale Schlüsse zu ziehen. Solche natürlichen Experimente mindern das Risiko von Rückwärtskausalität, da sie externe Schocks oder Veränderungen ausnutzen.
Die Argumentation der Autoren erscheint mir glaubwürdig, da sie eine Vielzahl an Methoden und Kontrollmechanismen verwenden, um alternative Erklärungen wie Rückwärtskausalität und ausgelassene Variablen auszuschließen. Die Verwendung von natürlichen Experimenten und die Kontrolle für eine breite Palette von Faktoren sind starke Indikatoren dafür, dass die Effekte, die sie beobachten, tatsächlich kausal sein könnten.
Allerdings könnten einige Bedenken bestehen, insbesondere in Bezug auf die Frage, ob alle relevanten Variablen erfasst wurden. Selbst mit einer umfangreichen Anzahl an Kontrollvariablen besteht immer ein Risiko, dass wichtige Faktoren übersehen wurden, die das Ergebnis verzerren könnten. Ein weiterer möglicher Kritikpunkt könnte sein, dass natürliche Experimente nicht immer perfekt randomisiert sind und andere latente Faktoren den Zusammenhang beeinflussen könnten.
Um sicherzustellen, dass man einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität ideal misst, wären folgende Bedingungen ideal:
Zufällige Zuweisung zu Netzwerken:
Um den Einfluss der Selektion zu vermeiden, sollten Individuen zufällig
sozialen Netzwerken mit unterschiedlichen ECI-Werten zugeordnet werden.
Dies könnte beispielsweise durch gezielte Migrationsprogramme oder
Sozialexperimente geschehen.
Langfristige Längsschnittstudien:
Es sollten langfristige Daten erhoben werden, um den zeitlichen Verlauf
der sozialen Vernetzung und der wirtschaftlichen Mobilität zu messen. So
kann sichergestellt werden, dass die soziale Vernetzung zeitlich der
wirtschaftlichen Mobilität vorausgeht.
Erfassung aller relevanten Variablen:
Es sollte eine umfassende Erfassung von Variablen wie Bildung,
familiärer Hintergrund, Arbeitsmarktbedingungen und regionale
Unterschiede erfolgen, um ausgelassene Variablen zu minimieren.
Exogene Schocks nutzen:
Exogene Schocks, wie z.B. unvorhergesehene politische oder
wirtschaftliche Veränderungen, könnten verwendet werden, um die
Auswirkungen der sozialen Vernetzung auf die Mobilität zu isolieren.
Solche Schocks stellen sicher, dass Veränderungen in der sozialen
Vernetzung unabhängig von der wirtschaftlichen Situation der Individuen
sind.
Mit diesen optimalen Bedingungen wäre es möglich, einen überzeugenden kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität zu identifizieren.
Einflussfaktoren auf die soziale Vernetzung
Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?
14. Ein Treiber der sozialen Vernetzung könnte natürlich eine
hohe Exposition (exposure_grp_mem_county) sein, d.h. wenn
es viele gut verdienende Personen in einem County gibt. Anders herum:
Wenn es in einigen Counties gar keine gut verdienende Personen gibt,
dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus
einem hohen Einkommensdezil zu haben.
Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.
Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?
Die oben generierte Karte stellt die Verteilung der Exposition auf County-Ebene in den USA dar. Sie verwendet eine Farbskala, die von Gelb (niedrige Exposition) bis Rot (hohe Exposition) reicht. Counties mit einer hohen Exposition befinden sich überwiegend in städtischen und wohlhabenderen Regionen, während ländliche, wirtschaftlich schwächere Gebiete tendenziell eine geringere Exposition aufweisen.
Vergleich mit der Karte des Economic Connectedness Index (ECI) (Aufgabe 7):
Hohe Übereinstimmung in urbanen Gebieten:
In urbanen Gebieten wie Kalifornien, der Ostküste (z.B. New York,
Boston), Texas und Teilen des Mittleren Westens sind sowohl die
Exposition als auch der ECI hoch. Dies deutet darauf hin, dass in diesen
Gebieten viele wohlhabende Menschen leben und die soziale Vernetzung
stärker ist, was zu einer höheren wirtschaftlichen Mobilität führt.
Niedrige Werte in ländlichen Gebieten:
In ländlichen Gebieten, insbesondere im Westen (wie Wyoming, Montana)
und in ländlichen Gebieten des Südostens, sind sowohl die Exposition als
auch der ECI niedrig. Dies deutet darauf hin, dass in diesen Regionen
wenige wohlhabende Menschen leben, was die soziale Vernetzung mit
Personen aus höheren Einkommensschichten erschwert und somit die
wirtschaftliche Mobilität geringer sein könnte.
Graue Regionen:
Einige graue Bereiche, in denen keine Daten verfügbar sind, sind sowohl
in der ECI- als auch in der Expositionskarte sichtbar. Diese Bereiche
sind oft weniger bevölkerte, ländliche Regionen oder besondere
Territorien wie Alaska, wo umfassende Daten schwieriger zu erheben
sind.
Positive Korrelation zwischen Exposition und ECI: Es fällt auf, dass Gebiete mit einer höheren Exposition tendenziell auch einen höheren ECI aufweisen. Dies deutet darauf hin, dass in diesen Regionen wohlhabendere Personen häufiger präsent sind und somit mehr Möglichkeiten zur sozialen Vernetzung mit diesen bestehen.
Exposition als Treiber der sozialen Vernetzung:
Die Karte stützt die Annahme, dass eine höhere Exposition mit einem
höheren Maß an sozialer Vernetzung (und folglich höherer
wirtschaftlicher Mobilität) verbunden ist. In Gebieten, in denen die
Exposition niedrig ist, wie in ländlichen Regionen, ist auch der ECI
tendenziell niedriger, was darauf hindeutet, dass eine eingeschränkte
Exposition die wirtschaftliche Mobilität behindern könnte.
Die Annahme, dass die Exposition ein wichtiger Faktor für die soziale Vernetzung und wirtschaftliche Mobilität ist, wird durch den Vergleich der beiden Karten gestützt. Regionen mit hoher Exposition zeigen tendenziell auch eine stärkere soziale Vernetzung (höherer ECI). In ländlichen oder strukturschwachen Regionen, in denen die Exposition gering ist, scheint es auch weniger Möglichkeiten für wirtschaftliche Mobilität durch soziale Vernetzung zu geben.
Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.
15. Um zu untersuchen ob es eine entsprechende Segregation
der Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein
Punktediagramm erzeugen, welche auf der x-Achse die Exposition
(exposure_grp_mem_county) und auf der y-Achse den
Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin
sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke
der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco
County, California” und “Bronx County, New York” in ihr Grafik explizit
heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer
Interpretation auf diese zwei Counties ein.
Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:
- Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?
Die Grafik zeigt den Zusammenhang zwischen “Freundschafts-Bias” (auf der y-Achse) und “Exposition” (auf der x-Achse). Auf beiden Achsen werden Daten auf County-Ebene dargestellt. Zwei Counties, “Bronx County, New York” und “San Francisco County, California”, sind in der Grafik hervorgehoben.
Beschreibung der Achsen:
Exposition:
Diese beschreibt den Anteil an Kontakten, den eine Person zu Menschen
aus verschiedenen sozioökonomischen Gruppen hat. Ein höherer
Expositionswert deutet darauf hin, dass eine Person mit mehr Menschen
aus anderen sozialen Schichten in Kontakt tritt.
Freundschafts-Bias:
Dieser misst, inwieweit sich eine Person in ihrer Freundesgruppe
innerhalb derselben sozioökonomischen Schicht bewegt. Ein höherer
Bias-Wert deutet auf stärkere soziale Homogenität hin, d.h., die
Freundschaften bestehen überwiegend aus Personen der gleichen sozialen
Gruppe.
Interpretation des Diagramms:
Die Punkte zeigen die Counties und es ist eine große Streuung in der Mitte zu erkennen, was auf eine gewisse Variabilität und Flexibilität in der sozialen Vernetzung zwischen den Counties hinweist. Die zwei hervorgehobenen Punkte zeigen spezifische Counties:
Das Bronx County, New York scheint einen moderaten Freundschafts-Bias und eine relativ mittlere Exposition zu haben. Das San Francisco County, California hat eine geringere Exposition und einen leicht erhöhten Freundschafts-Bias.
Einfluss auf die soziale Vernetzung:
Exposition:
Ein höherer Wert für Exposition deutet darauf hin, dass Menschen
häufiger mit Individuen aus verschiedenen sozioökonomischen Gruppen
interagieren, was eine positive Wirkung auf die soziale Vernetzung und
den Economic Connectedness Index haben könnte. Je größer die
Durchmischung, desto mehr Chancen entstehen für Vernetzung zwischen
verschiedenen sozialen Schichten.
Freundschafts-Bias:
Ein höherer Freundschafts-Bias kann die soziale Vernetzung einschränken,
da Menschen eher dazu neigen, Freundschaften in derselben sozialen
Gruppe zu knüpfen. Dies könnte eine Barriere für soziale Mobilität
darstellen.
Insgesamt deutet das Diagramm darauf hin, dass eine höhere Exposition tendenziell mit einem niedrigeren Freundschafts-Bias korreliert. Dies würde nahelegen, dass Counties mit höherer sozialer Durchmischung (niedrigerer Bias) tendenziell stärker vernetzt sind und somit den Economic Connectedness Index positiv beeinflussen.
16. Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.
Zusammenfassung der Ergebnisse:
Aufgabe 14:
Hier wurde untersucht, wie der Economic Connectedness Index (ECI) von
verschiedenen Faktoren wie dem Median-Haushaltseinkommen beeinflusst
wird. Regionen mit höherem Einkommen tendieren dazu, besser vernetzt zu
sein, während ärmere Regionen oft isolierter sind, was ihre
wirtschaftlichen Chancen verringert.
Aufgabe 15:
Es wurde festgestellt, dass Regionen mit einer höheren Exposition
(exposure_grp_mem_county), also mehr Kontakt mit unterschiedlichen
sozialen Gruppen, tendenziell eine stärkere soziale Vernetzung
aufweisen. Ein hoher Freundschafts-Bias (bias_grp_mem_county), bei dem
Freundschaften vor allem innerhalb homogener Gruppen bestehen, hemmt
diese Vernetzung. Speziell Regionen wie San Francisco County, California
zeigten eine starke Vernetzung und Exposition, während Regionen wie
Bronx County, New York eine geringere Vernetzung aufgrund eines höheren
Bias aufwiesen.
Politische Maßnahmen zur Förderung der sozialen Vernetzung:
Bildungsprogramme und Schulintegration:
Ergebnisse:
Höhere Exposition fördert die Vernetzung. Bildungsprogramme, die gezielt
darauf abzielen, Kinder und Jugendliche aus verschiedenen
sozioökonomischen Hintergründen zusammenzubringen, können den Bias
reduzieren und die Exposition erhöhen.
Maßnahme:
Regierungen könnten durch Programme zur Schulintegration und bunte
Wohnviertel soziale Kontakte über verschiedene Gruppen hinweg fördern.
Dazu gehört auch die gezielte Förderung von Ganztagsschulen oder
außerschulischen Programmen, die Kindern aus unterschiedlichen Schichten
gemeinsame Aktivitäten bieten.
Wohnpolitik:
Ergebnisse:
Der Freundschafts-Bias tritt oft in räumlich segregierten Regionen auf,
wo Menschen hauptsächlich mit anderen in Kontakt kommen, die ihnen
sozial ähnlich sind.
Maßnahme:
Eine durchdachte Wohnpolitik, die auf gemischte Wohnviertel abzielt,
könnte die soziale Durchmischung erhöhen. Insbesondere der Bau von
erschwinglichem Wohnraum in wohlhabenderen Gegenden oder die Förderung
gemischter Wohnprojekte könnte eine stärkere Vernetzung ermöglichen.
Förderung von sozialen Netzwerken:
Ergebnisse:
Ein hohes Maß an sozialer Vernetzung trägt zu besseren wirtschaftlichen
Chancen bei. Dies deutet darauf hin, dass Netzwerke, in denen Menschen
verschiedene Ressourcen und Informationen teilen, besonders wichtig
sind.
Maßnahme:
Lokale Netzwerktreffen, Mentorenprogramme und Unternehmenspatenschaften
könnten gezielt in benachteiligten Regionen gefördert werden, um den
Austausch und die Zusammenarbeit zwischen unterschiedlichen sozialen
Gruppen zu fördern.
Verbesserung des öffentlichen Verkehrs:
Ergebnisse:
Regionen mit besserer Exposition sind tendenziell stärker vernetzt.
Diese Exposition könnte auch durch Mobilität beeinflusst werden, da
Menschen in abgelegenen oder schlecht angebundenen Regionen seltener
Kontakt zu anderen sozialen Gruppen haben.
Maßnahme:
Investitionen in den öffentlichen Nahverkehr könnten die Erreichbarkeit
von Arbeitsplätzen und sozialen Treffpunkten in unterschiedlichen
Regionen verbessern und so den Kontakt und die Exposition zwischen
Menschen unterschiedlicher Schichten erleichtern.
Förderung digitaler Vernetzung:
Ergebnisse:
In ländlichen und strukturschwachen Regionen ist die physische
Exposition oft begrenzt. Hier könnten digitale Plattformen und
Technologien eine Brücke zur Vernetzung schaffen.
Maßnahme:
Der Ausbau von Breitbandinternet in ländlichen Regionen sowie die
Förderung digitaler Bildungsplattformen und sozialer Netzwerke könnte
helfen, Menschen auch virtuell miteinander zu vernetzen.
Soziale Räume und Gemeinschaftsräume:
Ergebnisse:
Orte, an denen Menschen aus verschiedenen Hintergründen zusammenkommen,
könnten die Exposition erhöhen und den Bias verringern.
Maßnahme:
Der Ausbau von öffentlichen Räumen und Freizeitangeboten, die Menschen
aus unterschiedlichen Gruppen anziehen, könnte die soziale Vernetzung
fördern. Dazu gehören Parks, Kulturzentren, Sporteinrichtungen und
Veranstaltungen, die den sozialen Austausch fördern.
Fazit:
Die Förderung der sozialen Vernetzung ist eng mit wirtschaftlicher Mobilität verbunden. Maßnahmen, die darauf abzielen, den Kontakt zwischen verschiedenen sozialen Gruppen zu stärken, wie Bildung, Wohnpolitik und der Ausbau von Infrastruktur, können die Chancen der Menschen in benachteiligten Regionen verbessern. Entscheidend ist dabei, räumliche und soziale Barrieren abzubauen, um den Bias zu reduzieren und die Exposition zu erhöhen.
Zusatzaufgabe
17. Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:
Hier können Sie die Daten auf College Ebene herunterladen
18. Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API
von IPUMS herunter. Am einfachsten
funktioniert dies mit dem R Paket tidycensus. Für
den API Zugang müssen Sie sich erst bei IPUMS registrieren und können
danach einen API Key beantragen, welchen Sie dann für den Daten download
über das tidycencus Paket hinterlegen müssen.
Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.
19. Stellen Sie den Economic Connectedness Index des Colleges
(ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte
dar. Machen Sie ihre Karte interaktiv mit dem Paket
leaflet.