Motivation
In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.
Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer
Vernetzung:
- Exposition: In welchem Ausmaß kommen Menschen aus
verschiedenen sozialen Schichten überhaupt in Kontakt?
- Freundschafts-Bias: Wenn Menschen die Möglichkeit haben, sich mit Personen aus anderen sozialen Schichten anzufreunden – nutzen sie diese Chance auch? Oder bleiben sie lieber in ihrer vertrauten sozialen Umgebung?
Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und
in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu
wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin,
dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit
geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über
soziale Schichten hinweg vernetzt sind, profitieren tendenziell von
besseren wirtschaftlichen Perspektiven.
Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.
Datengrundlage
Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:
- Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?
- Welche Faktoren tragen zur sozialen Ungleichheit bei?
- Welche Maßnahmen könnten die Vernetzung über sozioökonomische Grenzen hinweg fördern?
Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.
Einlesen
Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.
- Lesen Sie den Datensatz
social_capital_county.rdsaus dem Unterordner “Daten” in R ein und nennen diesen Datensatzsocial_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.
Schränken Sie ihren Datensatz auf folgende Variablen ein:
- county
- ec_county
- exposure_gpr_mem_county
- bias_grp_mem_county
- pop2018
Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.
Beantworten Sie auch folgende Fragen:
- Was ist eine Beobachtung?
- Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
- In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?
Folgende Variable werden zur weiteren Analyse verwendet :
county : Enthält einen 5-stelligen Code, welcher jeden County eindeutig nach FIPS Standrad identfiziert.
pop2018 : Zeigt die Bevölkerungszahl des jeweiligen Counties aus dem Jahr 2018. Diese Daten stammen aus der “American Community Survey” und sind öffentlich zugängliche Daten.
ec_county : Misst die wirtschaftliche Verbundenheit als zweifachen Anteil der Freunde mit hohem sozioökonomischem Status (SOS), gemittelt über alle Personen mit niedrigem SoS. Aus Datenschutzgründen werden die Daten leicht abgeändert.
exposure_grp_mem_county : Dieser Wert misst die Interaktion zwischen Personen mit niedrigem sozioökonomischen Status (SES) und Personen mit hohem sozioökonomischen Status innerhalb eines Landkreises. Er basiert auf dem doppelten Durchschnitt des Anteils von Personen mit hohem SES in den sozialen Gruppen, denen Personen mit niedrigem SES angehören.
bias_grp_mem_county : In dieser Variable wird ecgrpmemcounty durch exposure_grp_mem_county geteilt und dann das Ergebnis von 1 subtrahiert. Wichtig ist anzumerken, dass es sich hier um eine vereinfachte Rechnung handelt, dennoch weist sie eine hohe Korrelation von 0.85 zu der detaillierteren gruppenbasierten Schätzung auf, dies zeigt einen hohen Zusammenhang zwischen den Daten.
Eine Beobachtung in einem Datensatz zeigt ein County in den USA mit folgenden Variablen: FIPS Code, Bevölkerungszahl 2018, Ökonomische Verbindungen, Begegungen der SOS Gruppen und die Verzerrung durch die soialen Verbindungen.
Der Datensatz enthält 3.089 Counties Daten und die USA haben insgesamt 3.143 Counties. Somit sind etwa 98,3% der Counties enthalten.
In 87,828% der Fälle sind alle Informationen vollständig enthalten, das bedeutet, jede Variable einer Beobachtung hat einen Wert. Dies zeigt, dass für einen Großteil der Counties alle untersuchten Informationen enthalten sind.
- Weiterhin haben wir Ihnen den Datensatz
county_covariates.dtaim Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihncovariates.
Schränken Sie diesen Datensatz auf die folgenden Variablen ein:
- county
- kfr_pooled_pooled_p25
- gini99_simple
Generieren Sie eine neue Variable upward_mobility als
kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die
Variable kfr_pooled_pooled_p25.
Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.
Hinweis: Mit dem haven Paket können Sie .dta
Dateien einlesen
county: Ein fünfstelliger FIPS-Code, der die Landkreise identifiziert.
gini99_simple: Ein modifizierter Gini-Koeffizient, der die Einkommensungleichheit misst, indem er den Anteil des Einkommens vom obersten 1% der Bevölkerung abzieht.
upward_mobility: Ein Messwert, der die Aufstiegsmöglichkeiten von Kindern beschreibt. Er zeigt das durchschnittliche Einkommensperzentil der Kinder an, deren Eltern im 25. Perzentil der Einkommensverteilung lagen. Dieser Wert wird mit 100 multipliziert, um ihn deutlicher darzustellen.
- Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.
Lesen sie die Daten County_census_data.shp in R ein und
speichern diesen in R als county_census_shape ab. Neben den
County Namen und und Polygonen enthält dieser Datensatz auch das
geschätzte Median Einkommen pro County für das Jahr 2023
(medincE).
Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren
- Verbinden Sie die Dataframes
county_census_shape,covariatesundsocial_capital_countyzu einem Datensatzanalysis_data.
- Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
- Welcher Datensatz sollte der Hauptdatensatz sein? Warum?
Wahl des geeigneten Joins
Für die Integration dieser Datensätze halten wir einen Left Join für die geeignetste Option. Ein Left Join bietet den Vorteil, dass alle Einträge des Hauptdatensatzes vollständig erhalten bleiben, selbst wenn für einige Counties keine ergänzenden Daten aus den anderen beiden Datensätzen vorliegen. Dies ist besonders wichtig, wenn die geografische Vollständigkeit des Datensatzes gewahrt bleiben soll, was bei der Arbeit mit geospatialen Daten von Vorteil ist. Auf diese Weise können wir sicherstellen, dass keine geografische Region in der Analyse übersehen wird, selbst wenn nicht alle Informationen vollständig sind.
Alternativ könnte man auch einen Full Join in Betracht ziehen, da dieser Join-Ansatz sämtliche Datensätze integriert und bei Nicht-Übereinstimmungen NA’s eingefügt. Dies wäre sinnvoll, um wirklich alle verfügbaren Datenpunkte zu erfassen, jedoch auf Kosten einer höheren Anzahl fehlender Datenfelder, die ausgewertet werden müssten. Für die Zielsetzung unserer Arbeit, die sich stärker auf die kartografische Visualisierung von Daten konzentriert, ist jedoch der Left Join die präferierte Wahl.
Bestimmung des Hauptdatensatzes
Der Hauptdatensatz in unserer Analyse sollte
county_census_shape sein, und das aus mehreren Gründen:
Zentralität der Geodaten:
county_census_shapeenthält die essenziellen geografischen Daten, die unabdingbar für die Erstellung von Karten sind. Indem wir diesen Datensatz als Hauptdatensatz nutzen, können wir sicherstellen, dass diese wichtigen Informationen im Zentrum unserer Analyse stehen und alle weiteren Daten korrekt georeferenziert werden.Vollständige geografische Abdeckung: Es ist davon auszugehen, dass dieser Datensatz eine vollständige Liste aller US-Counties enthält, sodass er eine solide Basis für die Integration der anderen Informationen bietet. Auch wenn möglicherweise nicht alle Variablen für jeden County im Detail vorliegen, bleiben die geografischen Konturen und Gebiete vollständig erhalten, was für die Darstellung auf Karten entscheidend ist.
- Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:
- upward_mobility
- ec_county
- exposure_gpr_mem_county
- bias_grp_mem_county
Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:
- Was genau misst die wirtschaftliche Mobilität
(
upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen. - Bitte schauen Sie sich an, wie die sozialen Vernetzung
(
ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
Hinweis: Die genaue Berechnung der sozialen Vernetzung
(ec_county) finden Sie im Dokument
“social_capital_codebook.pdf”
Wirtschaftliche Mobilität und die soziale Vernetzung. Warum ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringt.
Begriffsdefinitionen
Wirtschaftliche Mobilität (upward_mobility) misst das durchschnittliche Einkommensperzentil von Kindern, deren Eltern im 25. Perzentil der Einkommensverteilung liegen, multipliziert mit 100. Ein hoher Wert dieser Messgröße zeigt an, dass Kinder aus einkommensschwachen Familien bessere Chancen auf eine Verbesserung ihres Einkommens im Erwachsenenalter haben, was auf gute soziale Aufstiegschancen hinweist. Soziale Vernetzung (ec_county) dagegen quantifiziert die wirtschaftliche Verbundenheit anhand des Anteils von Freundschaften zwischen Individuen aus niedrigem und hohem sozioökonomischen Status (SES). Es handelt sich dabei um den doppelten Anteil von Freundschaften mit hohem SES unter Individuen mit niedrigem SES, gemittelt über alle Personen mit niedrigem SES im betreffenden Landkreis.
Einfluss der Vernetzung
Ein hoher Wert der sozialen Vernetzung kann potenziell zu besseren ökonomischen Aufstiegschancen führen und somit die wirtschaftliche Mobilität erhöhen. Es gibt mehrere Gründe, die dies erklären können. Erstens erleichtert eine starke soziale Vernetzung den Informationsaustausch über Bildungs- und Beschäftigungsmöglichkeiten, die für den wirtschaftlichen Fortschritt entscheidend sein können. Zweitens ermöglicht sie eine effektive Ressourcenteilung, indem sie den Zugang zu wichtigen Ressourcen wie Mentoring, finanziellen Hilfen oder geschäftlichen Gelegenheiten schafft. Drittens können soziale Netzwerke Vertrauen und Unterstützung aufbauen, die helfen, wirtschaftliche Risiken zu mindern und Aufstiegschancen zu maximieren. Schließlich können durch den Kontakt mit Personen aus höheren SES-Gruppen auch positive Verhaltensweisen und Normen, die für den wirtschaftlichen Erfolg förderlich sind, beeinflusst und gefördert werden.
Annahmen und Vorbedingungen
Allerdings beruhen diese Überlegungen auf bestimmten Annahmen: Es wird angenommen, dass substanzielle soziale Interaktionen zwischen den SES-Gruppen stattfinden und dass dieser Austausch nicht durch institutionelle oder informelle Barrieren behindert wird. Außerdem setzen sie eine kulturelle Offenheit der Bevölkerung voraus, die eine sozioökonomische Durchmischung positiv aufnimmt und frei von signifikanten Vorurteilen ist. Auf dieser Grundlage könnte empirisch überprüft werden, wie robust diese Annahmen sind und welchen tatsächlichen Einfluss sie auf die wirtschaftliche Mobilität haben.
Berechnung der sozialen Vernetzung. Erwartung, wie die Exposition und der Freundschafts-Bias die soziale Vernetzung beeinflussen.
Bedeutung der sozialen Vernetzung
Die Berechnung der sozialen Vernetzung (ec_county) ist ein Schlüsselmaß, um zu verstehen, wie wirtschaftliche Verbundenheit innerhalb einer Region entsteht. Dabei wird die Vernetzung zwischen Personen aus unterschiedlichen sozioökonomischen Status (SES) quantifiziert. Zwei wichtige Faktoren, die diese soziale Vernetzung beeinflussen können, sind die Exposition gegenüber anderen SES-Gruppen (exposure_grp_mem_county) und der Freundschafts-Bias (bias_grp_mem_county).
Rolle der Exposition gegenüber anderen SES-Gruppen
Mit Exposition (exposure_grp_mem_county) wird der durchschnittliche Anteil von Personen mit hohem SES in den sozialen Gruppen von Individuen mit niedrigem SES gemessen. Eine hohe Exposition bedeutet, dass Menschen aus einkommensschwachen Schichten häufig in Kontakt mit Menschen kommen, die einen höheren sozioökonomischen Status haben. Dies hat zur Folge, dass sich das Potential für intersoziale Freundschaften erhöht, wodurch die wirtschaftliche Verbundenheit und damit die soziale Vernetzung gestärkt werden können. Der zugrunde liegende Gedanke hierbei ist, dass diese verstärkte Exposition die Wahrscheinlichkeit fördert, dass tatsächliche Bindungen und Interaktionen entstehen, die den sozialen und letztendlich ökonomischen Aufstieg begünstigen.
Auswirkungen des Freundschafts-Bias
Der Freundschafts-Bias (bias_grp_mem_county) hingegen gibt an, wie stark Freundschaften innerhalb der eigenen sozioökonomischen Gruppe gebildet werden im Vergleich zu denen mit anderen Gruppen. Ein höherer Wert des Freundschafts-Bias zeigt, dass Freundschaften weniger durchmischt sind, was bedeutet, dass Menschen dazu tendieren, vorwiegend innerhalb ihrer eigenen SES-Gruppe zu bleiben. Dies kann die soziale Vernetzung einschränken, da es zu weniger Durchlässigkeit zwischen den Gruppen und somit einer geringeren wirtschaftlichen Verbundenheit führt. Der Freundschafts-Bias berücksichtigt dabei, dass strukturelle und soziale Barrieren den Prozess der Vernetzung zwischen den SES-Gruppen beeinflussen können.
Praktische Implikationen und Kontextabhängigkeit
In der Praxis würde man erwarten, dass eine hohe Exposition gegenüber unterschiedlichen SES-Gruppen die soziale Vernetzung erhöht, während ein hoher Freundschafts-Bias diese tendenziell senkt. Diese Annahmen basieren auf der Idee, dass stärkere Durchmischung und Interaktion zwischen verschiedenen sozialen und wirtschaftlichen Gruppen die Möglichkeiten zur persönlichen und wirtschaftlichen Weiterentwicklung vervielfachen. Natürlich sind diese Vorstellungen kontextabhängig und müssen in empirischen Studien überprüft werden, um die tatsächlichen Auswirkungen auf die soziale Vernetzung zu verstehen.
Deskriptive Analysen
Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.
- Schauen Sie sich in einem ersten Schritt an, wie die Variablen im
Datensatz
analysis_dataüber alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.
Beschreiben und interpretieren Sie Ihre Tabelle.
Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?
Hinweis: Achten Sie auf eine schöne Darstellung ihrer
Tabelle mittels der Pakete kableExtra oder
gt!
| Attribute | Mittelwert | Median | Minimum | 25%-Quantil | 75%-Quantil | Maximum | Standardabw. |
|---|---|---|---|---|---|---|---|
| Median Einkommen | 65.046,65 | 63.161,50 | 16.170,00 | 54.113,25 | 73.216,25 | 178.707,00 | 18.388,68 |
| Gini Index | 0,29 | 0,29 | -0,06 | 0,24 | 0,33 | 0,57 | 0,06 |
| Einkommensmobilität | 42,72 | 41,96 | 12,22 | 38,43 | 46,11 | 68,83 | 6,49 |
| Sozioökonomische Vernetzung (County) | 0,81 | 0,81 | 0,29 | 0,69 | 0,94 | 1,36 | 0,18 |
| Gruppenbasierte Durchmischung | 0,91 | 0,91 | 0,26 | 0,76 | 1,05 | 1,49 | 0,21 |
| Soziale Verzerrung | 0,06 | 0,06 | -0,11 | 0,03 | 0,10 | 0,33 | 0,05 |
| Bevölkerung 2018 | 107.129,87 | 27.837,50 | 544,00 | 12.618,75 | 71.974,50 | 10.098.052,00 | 337.331,88 |
Statistische Übersicht und Variablenbeschreibung
Die Tabelle zeigt eine statistische Übersicht von sieben verschiedenen Variablen und deren Kennzahlen aller im Datensatz vorhandenen Daten. Die erste Spalte ist die Attributliste der untersuchten Variablen. Für jedes dieser Attribute werden die sieben Kennzahlen angezeigt:
- Der arithmetische Mittelwert (Mittelwert)
- Der Median 50%-Quantil
- Das Minimum und Maximum, als niedrigster bzw. höchster Wert
- Das erste Quartil (25%-Quantil) und dritte Quartil (75%-Quantil)
- Die Standardabweichung (SD)
Unterschiedliche Größenordnungen und Einkommensanalyse der Counties
Besonders auffällig sind die stark unterschiedlichen Größenordnungen der Variablen. Während beispielsweise das Median-Einkommen im fünfstelligen Bereich liegt, bewegen sich Gini-Index und Bias-Werte zwischen 0 und 1. Die Bevölkerungszahlen zeigen die größte Spannweite mit Werten von 544 bis über 10 Millionen Einwohnern. Interpretation Das Median-Einkommen der Counties weist eine große Spanne zwischen dem Minimum und dem Maximum auf. Dies scheint logisch, da extrem hohe Einkommen in Spitzenpositionen in den USA erwartbar sind, dennoch zeigt dies erhebliche Wohlstandsunterschiede in den unterschiedlichen Regionen. Der Mittelwert (65.046,65) ist nah am Median (63.161,50), dies spricht für eine hohe Konzentration der Einkommen in diesem Bereich und eine leicht rechtsschiefe Verteilung der Einkommen. Zudem zeigt auch die Standardabweichung eine moderate Abweichung um den Mittelwert im Vergleich zu der Einkommensspanne, dies spricht alles für ein stabiles Einkommen der Mittelschicht.
Gleichmäßigkeit und Datenfehler im Gini-Index
Beim Gini-Index scheint es kaum eine Streuung zu geben mit nur 0,06 Prozentpunkten, und der Median und Mittelwert sind identisch. Dies spricht für eine sehr gleichmäßige Vermögensverteilung innerhalb der analysierten Counties um die 0,29. Leider zeigt der Gini-Index auch einen negativen Wert, dies ist laut Definition nicht möglich, somit muss es sich um einen Fehler in den Daten handeln.
Heterogene Bevölkerungsstrukturen und ihre Auswirkungen auf Mobilität
Die Bevölkerungszahlen von 2018 zeigen die größten Ausreißer. Der Unterschied zwischen dem Median von 27.837,50 und dem Mittelwert von 107.129,87 ist erheblich. Die extreme Spannweite von minimal 544 bis maximal über 10 Millionen Einwohnern deutet auf sehr unterschiedliche Gebietsstrukturen hin. In Bezug auf die Größe der USA und die unterschiedlichen im Datensatz enthaltenen Gebiete lässt sich auch gut die große Standardabweichung von 337.331,88 nachvollziehen durch eine Mischung aus ländlichen Gebieten, Kleinstädten und Großstädten. Dies ist auch in Bezug auf andere Variablen zu beachten, da dieser Datensatz eine hohe Durchmischung verschiedener Gebiete aufweist. Durch die strukturellen Unterschiede können sich die anderen Variablen deutlich unterscheiden. Dies könnte auch stark mit der Einkommensmobilität korrelieren, da sich die strukturellen Gegebenheiten wie Bildungseinrichtungen oder ärztliche Versorgung auf die Einkommenschancen der Kinder auswirken können. Besonders in ländlichen Gebieten könnten fehlende Strukturen für eine geringere Aufstiegschance sorgen und so das durchschnittliche Einkommen verringern. 50% der Werte liegen zwischen 38,43 und 46,11, was eine relativ große Streuung der Mobilitätschancen zeigt. Diese Zahlen deuten darauf hin, dass die Einkommensmobilität eng mit den strukturellen Unterschieden zwischen städtischen und ländlichen Gebieten zusammenhängt.
Ähnlichkeit in der Vernetzung und geringe soziale Verzerrung
Die sozioökonomische Vernetzung und die gruppenbasierte Durchmischung weisen sehr ähnliche Werte auf. Sie haben eine Standardabweichung von 0,18 und 0,21. Auch deren 25%-Quartil sowie 75%-Quartil liegen sehr nah beieinander und haben eine ähnliche Spannweite. Dies könnte auf eine starke Korrelation zwischen diesen beiden Werten hinweisen. Die soziale Verzerrung weist beim Mittelwert (0,06) sowie beim Median (0,06) die gleichen Werte auf. Dies spricht für eine hohe Konzentration der Werte in diesem Bereich. Dies lässt sich durch die geringe Standardabweichung von 0,05 bestätigen. Zudem liegen auch 50% aller Werte im Bereich von 0,03 bis 0,1. Es gibt also eine sehr geringe soziale Verzerrung, die gleichmäßig über die USA verteilt ist.
Symmetrische Verteilung und regionale Unterschiede in der Durchmischung
Bei der gruppenbasierten Durchmischung liegt die durchschnittliche Verteilung ebenfalls beim Median, was auf eine symmetrische Verteilung hindeutet. Dies zeigt, dass die Durchmischung durchschnittlich bei 0,91 liegt für die meisten Counties und es eine relativ hohe Durchmischung der Gruppen mit unterschiedlichem sozioökonomischem Status gibt. Die Streuung ist mit 0,21 etwas überdurchschnittlich, dies zeigt, dass es größere Unterschiede in den unterschiedlichen Regionen gibt. Dennoch sind 50% aller Werte im Bereich von 0,76 und 1,05. Bei den Extremwerten zeigt sich, dass es eine große Spannweite der Durchmischung von 0,26 bis 1,49 gibt. Dies deutet auf Regionen hin, welche vermutlich eine sehr kleine sozioökonomische Gruppe haben oder sozioökonomische Gruppen, welche durch strukturelle Eigenschaften stark vermischt werden.
Datenfehler bei Gini-Index und sozialer Verzerrung überprüfen
Negative Werte beim Gini-Index und bei der sozialen Verzerrung können methodisch nicht korrekt sein. Der Gini-Index bewegt sich definitionsgemäß zwischen 0 und 1, und soziale Verzerrungen sollten ebenfalls keine negativen Werte annehmen, es sei denn, es gibt eine spezielle Methodik, die dies rechtfertigt (was hier nicht dokumentiert scheint). Vermutlich handelt es sich um Datenfehler oder falsche Berechnungen, die überprüft und bereinigt werden sollten.
Soziale Vernetzung und wirtschaftliche Mobilität
Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild
über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre
Analyse näheres über die soziale Vernetzung lernen, den Economic
Connectedness Index (ec_county), welcher aus den Facebook
Freundschaften generiert wurde. Die Daten des Economic Connectedness
Index wurden auf County Ebene aggregiert, beruhen jedoch auf
Freundschaftsdaten von individuellen Facebook Nutzern.
- Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.
Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:
Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?
Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt
sich das tigris
Paket und der Befehl shift_geometry() um Alaska, Hawaii
und Puerto Rico schön darstellen zu lassen.
Beschreibung
Die Grafik zeigt den Economic Connectedness Index (wirtschaftliche Verbundenheit) auf Kreisebene (County-Ebene) in den USA. Der Index misst, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander verbunden sind. Die Farbskala reicht von dunkelblau (niedrige Exposition) bis gelb (hohe Exposition).
Regionale Unterschiede in der wirtschaftlichen Verbundenheit in den USA
Die nördlichen Bundesstaaten, insbesondere im oberen mittleren Westen, weisen überwiegend hellere Farbtöne auf, was auf eine stärkere wirtschaftliche Verbundenheit zwischen verschiedenen sozioökonomischen Gruppen hindeutet. Diese höhere Exposition könnte auf die traditionell stärkere Industrialisierung in diesen Regionen zurückzuführen sein. Im starken Kontrast dazu steht der Süden der USA, wo sich eine auffällige Konzentration dunklerer Farbtöne zeigt, die eine deutlich niedrigere Exposition anzeigen. Diese geografischen Unterschiede scheinen in den Gebieten der Konföderierten Staaten zu liegen, in welchen historisch lange Segregation herrschte, deren Nachwirkungen könnten bis heute die Expositionen unterschiedlicher Gruppen erschweren.
Städtische und regionale Muster der wirtschaftlichen Verbundenheit in den USA
Erwähnenswert ist auch das Muster in den städtischen Gebieten, die sich als hellere Flecken von ihrer Umgebung abheben. Diese höhere Exposition in städtischen Gebieten lässt sich durch die Vielfalt an Begegnungsmöglichkeiten zwischen verschiedenen sozioökonomischen Gruppen erklären. Städte bieten durch ihre Infrastruktur, Bildungseinrichtungen und die großen Arbeitsmärkte mehr Möglichkeiten für soziale Interaktionen über sozioökonomische Gruppen hinweg. Diese städtischen Gebiete können dazu beitragen, die soziale Mobilität zu erhöhen.
In den Küstenregionen, insbesondere an der Ostküste, zeigen sich unterschiedliche Expositionswerte. Während einige Metropolregionen wie Boston oder New York durch hellere Farbtöne gekennzeichnet sind, finden sich in den umliegenden ländlichen Gebieten oft niedrigere Werte. Diese Verteilung spiegelt die unterschiedlichen wirtschaftlichen Möglichkeiten wider, wobei die Metropolregionen strukturelle Vorteile bieten, um soziale Netze auszubauen.
Im Mittleren Westen zeigt sich ein besonders interessantes Muster mittlerer bis höherer Exposition, das sich wie ein Band durch die landwirtschaftlich geprägten Staaten zieht. Trotz ihrer überwiegend ländlichen Struktur weisen die Regionen eine bemerkenswert gute wirtschaftliche Verbundenheit auf. Dies könnte auf starke soziale Strukturen hinweisen, welche die gruppenübergreifenden Interaktionen fördern. Möglicherweise können durch Bildung und Vereine schon früh gruppenübergreifende Beziehungen geschaffen werden, welche die gesamte Exposition fördern.
- Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.
Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:
- Median Haushaltseinkommen in dem County (
medincE) - Wirtschaftliche Mobilität in dem County
(
upward_mobility) - Einkommensungleichheit in dem County (gemessen mit dem
Gini-Koeffizient des Counties) (
gini99_simple)
Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.
Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:
- Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.
| Top 10 Counties nach Economic Connectedness | ||||
| Mit zusätzlichen Variablen | ||||
| Countyname | Economic Connectedness1 | Median Haushaltseinkommen | Mobilität1 | Gini Index1 |
|---|---|---|---|---|
| Rockingham County, New Hampshire | 1,360 | 113927 | 45,314 | 0,225 |
| Douglas County, Colorado | 1,353 | 145737 | 48,243 | 0,116 |
| San Francisco County, California | 1,312 | 141446 | 50,389 | 0,310 |
| Morgan County, Utah | 1,291 | 126092 | 54,124 | 0,154 |
| Madison County, Idaho | 1,281 | 58259 | 51,537 | 0,224 |
| Arlington County, Virginia | 1,272 | 140160 | 46,281 | 0,387 |
| Sussex County, New Jersey | 1,258 | 114316 | 47,040 | 0,183 |
| Wright County, Minnesota | 1,252 | 106666 | 49,544 | 0,184 |
| Gunnison County, Colorado | 1,248 | 77358 | 48,711 | 0,347 |
| Pitkin County, Colorado | 1,244 | 100318 | 45,834 | −0,010 |
| 1 Alle Zahlen sind auf drei Nachkommastellen gerundet. | ||||
| Bottom 10 Counties nach Economic Connectedness | ||||
| Mit zusätzlichen Variablen | ||||
| Countyname | Economic Connectedness1 | Median Haushaltseinkommen | Mobilität1 | Gini Index1 |
|---|---|---|---|---|
| Scotland County, North Carolina | 0,396 | 43500 | 31,079 | 0,387 |
| Crisp County, Georgia | 0,388 | 42745 | 32,888 | 0,424 |
| Marlboro County, South Carolina | 0,385 | 36293 | 32,818 | 0,307 |
| Early County, Georgia | 0,380 | 53750 | 33,828 | 0,456 |
| Robeson County, North Carolina | 0,363 | 40318 | 32,095 | 0,362 |
| Allendale County, South Carolina | 0,361 | 31603 | 31,404 | 0,332 |
| Bullock County, Alabama | 0,355 | 36723 | 34,566 | 0,315 |
| Terrell County, Georgia | 0,347 | 43812 | 31,165 | 0,364 |
| Oglala Lakota County, South Dakota | 0,330 | 34769 | 24,840 | NA |
| Todd County, South Dakota | 0,295 | 39148 | 30,178 | 0,323 |
| 1 Alle Zahlen sind auf drei Nachkommastellen gerundet. | ||||
Analyse des Zusammenhangs zwischen Economic Connectedness Index und wirtschaftlichen Variablen in US-Counties
In dieser Analyse untersuchen wir den Economic Connectedness Index (ECI) einzelner Counties und dessen Zusammenhang mit verschiedenen wirtschaftlichen Variablen, die den ökonomischen Aufstieg darstellen. Wir haben jeweils in einer Tabelle die zehn Counties mit dem höchsten ECI und die zehn Counties mit dem niedrigsten ECI aufgelistet. Für diese ausgewählten Counties betrachten wir folgende Variablen im Detail:
- Median-Haushaltseinkommen: Diese Variable gibt an, wie viel der durchschnittliche Haushalt in einem County verdient, und kann ein Indikator für den allgemeinen Wohlstand der Region sein.
- Wirtschaftliche Mobilität: Diese misst die durchschnittliche Fähigkeit von Individuen, ihre Einkommensposition im Laufe der Zeit zu verbessern, und ist entscheidend für die Bewertung sozialer Aufstiegsmöglichkeiten in einem County.
- Einkommensungleichheit: Der Gini-Koeffizient, der hier verwendet wird, ist ein Maß für die Einkommensverteilung innerhalb eines Countys und gibt an, wie ungleich das Einkommen verteilt ist.
Wirtschaftliche Vernetzung und Einkommensunterschiede in den Top und Bottom 10 Counties
Die Top 10 Counties zeichnen sich durch eine deutlich höhere wirtschaftliche Vernetzung aus, mit Werten zwischen 1,244 und 1,360. Rockingham County in New Hampshire führt diese Liste an. Diese Counties weisen auch höhere Median-Haushaltseinkommen auf, die von 58.259 USD bis 145.737 USD reichen, wobei Douglas County in Colorado mit 145.737 USD den Spitzenwert darstellt.
Im Gegensatz dazu zeigen die Bottom 10 Counties deutlich niedrigere Werte in der wirtschaftlichen Vernetzung, die zwischen 0,295 und 0,396 liegen. Diese Counties befinden sich hauptsächlich in den südlichen Bundesstaaten wie Georgia, South Carolina und North Carolina. Dies könnte auf einen geografischen Einfluss auf die wirtschaftliche Vernetzung hindeuten. Ihre Median-Haushaltseinkommen sind signifikant niedriger und bewegen sich zwischen 31.603 USD und 53.750 USD. Zudem zeigt sich, dass sich der Gini-Index ebenfalls signifikant von dem der Top 10 unterscheidet, er liegt teilweise bis zu 20% über dem in den Top 10. Auch die Mobilität ist in jedem Bottom-10-County deutlich geringer als in den Top 10.
Auffällig ist, dass sich die Bottom 10 Counties vermehrt in den südlichen Staaten befinden, während die Top 10 über die USA verteilt sind. Darüber hinaus sind die Top 10 häufig besonders strukturstarke Regionen wie San Francisco, die unter anderem durch eine starke Tech Industrie geprägt sind. Dies fördert nicht nur das Medianeinkommen, sondern erhöht auch die Vernetzungsmöglichkeiten, beispielsweise durch einen großen Arbeitsmarkt und bevölkerungsreiche Städte. Dennoch existieren Regionen wie Madison County in Idaho, die ein niedriges Medianeinkommen aufweisen. Dies kann auf die Brigham Young University zurückzuführen sein, da Studierende selten ein hohes Einkommen haben, aber dennoch eine gute Vernetzung besteht.
Zusammenhang von Mobilität, Vernetzung und Einkommensungleichheit in Counties
Die Mobilität und wirtschaftliche Vernetzung scheinen stark miteinander korreliert zu sein, da besonders hohe Mobilitätswerte mit ebenfalls hoher Vernetzung einhergehen. Umgekehrt gilt dies bei niedriger Mobilität. Der Gini-Index ist ein Maß für die Einkommensverteilung - je höher, desto ungleicher ist das Einkommen verteilt. Auffällig sind bei diesen Werten die klaren Unterschiede zwischen Top-10 und Bottom-10 Counties. Bei den Bottom-10 gibt es kein County, welches unter 0,3 liegt, wobei der maximale Gini-Index bei 0,456 liegt. Dies weist auf eine konstant ungleiche Verteilung innerhalb der Bottom-10 Counties hin, was sich vermutlich auch mit den niedrigeren Medianeinkommen in Verbindung bringen lässt. In diesen Counties gibt es weniger Topverdiener, aber diese Topverdiener verdienen überdurchschnittlich viel.
Im Gegensatz dazu lässt sich bei den Top-10 Counties kein genaues Muster der Verteilung des Gini-Index feststellen, doch im Vergleich zu den Bottom-10 sind diese durchschnittlich deutlich niedriger. Dies zeigt, dass bessere wirtschaftliche Verbindungen zu einer gleicheren Verteilung führen können. Einer der Gründe dafür könnte zum einen der höhere Bildungsstand sein, welcher mit höheren Einkommen einhergeht. Des Weiteren kann auch das größere Jobangebot zu einer Konkurrenz zwischen den Unternehmen führen, wodurch in diesen Regionen ein höheres Gehalt gezahlt wird.
An dieser Stelle sollte auch auf die Datenqualität verwiesen werden: In Pitkin County in Colorado gibt es einen Gini-Index von -0,010. Dies ist theoretisch unmöglich, da der Gini-Index definitionsgemäß nur Werte zwischen 0 (perfekte Gleichheit) und 1 (maximale Ungleichheit) annehmen kann. Dieser Wert deutet auf einen möglichen Messfehler oder eine fehlerhafte Datenerfassung hin.
Einfluss der Lebenshaltungskosten auf reale Kaufkraft
Als letzten Punkt wollen wir noch auf die Lebenshaltungskosten der Counties eingehen. Da sich die Median-Haushaltseinkommen teilweise sehr stark zwischen den Top 10 und Bottom 10 unterscheiden, sollte man dies im Kontext der regionalen Kosten betrachten, da die Einkommen nicht direkt vergleichbar sind. Insbesondere in Metropolregionen wie San Francisco gibt es höhere Haushaltseinkommen, doch diese Regionen haben auch höhere Wohnkosten und allgemeine Lebenshaltungskosten. Im Vergleich dazu haben die Bottom-10 Counties in den südlichen Staaten niedrigere Einkommen, profitieren aber von niedrigeren Lebenshaltungskosten.
Demnach unterscheidet sich die reale Kaufkraft wesentlich von den nominellen Einkommen. Daher wäre ein Vergleich unter Berücksichtigung der regionalen Kaufkraft sinnvoll.
Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?
- In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot)
erstellen, welches die wirtschaftliche Mobilität
(
upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
- In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?
Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen
Beschreibung
Die Grafik zeigt den Zusammenhang zwischen Economic Connectedness und wirtschaftlicher Mobilität. Die lineare Korrelation wird verdeutlicht durch die rote Regressionslinie, diese verläuft von links unten nach rechts oben. Die Datenpunkte (blaue Punkte) zeigen je ein County mit dem jeweiligen Economic Connectedness Index und der Upward Mobility. Die Streuung um die Regression scheint moderat, da sich viele Punkte entlang der Linie häufen. Besonders dicht sind die Datenpunkte in der Mitte der Grafik. Einige Ausreißer sind erkennbar, besonders im unteren Bereich der Grafik mit sehr niedrigen Mobilitätswerten. Die Punktewolke reicht von etwa 0,4 bis 1,4 auf der X-Achse und von 30 bis 60 auf der Y-Achse, hier befinden sich die meisten Datenpunkte. Die Grafik zeigt deutlich einen positiven, linearen Zusammenhang, mit einem Wert von 0,723, zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität (Upward Mobility).
Bezug zu Erwartungen aus Aufgabe 5
Der positive Zusammenhang in der Grafik entspricht den Erwartungen aus Aufgabe 5. Dort wurde argumentiert, dass eine höhere soziale Vernetzung (Economic Connectedness) potenziell die wirtschaftliche Mobilität steigern kann, da Menschen durch diese Netzwerke besseren Zugang zu Ressourcen, Informationen und Chancen erhalten. Der hohe Korrelationswert bestätigt diese Annahme und unterstreicht, dass Regionen mit höherer sozialer Vernetzung tendenziell auch höhere Werte der wirtschaftlichen Mobilität aufweisen.
Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?
Die Grafik liefert eine starke Evidenz für einen positiven Zusammenhang zwischen sozialer Vernetzung und wirtschaftlicher Mobilität. Regionen mit einem höheren Economic Connectedness Index verzeichnen im Durchschnitt bessere Chancen für den sozialen Aufstieg von Personen aus einkommensschwachen Familien. Die Stärke der Korrelation (0,723) zeigt, dass soziale Netzwerke einen bedeutenden Einfluss auf die wirtschaftliche Mobilität haben könnten.
Einschränkungen der Grafik: Der Zusammenhang ist statistisch, jedoch nicht kausal. Es bleibt offen, ob die soziale Vernetzung tatsächlich die Ursache für die höhere wirtschaftliche Mobilität ist oder ob andere Faktoren (z. B. Bildung, Infrastruktur oder regionale wirtschaftliche Stärke) diesen Zusammenhang beeinflussen. Die Grafik zeigt aggregierte Daten auf regionaler Ebene, wodurch individuelle Unterschiede und lokale Besonderheiten möglicherweise nicht erfasst werden.
- Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
- Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
- Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index
Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:
- San Francisco County, California
- Arlington County, Virginia
- Morgan County, Utah
- New York County, New York
- Bronx County, New York
Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:
- Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.
Grafik 1: Zusammenhang zwischen Gini-Koeffizient und Economic Connectedness
Beschreibung: Die Grafik zeigt den negativen Zusammenhang zwischen dem Economic Connectedness Index (horizontale Achse) und dem Gini-Koeffizienten (vertikale Achse). Der Gini-Koeffizient misst die Einkommensungleichheit in einer Region (höhere Werte = größere Ungleichheit). Die rote Regressionslinie verdeutlicht die negative Beziehung.
Interpretation: Regionen mit höherer sozialer Vernetzung (höherer Economic Connectedness Index) haben tendenziell einen niedrigeren Gini-Koeffizienten, was auf geringere Einkommensungleichheit hindeutet. Beispielsweise liegen Regionen wie die Bronx (niedriger Economic Connectedness und hoher Gini-Koeffizient) und Arlington (hoher Economic Connectedness und niedriger Gini-Koeffizient) im Einklang mit diesem Trend.
Grafik 2: Zusammenhang zwischen Medianeinkommen und Economic Connectedness
Beschreibung: Diese Grafik zeigt einen positiven Zusammenhang zwischen dem Economic Connectedness Index (horizontale Achse) und dem Medianeinkommen (vertikale Achse). Regionen mit einem höheren Economic Connectedness Index weisen tendenziell höhere Medianeinkommen auf. Beispiele wie Arlington und San Francisco liegen weit oben, während die Bronx und New York eher am unteren Ende der Skala stehen.
Interpretation: Regionen mit stärkerer sozialer Vernetzung scheinen von höherem Wohlstand (gemessen am Medianeinkommen) zu profitieren. Dies könnte auf bessere ökonomische Chancen und eine stärkere Durchlässigkeit zwischen sozioökonomischen Gruppen hinweisen.
Entsprechen die Zusammenhänge den Erwartungen aus Aufgabe 5?
Ja, die dargestellten Zusammenhänge stimmen mit den Erwartungen aus Aufgabe 5 überein:
Gini-Koeffizient und Economic Connectedness: Aufgabe 5 legte nahe, dass soziale Netzwerke die wirtschaftliche Mobilität fördern könnten. Eine höhere soziale Vernetzung würde theoretisch auch die Einkommensungleichheit verringern, da Menschen aus einkommensschwachen Gruppen Zugang zu besseren Ressourcen und Möglichkeiten erhalten. Die negative Korrelation in Grafik 1 bestätigt diese Annahme.
Medianeinkommen und Economic Connectedness: Eine stärkere soziale Vernetzung (höherer Economic Connectedness Index) wurde in Aufgabe 5 als Faktor für den sozialen und wirtschaftlichen Aufstieg identifiziert. Die positive Korrelation in Grafik 2 unterstützt dies, da Regionen mit höherer Vernetzung auch ein höheres durchschnittliches Einkommen aufweisen.
Erklärungen: Die Ergebnisse passen gut zu den theoretischen Überlegungen: Regionen mit hohem Economic Connectedness (z. B. Arlington, San Francisco) fördern wahrscheinlich den Zugang zu Ressourcen, Netzwerken und wirtschaftlichen Chancen, wodurch sowohl die Einkommensungleichheit reduziert als auch das allgemeine Einkommensniveau erhöht wird. Umgekehrt zeigen Regionen mit geringerer sozialer Vernetzung (z. B. Bronx, New York) tendenziell eine größere Ungleichheit und niedrigere Medianeinkommen, was auf einen Mangel an Vernetzung und Chancen hinweist.
Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.
- Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
- Economic Connectedness Index (ec_county)
- Wirtschaftliche Mobilität (upward_mobility)
- Median Haushaltseinkommen (medincE)
- Bevölkerung in 2018 (pop2018)
- Einkommensungleichheit (gini99_simple)
- Exposition (exposure_grp_mem_county)
- Freundschafts-Bias (bias_grp_mem_county)
Beschreiben und interpretieren Sie ihre Korrelationsmatrix.
Beschreibung der Korrelationsmatrix
Die Korrelationsmatrix zeigt die linearen Zusammenhänge zwischen sieben Variablen, die im Kontext der wirtschaftlichen Mobilität und sozialen Vernetzung untersucht werden. Die Werte reichen von -1 (starke negative Korrelation) bis 1 (starke positive Korrelation), während 0 für keinen Zusammenhang steht. Die Stärke der Korrelation ist durch die Farbskala visualisiert. Dunkleres Grün repräsentiert stärkere positive Korrelationen, während hellere Farben schwächere oder negative Korrelationen anzeigen.
Hauptbeobachtungen und Interpretation
Economic Connectedness Index: Wirtschaftliche Mobilität (0.73): Es besteht eine starke positive Korrelation. Dies bestätigt, dass eine stärkere wirtschaftliche Verbundenheit (z. B. durch soziale Netzwerke) mit einer besseren wirtschaftlichen Mobilität einhergeht. Dies stimmt mit den Ergebnissen aus früheren Aufgaben überein. Exposition (0.94): Ein sehr starker positiver Zusammenhang deutet darauf hin, dass die Durchmischung verschiedener sozioökonomischer Gruppen eine zentrale Rolle für die wirtschaftliche Vernetzung spielt. Einkommensungleichheit (-0.64): Ein negativer Zusammenhang deutet darauf hin, dass Regionen mit besserer wirtschaftlicher Vernetzung tendenziell geringere Einkommensungleichheiten aufweisen.
Wirtschaftliche Mobilität: Median Haushaltseinkommen (0.34): Ein moderater positiver Zusammenhang deutet darauf hin, dass wirtschaftlich wohlhabendere Regionen tendenziell auch mehr soziale Aufstiegsmöglichkeiten bieten. Exposition (0.69): Die Exposition korreliert stark mit der wirtschaftlichen Mobilität, was darauf hindeutet, dass Kontakt zwischen sozioökonomischen Gruppen wichtige Möglichkeiten für den sozialen Aufstieg schafft.
Freundschafts-Bias: Economic Connectedness (-0.38): Eine moderate negative Korrelation zeigt, dass ein höherer Bias (d. h. eine stärkere Tendenz, Freundschaften innerhalb der eigenen sozialen Gruppe zu bilden) die wirtschaftliche Vernetzung reduziert. Wirtschaftliche Mobilität (-0.30): Ein ähnlicher negativer Zusammenhang deutet darauf hin, dass ein hoher Freundschafts-Bias den sozialen Aufstieg behindern kann.
Einkommensungleichheit: Economic Connectedness (-0.64): Regionen mit geringerer Einkommensungleichheit weisen höhere wirtschaftliche Vernetzung auf. Exposition (-0.60): Der negative Zusammenhang zeigt, dass Einkommensungleichheit die Durchmischung zwischen sozialen Gruppen verringern kann. Bevölkerung in 2018: Die Korrelationen der Bevölkerungsgröße mit den anderen Variablen sind überwiegend schwach (nahe 0). Dies deutet darauf hin, dass die Bevölkerungsgröße keine bedeutende Rolle in den Zusammenhängen der betrachteten Variablen spielt.
Einflussfaktoren auf Mobilität
Die Korrelationsmatrix zeigt: Economic Connectedness und Exposition sind die stärksten Prädiktoren für wirtschaftliche Mobilität. Eine stärkere Durchmischung sozialer Gruppen (Exposition) und stärkere Vernetzung (Connectedness) erhöhen die Chancen auf sozialen Aufstieg. Hemmende Faktoren: Einkommensungleichheit und Freundschafts-Bias wirken sich negativ auf die wirtschaftliche Vernetzung und Mobilität aus. Zusammenhang mit Median Einkommen: Wohlhabendere Regionen haben bessere soziale Aufstiegsmöglichkeiten, allerdings mit einer moderaten Korrelation.
Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?
- Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.
Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.
Beschreibung
Die Grafik zeigt den Zusammenhang zwischen dem Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen (x-Achse) in verschiedenen Counties. Die Datenpunkte sind nach der wirtschaftlichen Mobilität (Farblegende: Grün bis Blau) eingefärbt. Grün steht für niedrigere wirtschaftliche Mobilität, während Blau für höhere Mobilität steht.
Verteilung der Datenpunkte: Es gibt eine sichtbare positive Beziehung zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index: Höhere Haushaltseinkommen sind tendenziell mit höherer sozialer Vernetzung assoziiert. Färbung der Punkte: Die wirtschaftliche Mobilität scheint bei einem höheren Economic Connectedness Index und Median Haushaltseinkommen (oben rechts) stärker ausgeprägt zu sein.
Wirtschaftliche Wohlstandsförderung sozialer Vernetzung
Zusammenhang zwischen Economic Connectedness und Median Haushaltseinkommen: Positive Beziehung: Counties mit höherem Median Haushaltseinkommen weisen tendenziell eine stärkere soziale Vernetzung (höherer Economic Connectedness Index) auf. Dies deutet darauf hin, dass wirtschaftlich wohlhabendere Regionen strukturelle oder soziale Bedingungen fördern, die soziale Vernetzung begünstigen. Erklärung: Gut verdienende Regionen bieten oft mehr Möglichkeiten für intersoziale Kontakte, sei es durch Bildung, Arbeit oder soziale Aktivitäten. Gleichzeitig könnten wohlhabendere Gebiete weniger Einkommensungleichheit und weniger Barrieren für soziale Interaktion aufweisen.
Einfluss der Vernetzung auf Mobilität und Einkommensvariabilität
Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität: Höhere Mobilität bei stärkerer Vernetzung: Die Färbung zeigt, dass Regionen mit einem höheren Economic Connectedness Index (oberer Bereich der Grafik) auch eine höhere wirtschaftliche Mobilität (rote Punkte) aufweisen. Dies gilt unabhängig vom Haushaltseinkommen, wobei wohlhabendere Regionen (höheres Median Haushaltseinkommen) stärkere Effekte zeigen. Unterschied zwischen Einkommensgruppen: Der Effekt der sozialen Vernetzung scheint für Gutverdiener (höheres Median Haushaltseinkommen) stärker zu sein als für weniger gut verdienende Regionen. Dies könnte daran liegen, dass in einkommensstärkeren Regionen nicht nur die soziale Vernetzung besser ist, sondern auch andere Faktoren wie Bildung, Infrastruktur oder Zugang zu Ressourcen verstärkend wirken.
Unterschiedliche Mobilität bei ähnlichem Einkommen: Einige Regionen mit ähnlichem Median Haushaltseinkommen zeigen unterschiedliche Mobilitätswerte (unterschiedliche Farben), was darauf hindeutet, dass soziale Vernetzung nicht der einzige Faktor ist. Dies betont die Rolle weiterer Variablen wie Bildung, Arbeitsmarkt oder regionaler Kultur.
- Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.
Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:
- Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
- In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
- Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
- Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?
Rückwärtskausalität, Selektionseffekte und ausgelassene Variablen
Rückwärtskausalität: Rückwärtskausalität bedeutet, dass der beobachtete Zusammenhang in der umgekehrten Richtung besteht, also wirtschaftliche Mobilität zu stärkerer sozialer Vernetzung führt. In Regionen mit höherer Mobilität könnten beispielsweise Menschen aus niedrigen SES-Familien als Erwachsene mehr Freundschaften mit höherem SES aufbauen, was die Economic Connectedness erhöht. Dies könnte den Eindruck erwecken, dass Vernetzung Mobilität fördert, obwohl der kausale Zusammenhang umgekehrt ist.
Selektionseffekte: Menschen könnten bewusst Regionen auswählen, die bereits hohe Mobilitätschancen bieten. Beispielsweise ziehen einkommensschwache Familien, die hohe Ambitionen für ihre Kinder haben, in Gebiete mit hoher sozialer Vernetzung und guten Bildungschancen. Dadurch könnte der Zusammenhang zwischen Vernetzung und Mobilität auf der selektiven Migration basieren und nicht auf einem kausalen Effekt der Vernetzung.
Ausgelassene Variablen: Faktoren wie Qualität der Bildung, Arbeitsmarktbedingungen oder lokale politische Maßnahmen könnten sowohl die wirtschaftliche Mobilität als auch die soziale Vernetzung beeinflussen. Wenn diese Variablen nicht berücksichtigt werden, könnte ein scheinbarer Zusammenhang zwischen Vernetzung und Mobilität bestehen, obwohl dieser tatsächlich durch diese ausgelassenen Faktoren verursacht wird.
Argumente gegen die genannten Faktoren
Rückwärtskausalität: Die Autoren untersuchen die Economic Connectedness (EC) während der Kindheit, basierend auf Freundschaften in der Schulzeit. Da diese Freundschaften vor der Arbeitsaufnahme entstehen, können sie nicht durch Mobilität im Erwachsenenalter beeinflusst sein. Die Korrelation zwischen Kindheits-EC und Mobilität bleibt hoch, was Rückwärtskausalität als Hauptursache unwahrscheinlich macht.
Selektionseffekte: Chetty et al. nutzen Daten aus quasi-experimentellen Studien, die den Einfluss von Migration auf Mobilität untersuchen. Ihre Ergebnisse zeigen, dass Familien, die in Regionen mit hoher EC ziehen, höhere Mobilitätschancen haben. Dies spricht für einen kausalen Effekt der Region und nicht ausschließlich für Selektion.
Ausgelassene Variablen: In multivariaten Analysen kontrollieren die Autoren für andere potenzielle Einflussfaktoren wie Einkommensungleichheit, Segregation und Bildung. EC bleibt der stärkste Prädiktor für Mobilität, auch wenn andere Variablen einbezogen werden.
Bewertung der Argumentation
Glaubhaftigkeit: Die Argumentation ist methodisch gut fundiert, insbesondere durch die Berücksichtigung von Kindheits-EC und den Einsatz von quasi-experimentellen Methoden.
Kritische Punkte:
- Die Messung von Kindheits-EC basiert auf Facebook-Daten und könnte nicht repräsentativ für die gesamte Bevölkerung sein.
- Obwohl viele potenzielle Variablen berücksichtigt werden, könnten immer noch nicht erfasste Faktoren existieren, die EC und Mobilität beeinflussen.
- Quasi-experimentelle Ansätze können durch systematische Unterschiede in den untersuchten Gruppen (z. B. Zuzügler vs. lokale Bevölkerung) verzerrt sein.
Optimale Bedingungen für die Messung eines kausalen Effekts
Um einen kausalen Effekt der sozialen Vernetzung auf wirtschaftliche Mobilität zu messen, wären folgende Bedingungen erforderlich:
- Randomisierte Zuweisung: Familien sollten zufällig in Regionen mit unterschiedlicher EC zugewiesen werden, um Selektionseffekte auszuschließen.
- Langfristige Beobachtung: Eine Kohorte von Kindern sollte über mehrere Jahrzehnte hinweg beobachtet werden, um langfristige Effekte zu analysieren.
- Breite Datengrundlage: Daten sollten nicht nur auf Facebook-Nutzern basieren, sondern auch andere soziale Schichten und Gruppen umfassen.
- Kontrolle relevanter Variablen: Variablen wie Bildung, Einkommensungleichheit, Arbeitsmarktsituation und Segregation sollten umfassend berücksichtigt werden.
- Kulturelle und lokale Unterschiede: Effekte der EC sollten in verschiedenen Regionen und unter unterschiedlichen sozialen und kulturellen Bedingungen untersucht werden, um universelle Schlüsse zu ziehen.
Einflussfaktoren auf die soziale Vernetzung
Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?
- Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe
Exposition (
exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.
Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.
Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?
Beschreibung und Interpretation der Karten
Karte aus Aufgabe 7 (Economic Connectedness Index): Diese Karte zeigt den Economic Connectedness Index (EC) auf County-Ebene in den USA. Regionen mit höheren Werten sind farblich heller dargestellt (grün-gelb), was auf eine stärkere soziale Vernetzung hindeutet. Hohe EC-Werte konzentrieren sich in der Regel auf wirtschaftlich starke Regionen wie Teile der Küstenstaaten (z. B. Kalifornien und der Nordosten) und einige Teile des Mittleren Westens.
Karte aus Aufgabe 14 (Exposition): Die zweite Karte zeigt die Exposition (den Anteil von gut verdienenden Personen, mit denen jemand in Kontakt kommen kann) auf County-Ebene. Die Farbskala ist ähnlich wie bei der ersten Karte, wobei hellere Farben (grün-gelb) auf eine höhere Exposition hinweisen. Auch hier zeigen die Küstenregionen und einige zentrale Regionen (z. B. in Texas) höhere Werte. In wirtschaftlich schwächeren Regionen wie dem Südosten der USA sind die Expositionswerte tendenziell niedriger. Vergleich der Karten
Ähnlichkeiten: Die räumlichen Muster in beiden Karten sind stark korreliert. Regionen mit hohem Economic Connectedness Index weisen auch eine hohe Exposition auf, was darauf hindeutet, dass die Durchmischung verschiedener sozioökonomischer Gruppen (Exposition) ein zentraler Treiber für die soziale Vernetzung ist. Küstenregionen und wirtschaftlich starke Gebiete (z. B. Kalifornien, New York) haben sowohl hohe Expositionswerte als auch hohe EC-Werte.
Unterschiede: Einige Counties zeigen relativ hohe Expositionswerte, aber vergleichsweise niedrigere EC-Werte. Dies könnte darauf hinweisen, dass die bloße Präsenz von gut verdienenden Personen nicht automatisch zu einer starken sozialen Vernetzung führt. Es könnten zusätzliche Faktoren wie Segregation, Bildungszugang oder kulturelle Barrieren eine Rolle spielen.
Einfluss der Exposition auf wirtschaftliche Vernetzung
Annahme: Wenn es in einem County keine gut verdienenden Personen gibt, ist es schwierig, soziale Verbindungen zu diesen aufzubauen.
Befund: Die Karten bestätigen diese Annahme größtenteils. Regionen mit niedriger Exposition (z. B. Teile des Südostens) weisen tendenziell auch einen niedrigeren Economic Connectedness Index auf. Es scheint, dass die Präsenz gut verdienender Personen eine notwendige Voraussetzung für eine hohe soziale Vernetzung ist.
Fazit: Die Exposition ist ein zentraler Treiber für den Economic Connectedness Index, da Regionen mit hoher Exposition tendenziell auch höhere EC-Werte aufweisen. Allerdings reicht die bloße Präsenz von gut verdienenden Personen nicht aus, um eine hohe soziale Vernetzung sicherzustellen. Weitere Faktoren wie soziale Barrieren, Segregation und Bildungszugang sollten untersucht werden, um die Unterschiede in den EC-Werten zwischen Regionen mit ähnlicher Exposition zu erklären.
Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.
- Um zu untersuchen ob es eine entsprechende Segregation der
Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein
Punktediagramm erzeugen, welche auf der x-Achse die Exposition
(
exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihrer Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.
Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:
- Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?
Beschreibung
Die Grafik zeigt die Beziehung zwischen Exposition, Freundschafts-Bias und der sozialen Vernetzung (Economic Connectedness Index) auf der Ebene der US-Counties. Die Punkte repräsentieren einzelne Counties, die nach drei Dimensionen beschrieben werden:
X-Achse (Exposition): Diese Achse zeigt, wie häufig Menschen aus unterschiedlichen sozialen Schichten (insbesondere niedrige vs. hohe Einkommensschichten) in einem County potenziell in Kontakt kommen können. Höhere Werte bedeuten eine größere Exposition zu Menschen aus höheren Einkommensgruppen.
Y-Achse (Freundschafts-Bias): Diese Achse misst, inwieweit Menschen trotz der Möglichkeit, Freunde aus anderen sozialen Schichten zu finden, innerhalb ihrer eigenen Schicht bleiben. Höhere Werte zeigen eine stärkere Tendenz zur sozialen Abschottung (Segregation).
Farbskala (Economic Connectedness): Die Farbe der Punkte repräsentiert den Economic Connectedness Index. Gelbe/grüne Punkte stehen für eine starke soziale Vernetzung, während violett/blaue Punkte für eine schwächere Vernetzung stehen.
Hervorgehobene Counties
San Francisco County, California: Dieses County hat eine hohe Exposition und einen niedrigen Freundschafts-Bias, was zu einer hohen sozialen Vernetzung führt (gelber Punkt). Bronx County, New York: Dieses County zeigt eine moderate Exposition, aber einen hohen Freundschafts-Bias, was zu einer geringeren sozialen Vernetzung führt (dunkelvioletter Punkt).
Hauptmuster: Punkte mit hoher Exposition und niedrigem Freundschafts-Bias liegen in der Regel weiter rechts unten und sind häufig heller gefärbt (hoher Economic Connectedness Index). Punkte mit niedrigem Economic Connectedness Index (blau/violett) finden sich häufig bei geringer Exposition oder hohem Bias.
Interpretation
1. Einfluss von Exposition:
Definition: Exposition beschreibt die potenzielle Möglichkeit, mit Personen aus höheren Einkommensgruppen in Kontakt zu treten. Beobachtung: Höhere Expositionswerte (rechte Seite der Grafik) sind oft mit einer höheren sozialen Vernetzung (hellere Farben: grün/gelb) verbunden. Regionen mit niedriger Exposition (linke Seite der Grafik) weisen fast ausschließlich niedrigere Werte der sozialen Vernetzung auf (dunkelblau/violett). Erklärung: Ohne Zugang zu Menschen aus höheren sozioökonomischen Schichten ist es kaum möglich, soziale Verbindungen über Einkommensgrenzen hinweg aufzubauen. Daher bildet eine hohe Exposition die Grundlage für starke soziale Vernetzung.
2. Einfluss von Freundschafts-Bias:
Definition: Freundschafts-Bias misst, inwieweit Menschen bevorzugt innerhalb ihrer eigenen sozialen Schicht bleiben, auch wenn sie Zugang zu anderen sozialen Gruppen haben. Beobachtung: Ein hoher Freundschafts-Bias (oben in der Grafik) korreliert mit niedriger sozialer Vernetzung (dunklere Farben). Selbst bei moderater bis hoher Exposition (z. B. mittlere bis rechte Bereiche auf der x-Achse) bleibt die soziale Vernetzung gering, wenn der Bias hoch ist. Ein niedriger Freundschafts-Bias (unten in der Grafik) fördert dagegen die soziale Vernetzung, insbesondere bei hoher Exposition. Erklärung: Ein hoher Bias verhindert, dass Menschen die Chance nutzen, sich mit Personen aus anderen sozialen Schichten anzufreunden, selbst wenn Exposition vorhanden ist. Das reduziert die soziale Vernetzung.
3. Vergleich der hervorgehobenen Counties:
San Francisco County, California: Hohe Exposition und niedriger Freundschafts-Bias führen zu einer sehr hohen sozialen Vernetzung (Economic Connectedness Index). Menschen in diesem County nutzen die Möglichkeit, Freundschaften über Einkommensgrenzen hinweg zu bilden, was ihre wirtschaftliche Mobilität stärkt. Bronx County, New York: Trotz moderater Exposition ist der Freundschafts-Bias deutlich höher, was die soziale Vernetzung schwächt. Dies zeigt, dass die bloße Präsenz von Menschen aus höheren Einkommensgruppen nicht ausreicht, um starke soziale Verbindungen zu fördern, wenn Bias und Segregation vorherrschen.
4. Zusammenwirken von Exposition und Freundschafts-Bias:
Die Grafik verdeutlicht, dass Exposition und Freundschafts-Bias sich gegenseitig bedingen: Hohe Exposition: Ermöglicht Verbindungen zwischen sozialen Schichten, ist aber nicht allein ausreichend. Niedriger Freundschafts-Bias: Entscheidend für die tatsächliche Bildung solcher Verbindungen. Regionen mit niedriger sozialer Vernetzung (dunkle Farben) weisen entweder geringe Exposition, hohen Bias oder beides auf. Dies unterstreicht, dass beide Faktoren in Kombination notwendig sind, um eine hohe soziale Vernetzung zu erreichen.
Rolle von Exposition und Bias bei der Förderung sozialer Vernetzung und Mobilität
Exposition schafft die Grundlage für soziale Vernetzung, indem sie Kontaktmöglichkeiten zwischen sozialen Schichten ermöglicht. Ein niedriger Freundschafts-Bias ist jedoch die entscheidende Voraussetzung, um diese Möglichkeiten in echte soziale Verbindungen zu übersetzen. Maßnahmen, die sowohl Exposition fördern (z. B. durch durchmischte Wohn- und Bildungspolitik) als auch den Freundschafts-Bias abbauen (z. B. durch soziale Programme oder Bildungsinitiativen), könnten die soziale Vernetzung und damit die wirtschaftliche Mobilität erheblich verbessern.
- Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.
1. Förderung von Durchmischung und Reduzierung von Segregation
Problem:
Die Karten zeigen, dass Regionen mit niedriger Exposition oft auch niedrigere Werte im Economic Connectedness Index aufweisen. Gleichzeitig kann ein hoher Freundschafts-Bias die Vernetzung selbst bei hoher Exposition einschränken.
Maßnahmen:
Wohnungsbaupolitik: Förderung von durchmischten Wohnvierteln durch sozial gemischte Bauprojekte, die sowohl einkommensschwachen als auch einkommensstarken Familien zugutekommen.
Subventionierte Wohnmöglichkeiten: Finanzielle Anreize für einkommensstärkere Familien, in benachteiligte Gegenden zu ziehen, um die Exposition zu erhöhen.
Städtische Planung: Investitionen in gemeinsame öffentliche Räume (Parks, Gemeinschaftszentren), die soziale Interaktionen zwischen verschiedenen Gruppen fördern.
2. Verbesserung des Zugangs zu hochwertigen Bildungseinrichtungen
Problem:
Bildungsungleichheit kann die Durchmischung in Schulen verhindern und den Freundschafts-Bias verstärken.
Maßnahmen:
Schulreformen: Einführung von integrativen Schulmodellen, bei denen Kinder aus unterschiedlichen sozioökonomischen Hintergründen in dieselben Schulen gehen.
Schüleraustauschprogramme: Programme, die Schüler aus einkommensschwachen Regionen den Zugang zu besser ausgestatteten Schulen ermöglichen, fördern Exposition und Vernetzung.
Förderung von außerschulischen Aktivitäten: Investitionen in Sport- und Freizeitprogramme, die den Kontakt zwischen Schülern verschiedener Schichten erleichtern.
3. Förderung von interkulturellem und sozialem Austausch
Problem:
Ein hoher Freundschafts-Bias zeigt, dass Menschen oft innerhalb ihrer eigenen sozioökonomischen Gruppen bleiben.
Maßnahmen:
Mentorenprogramme: Initiativen, die einkommensstärkere Personen mit einkommensschwachen Jugendlichen verbinden, können langfristige Beziehungen fördern.
Gemeinschaftsprojekte: Förderung von Projekten, bei denen verschiedene soziale Gruppen zusammenarbeiten, z. B. Freiwilligenarbeit oder Nachbarschaftsinitiativen.
Öffentliche Kampagnen: Sensibilisierungskampagnen, die den Wert von Vielfalt und sozialer Vernetzung betonen.
4. Wirtschaftliche und infrastrukturelle Förderung
Problem:
Benachteiligte Regionen fehlen oft die finanziellen Ressourcen, um soziale Vernetzung zu fördern.
Maßnahmen:
Regionale Förderprogramme: Zielgerichtete Investitionen in benachteiligte Regionen, um Arbeitsplätze und Infrastruktur zu schaffen.
Transportförderung: Ausbau von öffentlichen Verkehrsmitteln, um Menschen aus verschiedenen Regionen und sozioökonomischen Hintergründen zu verbinden.
Anreize für Unternehmen: Steuerliche Vorteile für Unternehmen, die Programme zur Förderung von sozialer Vernetzung am Arbeitsplatz anbieten.
5. Förderung sozialer Netzwerke durch digitale Plattformen
Problem:
Die Ergebnisse deuten darauf hin, dass persönliche Kontakte für soziale Vernetzung entscheidend sind, aber digitale Tools bleiben ungenutzt.
Maßnahmen:
Digitale Netzwerke: Aufbau von Plattformen, die Menschen aus verschiedenen Schichten miteinander verbinden, z. B. über Mentoring-Programme, Bildung oder berufliche Netzwerke.
Zugang zu Technologie: Bereitstellung von erschwinglichem Internet und digitalen Geräten in einkommensschwachen Regionen.
Zusammenfassung
Die Förderung der sozialen Vernetzung und damit der wirtschaftlichen Chancen in benachteiligten Regionen erfordert eine Kombination aus Wohnungsbaupolitik, Bildungsförderung, sozialem Austausch, wirtschaftlicher Unterstützung und digitalen Lösungen. Politische Maßnahmen sollten darauf abzielen, die Exposition zu erhöhen und den Freundschafts-Bias zu verringern, wie es in den Analysen von San Francisco (geringer Bias, hohe Vernetzung) und Bronx (hoher Bias, niedrige Vernetzung) deutlich wurde. Ziel ist es, Hindernisse für soziale Durchmischung zu beseitigen und interaktive Begegnungen zwischen verschiedenen sozioökonomischen Gruppen aktiv zu fördern.
Zusatzaufgabe
- Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:
Hier können Sie die Daten auf College Ebene herunterladen
- Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten
funktioniert dies mit dem R Paket tidycensus. Für
den API Zugang müssen Sie sich erst bei IPUMS registrieren und können
danach einen API Key beantragen, welchen Sie dann für den Daten download
über das
tidycencusPaket hinterlegen müssen.
Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.
- Stellen Sie den Economic Connectedness Index des Colleges
(
ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paketleaflet.