Motivation

In diesem Projekt untersuchen Sie, wie soziale Netzwerke – insbesondere Freundschaften – wirtschaftliche Chancen und sozialen Aufstieg beeinflussen. Dabei greifen Sie auf einen Datensatz von 70,3 Millionen Facebook Nutzern zurück, um das Konzept des Sozialkapitals besser zu verstehen. Ihr Ziel ist es, zu analysieren, wie stark Menschen aus unterschiedlichen sozioökonomischen Hintergründen miteinander vernetzt sind und welche Auswirkungen dies auf die wirtschaftliche Mobilität hat.

Fokus der Analyse
Das Projekt konzentriert sich auf zwei zentrale Aspekte sozialer Vernetzung:

Warum ist das relevant?
Eine zentrale Fragestellung des Projekts ist es, zu untersuchen, ob und in welchem Ausmaß soziale Netzwerke – insbesondere Freundschaften – zu wirtschaftlicher Mobilität beitragen. Frühere Studien deuten darauf hin, dass ein Mangel an sozialer Interaktion über Klassengrenzen hinweg mit geringeren Aufstiegschancen verbunden ist. Menschen, die stärker über soziale Schichten hinweg vernetzt sind, profitieren tendenziell von besseren wirtschaftlichen Perspektiven.

Doch der genaue Zusammenhang zwischen Sozialkapital und wirtschaftlicher Mobilität ist bisher nur teilweise verstanden. Ihr Projekt hat daher das Ziel, diesen Zusammenhang empirisch zu untersuchen und offenzulegen. Sie analysieren, inwiefern unterschiedliche Formen sozialer Vernetzung Chancen auf sozialen Aufstieg beeinflussen – oder behindern.

Datengrundlage

Für Ihre Analyse verwenden Sie reale Daten des Social Capital Atlas (https://www.socialcapital.org). Ihr Ziel ist es, herauszufinden:

Durch Ihre eigene Analyse decken Sie nicht nur bestehende Muster auf, sondern tragen auch dazu bei, neue Erkenntnisse darüber zu gewinnen, wie soziale Netzwerke Chancen für wirtschaftlichen Aufstieg verbessern können.

Einlesen

Dieses Projekt basiert auf öffentlich zugänglichen Facebook-Daten, welche die soziale Vernetzung auf County Ebene messen. Die zugrunde liegende Datenquelle wurde in den Studien von Chetty et al. (2022a, 2022b) detailliert beschrieben und liefert wichtige Einblicke in die soziale Vernetzung über sozioökonomische Grenzen hinweg. Für Ihre Analyse stellen wir Ihnen diesen Datensatz zur Verfügung.

  1. Lesen Sie den Datensatz social_capital_county.rds aus dem Unterordner “Daten” in R ein und nennen diesen Datensatz social_capital_county. Dieser Datensatz beinhaltet Variablen, welche von Facebook stammen und die Freundschaftsverbindungen einzelner Personen untereinander (aggregiert auf County-Ebene) darstellen.

Schränken Sie ihren Datensatz auf folgende Variablen ein:

  • county
  • ec_county
  • exposure_gpr_mem_county
  • bias_grp_mem_county
  • pop2018

Bitte beschreiben Sie die Variablen, nutzen Sie dafür die bereitgestellte Datei “social_capital_codebook.pdf”.

Beantworten Sie auch folgende Fragen:

  • Was ist eine Beobachtung?
  • Wie viele Counties sind in diesem Datensatz vorhanden? Wie viele Counties hat die USA?
  • In wie viel Prozent der Fälle haben Sie Informationen zu allen Variablen einer Beobachtung in dem vorliegenden Datensatz?

Beschreibung der Variablen:

Die Variable county enthält einen fünfstelligen FIPS (Federal Information Processing Standards) Code zur eindeutigen Identifizierung der US-Counties. Die ersten beiden Ziffern stehen für den Bundesstaat und die letzten drei Ziffern für den Bezirk.

“ec_county” misst die wirtschaftliche Verbundenheit in einem County. Sie beschreibt, wie stark Menschen unterschiedlicher sozialer und wirtschaftlicher Hintergründe miteinander in Kontakt stehen, gemessen mit ihrem SES (Sozioökonomischer Score).

Die Variable exposure_grp_mem_county beschreibt den durchschnittlichen Kontakt von Individuen mit einem niedrigen sozioökonomischen Status (low-SES) zu Individuen mit einem hohen sozioökonomischen Status (high-SES) in den jeweiligen Counties. Es wird der durchschnittliche Anteil von high-SES-Individuen innerhalb der Gruppen von low-SES-Individuen berechnet. Die Berechnung wird mit dem Faktor 2 multipliziert, um die Exposition deutlicher hervorzuheben. Anschließend wird dieser Wert über alle low-SES-User in einem County gemittelt.

Die Variable bias_grp_mem_county misst den Freundschafts-Bias in einem Landkreis und beschreibt das Ausmaß, in dem low-SES-Individuen weniger wahrscheinlich mit high-SES-Individuen Freundschaften schließen, als man es auf Basis ihrer Exposition gegenüber high-SES-Individuen erwarten würde.Es vergleicht das Verhältnis der wirtschaftlichen Verbundenheit (ec_county) zur Exposition gegenüber hoch-SES Leuten (exposure_gpr_mem_county).

Pop2018 zeigt die Bevölkerung der Counties in 2018, die Zahlen stammen nicht von Facebook, sondern aus öffentlich zugänglichen Informationen des US-amerikanischen Zensus.

Eine Beobachtung in diesem Datensatz repräsentiert einen Landkreis und enthält aggregierte Daten zur wirtschaftlichen Vernetzung, Exposition gegenüber high-SES-Individuen, Friending Bias und der Bevölkerung des Landkreises im Jahr 2018. Der Datensatz enthält sämtliche Informationen zu über 3089 Counties, die USA hat 3144 Counties. Außerdem hat man in 95.14% der Fälle Informationen zu allen Variablen.


  1. Weiterhin haben wir Ihnen den Datensatz county_covariates.dta im Unterordner “Daten” bereitgestellt, welcher unter anderem Daten aus dem Opportunity Atlas enthält und in Chetty et al. (2018) vorgestellt wird. Lesen Sie diese Daten in R ein und nennen Sie ihn covariates.

Schränken Sie diesen Datensatz auf die folgenden Variablen ein:

  • county
  • kfr_pooled_pooled_p25
  • gini99_simple

Generieren Sie eine neue Variable upward_mobility als kfr_pooled_pooled_p25*100. Löschen Sie weiterhin die Variable kfr_pooled_pooled_p25.

Bitte beschreiben Sie die Variablen in ihrem Datensatz, nutzen Sie dafür die bereitgestellte Datei “replication_package_README.pdf”.

Hinweis: Mit dem haven Paket können Sie .dta Dateien einlesen


Beschreibung der Variablen:

Die Variable gini99_simple ist der einfache geschätzte Gini-Koeffizient abzüglich des Einkommensanteils der obersten 1 % zur Messung der Einkommensungleichheit anhand von Steuerdaten. Der Gini-Koeffizient ist ein gängiges Maß für Einkommensungleichheit innerhalb einer Bevölkerung. Werte reichen von 0 (vollständige Einkommensgleichheit) bis 1 (maximale Einkommensungleichheit). Diese Art der Berechnung hilft, das Bild von Einkommensungleichheit ohne den Einfluss der sehr wohlhabenden Oberklasse zu vermitteln, was nützlich sein kann, um eine präzisere Vorstellung von der Ungleichheit in der breiten Bevölkerung zu erhalten.

kfr_pooled_pooled_p25 beschreibt das mittlere Einkommensperzentil im Erwachsenenalter eines Kindes, dessen Eltern in dem 25. Perzentil der Einkommensverteilung liegen. Dies gibt an, wie sich das Einkommen eines Kindes im Vergleich zu anderen Menschen in der Gesellschaft entwickelt, wenn es von Eltern mit einem Einkommen im unteren Viertel der Einkommensverteilung aufgezogen wurde.

Die neue Variable upward_mobility wurde als 100-mal der kfr_pooled_pooled_p25-Werte berechnet, um die wirtschaftliche Aufwärtsmobilität darzustellen. Eine höhere Zahl in dieser Variable deutet auf eine größere Wahrscheinlichkeit hin, dass Individuen in den unteren Einkommensbereichen in höhere Einkommensklassen aufsteigen.


  1. Um Karten wie bspw. in der Case Study zu erstellen, benötigen Sie Kartendaten in Form von Shapefiles (Endung .shp). In einer späteren Analyse sollen Sie die soziale Vernetzung und andere Variablen zwischen den Counties mittels einer Karte visualisieren. Hierzu benötigen Sie jedoch erst die nötigen Shapefiles, welche wir Ihnen im Unterordner “Daten” bereitgestellt haben (County_census_data.shp). Diese Daten haben wir mittels des Pakets tidycensus direkt von der amerikanischen Statistikbehörde IPUMS heruntergeladen. Neben den Geografischen Informationen der Counties sind auch noch weitere Daten enthalten.

Lesen sie die Daten County_census_data.shp in R ein und speichern diesen in R als county_census_shape ab. Neben den County Namen und und Polygonen enthält dieser Datensatz auch das geschätzte Median Einkommen pro County für das Jahr 2023 (medincE).

Hinweis: Achten Sie darauf eine numerische county Variable aus GEOID zu generieren



  1. Verbinden Sie die Dataframes county_census_shape, covariates und social_capital_county zu einem Datensatz analysis_data.
  • Welche Art von Join sollten sie hierbei verwenden? Warum gerade diesen Join?
  • Welcher Datensatz sollte der Hauptdatensatz sein? Warum?

Ein Left Join ist sinnvoll, da wir sicher stellen möchten, dass alle Counties aus dem Hauptdatensatz erhalten bleiben, auch wenn es keine Übereinstimmungen in den anderen Datensätzen gibt.

Der Datensatz “covariates” enthält wichtige Kennzahlen, wie den Gini-Koeffizienten und die upward mobility. Die anderen Datensätze (county_census_shape und social_capital_county) enthalten zusätzliche Eigenschaften, die für die Analyse hinzugefügt werden sollen. Außerdem sollen alle Daten aus “covariates” erhalten bleiben, auch wenn die anderen Datensätze keine passenden Einträge besitzen. Der Datensatz “covariates” ist der größte, welcher die meisten Counties enthält und deswegen macht es durchaus Sinn, diesen als Hauptdatensatz zu betrachten, um möglichst alle Informationen zu allen Counties zu bekommen.


  1. Folgende Variablen werden Sie in diesem Projekt hauptsächlich nutzen:
  • upward_mobility
  • ec_county
  • exposure_gpr_mem_county
  • bias_grp_mem_county

Bevor Sie eine Analyse tätigen, sollten Sie sich überlegen, welche Erwartungen bzgl. der Zusammenhänge innerhalb der einzelnen Variablen Sie haben. Gehen Sie dabei auf folgende Fragen ein:

  • Was genau misst die wirtschaftliche Mobilität (upward_mobility) und die soziale Vernetzung (ec_county)? Warum sollte ein hoher Wert der sozialen Vernetzung auch potentiell gute ökonomische Aufstiegschancen, d.h. eine hohe wirtschaftliche Mobilität, mit sich bringen? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.
  • Bitte schauen Sie sich an, wie die sozialen Vernetzung (ec_county) berechnet wird. Was würden Sie erwarten, wie die Exposition (exposure_gpr_mem_county) und der Freundschafts-Bias (bias_grp_mem_county) die sozialen Vernetzung (ec_county) beeinflusst? Begründen Sie und benennen Sie explizit die Annahmen, die ihrer Begründung zugrunde liegen.

Hinweis: Die genaue Berechnung der sozialen Vernetzung (ec_county) finden Sie im Dokument “social_capital_codebook.pdf”


Die wirtschaftliche Mobilität (upward_mobility) misst, wie wahrscheinlich es für eine Person ist, aus einer einkommensschwachen Schicht in eine höhere Einkommensklasse aufzusteigen. Der Berechnung zur Folge nach, zeigt diese Variable, das durchschnittliche Einkommensperzentil eines Kindes im Erwachsenenalters, welches Eltern im 25%-Perzentil hat.

Die soziale Vernetzung (ec_county) ist ein Maß für soziale Vernetzung innerhalb eines Countys, das beschreibt, wie stark Menschen unterschiedlicher sozialer und wirtschaftlicher Hintergründe miteinander in Kontakt stehen. Daraus folgt, dass ein hoher Wert für soziale Vernetzung zu besseren ökonomischen Aufstiegschancen führen könnte, da Personen mit einer hohen sozialen Vernetzung oftmals von einem größeren Zugang zu Informationen, Ressourcen und Jobchancen profitieren, die durch heterogene Netzwerke vermittelt werden. Außerdem könnten Kontakte zu Personen aus höheren Einkommensschichten Bildungs- und Beschäftigungschancen, Empfehlungen oder den Zugang zu wirtschaftlich vorteilhaften Netzwerken fördern.

“ec_county” misst die ökonomische Vernetzung in einem County und gibt an, wie stark Personen mit niedrigem sozioökonomischen Status (SES) mit Personen aus höherem SES verbunden sind. Sie wird berechnet als das zweifache des Anteils der Freunde mit hohem sozialen Status unter Personen mit niedrigem sozialen Status, gewichtet und gemittelt über alle Personen mit niedrigem sozialen Status im County.

“exposure_gpr_mem_county” misst die durchschnittliche Exposition von Menschen mit niedrigem sozioökonomischen Status gegenüber Personen mit hohem Status in einem County und “bias_grp_mem_county” misst den Freundschafts-Bias innerhalb eines Countys und gibt an, inwieweit Menschen mit niedrigem sozioökonomischen Status eher dazu neigen, Freundschaften innerhalb ihrer eigenen sozioökonomischen Gruppe zu bilden.

Eine höhere Exposition von Menschen mit niedrigem sozioökonomischen Status gegenüber Personen mit höherem Status, gemessen durch exposure_gpr_mem_county, sollte die soziale Vernetzung positiv beeinflussen. Wenn ärmere Menschen regelmäßig mit Personen höheren sozioökonomischen Status interagieren, haben sie besseren Zugang zu Ressourcen und Netzwerken, die ihre wirtschaftliche Mobilität fördern.

Ein niedrigerer Freundschafts-Bias deutet darauf hin, dass Personen mit geringerem Status weniger in sozialen Segregationen verhaftet sind und eher Freundschaften mit Menschen mit hohem sozialen Status interagieren, was ebenfalls die soziale Vernetzung stärkt. Beide Faktoren fördern die Integration und somit den Zugang zu besseren Chancen, was die ökonomische Mobilität steigert. Ein hoher Freundschafts-Bias führt allerdings zu weniger Verbindungen zwischen den unterschiedlichen Klassen, da hauptsächlich innerhalb der eigenen sozioökonomischen Gruppe Freundschaften gepflegt werden, was die soziale Vernetzung verringert und die wirtschaftliche Mobilität einschränkt.


Deskriptive Analysen

Nun haben Sie alle Daten zusammen, die Sie für die Analyse der soziodemographischen Zusammenhänge innerhalb der einzelnen Counties benötigen und können in ihre Analysen einsteigen.

  1. Schauen Sie sich in einem ersten Schritt an, wie die Variablen im Datensatz analysis_data über alle Counties verteilt sind. Konkret sollten Sie eine Tabelle erstellen, welche Informationen zu allen numerischen Variablen in ihrem Datensatz darstellt. Berechnen Sie zu jeder Variablen den Mittelwert, den Median, das Minimum, das Maximum, die Standardabweichung, sowie das 25%- und das 75%- Quantil bezogen auf alle Counties.

Beschreiben und interpretieren Sie Ihre Tabelle.

Bei welchen Variablen gibt es Auffälligkeiten? Gibt es Ausreißer nach oben oder unten?

Hinweis: Achten Sie auf eine schöne Darstellung ihrer Tabelle mittels der Pakete kableExtra oder gt!


Statistische Zusammenfassung ausgewählter Variablen
Mittelwert Standardabweichung Minimum 25%-Quantil Median 75%-Quantil Maximum
Wirtschaftliche Mobilität 42.72 6.48 12.22 38.44 41.95 46.07 68.83
Median Einkommen 64956.94 18342.48 16170.00 54088.00 63125.00 73051.00 178707.00
Economic Connectedness 0.81 0.18 0.29 0.70 0.81 0.94 1.36
Exposition 0.91 0.21 0.26 0.77 0.91 1.05 1.49
Freundschafts-Bias 0.06 0.05 -0.11 0.03 0.06 0.10 0.33
Bevölkerung 2018 108010.41 337782.56 544.00 12630.00 27887.00 72728.50 10098052.00
Gini-Koeffizient 0.29 0.06 -0.06 0.24 0.29 0.33 0.57

Die Tabelle zeigt eine Übersicht der statistischen Kennzahlen der ausgewählten Variablen. Dadurch können interessante Ergebnisse und einige auffällige Werte, die auf mögliche Ausreißer oder Besonderheiten in den Daten hinweisen erkannt werden.

Die Variable Wirtschaftliche Mobilität weist mit einem Mittelwert von 42.72 und einem Median von 41.95, welche nahe bei einander liegen, eine relativ geringe Streuung auf, was durch die moderate Standardabweichung von 6.48 unterstützt wird. Dennoch gibt es nach unten hin einen doch auffälligen Ausreißer, mit 12.22. Dies könnte auf ein County hinweisen, in dem die soziale Aufwärtsmobilität extrem niedrig ist, was möglicherweise mit strukturellen Problemen wie Armut, Kriminalität oder unzureichendem Zugang zu Bildung zusammenhängt und ein möglicher Hinweis auf sozioökonomische Barrieren sein könnte. Das Maximum von 68.83 zeigt, dass es aber auch Counties gibt, in denen die Aufwärtsmobilität besonders hoch ist, was auf eine starke lokale Wirtschaft, stärkere soziale Vernetzungen oder gute Bildungsangebote hindeuten könnte.

Das Median-Einkommen, das als Maß für den ökonomischen Status einer Region/eines Counties dienen kann, ist ebenfalls von großer Bedeutung. Mittelwert und Median zeigen, dass die meisten Einkommen recht ausgewogen verteilt sind und der Großteil dieser um die beiden Werte (ca.64000) liegt. Nichtsdestotrotz gibt es eine hohe Streuung aufgrund der hohen Spanne der Maximum- und Minimumwerte. Das Vorhandensein von sehr hohen Einkommen (178707 Dollar) in einigen Counties könnte die Exposition und den sozialen Aufstieg in diesen Regionen begünstigen, allerdings könnte es dadurch auch eine stärke Vernetzung in den Oberschichten geben, wodurch einkommensschwächere Personen ausgegrenzt werden. Auf der anderen Seite, in ärmeren Landkreisen mit niedrigeren Einkommen (16170 Dollar), sehen die Chancen auf wirtschaftliche Mobilität deutlich eingeschränkter aus (Fehlende soziale Netzwerke, Bildungschancen etc.).

Ein hoher Wert der Ökonomische Vernetzung deutet darauf hin, dass die Menschen innerhalb eines Landkreises über vielfältige ökonomische Netzwerke verfügen, die Menschen aus unterschiedlichen sozialen und wirtschaftlichen Schichten miteinander verbinden. Mittelwert und Median sind hier identisch bei 0.81 und im Zusammenhang mit der Standardabweichung (0.18) und den Quantilen lässt sich sagen, dass die Verteilung symmetrisch ist und es keine große Verschiebung der Daten gibt. Dennoch zeigen die Extremwerte Unterschiede auf. Menschen in Counties mit höherer Vernetzung (z.B.: 1.36) haben wahrscheinlich tendenziell bessere Chancen, Bildungsangebote und wirtschaftliche Möglichkeiten. Durch Kontakte zu einflussreicheren oder gut vernetzten Individuen aus höheren sozialen Schichten, die Ratschläge, Empfehlungen oder berufliche Gelegenheiten bieten, können sie profitieren. Ein hoher Wert der Vernetzung könnte dazu beitragen, soziale Isolation zu verringern und den Austausch von Kultur, Erfahrungen und Wissen zu fördern. Es ist davon auszugehen, dass eine bessere soziale Vernetzung mit einer besseren Aufstiegsmöglichkeit einhergeht. Gleichzeitig wird eine schlechtere Vernetzung die Ausgrenzung und das Leben in getrennten und identischen Gruppen fördern, was wiederum schlecht für die sozioökonomische Entwicklung der Personen ist.

Der Mittelwert der Exposition (0.91) und der Median von 0.91 deuten darauf hin, dass es in den meisten Counties eine relativ starke Exposition gibt, welche den sozialen Aufstieg potenziell positiv unterstützt. Counties, in denen Menschen aus verschiedenen sozialen Schichten miteinander in Kontakt kommen, könnten ein besseres Umfeld für soziale Mobilität bieten. Das Minimum von 0.26 und das Maximum von 1.49 zeigen jedoch, dass es auch Regionen gibt, in denen die Exposition zwischen den Schichten entweder sehr gering oder besonders hoch ist. Geringe Exposition könnte zu einer Art sozialer Isolation führen und den Zugang zu wirtschaftlichen Chancen einschränken. Hohe Exposition hingegen könnte zu einem breiteren Austausch von Ressourcen und Möglichkeiten führen, was den sozialen Aufstieg fördert.

Der Freundschafts-Bias ist ebenfalls symmetrisch und ausgeglichen verteilt. Das Maximum von 0.33 deutet auf einen Ausreißer hin, möglicherweise in einem County in dem es eine starke Isolierung der einzelnen Gruppen gibt. Der negative Minimumwert von -0.11 ist ungewöhnlich und könnte bedeuten, dass Menschen aus unterschiedlichen sozialen Schichten besonders in Kontakt kommen. Dies fördert die Verbundenheit deutlich. Die Menschen scheinen in den meisten Landkreisen relativ offen für verschiedene soziale Verbindungen zu sein.

Die Bevölkerungszahl stellt einen weiteren wichtigen Indikator für die Struktur von Counties dar. Die Verteilung ist vermutlich rechtsschief, da der Median deutlich unter dem Mittelwert liegt. Die hohe Standardabweichung (337782) ist ebenfalls ein Indikator für die starken Unterschiede. Ein Maximum von 10098052 und der Mittelwert von 108010 zeigen, dass einige Landkreise sehr bevölkerungsreich sind, was möglicherweise mit einer besseren Vernetzung und einer stärkeren sozialen Mobilität einhergeht. Große Städte mit hoher Bevölkerungsdichte könnten auch mehr Möglichkeiten für Interaktionen über sozioökonomische Grenzen hinweg bieten. Kleinere Landkreise mit einer geringeren Bevölkerungszahl könnten dagegen isolierter sein, was den Austausch zwischen sozialen Schichten erschwert und damit die wirtschaftliche Mobilität einschränkt.

Der Gini-Koeffizient zeigt eine relativ ausgeglichene Einkommensverteilung, mit einzelnen Ausreißern. Das Maximum von 0.57 deutet darauf hin, dass es trotzdem in manchen Counties eine deutliche Einkommensungleichheit gibt. Diese Ungleichheit könnte auf ein schwaches soziales Kapital hinweisen, da soziale Netzwerke in ungleichen Gesellschaften häufig weniger integrativ sind. Der negative Wert von -0.06 im Minimum ist ungewöhnlich und könnte ein Indiz für fehlerhafte Daten sein, da die Werte im Normalfall zwischen 0 und 1 liegen müssten. Ein hoher Gini-Koeffizient könnte darauf hinweisen, dass die wirtschaftliche Mobilität in Regionen mit starker Ungleichheit sehr stark eingeschränkt ist, da es deutlich weniger Möglichkeiten gibt und es schwer ist aus dieser Ungleichverteilung heraus zu kommen.


Soziale Vernetzung und wirtschaftliche Mobilität

Ihre Analyse der Daten aus Aufgabe 6 gibt ihnen schon ein erstes Bild über die Verteilung der einzelnen Variablen. Jedoch sollten Sie für ihre Analyse näheres über die soziale Vernetzung lernen, den Economic Connectedness Index (ec_county), welcher aus den Facebook Freundschaften generiert wurde. Die Daten des Economic Connectedness Index wurden auf County Ebene aggregiert, beruhen jedoch auf Freundschaftsdaten von individuellen Facebook Nutzern.

  1. Um sich ein Bild der sozialen Vernetzung auf County Ebene machen zu können, sollten Sie diese in einer Karte der USA darstellen. Beschreiben und interpretieren Sie die gezeigte Karte.

Gehen Sie bei ihrer Interpretation auch auf folgende Frage ein:

Welche Annahme müssen Sie machen, damit Sie gültige Aussagen zum Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität tätigen können und Sie tatsächlich etwas über Freundschaftsnetzwerke lernen können?

Hinweis: Wenn Sie Karten der USA darstellen, dann empfiehlt sich das tigris Paket und der Befehl shift_geometry() um Alaska, Hawaii und Puerto Rico schön darstellen zu lassen.


Die Karte stellt den Economic Connectedness Index (ECI) auf County-Ebene in den USA dar, basierend auf aggregierten Freundschaftsdaten aus Facebook. Der Index misst, wie stark unterschiedliche sozioökonomische Gruppen innerhalb eines Countys vernetzt sind. Höhere Werte (gekennzeichnet durch gelb/orange Farben) stehen für eine stärkere ökonomische Vernetzung, während niedrigere Werte (violett/blau) auf eine schwächere Vernetzung hinweisen.

Bei Betrachtung der verschiedenen Regionen der USA, fällt einem auf, dass das gerade in zentraleren und Nord/Östlichen Regionen die Werte höher sind als im Süden. Niedrigere Werte dominieren vor allem in südlichen und südöstlichen Counties, wie z.B.: im Staat Florida. Diese Regionen könnten in Bezug auf sozioökonomische Interaktionen weniger durchmischt sein, was zu einer geringeren ökonomischen Vernetzung führt. Regionen im Nordosten und Zentrum der USA haben historisch stärkere industrielle und urbane Zentren entwickelt, die die Vernetzung über verschiedene sozioökonomische Gruppen hinweg begünstigen. Dagegen haben die südlichen und westlichen Staaten oft weniger städtische Ballungsräume und sind stärker von ländlicheren und einkommensschwächeren Regionen geprägt, die weniger durchmischte soziale Netzwerke aufweisen könnten. Im Südosten der USA bestehen seit Jahrhunderten tief verwurzelte soziale und wirtschaftliche Ungleichheiten, die bis in die Zeiten der Sklaverei und der Rassentrennung zurückreichen. Diese historischen Ungleichheiten haben dazu geführt, dass bestimmte sozioökonomische Gruppen, insbesondere Dunkelhäutige und andere Minderheiten, über Generationen hinweg von den gleichen wirtschaftlichen Chancen ausgeschlossen waren wie weiße, wohlhabendere Gruppen. Solche historischen Trennungen in sozialen und wirtschaftlichen Netzwerken haben möglicherweise auch die heutigen Strukturen sozialer Vernetzung beeinflusst. In vielen dieser Regionen haben sich soziale Netze stärker entlang von rassischen und sozioökonomischen Linien entwickelt, was dazu führt, dass die Vernetzung zwischen Menschen mit hohem und niedrigem SES weniger intensiv ist.

In wirtschaftlich stärkeren Regionen gibt es oft mehr Möglichkeiten für die Bevölkerung, sich mit unterschiedlichen sozioökonomischen Gruppen zu vernetzen, sei es im Bildungssystem, am Arbeitsmarkt oder in sozialen Einrichtungen. Des Weiteren lässt sich dadurch die größere Dichte und Vielfalt der sozialen Netzwerke in urbanen Zentren erklären, wo Menschen aus verschiedenen sozialen Schichten häufiger miteinander in Kontakt kommen und interagieren. In diesen Regionen sind die sozialen Netzwerke potenziell auch vielfältiger und bieten mehr Möglichkeiten für den Austausch und die Förderung von sozialem Aufstieg. Auffallend ist, dass das Zentrum der USA trotz ländlicher Region und geringer Bevölkerungsdichte recht hohe Werte aufweißt. In vielen ländlichen Regionen, auch im Zentrum der USA, spielen lokale Gemeinschaften eine zentrale Rolle im sozialen Leben. Während diese Gebiete möglicherweise eine geringere Bevölkerungsdichte aufweisen, zeichnen sie sich häufig durch enge, stark miteinander verbundene Netzwerke aus. In kleinen Städten und ländlichen Gemeinden kennen sich viele Menschen über Generationen hinweg und interagieren regelmäßig miteinander. Dies kann zu einer hohen Vernetzung innerhalb der eigenen sozialen Gruppe führen, auch wenn diese Gruppe größtenteils aus Menschen mit ähnlichem sozioökonomischen Status (SES) besteht. Ein weiterer möglicher Faktor könnte die Art der Wirtschaft in diesen Regionen sein. Das Zentrum der USA ist traditionell landwirtschaftlich geprägt, und Landwirtschaft erfordert oft enge Netzwerke zwischen den Beteiligten. Farmer und Landwirte sind in vielen Regionen auf Kooperationen angewiesen, etwa durch landwirtschaftliche Genossenschaften oder den Austausch von Arbeitskräften und Ressourcen. Solche Netzwerke könnten den Economic Connectedness Index anheben, selbst wenn die Bevölkerungszahl in diesen Gebieten gering ist.

Die moderaten, teils sogar hohen Werte des Economic Connectedness Index in Alaska und Hawaii, die auf der Karte sichtbar sind, weisen darauf hin, dass es in beiden Bundesstaaten gewisse soziale und ökonomische Vernetzungen gibt, auch wenn diese nicht so stark ausgeprägt sind wie in anderen Regionen der USA.

Hawaii zieht nicht nur Touristen aus anderen Teilen der USA an, sondern auch internationale Reisende. Der Tourismus ist einer der größten Wirtschaftszweige, und dieser internationale Austausch könnte zu einer gewissen sozialen und ökonomischen Vernetzung über verschiedene soziale Schichten hinweg führen. Menschen aus unterschiedlichen sozioökonomischen Gruppen, sowohl lokal als auch international, könnten durch den Tourismus in Kontakt kommen. Besonders im Dienstleistungssektor, der einen erheblichen Anteil an der Beschäftigung in Hawaii hat, könnten Arbeitskräfte mit niedrigem und hohem SES aufeinander treffen, wenn auch häufig in weniger stabilen Arbeitsverhältnissen.

Auch wenn Alaska im Allgemeinen ländlich ist, gibt es in den größeren Städten wie Anchorage und Fairbanks eine gewisse Vernetzung zwischen unterschiedlichen sozialen Schichten. Diese Städte haben eine Mischung aus städtischen und ländlichen Merkmalen, was zu einer spezifischen sozialen Struktur führt, die eine moderate Vernetzung ermöglicht.

Um jedoch gültige Aussagen über den Einfluss des Economic Connectedness Index auf die wirtschaftliche Mobilität und den tatsächlichen Nutzen von Freundschaftsnetzwerken zu treffen, müssen mehrere Annahmen gemacht werden. Zunächst einmal muss angenommen werden, dass die ökonomische Vernetzung durch Freundschaften mit höheren SES-Gruppen tatsächlich einen positiven Einfluss auf den sozialen Aufstieg hat. Diese Annahme setzt voraus, dass die Vernetzung nicht nur ein passiver Austausch von Informationen ist, sondern aktiv zu mehr wirtschaftlichen Chancen führt. Zweitens muss man davon ausgehen, dass die Freundschaften innerhalb eines sozialen Netzwerks eine tiefe und bedeutungsvolle Verbindung darstellen. Wenn die Netzwerke zwar quantitativ stark sind, aber die Freundschaften wenig Einfluss auf das Leben der Individuen haben, könnte der Economic Connectedness Index lediglich eine oberflächliche oder symbolische Vernetzung widerspiegeln, die nicht zu tatsächlichen wirtschaftlichen Vorteilen führt. Ein weiterer wichtiger Aspekt ist die Kontrolle von Drittvariablen. Es muss sichergestellt werden, dass keine anderen Faktoren, wie etwa Bildung, berufliche Qualifikationen oder der allgemeine Zugang zu Arbeitsmöglichkeiten, die ökonomische Vernetzung und die damit verbundene Mobilität beeinflussen.


  1. Wie in der vorherigen Aufgabe zu sehen war, unterscheidet sich der Economic Connectedness Index in den einzelnen Counties doch deutlich voneinander. In einer ersten deskriptiven Analyse wäre es spannend zu sehen, ob der EC mit unterschiedlichen Variablen, welche den ökonomischen Aufstieg repräsentieren, zusammenhängt.

Hier sollen Sie in einem ersten Schritt die zehn Counties mit dem höchsten Economic Connectedness Index und die zehn Counties mit dem niedrigsten Economic Connectedness Index auflisten und folgende Variablen näher anschauen:

  • Median Haushaltseinkommen in dem County (medincE)
  • Wirtschaftliche Mobilität in dem County (upward_mobility)
  • Einkommensungleichheit in dem County (gemessen mit dem Gini-Koeffizient des Counties) (gini99_simple)

Erstellen Sie eine oder mehrere Tabelle um die Ergebnisse für die 20 Counties übersichtlich dazustellen.

Beschreiben und interpretieren Sie ihre Tabellen und gehen Sie auf die folgende Frage ein:

  • Haben Sie diese Unterschiede in den einzelnen Variablen erwartet? Begründen Sie warum, oder warum nicht.

Top 10 und Bottom 10 Counties basierend auf dem Economic Connectedness Index
County Economic Connectedness Median Einkommen Wirtschaftliche Mobilität Gini-Koeffizient
Top 10 Counties
Rockingham County, New Hampshire 1.36 113927 45.31 0.23
Douglas County, Colorado 1.35 145737 48.24 0.12
San Francisco County, California 1.31 141446 50.39 0.31
Morgan County, Utah 1.29 126092 54.12 0.15
Madison County, Idaho 1.28 58259 51.54 0.22
Arlington County, Virginia 1.27 140160 46.28 0.39
Sussex County, New Jersey 1.26 114316 47.04 0.18
Wright County, Minnesota 1.25 106666 49.54 0.18
Gunnison County, Colorado 1.25 77358 48.71 0.35
Pitkin County, Colorado 1.24 100318 45.83 -0.01
Bottom 10 Counties
Todd County, South Dakota 0.29 39148 30.18 0.32
Oglala Lakota County, South Dakota 0.33 34769 24.84 NA
Terrell County, Georgia 0.35 43812 31.17 0.36
Bullock County, Alabama 0.36 36723 34.57 0.31
Allendale County, South Carolina 0.36 31603 31.4 0.33
Robeson County, North Carolina 0.36 40318 32.1 0.36
Early County, Georgia 0.38 53750 33.83 0.46
Marlboro County, South Carolina 0.38 36293 32.82 0.31
Crisp County, Georgia 0.39 42745 32.89 0.42
Scotland County, North Carolina 0.4 43500 31.08 0.39

Wir haben hier zwei Tabellen, welche an sich gleich aufgebaut sind. Die Reihennamen sind immer die Counties mit dem Bundesstaat in dem sie liegen und die Spaltennamen sind die ökonomische Vernetzung gemessen am ec_county wert, der Median des Einkommens der counties, die wirtschaftliche Mobilität, also die Chancen, die Menschen haben, ihre Einkommenssituation im Vergleich zu ihrer aktuellen Position zu verändern und die Einkommensungleichheit gmessen mit dem Gini-Koeffizienten. Der große unterschied zwischen beiden Grafiken ist, dass die Top10 Counties Tabelle sie die zehn Counties mit dem höchsten Economic Connectedness Index, also dem Wert der bei ökonomische Vernetzung steht, anschaut und die Bottom10 Counties Tabelle eben die mit dem niedrigsten EC-Wert

Die ökonomische Vernetzung der Top-10 Counties zeichnet sich hier durch sehr hohe Werte aus, die zwischen 1.24 (Pitkin County, Colorado) und 1.36 (Rockingham County, New Hampshire) liegen. Diese Regionen sind hochgradig vernetzt und profitieren offensichtlich von gut etablierten wirtschaftlichen Netzwerken, die Zugang zu Ressourcen und Chancen begünstigen.

Das mediane Einkommen variiert stark, von 58 259 USD (Madison County, Idaho) bis hin zu 145 737 USD (Douglas County, Colorado). Während die meisten dieser Counties wirtschaftlich aufblühen und die Einkommen extrem hoch sind, gibt es Ausnahmen wie Madison County und Gunnison County, deren Einkommen vergleichsweise niedrig ist. Diese Unterschiede deuten darauf hin, dass selbst in hoch vernetzten Regionen andere Faktoren wie Branchenstruktur oder lokale Wirtschaftspolitik eine Rolle spielen.

Die Zahlen für die wirtschaftliche Mobilität liegen zwischen 45.31 (Rockingham County, New Hampshire) und 54.12 (Morgan County, Utah). Diese Werte sind im Vergleich zu den unten betrachteten Bottom-10 Counties signifikant höher, was darauf hinweist, dass in vernetzten Regionen mehr Möglichkeiten für wirtschaftlichen Aufstieg bestehen.

Betrachtet man die Einkommensungleichheit, gemessen am Gini-Koeffizienten, fällt auf, dass die Werte vergleichsweise niedrig sind, zwischen -0.01 (Pitkin County, Colorado) und 0.39 (Arlington County, Virginia). Dies deutet darauf hin, dass in diesen Regionen eine gerechte Verteilung des Einkommens herrscht, was möglicherweise auf die Vorteile starker Vernetzung, sowie die daraus entstehenden Vorteile wie Bildung und Arbeitsplätze zurückzuführen ist.

Im Gegensatz dazu weisen die Bottom-10 Counties eine deutlich geringere ökonomische Vernetzung auf. Die Werte bewegen sich zwischen 0.29 (Todd County, South Dakota) und 0.4 (Scotland County, North Carolina). Also eine ziemlich schwache ökonomische Vernetzung. Diese Counties könnten weniger Zugang zu externen Netzwerken und wirtschaftlichen Ressourcen haben, was sich negativ auf ihre Entwicklung auswirkt.

Das mediane Haushaltseinkommen dieser zehn Counties variiert zwischen 31 603 USD (Allendale County, South Carolina) und 53 750 USD (Early County, Georgia). Diese Einkommen sind erheblich niedriger als die der Top-10 Counties und spiegeln die wirtschaftlichen Herausforderungen wider, mit denen weniger vernetzte Regionen häufig konfrontiert sind.

Die wirtschaftliche Mobilität ist ebenfalls stark eingeschränkt und liegt zwischen 24.84 (Oglala Lakota County, South Dakota) und 34.56 (Bullock County, Alabama). Sie ist relativ begrenzt, was darauf hinweist, dass in diesen Regionen weniger Chancen bestehen, sozioökonomisch aufzusteigen.

Auch die Einkommensungleichheit ist in diesen Counties deutlich ausgeprägter und bewegt sich zwischen 0.31 (Marlboro County, South Carolina) bis 0.46 (Early County, Georgia). In einigen Counties gibt es also eine relativ hohe Einkommensungleichheit, was darauf hindeutet, dass es eine deutliche Disparität im Wohlstand gibt, was auf strukturelle Ungleichheiten und fehlende Ressourcen hinweist.

Der Vergleich der Top-10 und Bottom-10 Counties zeigt eindrucksvoll, wie entscheidend die Höhe des EC-Index für die wirtschaftliche Situation einer Region ist. Während die Medianhaushaltseinkommen in den Top-10 Counties zwischen 58.000 und 145.000 USD liegen, bewegen sich diese Werte in den Bottom-10 Counties lediglich zwischen 31.000 und 53.000 USD. Dieser erhebliche Einkommensunterschied verdeutlicht den direkten Zusammenhang zwischen ökonomischer Vernetzung und wirtschaftlichem Wohlstand.

Auch bei der wirtschaftlichen Mobilität sind die Unterschiede markant: In stark vernetzten Regionen gibt es wesentlich mehr Chancen für sozialen und wirtschaftlichen Aufstieg, während in weniger vernetzten Regionen solche Möglichkeiten stark eingeschränkt sind. Ebenso zeigt sich, dass das Einkommen in den Top-10 Counties gerechter verteilt ist, was vermutlich auf die Vorteile von starker Vernetzung zurückzuführen ist, darunter Zugang zu hochwertiger Bildung, besseren Arbeitsplätzen und effizientem Wissensaustausch.

Die Analyse verdeutlicht, dass eine hohe ökonomische Vernetzung zahlreiche Vorteile mit sich bringt: Sie schafft bessere wirtschaftliche Chancen, fördert den Austausch von Wissen und Technologien und ermöglicht es den Einwohnern, ihr Einkommen und ihre Lebenssituation nachhaltig zu verbessern. Gleichzeitig unterstreicht sie die Herausforderungen, vor denen weniger vernetzte Regionen stehen, und betont die Notwendigkeit, gezielte Maßnahmen zu ergreifen, um diese Gebiete stärker in wirtschaftliche Netzwerke einzubinden.


Aktuell haben Sie in einer univariaten Analyse viel über die soziale Vernetzung auf Basis von Facebook Daten gelernt. Doch was hat der Economic Connectedness Index mit tatsächlicher Entwicklungsmöglichkeit auf sich?

  1. In dieser Aufgabe sollten Sie eine Punktdiagramm (Scatter-Plot) erstellen, welches die wirtschaftliche Mobilität (upward_mobility) gegenüber dem Economic Connectedness Index darstellt. Diese Grafik sollte interaktiv gestaltet sein. Konkret sollte der Name des Counties zu sehen sein, wenn Sie über einen Punkt im Diagramm fahren. Fügen Sie Ihrer Grafik den Korrelationskoeffizient der zwei Variablen hinzu und zeichnen Sie eine Regressionsgerade durch die Punktewolke.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie dabei insbesondere auf die folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5?
  • In wie weit können Sie mit dieser Grafik die Frage “Wie stark beeinflussen soziale Netzwerke die wirtschaftliche Mobilität?” aus der Motivation beantworten?

Hinweis: Um interaktive Grafiken zu erstellen könnten Sie z.B. das plotly Paket, oder das ggiraph Pakte nutzen


Die Grafik zeigt den Zusammenhang zwischen wirtschaftlicher Mobilität (y-Achse) und dem Economic Connectedness Index (x-Achse) in einem Streudiagramm. Eine positive Korrelation (0,72) deutet darauf hin, dass ein höherer Economic Connectedness Index mit einer stärkeren wirtschaftlichen Mobilität assoziiert ist. Die Regressionslinie visualisiert diesen Trend, wobei die Datenpunkte relativ gut an die Linie angepasst sind, was die Stärke des Zusammenhangs unterstreicht.

In Aufgabe 5 wurde beschrieben, dass eine hohe soziale Vernetzung zwischen Menschen unterschiedlicher sozialer und wirtschaftlicher Hintergründe ökonomische Aufstiegschancen fördern könnte. Der Economic Connectedness Index reflektiert genau diese Verbindungen und hebt hervor, wie stark Personen aus verschiedenen sozialen Schichten miteinander in Kontakt stehen. Ein hoher Wert deutet darauf hin, dass die Menschen Zugang zu heterogenen Netzwerken haben, was Informationsaustausch, Ressourcenverteilung und Jobchancen begünstigen kann. Die Grafik bestätigt diese Erwartung deutlich. Der positive Zusammenhang zeigt, dass eine bessere Vernetzung tatsächlich mit höheren wirtschaftlichen Aufstiegschancen korreliert. Die Hypothese, dass soziale Netzwerke eine zentrale Rolle dabei spielen, ist somit empirisch gestützt. Besonders auffällig ist die klare Ausrichtung der Punkte entlang der Regressionslinie, was die Stärke und Konsistenz der Beziehung betont.

Die Grafik zeigt lediglich einen statistischen Zusammenhang zwischen den beiden Variablen. Sie kann jedoch nicht belegen, dass soziale Netzwerke tatsächlich die Ursache für die höhere wirtschaftliche Mobilität sind. Möglicherweise beeinflusst ein dritter Faktor (z. B. Bildung, Einkommen oder regionale Wirtschaftspolitik) sowohl den Economic Connectedness Index als auch die wirtschaftliche Mobilität. Außerdem gibt es Ausreißer, welche weiter von der Regressionslinie entfernt liegen ,dadurch sieht man, dass es Varianzen gibt, die der Economic Connectedness Index allein nicht erklären kann. Beispielsweise “Kusilvak Census Area, Alaska”, dort sieht man einen Ausreißer mit einer wirtschaftlichen Mobilität knapp über 20 aber einem Economic Connectedness Index von über 0,6. Der Großteil der Beobachtungen mit diesem Indexwert liegen bei einer wirtschaftlichen Mobilität von 35 bis 45. Kusilvak County verdeutlicht, dass soziale Netzwerke zwar wichtig sind, aber alleine nicht ausreichen, um wirtschaftliche Mobilität zu gewährleisten, wenn andere grundlegende Bedingungen fehlen.


  1. Erstellen Sie zwei weitere Punktediagramme, welche die 500 größten Counties nach Bevölkerungsgröße abtragen und zeigen Sie folgende Zusammenhänge auf (ohne Interaktivität):
  • Zusammenhang zwischen der Einkommensungleichheit (gemessen im Gini-Koeffizient) und dem Economic Connectedness Index
  • Zusammenhang zwischen dem Median Haushaltseinkommen und dem Economic Connectedness Index

Weiterhin sollten Sie die folgenden Counties in ihrem Diagramm hervorheben und benennen:

  • San Francisco County, California
  • Arlington County, Virginia
  • Morgan County, Utah
  • New York County, New York
  • Bronx County, New York

Beschreiben und interpretieren Sie ihre Grafiken. Gehen Sie dabei insbesondere auf folgende Frage ein:

  • Entspricht der Zusammenhang zwischen den zwei Variablen ihren Erwartungen aus Aufgabe 5? Erklären Sie.

Die beiden Grafiken zeigen den Zusammenhang zwischen dem Economic Connectedness Index (ECI) und zwei Variablen: dem Gini-Koeffizienten (Einkommensungleichheit) und dem Median-Haushaltseinkommen. Beide Punktediagramme bieten Einblicke in die Beziehung zwischen sozialer Vernetzung und wirtschaftlichen Rahmenbedingungen.

In der Grafik, die den Zusammenhang des ECI und der Einkommensungleichheit darstellt, sieht man eine deutliche negative Korrelation zwischen den beiden Variablen. Ein wachsender Gini-Koeffizient führt gleichzeitig auch zu einer sinkenden sozialen Vernetzung der Menschen. Der Großteil der Punkte liegen in Nähe der Regressionlinie, allerdings sieht man auch einige deutliche Ausreißer , besonders in Richtung höherem ECI.

Dieser negative Zusammenhang entspricht unseren Erwartungen aus Aufgabe 5, da eine geringere Ungleichheit in einer Region oft eine stärkere Durchmischung verschiedener sozialer und wirtschaftlicher Gruppen ermöglicht. Dies fördert die Bildung von heterogenen Netzwerken, die den ECI erhöhen. In einer Region mit geringer Ungleichheit sind Menschen unterschiedlicher Einkommensklassen eher bereit, sich in denselben sozialen Räumen zu bewegen, z. B. in Bildungseinrichtungen, Arbeitsplätzen oder Veranstaltungen. Dadurch können Verbindungen zwischen diesen Gruppen entstehen. Eine geringe Ungleichheit allein führt jedoch nicht automatisch zu einer hohen sozialen Vernetzung. Andere Einflussfaktoren, wie räumliche Segregation, kulturelle Vorurteile oder gesellschaftliche Hürden, könnten den Aufbau heterogener Netzwerke weiterhin behindern.

Die zweite Grafik zeigt eine positive Korrelation zwischen dem Median-Haushaltseinkommen und dem Economic Connectedness Index (ECI). Regionen mit einem höheren Median-Haushaltseinkommen haben tendenziell auch einen höheren Economic Connectedness Index. Allerdings nimmt die Streuung mit steigenden Haushaltseinkommen zu, was auf Heterogenität zwischen Regionen hinweist. So haben einige Counties die ein hohes Median-Einkommen haben, trotzdem einen geringen ECI. Umgekehrt weisen einige Regionen mit mittleren/leicht erhöhten Einkommen einen überraschend hohen ECI auf, was auf starke soziale Durchmischung hindeuten könnte. Diese Ausreißer könnten damit erklärt werden, dass Regionen mit sehr hohem Einkommen und dennoch niedrigem ECI Ballungszentren sein könnten, in denen Segregation oder exklusive Lebensstile (z. B. Gated Communities) eine stärkere Durchmischung verhindern.

Dieser positive Zusammenhang ist ebenfalls konsistent mit den Erwartungen aus Aufgabe 5. Ein höheres Median-Haushaltseinkommen ist oft mit besserer Infrastruktur, Bildungssystemen und sozialen Ressourcen verbunden, die den Aufbau von sozialen Netzwerken fördern. Ein höheres Median-Einkommen trägt direkt als auch indirekt zur besseren sozialen Vernetzung bei. Auf direkter Weise haben wohlhabendere Gegenden oftmals bessere öffentliche Einrichtungen, wie Schulen, Universitäten etc., wodurch die Kontaktknüpfung erleichtert werden kann. Indirekt korrellieren höhere Einkommen teils mit besseren Kommunikationsinfrastrukturen, die physische und soziale Barrieren überwinden helfen und somit die Vernetzung zwischen unterschiedlichen Einkommensklassen fördern kann.


Wie aus Aufgabe 9 hervorgeht ist die wirtschaftliche Mobilität stark mit dem Economic Connectedness Index korreliert. In den nächsten Aufgaben sollten Sie sich tiefer mit den Gründen dafür beschäftigen und sich im ersten Schritt die Korrelationen zwischen verschiedenen Variablen in ihrem Datensatz anschauen.

  1. Erstellen Sie in dieser Aufgabe eine Korrelationsmatrix, die Ihnen den Zusammenhang zwischen den folgenden Variablen aufzeigt:
  • Economic Connectedness Index (ec_county)
  • Wirtschaftliche Mobilität (upward_mobility)
  • Median Haushaltseinkommen (medincE)
  • Bevölkerung in 2018 (pop2018)
  • Einkommensungleichheit (gini99_simple)
  • Exposition (exposure_gpr_mem_county)
  • Freundschafts-Bias (bias_grp_mem_county)

Beschreiben und interpretieren Sie ihre Korrelationsmatrix.


Die Korrelationsmatrix zeigt die verschiedenen Zusammenhänge zwischen den Variablen. Rechts sieht man eine Säule, an der man ablesen kann, wie stark die jeweiligen Variablen korreliert sind. Links und oben stehen die Variablen aus unserem Datensatz und in den entsprechenden Feldern zwischen ihnen die zugehörige Korrelationskoeffizient. Die Korrelationskoeffizienten variieren zwischen -1 (starke negative Korrelation) und +1 (starke positive Korrelation), wobei Werte nahe 0 auf keinen oder nur sehr schwachen Zusammenhang hindeuten.

Die Ergebnisse der Korrelationsmatrix bestätigen die zuvor gemachten Beobachtungen. Die negative Korrelation von -0.64 zwischen Economic Connectedness und dem Gini-Koeffizienten steht im Einklang mit der Annahme aus Aufgabe 10, dass eine stärkere wirtschaftliche Vernetzung mit einer geringeren Einkommensungleichheit einhergeht. Ebenso unterstützt die positive Korrelation von 0.63 zwischen Economic Connectedness und dem Median-Einkommen unsere Feststellung aus Aufgabe 10, dass stärker vernetzte Regionen in der Regel höhere durchschnittliche Einkommen aufweisen. Schließlich bestätigt die starke positive Korrelation von 0.73 zwischen Economic Connectedness und wirtschaftlicher Mobilität den Zusammenhang, dass wirtschaftliche Vernetzung eng mit besseren Chancen für sozialen Aufstieg verbunden ist.

Die Economic Connectedness und Exposition haben eine Korrelation von 0.94. Dieser Wert ist auffällig hoch. Die nahezu perfekte positive Korrelation zeigt, dass wirtschaftliche Vernetzung und die Exposition zu hoch-SES Individuen für niedrig-SES Individuen (sozioökonomischer Status) stark miteinander verbunden sind. Dies könnte darauf hindeuten, dass Orte oder Individuen, die in Netzwerken besser vernetzt sind, auch stärkeren Zugang zu Ressourcen oder Möglichkeiten haben, die ihre ökonomische Lage verbessern. Es ist wichtig zu beachten, dass dieser Zusammenhang eine hohe Praktikabilität aufweist und es nahelegt, dass wirtschaftliche Vernetzung eine der Schlüsselfaktoren für den Zugang zu wirtschaftlichen Chancen ist.

Außerdem weisen die Ergebnisse eine positive Korrelation von 0.63 zwischen Economic Connectedness und dem Median-Einkommen. Dies deutet darauf hin, dass eine stärkere wirtschaftliche Vernetzung in Regionen mit höheren durchschnittlichen Einkommen verbunden ist. Dies könnte darauf hinweisen, dass Vernetzung den Zugang zu besseren wirtschaftlichen Ressourcen, Arbeitsplätzen und Bildungsmöglichkeiten erleichtert, was sich positiv auf das Einkommensniveau auswirkt.

Die nahezu neutrale Korrelation von 0.03 deutet darauf hin, dass es keinen signifikanten Zusammenhang zwischen dem Median-Einkommen und dem Freundschafts-Bias gibt. Mit anderen Worten, das durchschnittliche Einkommen in einer Region hat offenbar kaum Einfluss darauf, ob Menschen Freundschaften innerhalb oder außerhalb ihrer eigenen sozioökonomischen Gruppe knüpfen. Dieses Ergebnis ist interessant, da es darauf hindeutet, dass das Einkommensniveau allein nicht ausreichend ist, um soziale Strukturen oder Muster von Freundschaftsnetzwerken zu erklären.

Die Variable Bevölkerung zeigt in der Korrelationsmatrix mit den meisten anderen Variablen nur sehr geringe Korrelationswerte, was darauf hindeutet, dass die Größe der Bevölkerung in einer Region keinen starken Zusammenhang mit sozioökonomischen Faktoren wie wirtschaftlicher Mobilität, Einkommensniveau oder sozialer Vernetzung aufweist.


Im nächsten Schritt sollten Sie sich anschauen, welche Rolle das Median Haushaltseinkommen in den Counties bei der wirtschaftlichen Mobilität spielt. Gibt es einen Unterschied des Effekts der sozialen Vernetzung zwischen Gutverdienern und weniger gut verdienenden?

  1. Zeigen Sie in einem Punktediagramm den Zusammenhang des Economic Connectedness Index (y-Achse) und dem Median Haushaltseinkommen in den einzelnen Counties. Färben Sie die einzelnen Datenpunkte nach der wirtschaftlichen Mobilität ein.

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere darauf ein, ob er Effekt der sozialen Vernetzung für alle Einkommensgruppen gleich ist.


Diese Grafik zeigt den Zusammenhang zwischen dem ECI, mit Werten von ca.0,3 bis 1,5, auf der y-Achse und dem Median des Haushaltseinkommens, mit Werten von ~30000 und ~150000 Dollar, auf der x-Achse und stellt die wirtschaftliche Mobilität der einzelnen Counties als Punkte in einem Streudiagramm dar. Der ECI misst die ökonomische Vernetzung zwischen Individuen innerhalb der Counties, der Median des Haushaltseinkommens ist eben das 50% Quantil an jährlichem Einkommen aller Haushalte der Counties und die Wirtschaftliche Mobilität zeigt die Chance für wirtschaftlichen Aufstieg, also wie leicht Menschen aus ärmeren Verhältnissen aufsteigen können (z. B. ein höheres Einkommen oder besseren Lebensstandard erreichen). Jedes County wird hier als ein Punkt dargestellt und die Einfärbung eines Punktes zeigt dessen wirtschaftliche Mobilität an. Die Farben gehen von Dunkelviolett (niedrige wirtschaftliche Mobilität, ~30) bis Gelb (hohe wirtschaftliche Mobilität, ~60). Außerdem wird dazu eine Trendlinie dargestellt, welche mit ihrem Verlauf eine mögliche Korrelation zwischen ECI und Median des Haushaltseinkommens darstellt.

Da die Punktewolke und die Trendlinie nach rechts hin steigend sind sehen wir hier klar eine positive Korrelation zwischen ECI und Einkommen, also Counties bei denen einer der Werte hoch ist tendieren dazu, dass der andere Wert ebenfalls hoch ist. Das deutet darauf hin, dass stärker miteinander vernetzte Regionen wohlhabender sind.

An der Verteilung der Punkteverfärbung kann man erkennen, dass Counties mit hoher wirtschaftlicher Mobilität (gelbe/hellere Farbe) ebenfalls zu höheren Werten des Economic Connectedness Index neigen und umgekehrt, da sich der Großteil der hellen Punkte weit oben in der Grafik befindet. Daran lässt sich erkennen, dass ein guter ECI den wirtschaftlichen Aufstieg erleichtertc, was zum Beispiel an besserer sozialer Vernetzung für Jobangebote usw. liegt.

Zwischen der wirtschaftlichen Mobilität und dem Median-Haushaltseinkommen scheint es keine starke Korrelation zu geben, da die Farbskala keine klaren Trends zeigt. Es gibt nämlich Regionen mit hohem Einkommen, die sowohl hohe als auch niedrige wirtschaftliche Mobilität aufweisen, was auf die Unabhängigkeit dieser beiden Variablen hinweist. Dies deutet darauf hin, dass ein höheres Einkommen nicht zwangsläufig eine verbesserte wirtschaftliche Mobilität zur Folge hat.

Zusammenfassend lässt sich aber sagen, der Effekt der sozialen Vernetzung ist nicht für alle Einkommensgruppen gleich stark. In ärmeren Regionen scheint sie potenziell ein wichtigerer Faktor für den wirtschaftlichen Aufstieg zu sein, während in wohlhabenderen Regionen, der eintretende Effekt nicht ganz so eindeutig ist, was vermutlich daran liegt, dass dort andere Faktoren ebenfalls eine große Rolle spielen.


  1. Die soziale Vernetzung ist in der bisherigen Analyse ein treibender Faktor für die wirtschaftliche Mobilität. Jedoch ist es durchaus möglich, dass nicht die soziale Vernetzung, sondern andere Faktoren den zu Grunde liegenden Effekt treiben und es sich bei dem Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität nur um einen Scheinzusammenhang handelt. So könnten z.B. Rückwärtskausalität, Selektionseffekte oder ausgelassene Variablen den gefundenen Zusammenhang erklären.

Um dem nachzugehen sollten Sie sich Chetty et al. (2022a), Seite 115-120 durchlesen und folgende Fragen beantworten:

  • Nehmen Sie Bezug auf die Rückwärtskausalität, den Selektionseffekt und die ausgelassenen Variablen. Wie könnten diese Faktoren einen scheinbaren Zusammenhang zwischen dem Economic Connectedness Index und der wirtschaftlichen Mobilität verursachen? Gehen Sie auf jeden Faktor separat ein.
  • In der explorativ und deskriptiv angelegten Analyse der Autoren lassen sich die Argumente bzgl. Rückwärtskausalität, Selektionseffekten und ausgelassener Variablen nicht vollständig ausschließen. Doch welche Argumente sprechen laut den Autoren dafür, dass es sich nicht um die genannten Faktoren handelt?
  • Finden Sie die Argumentation glaubhaft? Hätten Sie bedenken bei deren Argumentation? Wenn ja, was stört Sie daran?
  • Nehmen wir an Sie können sich die optimalen Bedingungen zusammenstellen, damit Sie tatsächlich einen kausalen Effekt der sozialen Vernetzung auf die wirtschaftliche Mobilität messen könnten. Wie würden diese Bedingungen ausgestaltet sein?

Rückwärtskausalität beschreibt den Effekt, dass nicht nur der ECI die wirtschaftliche Mobilität beeinflusst, sondern auch umgekehrt die Mobilität einer Region den ECI prägen könnte. Regionen mit höherer wirtschaftlicher Mobilität könnten für Menschen mit gutem Einkommen und Netzwerken attraktiver sein, was wiederum die soziale Durchmischung und damit die wirtschaftliche Vernetzung stärkt. Dadurch entsteht ein scheinbarer Zusammenhang zwischen ECI und wirtschaftlicher Mobilität, der jedoch nicht rein kausal ist, sondern da wirtschaftlich erfolgreiche Regionen Menschen mit besseren sozialen Netzwerken anziehen. Chetty et al. (2022a) argumentieren aber damit, dass der Großteil der sozialen Netzwerke früh im Leben, meist in der Kindheit oder Jugend, entsteht. Damit wird die Annahme abgeschwächt, dass wirtschaftlicher Erfolg im Erwachsenenalter stark auf den Aufbau neuer Netzwerke zurückwirkt. Diese Beobachtung widerspricht dem Konzept der Rückwärtskausalität, da Netzwerke häufig schon vor der wirtschaftlichen Mobilität bestehen. Allerdings bleibt die Frage offen, in welchem Ausmaß Netzwerke durch berufliche oder gesellschaftliche Interaktionen im Erwachsenenalter noch beeinflusst werden]

Der Selektionseffekt verweist darauf, dass einkommensstärkere oder besser ausgebildete Familien bewusst in Regionen mit einem sehr hohen ECI ziehen, da es dort oft bessere soziale und wirtschaftliche Verbindungen gibt. Wenn Familien mit ohnehin höherer Mobilität gezielt in solche Gebiete ziehen, könnten ihre Eigenschaften – wie ein höheres Bildungsniveau oder bessere Netzwerke – den Zusammenhang zwischen ECI und wirtschaftlicher Mobilität verzerren. Der beobachtete Effekt könnte also weniger eine Folge des ECI sein, sondern vielmehr die Folge der selektiven Ansiedlung bestimmter Bevölkerungsgruppen. Chetty et al. (2022a) wollen bei ihren Analysen den Einfluss dieser Selektionseffekte minimieren, indem sie Daten nutzen, welche vor einem möglichen Umzug gesammelt wurden.

Es kann aber auch sein, dass ausgelassene, nicht berücksichtigte Variablen sowohl den ECI als auch die wirtschaftliche Mobilität beeinflussen. Zum Beispiel könnten die Qualität der Bildungseinrichtungen, der Zugang zu Arbeitsplätzen oder die Investitionen in soziale Infrastruktur in einer Region sowohl den ECI erhöhen als auch die wirtschaftliche Mobilität fördern. Chetty et al. (2022a) kontrollieren in ihren Analysen viele Variablen, wie Einkommen, ethnische Mobilität und Bildung, um ungewollte Abweichungen zu vermeiden.

In dem Buch wurden einige Argumente geliefert, die dagegen sprechen, dass der Zusammenhang zwischen ECI und wirtschaftlicher Mobilität nur aus den drei oben genannten Effekten besteht. Zum einen die Rückwärtskausalität, welche dadurch enkräftigt wurde, dass soziale Netzwerke überwiegend in der Kindheit und Jugend entstehen und im späteren Leben nur noch begrenzt erweitert werden. Weshalb es kaum einen Sinn ergibt, dass soziale Netzwerke so stark von wirtschaftlichem Aufstieg beeinflusst werden. Dazu versucht man Selektionseffekte zu vermeiden, indem man Daten verwendet, die vor einem möglichen Umzug in gut vernetzte Gebiete aufgenommen wurden. Außerdem gibt es auch innerhalb wirtschaftlich und sozial ähnlichen Counties/Regionen starke Unterschiede im ECI, woran man erkennen kann, dass der Zusammenhang nicht nur aus den oben genannten Effekten entsteht. Zu guter Letzt kontrolliert Chetty et al. auch sehr viele sozioökonomische Faktoren, um ausgelassene Variablen zu verringern.

Ist die Argumentation sinnvoll? Ja, die Argumentation des Autors ergibt durchaus schon Sinn, besonders die zuletzt genannte Kontrolle der vielen verschiedenen Faktoren ist sehr hilfreich, um Verzerrungen und Abweichungen, welche durch die ausgelassenen Variablen entstehen könnten, zu verhindern. Das stärkt die Glaubwürdigkeit der Daten, aber trotzdem gibt es ein paar Bedenken. Zum einen enthält unser Datensatz nur Facebookdaten, welches nicht alle Bevölkerungsgruppen gleich nutzen. Bei jüngeren Leuten ist Facebook zum Beispiel schon gar nicht mehr in Mode, weshalb es fraglich ist, wie repräsentativ die Freundeslisten tatsächlich sind. Außerdem kontrollieren Chetty et al. auch nicht alle Variablen, es könnte daher immer noch zu Verzerrungen durch unbeobachtete Faktoren, wie beispielsweise kulturelle Unterschiede, kommen.

Um ein möglichst optimales Umfeld für die Analyse des kausalen Effekts von sozialer Vernetzung auf wirtschaftliche Mobilität zu haben, bräuchte man einen umfassenderen Datensatz, welcher auch andere soziale Netzwerke, wie Instagram, Twitter usw., berücksichtigt, um möglichst viele Bevölkerungsgruppen zu erfassen. Oder idealerweise einen Datensatz, der auch Freundschaften erfasst, die außerhalb digitaler Netzwerke entstanden sind – also Kontakte, die man offline geknüpft hat, ohne dass sie anschließend in sozialen Netzwerken dokumentiert wurden. Dazu müsste man den Selektionseffekt vermindern, indem Familien zufällig Wohnorte mit unterschiedlichem ECI zugewiesen werden. Zudem wäre es hilfreich die Analysen möglichst lang durchzuführen, also über viele Jahre hinweg konsequent, um Veränderungen der sozialen Netzwerke und deren Auswirkungen auf die wirtschaftliche Mobilität besser nachvollziehen zu können.


Einflussfaktoren auf die soziale Vernetzung

Wie Sie in Ihrer bisherigen Analyse gesehen haben scheint der Economic Connectedness Index einen großen Teil der wirtschaftlichen Mobilität innerhalb der Counties erklären zu können. Doch was sind die Treiber hinter einer hohen sozialen Vernetzung?

  1. Ein Treiber der sozialen Vernetzung könnte natürlich eine hohe Exposition (exposure_grp_mem_county) sein, d.h. wenn es viele gut verdienende Personen in einem County gibt. Anders herum: Wenn es in einigen Counties gar keine gut verdienende Personen gibt, dann gibt es keine Möglichkeit für mich, der dort lebt, Freunde aus einem hohen Einkommensdezil zu haben.

Um sich einen Überblick über die Exposition in den einzelnen Counties zu verschaffen sollten Sie im ersten Schritt die Verteilung der Exposition über die Counties hinweg auf einer Karte der USA zeigen.

Beschreiben Sie ihre Karte und vergleichen diese mit der Karte aus Aufgabe 7. Was fällt Ihnen auf? Trifft die Annahme bzgl. der Exposition zu?


Die Karte illustriert die Verteilung der Exposition in den Countys der USA und zeigt auf, wie häufig Menschen in einzelnen Regionen von unterschiedlichen sozialen Schichten umgeben sind und mit ihnen in Kontakt treten. Exposition als Maßstab offenbart, wie oft Menschen aus niedrigerem sozioökonomischem Status auf Menschen aus höheren Schichten treffen, was tendenziell eine größere wirtschaftliche Vernetzung und Austauschmöglichkeiten fördert. Mit einer höheren Exposition erhöhen sich die Chancen, Beziehungen zu Personen aus wohlhabenderen Verhältnissen zu knüpfen, wodurch in der Regel auch der Economic Connectedness Index (ECI) steigt. Die Karte verwendet einen Farbverlauf, der von violett/rosa, für niedrige Exposition (0,25), bis zu gelb/orange reicht, was eine hohe Exposition (1,5) kennzeichnet.

Regional betrachtet, sind die Expositionswerte im Nordosten der USA mittelmäßig bis hoch, angesiedelt zwischen 0,75 und 1,25. Dieser Bereich ist bekannt für seine urbanen und wirtschaftlichen Zentren, was die hohe Exposition erklärt. Im Gegensatz dazu weisen der Südosten und der südmittlere Teil der USA überwiegend sehr niedrige Werte auf, welche durch historische und gegenwärtige sozioökonomische Barrieren beeinflusst werden. In westlichen Counties bewegen sich die Werte meist im mittleren Spektrum, während besonders im nördlichen Zentrum, speziell in östlicher Richtung, eine hohe Exposition verzeichnet wird, die von den dichten sozialen Netzwerken und teilweise von landwirtschaftlichem Austausch unterstützt wird. In Alaska sind die Werte überwiegend mittelmäßig, mit einer Ausnahme eines sehr niedrigen Countys. Hawaii weist ebenfalls mittelmäßig bis hohe Expositionswerte auf, was möglicherweise durch eine starke Durchmischung unterschiedlicher Kulturen und wirtschaftlicher Gegebenheiten, in Folge des Tourismus unterstützt wird.

Beim Vergleich mit der Karte aus Aufgabe 7, die den Economic Connectedness Index (ECI) darstellt, zeigt sich eine starke Korrelation zwischen der Exposition und dem Grad der ökonomischen Vernetzung der Regionen. Es gibt kaum Abweichungen von dem Muster einer positiven Korrelation. Nordöstliche Counties verweisen sowohl bei der Exposition als auch beim ECI auf mittlere bis hohe Werte, was auf eine einheitliche Stärke der sozialen und wirtschaftlichen Netzwerke hindeutet. Der Süden, insbesondere im Osten und zentral, zeigt in beiden Karten niedrige Werte, was geringe wirtschaftliche Chancen und schwache soziale Netzwerke widerspiegelt. Die zentralen Regionen im Norden hingegen, zeigen aufgrund von hochgradig vernetzten Gemeinschaften und wirtschaftlichem Austausch, trotz ihrer geringen Bevölkerungsdichte, in beiden Karten hohe Werte auf.

Die Gründe für die hohe Exposition im Nordosten und nördlichen Zentrum der USA lassen sich auf industrielle und urbane Ballungszentren zurückführen, die sowohl wirtschaftlichen Auftrieb geben als auch soziale Durchmischung erleichtern. Im Unterschied dazu könnten die niedrigen Werte beim ECI und bei der Exposition im Südosten das Ergebnis von historisch verankerten sozialen Barrieren und Ungleichheiten sein, welche die Integration unterschiedlicher sozioökonomischer Gruppen bis heute erschweren. Im Zentrum, wo lokale Gemeinschaften und landwirtschaftliche Kooperationen eine zentrale Rolle spielen, unterstützen trotz geringer Bevölkerungszahl, gut etablierte Netzwerke dennoch die soziale Vernetzung.

Abschließend lässt sich die Annahme bestätigen, dass eine hohe Exposition oft mit einer größeren sozialen Vernetzung verbunden ist, insbesondere in Regionen wie dem Nordosten und dem Zentrum der USA. Dort ermöglicht die hohe Präsenz von gut verdienenden Gruppen eine stärkere Vernetzung. Dennoch verdeutlichen die Werte im Südosten, dass strukturelle, historische und wirtschaftliche Herausforderungen die Exposition und den ECI beeinflussen können. Die geringere Exposition und der niedrige ECI in solchen Regionen spiegeln tiefgehende soziale und wirtschaftliche Hürden wider, die sich negativ auf die Netzwerkentwicklung auswirken.


Jedoch bedeutet eine hohe Exposition nicht gleich auch automatisch höhere soziale Vernetzung mit Personen aus hohen Einkommensdezilen. Falls Personen aus den jeweiligen Einkommensdezilen lieber unter sich bleiben möchten und keine Freundschaften zu Personen aus niedrigeren Einkommensdezilen pflegen, dann wird es ebenso schwer soziale Vernetzungen eine hohe wirtschaftliche Mobilität zu erreichen.

  1. Um zu untersuchen ob es eine entsprechende Segregation der Freundschaftsgruppen gibt sollten Sie in dieser Aufgabe ein Punktediagramm erzeugen, welche auf der x-Achse die Exposition (exposure_grp_mem_county) und auf der y-Achse den Freundschafts-Bias (bias_grp_mem_county) abträgt. Weiterhin sollten Sie die einzelnen Punkte in dem Punktediagramm nach der Stärke der sozialen Vernetzung einfärben. Heben Sie die Counties “San Francisco County, California” und “Bronx County, New York” in ihr Grafik explizit heraus (z.B. durch eine Beschriftung) und gehen Sie in ihrer Interpretation auf diese zwei Counties ein.

Beschreiben und interpretieren Sie ihre Grafik, gehen Sie dabei insbesondere auf folgende Fragen ein:

  • Welchen Einfluss haben die Faktoren Freundschafts-Bias und Exposition auf die soziale Vernetzung (den Economic Connectedness Index)?

Die Grafik visualisiert den Zusammenhang zwischen Exposition (x-Achse) und Freundschafts-Bias (y-Achse) und stellt die soziale Vernetzung (Economic Connectedness Index, ECI) durch eine Farbskala dar. Ein zentrales Muster in der Grafik ist die leichte negative Korrelation zwischen Exposition und Freundschafts-Bias, was bedeutet, dass in Regionen mit höherer Exposition tendenziell ein geringerer Freundschafts-Bias vorliegt. Dies deutet darauf hin, dass eine höhere Exposition mit einer größeren Bereitschaft einhergeht, soziale Kontakte über Einkommensgrenzen hinweg zu knüpfen.

Die Farbskala zeigt, dass der ECI in Regionen mit höherer Exposition tendenziell deutlich größer ist. Besonders die Punkte im rechten Bereich des Diagramms (hohe Exposition) tendieren zu wärmeren Farben (gelb/orange), was auf eine stärkere soziale Vernetzung hinweist. Dies legt nahe, dass eine hohe Exposition eine entscheidende Rolle bei der Förderung wirtschaftlicher Mobilität spielt, da sie Interaktionen zwischen unterschiedlichen sozioökonomischen Gruppen begünstigt.

Der Freundschafts-Bias hingegen zeigt eine größere Streuung und weniger direkten Einfluss auf den ECI. Während eine niedrige Exposition oft mit einem höheren Freundschafts-Bias einhergeht (Menschen bleiben eher in ihrer eigenen Einkommensgruppe), gibt es auch Regionen mit relativ hoher Exposition und dennoch ausgeprägtem Bias. Das bedeutet, dass Exposition allein nicht ausreicht, um soziale Segregation vollständig zu überwinden – kulturelle und gesellschaftliche Faktoren spielen ebenfalls eine Rolle.

Bronx County (New York) liegt im mittleren Bereich der Exposition und zeigt einen leicht erhöhten Freundschafts-Bias. Die Farbe deutet darauf hin, dass die wirtschaftliche Vernetzung eher moderat ist. Dies könnte darauf hindeuten, dass trotz einer gewissen Durchmischung strukturelle oder kulturelle Barrieren bestehen, die eine stärkere Vernetzung verhindern. Möglicherweise sind hier Bildungsunterschiede oder soziale Dynamiken ausschlaggebend, die eine stärkere wirtschaftliche Mobilität erschweren.

San Francisco County (California) befindet sich hingegen im rechten unteren Bereich des Diagramms mit hoher Exposition und niedrigem Freundschafts-Bias. Die kräftig gelbe Farbe zeigt, dass hier eine besonders starke wirtschaftliche Vernetzung vorliegt. Dies könnte durch die urbane Struktur und die kulturelle Diversität der Region begünstigt werden, die Interaktionen zwischen verschiedenen Einkommensgruppen erleichtert. San Francisco ist bekannt für eine hohe soziale und wirtschaftliche Mobilität, was sich in der Darstellung des ECI widerspiegelt.

Die Grafik verdeutlicht, dass eine hohe Exposition ein wichtiger Faktor für soziale Vernetzung und wirtschaftliche Mobilität ist. Während der Freundschafts-Bias ebenfalls eine Rolle spielt, ist sein Einfluss weniger eindeutig als der der Exposition. Besonders in urbanen, wirtschaftlich starken Regionen wie San Francisco zeigt sich, dass hohe Exposition und geringer Bias mit einer hohen sozialen Vernetzung einhergehen. In Gegenden wie der Bronx hingegen, wo der Freundschafts-Bias höher ist, kann die wirtschaftliche Vernetzung trotz mittlerer Exposition begrenzter sein. Dies unterstreicht, dass neben der Exposition auch weitere soziale und kulturelle Faktoren berücksichtigt werden müssen, um wirtschaftliche Mobilität zu fördern.


  1. Welche (politischen) Maßnahmen könnten dazu beitragen, die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern? Diskutieren Sie auf Basis ihrer Ergebnisse aus den Aufgaben 14 und 15.

Um die soziale Vernetzung und damit die wirtschaftlichen Chancen in benachteiligten Regionen zu verbessern, sind gezielte politische Maßnahmen erforderlich. Die Analyse der Exposition in verschiedenen Regionen der USA hat gezeigt, dass eine höhere Exposition in der Regel mit einer besseren wirtschaftlichen Vernetzung und einem höheren Economic Connectedness Index (ECI) einhergeht. Dies bedeutet, dass Menschen aus verschiedenen sozioökonomischen Schichten häufiger miteinander in Kontakt kommen, was ihre wirtschaftlichen Möglichkeiten erweitert.

Eine zentrale Maßnahme zur Förderung der sozialen Vernetzung ist die Verbesserung des Bildungsangebots in strukturschwachen Regionen. Schulen und Hochschulen sollten so ausgestattet sein, dass sie sowohl Kindern aus wohlhabenden als auch aus einkommensschwachen Familien gleiche Chancen bieten. Programme, die den Austausch zwischen Schulen unterschiedlicher sozialer Hintergründe fördern, könnten helfen, den Freundschafts-Bias zu reduzieren und langfristig zu einer stärkeren wirtschaftlichen Vernetzung beitragen.

Ein weiterer wichtiger Ansatz ist die gezielte Stadtplanung und Infrastrukturentwicklung. Wohnviertel sollten so gestaltet werden, dass sie eine soziale Durchmischung ermöglichen. Subventionierte Wohnprojekte, die einkommensschwächeren Familien den Zugang zu wirtschaftlich starken Regionen erleichtern, könnten dazu beitragen, die Exposition zu erhöhen. Gleichzeitig sollte der öffentliche Nahverkehr ausgebaut werden, um den Zugang zu Arbeitsplätzen und sozialen Netzwerken in wirtschaftlich florierenden Gebieten zu erleichtern.

Darüber hinaus könnten Programme zur Förderung von Mentoring und Netzwerken zwischen verschiedenen Einkommensgruppen implementiert werden. Besonders in Regionen mit hoher sozialer Segregation wäre es sinnvoll, gezielte Maßnahmen zu ergreifen, die den Austausch zwischen Menschen unterschiedlicher sozialer Hintergründe erleichtern. Unternehmen und gemeinnützige Organisationen könnten Partnerschaften eingehen, um berufliche Mentoring-Programme anzubieten, die insbesondere Jugendlichen aus einkommensschwachen Familien bessere Zukunftsperspektiven ermöglichen.

Ein weiteres Instrument zur Förderung der wirtschaftlichen Vernetzung ist die Unterstützung von Start-ups und kleinen Unternehmen in benachteiligten Regionen. Staatliche Fördermittel und Steuererleichterungen könnten Anreize schaffen, um Unternehmen in wirtschaftlich schwachen Gebieten anzusiedeln. Dies würde nicht nur Arbeitsplätze schaffen, sondern auch die soziale Vernetzung innerhalb der Gemeinschaft stärken. Zusätzlich könnten gezielte Steueranreize für Unternehmen geschaffen werden, die eine vielfältige Belegschaft fördern und bewusst Arbeitnehmer aus unterschiedlichen sozioökonomischen Schichten einstellen. Diese Maßnahmen könnten langfristig dazu beitragen, die soziale Mobilität zu erhöhen und strukturelle Barrieren abzubauen.

Abschließend zeigt sich, dass eine Kombination aus Bildungsförderung, Stadtentwicklung, Netzwerkbildung und wirtschaftlichen Anreizen notwendig ist, um die soziale Vernetzung in benachteiligten Regionen nachhaltig zu verbessern. Die Ergebnisse aus den Aufgaben 14 und 15 verdeutlichen, dass eine höhere Exposition und eine geringere soziale Segregation entscheidende Faktoren für wirtschaftlichen Erfolg sind. Politische Maßnahmen sollten daher darauf abzielen, diese Faktoren gezielt zu stärken und strukturelle Hürden abzubauen.


Zusatzaufgabe

  1. Laden Sie die Daten zur Economic Connectedness, dem Freundschafts-Bias und der Exposition auf College Ebene von der folgenden URL herunter und lesen Sie diese Daten in R ein:

Hier können Sie die Daten auf College Ebene herunterladen



  1. Laden Sie Kartendaten auf ZIP-Code Ebene mit einer API von IPUMS herunter. Am einfachsten funktioniert dies mit dem R Paket tidycensus. Für den API Zugang müssen Sie sich erst bei IPUMS registrieren und können danach einen API Key beantragen, welchen Sie dann für den Daten download über das tidycencus Paket hinterlegen müssen.

Hinweis: Der Download von Shape-File Daten wird in der Vignette des R Pakets tidycensus sehr gut beschrieben. Dieser Issue auf GitHub ist nützlich um zu erfahren, wie Sie ZIP-Code Daten herunterladen können.



  1. Stellen Sie den Economic Connectedness Index des Colleges (ec_own_ses_college) auf ZIP-Code Ebene in einer US-Karte dar. Machen Sie ihre Karte interaktiv mit dem Paket leaflet.


  1. Erstellen Sie ein Punktediagramm auf College Ebene, welches den Zusammenhang zwischen dem Freundschafts-Bias und der Exposition beleuchtet auf College Ebene näher beleuchtet.

Tragen Sie dafür auf der x-Achse den Anteil von Studierenden mit gut verdienenden Eltern ab (exposure_parent_ses_college) und den Freundschafts-Bias unter den Studierenden (bias_parent_ses_college)

Heben Sie fünf Colleges ihrer Wahl in der Grafik hervor (inkl. Beschriftung).

Beschreiben und interpretieren Sie ihre Grafik. Gehen Sie insbesondere auf die fünf von Ihnen hervorgehobenen Colleges ein.


Die Grafik zeigt den Zusammenhang zwischen dem Freundschafts-Bias und Exposition auf College-Ebene. Auf der X-Achse ist der Anteil von Studierenden mit gut verdienenden Eltern abgetragen, dem Studierende mit weniger gut verdienenden Eltern potenziell begegnen könnten (exposure_parent_ses_college). Dieser Wert wird als durchschnittliche Exposition zu Individuen mit hohem sozioökonomischen Status gemessen und repräsentiert die durchschnittliche Exposition, gewichtet nach Studierenden mit niedrigem sozioökonomischen Status (SES). Ein höherer Wert deutet darauf hin, dass Studierende mit niedrigem SES potenziell viele Studierende mit hohem SES an ihrem College treffen könnten. Auf der Y-Achse steht der Freundschafts-Bias (bias_parent_ses_college), der misst, inwieweit tatsächliche Freundschaften zwischen sozioökonomischen Gruppen seltener vorkommen, als aufgrund der Exposition erwartet würde. Ein hoher Freundschafts-Bias zeigt eine stärkere soziale Trennung zwischen den Gruppen an, während ein niedriger Bias auf mehr soziale Durchmischung hinweist.

Die Mehrheit der Beobachtungen liegen im Bereich 0.75 bis 1.5 auf der X-Achse und -0.05 bis 0.05 auf der Y-Achse. Es gibt eine breite Streuung des Bias-Werts, insbesondere bei moderaten Expositionswerten (0.5–1.0). Dies deutet darauf hin, dass der Bias nicht nur von der Exposition abhängt, sondern auch stark von anderen Einflussfaktoren, die nicht allein durch die Exposition erklärbar sind. Es lässt sich aber sagen, dass die Streuung im Bereich ab 1.25 auf der X-Achse deutlich abnimmt und die Werte immer mehr zusammenrücken. Unsere ausgewählten Colleges befinden sich vom Texas Southmost College bei ca. (0.5,0.03) bis hin zu der Stanford University bei ca. (1.55,0.03) unterschiedlich verteilt über die ganze Grafik.

Das Texas Southmost College, welches direkt an der mexikanischen Grenze liegt, befindet sich bei der Exposition im niedrigen Bereich, was auf wenige Interaktionsmöglichkeiten zwischen niedrig SES und hoch SES Personen hinweist. Studierende aus wohlhabenden Elternhäusern stellen nur eine kleine Gruppe dar. Vermutlich ist die Lage direkt an der Grenze zu Mexiko auch ein Indiz dafür, dass diese Region nicht sehr wohlhabend ist, mit einigen sozialen/wirtschaftlichen Problemen zu kämpfen hat und der Großteil der Bevölkerung vermutlich hispanischer Abstammung sind. Der nahezu neutrale Bias deutet darauf hin, dass die sozialen Barrieren zwischen verschiedenen sozioökonomischen Gruppen relativ gering sind, ohne dass eine übermäßige soziale Integration erkennbar ist.

Das Hawaii Community College besitzt eine Exposition von ca. 0.9 und einen Freundschafts-Bias von 0.13. Die Exposition ist dafür, dass Hawaii ein isolierter Inselstaat, mit begrenzten Kapazitäten ist relativ beachtlich. Der Grund dafür könnte sein, dass auf Hawaii einige wohlhabenden Auswanderer leben, die den Anteil der Wohlhabenden, im Vergleich zur einheimischen Bevölkerung, die oft mit hohen Lebenshaltungskosten zu kämpfen hat, nach oben zieht. Mit einem Freundschafts-Bias von 0.13 hat das Hawaii Community College den höchsten Bias-Wert unter den hervorgehobenen Colleges. Dies bedeutet, dass Studierende dazu neigen, sich hauptsächlich mit anderen aus ähnlichen sozioökonomischen Hintergründen anzufreunden, was eine signifikante soziale Segmentierung anzeigt. Der hohe Freundschafts-Bias könnte durch die isolierte Lage Hawaiis verstärkt werden, da viele Studierende aus der lokalen Gemeinschaft stammen und soziale Netzwerke möglicherweise stärker innerhalb dieser Gruppen bleiben.

Das College of the Florida Keys liegt auf einer Inselkette im Süden Floridas, die für ihre Tourismusindustrie bekannt ist. Die Florida Keys ziehen sowohl wohlhabende Zuzügler als auch Touristen an, während viele Einheimische in Dienstleistungsberufen arbeiten. Mit einer Exposition von ca 1.05 liegt das College im mittleren Bereich der hervorgehobenen Institutionen. Dieser Wert zeigt, dass Studierende aus niedrigeren sozioökonomischen Hintergründen eine moderate Wahrscheinlichkeit haben, mit Kommilitonen aus wohlhabenden Familien in Kontakt zu kommen. Der Freundschafts-Bias von knapp unter 0 bedeutet jedoch, dass keine soziale Trennung zwischen Studierenden unterschiedlicher sozioökonomischer Hintergründe besteht. Dies deutet auf ein außergewöhnlich inklusives soziales Umfeld hin, in dem wirtschaftliche Unterschiede keine Barrieren für soziale Interaktionen darstellen. Die geografische Lage und die Größe des Colleges könnten zur sozialen Integration beitragen, da kleinere Gemeinschaften oft eng miteinander verflochten sind.

Das Massachusetts Institute of Technology (MIT) befindet sich in Cambridge, einer Stadt an der Ostküste, bekannt für ihre zahlreichen Elite-Universitäten und hohe Lebensqualität. Cambridge ist eine wirtschaftlich starke Region mit einer hohen Konzentration an Akademikern und Forschern. Das Institut ist eine der renommiertesten Universitäten der Welt, mit einer starken Ausrichtung auf Wissenschaft und Technologie. Mit einer Exposition von 1.5 hat MIT den zweithöchsten Wert unter den hervorgehobenen Colleges. Dieser Wert zeigt, dass Studierende aus niedrigeren sozioökonomischen Hintergründen eine sehr hohe Wahrscheinlichkeit haben, mit Kommilitonen aus wohlhabenden Familien in Kontakt zu kommen. Dieser Wert spiegelt die starke Präsenz von Studierenden aus hochverdienenden Haushalten wider und deutet darauf hin, dass die soziale und wirtschaftliche Durchmischung am MIT außergewöhnlich hoch ist. Der Freundschafts-Bias von 0 bedeutet, dass es keinerlei soziale Trennung zwischen den sozioökonomischen Gruppen gibt. Studierende aus allen Hintergründen interagieren und bilden Freundschaften unabhängig von wirtschaftlichen Faktoren. Dies ist ein bemerkenswertes Zeichen für soziale Inklusion in einem akademischen Umfeld.

Die Stanford University liegt im Silicon Valley, Kalifornien, einer Region, die weltweit für Innovation, Technologieunternehmen und eine hohe Konzentration von Reichtum bekannt ist. Stanford ist eine private Eliteuniversität, die international als eine der führenden Hochschulen gilt. Die studentische Bevölkerung ist tendenziell wohlhabend, und die hohen Lebenshaltungskosten in der Region spiegeln sich in der Zusammensetzung der Studierenden wider. Mit einer Exposition von 1.6 liegt Stanford auch hier unter den hervorgehobenen Colleges ganz vorne. Der Wert deutet darauf hin, dass Studierende aus niedrigeren sozioökonomischen Hintergründen eine sehr hohe Wahrscheinlichkeit haben, mit Kommilitonen aus wohlhabenden Familien in Kontakt zu kommen. Dies reflektiert die starke Präsenz von Studierenden aus einkommensstärkeren Haushalten und die damit verbundene hohe soziale Mobilität, die durch die finanzielle Unterstützung von Stanford begünstigt wird. Der Freundschafts-Bias von 0.02 zeigt einen sehr niedrigen Bias, was bedeutet, dass es nur eine minimale Tendenz gibt, dass Studierende mit ähnlichen sozioökonomischen Hintergründen eher Freundschaften miteinander schließen.

Die Exposition und der Freundschafts-Bias bieten wertvolle Einblicke in die sozioökonomische Durchmischung auf College-Ebene. Höhere Expositionswerte, wie bei Stanford und MIT, deuten darauf hin, dass Studierende aus niedrigen sozioökonomischen Schichten stärker mit wohlhabenden Kommilitonen in Kontakt kommen. Während höhere Bias-Werte, wie bei dem Hawaii Community College, auf stärkere soziale Trennungen hinweisen. Insgesamt lässt sich sagen, dass eine hohe Exposition meist mit einer besseren sozialen Integration einhergeht.



Literatur

Chetty, R., Friedman, J. N., Hendren, N., Jones, M. R., & Porter, S. R. (2018). The opportunity atlas: Mapping the childhood roots of social mobility (No. w25147). National Bureau of Economic Research. https://doi.org/10.3386/w25147

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital I: measurement and associations with economic mobility. Nature 608, 108–121 (2022a). https://doi.org/10.1038/s41586-022-04996-4

Chetty, R., Jackson, M.O., Kuchler, T. et al. Social capital II: determinants of economic connectedness. Nature 608, 122–134 (2022b). https://doi.org/10.1038/s41586-022-04997-3