Hey Jörg,
hier die str und summary meiner benötigten Daten. Hoffe das hilft weiter.
Code: Alles auswählen
> summary(Datenset)
syear Geburtsjahr Aufenthaltstitel Geschlecht
Min. :2016 Min. :1951 Min. :1.000 Min. :1.000
1st Qu.:2016 1st Qu.:1977 1st Qu.:1.000 1st Qu.:1.000
Median :2016 Median :1984 Median :3.000 Median :1.000
Mean :2016 Mean :1983 Mean :2.902 Mean :1.382
3rd Qu.:2016 3rd Qu.:1990 3rd Qu.:3.000 3rd Qu.:2.000
Max. :2016 Max. :1998 Max. :8.000 Max. :2.000
NA's :52
aktuelleStellensuche Integrationskurs_Bamf ESF_Bamf
Min. :0.000 Min. :0.0000 Min. :0.00000
1st Qu.:0.000 1st Qu.:0.0000 1st Qu.:0.00000
Median :0.000 Median :0.0000 Median :0.00000
Mean :0.238 Mean :0.3646 Mean :0.03205
3rd Qu.:0.000 3rd Qu.:1.0000 3rd Qu.:0.00000
Max. :1.000 Max. :1.0000 Max. :1.00000
NA's :443 NA's :26 NA's :36
Einstiegskurs_DtSprachfoerd Perspektive_Fluechtlinge
Min. :0.00000 Min. :0.0000
1st Qu.:0.00000 1st Qu.:0.0000
Median :0.00000 Median :0.0000
Mean :0.08394 Mean :0.0207
3rd Qu.:0.00000 3rd Qu.:0.0000
Max. :1.00000 Max. :1.0000
NA's :40 NA's :46
PerspektiveJugendlFluechtl Dtsprachkurs Partner_Freunde
Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.0000 Median :0.0000 Median :0.0000
Mean :0.0046 Mean :0.0046 Mean :0.3383
3rd Qu.:0.0000 3rd Qu.:0.0000 3rd Qu.:1.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000
NA's :45 NA's :45
CD_Internet_App Fernseh_Buecher Sonstiges Betrug_Ausbeutung
Min. :0.0000 Min. :0.0000 Min. :0.0000 Min. :0.0000
1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.0000 Median :1.0000 Median :0.0000 Median :0.0000
Mean :0.2982 Mean :0.6959 Mean :0.1329 Mean :0.1788
3rd Qu.:1.0000 3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:0.0000
Max. :1.0000 Max. :1.0000 Max. :1.0000 Max. :1.0000
Sexuelle_Belaestigung Koerperliche_Uebergriffe Schiffbruch
Min. :0.00000 Min. :0.0000 Min. :0.00000
1st Qu.:0.00000 1st Qu.:0.0000 1st Qu.:0.00000
Median :0.00000 Median :0.0000 Median :0.00000
Mean :0.01712 Mean :0.1059 Mean :0.08694
3rd Qu.:0.00000 3rd Qu.:0.0000 3rd Qu.:0.00000
Max. :1.00000 Max. :1.0000 Max. :1.00000
Raubueberfall Erpressung Gefaengnisaufenthalt
Min. :0.00000 Min. :0.0000 Min. :0.0000
1st Qu.:0.00000 1st Qu.:0.0000 1st Qu.:0.0000
Median :0.00000 Median :0.0000 Median :0.0000
Mean :0.08874 Mean :0.0955 Mean :0.1297
3rd Qu.:0.00000 3rd Qu.:0.0000 3rd Qu.:0.0000
Max. :1.00000 Max. :1.0000 Max. :1.0000
Alter Maßnahmen
Min. :18.00 Min. :0.000
1st Qu.:26.00 1st Qu.:1.000
Median :32.00 Median :2.000
Mean :33.42 Mean :1.967
3rd Qu.:39.00 3rd Qu.:3.000
Max. :65.00 Max. :9.000
NA's :82
Code: Alles auswählen
> str(Datenset)
tibble [2,220 x 24] (S3: tbl_df/tbl/data.frame)
$ syear : num [1:2220] 2016 2016 2016 2016 2016 ...
..- attr(*, "label")= chr "Erhebungsjahr"
..- attr(*, "format.stata")= chr "%12.0g"
$ Geburtsjahr : num [1:2220] 1972 1984 1961 1972 1988 ...
..- attr(*, "label")= chr "Geburtsjahr"
..- attr(*, "format.stata")= chr "%12.0g"
$ Aufenthaltstitel : 'haven_labelled' num [1:2220] 6 NA NA 3 3 1 1 1 1 1 ...
..- attr(*, "label")= chr "Aktueller Aufenthaltstitel"
..- attr(*, "labels")= Named num [1:14] -6 -5 -4 -3 -2 -1 1 2 3 4 ...
.. ..- attr(*, "names")= chr [1:14] "[-6] Fragebogenversion mit geaenderter Filterfuehrung" "[-5] In Fragebogenversion nicht enthalten" "[-4] Unzulaessige Mehrfachantwort" "[-3] nicht valide" ...
$ Geschlecht : 'haven_labelled' num [1:2220] 1 2 1 2 1 2 1 1 2 1 ...
..- attr(*, "label")= chr "Geschlecht"
..- attr(*, "labels")= Named num [1:8] -6 -5 -4 -3 -2 -1 1 2
.. ..- attr(*, "names")= chr [1:8] "[-6] Fragebogenversion mit geaenderter Filterfuehrung" "[-5] In Fragebogenversion nicht enthalten" "[-4] Unzulaessige Mehrfachantwort" "[-3] nicht valide" ...
$ aktuelleStellensuche : num [1:2220] 0 0 0 1 0 NA 1 0 1 0 ...
$ Integrationskurs_Bamf : num [1:2220] 1 0 0 1 0 0 0 0 0 0 ...
$ ESF_Bamf : num [1:2220] 0 0 0 0 0 0 0 0 0 0 ...
$ Einstiegskurs_DtSprachfoerd: num [1:2220] 0 0 0 0 0 0 0 0 0 0 ...
$ Perspektive_Fluechtlinge : num [1:2220] 0 0 0 1 0 0 0 0 0 0 ...
$ PerspektiveJugendlFluechtl : num [1:2220] 0 0 0 0 0 0 0 0 0 0 ...
$ Dtsprachkurs : num [1:2220] 0 0 0 0 0 0 0 0 0 0 ...
$ Partner_Freunde : num [1:2220] 1 1 0 0 1 0 0 0 1 1 ...
$ CD_Internet_App : num [1:2220] 0 0 0 0 0 0 1 0 0 0 ...
$ Fernseh_Buecher : num [1:2220] 0 0 0 0 0 0 1 1 1 1 ...
$ Sonstiges : num [1:2220] 0 0 0 0 0 1 0 0 0 0 ...
$ Betrug_Ausbeutung : num [1:2220] 0 0 0 0 0 1 0 1 0 0 ...
$ Sexuelle_Belaestigung : num [1:2220] 0 0 0 0 0 0 0 0 0 0 ...
$ Koerperliche_Uebergriffe : num [1:2220] 0 0 0 0 0 0 0 1 0 0 ...
$ Schiffbruch : num [1:2220] 0 0 0 0 1 0 0 0 0 0 ...
$ Raubueberfall : num [1:2220] 0 0 0 0 0 0 0 0 0 0 ...
$ Erpressung : num [1:2220] 0 0 0 0 0 0 0 0 0 0 ...
$ Gefaengnisaufenthalt : num [1:2220] 0 0 0 0 0 1 1 0 0 0 ...
$ Alter : num [1:2220] 44 32 55 44 28 51 23 23 41 44 ...
..- attr(*, "label")= chr "Erhebungsjahr"
..- attr(*, "format.stata")= chr "%12.0g"
$ Maßnahmen : num [1:2220] 2 1 0 2 1 1 2 1 2 2 ...
- attr(*, "label")= chr "SOEP-Core, v35t (Teaching Dataset, 50%), doi:10.5684/soep-core.v35t"
also die ursprünglichen Antwortmöglichkeiten waren: Ja, Nein, Keine Angabe.
bei all meinen Variablen. Und diese habe ich jeweils umgeändert in: Ja= 1 und Nein=0.
Folgenden Codes habe ich für die Modelle genutzt:
1. Binär logistische Regression, na sowohl die AV als auch die AV Nominal skaliert sind.
Code: Alles auswählen
Formula.Logitbase <- aktuelleStellensuche ~ Betrug_Ausbeutung +
Sexuelle_Belaestigung +
Koerperliche_Uebergriffe +
Schiffbruch +
Raubueberfall +
Erpressung +
Gefaengnisaufenthalt.
Korr_Platzierung <- glm(Formula.Logitbase, data = Datenset, family = "binomial" (link = "logit"))
2. Lineare Regression, da die UV Nominal und die AV metrisch skaliert ist: (Hier bin ich mir nicht sicher, ob es Sinn macht, die AV metrisch zu skalieren, denn es ist ja von verschiedenen Faktoren abhängig, ob man an mehreren Maßnahmen teilnimmt oder nicht)
Code: Alles auswählen
Formula.Linear <- Maßnahmen ~ Betrug_Ausbeutung +
Sexuelle_Belaestigung +
Koerperliche_Uebergriffe +
Schiffbruch +
Raubueberfall +
Erpressung +
Gefaengnisaufenthalt
Korr_Kulturation <- lm(Formula.Linear, data = Datenset)
Also Hauptinteresse ist es eigt, ob negative Erfahrungen auf der Flucht von Geflüchteten einen negativen oder positiven Effekt auf Teile der Sozialintegration haben. Ich bin mir jedoch ebenfalls nicht sicher wie die Kodierung erfolgen sollte, um die jeweilige Hypothese zu prüfen.
Vielen Dank und liebe Grüße
adfn