Fixed-effect Koeffizienten in gemischtem Modell mit AR(1)-Cov.
Verfasst: Sa Jun 24, 2017 4:49 pm
Hallo,
ich möchte für eine Abschlussarbeit eine Analyse der Struktur des Systems internationaler Zwangsmigration (Flüchtlinge und Asylsuchende) durchführen.
Ich habe hierzu ein Modell angepasst, das das Zustandekommen der internationalen Bestände von Zwangsmigranten in Abhängigkeit von Eigenschaften der Herkunfts- und Aufenthaltsländer (Wirtschaftskraft, Auftreten bewaffneter Konflikte, ...) sowie von Eigenschaften der Beziehungen zwischen den jeweiligen Ländern (geographische und linguistische Distanz) beschreiben soll. Mein Datensatz umfasst alle möglichen dyadischen Beobachtungen zwischen insgesamt 160 Ländern über einen Zeitraum von 25 Jahren
Mein größtes Problem ist hierbei, dass es sich um ZwangsmigrantenBESTÄNDE (also nicht etwa um -ströme handelt): Diese Bestände aggregieren sich im Laufe der Zeit. Die Bestände zum Zeitpunkt t ergeben sich in etwa aus den Beständen zum Zeitpunkt t-1 zuzüglich der Einströme im Zeitraum von t-1 bis t und abzüglich der Ausströme im selben Zeitraum. Dies führt zu sehr starker serieller Autokorrelation, weshalb ich auf ein gemischtes Modell zurückgegriffen habe um eine autoregressive Korrelationsstruktur implementieren zu können. Angepasst habe ich es mittels der Funktion glmmTMB aus dem gleichnamigen Paket.
Ich komme bei der Interpretation der fixed-effect Koeffizienten (Wirtschaftskraft, Distanz, ...) nicht weiter und finde per Suchmaschine keine Antwort, die ich verstehen kann. Ich frage mich, ob die fixed-effect Koeffizienten (nach Implementierung der AR(1)-Korrelationsstruktur) die geschätzen absoluten Bestände zum Zeitpunkt t oder die geschätzte Differenz der Bestände zwischen Zeitpunkt t-1 und t beschreiben.
Kann mir hierbei jemand weiterhelfen?
Danke im Voraus
EDIT 1:
Das mit den aggregativen Beständen ist zwar wahrscheinlich die Hauptursache für serielle Korrelation, jedoch keine statistische Begründung für die Notwendigkeit der AR(1)-Korrelationsstruktur. Ich habe deshalb am Modell ohne die Korrelationsstruktur einen Durbin-Watson-Test (https://de.wikipedia.org/wiki/Durbin-Watson-Test) durchgeführt und einen Wert von 0.36 ermittelt. Ich weiß die Quelle gerade nichtmehr, habe aber gelesen, dass "The Durbin Watson test reports a test statistic, with a value from 0 to 4, where: 2 is no autocorrelation, 0 to <2 is positive autocorrelation, >2 to 4 is negative autocorrelation". Es liegt also ziemlich starke serielle Korrelation vor.
EDIT 2:
Sollte der summary-output beim Verständins helfen:
dist_mini == 0TRUE ist Nachbarschaft
dist_capi ist die log. geographische Distanz
comm_lang_spkn ist der Anteil gemeinsam gesprochener Sprachen
gdpc_orig ist das pro-Kopf BIP des Herkunftslandes
gdpc_orig ist das pro-Kopf BIP des Aufenthaltslandes
der Rest sind log. Bevölkerungsgrößen, Bürgerrechte und bewaffnete Konflike
ich möchte für eine Abschlussarbeit eine Analyse der Struktur des Systems internationaler Zwangsmigration (Flüchtlinge und Asylsuchende) durchführen.
Ich habe hierzu ein Modell angepasst, das das Zustandekommen der internationalen Bestände von Zwangsmigranten in Abhängigkeit von Eigenschaften der Herkunfts- und Aufenthaltsländer (Wirtschaftskraft, Auftreten bewaffneter Konflikte, ...) sowie von Eigenschaften der Beziehungen zwischen den jeweiligen Ländern (geographische und linguistische Distanz) beschreiben soll. Mein Datensatz umfasst alle möglichen dyadischen Beobachtungen zwischen insgesamt 160 Ländern über einen Zeitraum von 25 Jahren
Mein größtes Problem ist hierbei, dass es sich um ZwangsmigrantenBESTÄNDE (also nicht etwa um -ströme handelt): Diese Bestände aggregieren sich im Laufe der Zeit. Die Bestände zum Zeitpunkt t ergeben sich in etwa aus den Beständen zum Zeitpunkt t-1 zuzüglich der Einströme im Zeitraum von t-1 bis t und abzüglich der Ausströme im selben Zeitraum. Dies führt zu sehr starker serieller Autokorrelation, weshalb ich auf ein gemischtes Modell zurückgegriffen habe um eine autoregressive Korrelationsstruktur implementieren zu können. Angepasst habe ich es mittels der Funktion glmmTMB aus dem gleichnamigen Paket.
Ich komme bei der Interpretation der fixed-effect Koeffizienten (Wirtschaftskraft, Distanz, ...) nicht weiter und finde per Suchmaschine keine Antwort, die ich verstehen kann. Ich frage mich, ob die fixed-effect Koeffizienten (nach Implementierung der AR(1)-Korrelationsstruktur) die geschätzen absoluten Bestände zum Zeitpunkt t oder die geschätzte Differenz der Bestände zwischen Zeitpunkt t-1 und t beschreiben.
Kann mir hierbei jemand weiterhelfen?
Danke im Voraus
EDIT 1:
Das mit den aggregativen Beständen ist zwar wahrscheinlich die Hauptursache für serielle Korrelation, jedoch keine statistische Begründung für die Notwendigkeit der AR(1)-Korrelationsstruktur. Ich habe deshalb am Modell ohne die Korrelationsstruktur einen Durbin-Watson-Test (https://de.wikipedia.org/wiki/Durbin-Watson-Test) durchgeführt und einen Wert von 0.36 ermittelt. Ich weiß die Quelle gerade nichtmehr, habe aber gelesen, dass "The Durbin Watson test reports a test statistic, with a value from 0 to 4, where: 2 is no autocorrelation, 0 to <2 is positive autocorrelation, >2 to 4 is negative autocorrelation". Es liegt also ziemlich starke serielle Korrelation vor.
EDIT 2:
Sollte der summary-output beim Verständins helfen:
Code: Alles auswählen
Family: poisson ( log )
Formula: popc ~ ar1(year + 0 | dyad) + (1 | orig) + (1 | dest) + year_intr + (dist_mini == 0) + dist_capi + comm_lang_spkn + gdpc_orig + gdpc_dest + popt_orig + popt_dest + civl_orig + civl_dest + (cnfl_intr_orig > 1 & cnfl_intr_orig <= 999) + (cnfl_intr_orig > 999) + (cnfl_intr_dest > 999)
Data: rckl
AIC BIC logLik deviance df.resid
775403.4 775641.7 -387680.7 775361.4 625795
Random effects:
Conditional model:
Groups Name Variance Std.Dev. Corr
dyad year1990 12.746 3.570
year1991 12.746 3.570 0.95
year1992 12.746 3.570 0.90 0.95
year1993 12.746 3.570 0.86 0.90 0.95
year1994 12.746 3.570 0.81 0.86 0.90 0.95
year1995 12.746 3.570 0.77 0.81 0.86 0.90 0.95
year1996 12.746 3.570 0.73 0.77 0.81 0.86 0.90 0.95
year1997 12.746 3.570 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year1998 12.746 3.570 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year1999 12.746 3.570 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2000 12.746 3.570 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2001 12.746 3.570 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2002 12.746 3.570 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2003 12.746 3.570 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2004 12.746 3.570 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2005 12.746 3.570 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2006 12.746 3.570 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2007 12.746 3.570 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2008 12.746 3.570 0.40 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2009 12.746 3.570 0.38 0.40 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2010 12.746 3.570 0.36 0.38 0.40 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2011 12.746 3.570 0.34 0.36 0.38 0.40 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2012 12.746 3.570 0.32 0.34 0.36 0.38 0.40 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2013 12.746 3.570 0.31 0.32 0.34 0.36 0.38 0.40 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
year2014 12.746 3.570 0.29 0.31 0.32 0.34 0.36 0.38 0.40 0.42 0.44 0.46 0.49 0.51 0.54 0.57 0.60 0.63 0.66 0.70 0.73 0.77 0.81 0.86 0.90 0.95
orig (Intercept) 17.941 4.236
dest (Intercept) 7.239 2.691
Number of obs: 625816, groups: dyad, 26537; orig, 167; dest, 160
Conditional model:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -11.98933 0.39938 -30.02 < 2e-16 ***
year_intr(1995,2000] 0.90376 0.02930 30.84 < 2e-16 ***
year_intr(2000,2004] 1.99128 0.03724 53.48 < 2e-16 ***
year_intr(2004,2009] 2.10190 0.04389 47.89 < 2e-16 ***
year_intr(2009,2014] 2.22587 0.04980 44.69 < 2e-16 ***
dist_mini == 0TRUE 2.08443 0.20831 10.01 < 2e-16 ***
dist_capi -2.00021 0.03716 -53.83 < 2e-16 ***
comm_lang_spkn 0.49519 0.03582 13.83 < 2e-16 ***
gdpc_orig -0.98140 0.06317 -15.53 < 2e-16 ***
gdpc_dest 1.57218 0.09313 16.88 < 2e-16 ***
popt_orig 6.52293 0.36411 17.91 < 2e-16 ***
popt_dest 3.00346 0.19390 15.49 < 2e-16 ***
civl_orig 0.17141 0.02050 8.36 < 2e-16 ***
civl_dest -0.14238 0.02712 -5.25 1.52e-07 ***
cnfl_intr_orig > 1 & cnfl_intr_orig <= 999TRUE 0.04906 0.01482 3.31 0.000931 ***
cnfl_intr_orig > 999TRUE 0.06908 0.02217 3.12 0.001834 **
cnfl_intr_dest > 999TRUE -0.14133 0.03367 -4.20 2.70e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
dist_capi ist die log. geographische Distanz
comm_lang_spkn ist der Anteil gemeinsam gesprochener Sprachen
gdpc_orig ist das pro-Kopf BIP des Herkunftslandes
gdpc_orig ist das pro-Kopf BIP des Aufenthaltslandes
der Rest sind log. Bevölkerungsgrößen, Bürgerrechte und bewaffnete Konflike