Tests um Koeffizienten zweier Regressionen zu vergleichen

Methoden der Zeitreihenanalyse

Moderator: schubbiaschwilli

Antworten
daten_tim

Tests um Koeffizienten zweier Regressionen zu vergleichen

Beitrag von daten_tim »

Liebes Forum,
ich will Tests zu den Koeffizienten zweier gleichartiger Regressionen für zwei Stichproben durchführen.
Hierfür möchte ich also für die gleiche Regression, die ich für zwei unterschiedliche Datensätze durchgeführt habe, Koeffizienten der beiden Regressionen auf Gleichheit untersuchen. Welche Tests kann ich nutzen?

Ich habe das bisher so gemacht, dass ich meine beiden Regressionen durch bootstrapping hundertfach durchführe. Dadurch erhalte ich Schätzungen für meine beiden Koeffizienten aus beiden Regressionen in großer Anzahl. Wenn ich da einen Zweistichproben-t-Test mache, um z.B. die beiden Reihen von Koeffizienten einer erklärenden Zeitreihe in meinen beiden Zeitreihen auf Unterschiede zu testen, schlägt dieser sehr stark an, weil die Varianz sehr klein ist. Also wenn mein einer Koeffizient in der ersten Stichprobe 0.29 ist und der andere 0.32 finde ich, dass beide nicht sonderlich unterschiedlich sind - der Welch-Test schlägt aber an, da wie gesagt, die Varianzen in meinen hundertfach gebootstrapped-ten Reihen von Koeffizienten sehr klein sind. Habt Ihr andere Ideen für einen passenden Test?

Ich freue mich auf Feedback.
beste Grüße
tim
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Tests um Koeffizienten zweier Regressionen zu vergleichen

Beitrag von jogo »

Hallo Tim,

willkommen im Forum!
Da Du zu dem geschätzten Wert des Koeffizienten jeweils auch einen Standardfehler des Schätzers hast, könntest Du den t-Test auch so durchführen:
https://de.wikipedia.org/wiki/Zweistich ... tichproben

Gruß, Jörg
daten_tim

Re: Tests um Koeffizienten zweier Regressionen zu vergleichen

Beitrag von daten_tim »

Hallo Jörg,
vielen Dank für Deine Antwort.
Vorweg: Ich war auch schon im „vorherigen“ Forum, aber das gibt es ja irgendwie nicht mehr.

Zu deiner Antwort: Stimmt. Ich kann ja mit dem Koeffizienten, den Standardfehler und der Anzahl meiner Zeitreihe (n) den Zweistichproben-t-test selbst rechnen. Das habe ich nun einmal gemacht und komme auf das Ergebnis, dass die Ergebnisse stets deutlich niedriger sind, also weniger stark über dem Signifikanzniveau als nach dem bootstrapping? Woran kann das liegen? Eigentlich kommen die gebootstrapped-ten Daten zu vergleichbaren Standardfehlern und im Mittel auch zu einem vergleichbaren Koeffizienten, wie bei der einzelnen Regression?

Zusätzlich: Wenn ich bootstrappe und mit dem Shapiro-Wilk-Test schaue, ob meine hundertfachen Koeffizienten normalverteilt sind, kommt bei einem Durchlauf mal was normalverteiltes raus und mal nicht. Das finde ich schon komisch. Macht es nun aber Sinn eine normalverteilte Koeffizienten-Stichprobe 1 mit einer nicht-normalverteilten Koeffizienten-Stichprobe 2 per t-test zu vergleichen, wo aber die Stichprobenumfänge sehr hoch sind, also mehrere hundert? Oder sollte man da die Finger von lassen?

tim
daten_tim

Re: Tests um Koeffizienten zweier Regressionen zu vergleichen

Beitrag von daten_tim »

ahhh - ich habe den bug bei mir gefunden. meine bootstrap-ergebnisse sind denen der original-daten (dein tipp) sehr aehnlich.

mal eine grundsaetzliche frage, über die ich gerade gruebele: wenn ich eine regression über alle daten mache und einen koeefizienten anschaue (koeffizient_all), dann die daten, wie beschrieben in zwei gruppen aufteile und wieder regressiere (koeffizient_1 und koeffizient_2), müssten dann die koeffizienten 1 und 2 im mittel wieder den wert annehmen des koeefizienten_all der ganzen gruppe?

y(x) = a+ b*x

also z.B.: b_all = 0,5 dann koennten b_1 = 0,25 und b_2 = 0,75 sein.

Oder kann es auch unter umstaenden (eventuell hat die teilung der grundgesamtheit darauf einfluss, bzw. auch die standardfehler der koeefizienten) so sein: b_1 = 0,55 und b_2 = 0,58 ?

beste gruesse
tim
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Tests um Koeffizienten zweier Regressionen zu vergleichen

Beitrag von jogo »

daten_tim hat geschrieben: Fr Mär 17, 2017 11:06 ammal eine grundsaetzliche frage, über die ich gerade gruebele: wenn ich eine regression über alle daten mache und einen koeefizienten anschaue (koeffizient_all), dann die daten, wie beschrieben in zwei gruppen aufteile und wieder regressiere (koeffizient_1 und koeffizient_2), müssten dann die koeffizienten 1 und 2 im mittel wieder den wert annehmen des koeefizienten_all der ganzen gruppe?
Wenn Du meinst im Sinne eines einfachen arithmetischen Mittels, dann halte ich das für ein Gerücht. Dafür ist der Algorithmus für die Berechnung der Koeffizienten einfach zu kompliziert.
Hier ein Beispiel, das Deine Behauptung widerlegt: ...

Code: Alles auswählen

d1 <- data.frame(x=1:4, y=1:4)
d2 <- data.frame(x=2:5, y=9:6)

lm(y ~ x, data=d1)
lm(y ~ x, data=d2)
lm(y ~ x, data=rbind(d1,d2))
Gruß, Jörg
Antworten