Test eines signifikanten Unterschieds in den Koeffizienten zweier Teilsamples

Anastasia · Beitrag von **Anastasia** » Fr Jan 26, 2018 1:18 pm

Liebe R Nutzer,

ich versuche (wie es in einigen Statistik Büchern steht) mit einem Panel Datensatz (5 Firmen über jeweils 20 Jahre) formal zu testen
ob ein signifikanter Unterschied in den Koeffizienten zwischen zwei Teilperioden (1-10 gegen 11-20) besteht. Die Regression ist eine einfache
univariate in der Form: y = a + b*x.
"Normalerweise" kann man doch einen möglichen Unterschied in den betas

((i) y1 = a1 + b1*x1 für Periode 1-10 und
(ii) y2 = a1 + b2*x2 für Periode 11-20)

über eine Regression mit einem zusätzlichen Interaktionsterm (x*dummy, wobei dummy = 1 in der Teilperiode 11 bis 20 und sonst 0) untersuchen:

(iii) y = a + dummy + b*x + c*x*dummy.

Wenn dabei c signifikant ist kann man daraus schließen, dass der Effekt zw. den Teilperioden signifikant unterschiedlich ist.
Und es spielt dabei keine Rolle ob man die beiden betas aus den beiden Teilperioden nimmt oder aus der vollen Regressione mit Interaktionsterm, weil hier "normalerweise" gilt das: b1 (aus (i)) = b (aus (iii)) und b2 (aus (ii) = b + c (aus (iii)).

Was ich aber festgestellt habe und was meine eigentliche Frage ist, dass wenn man z.B. eine Fixed Effects Schätzer (plm-Packet) verwendet diese beiden Gleichungen nicht mehr gehen.
D.h. die beiden Effekte für die beiden Teilperioden unterscheiden sich dabei je nachdem ich die beiden betas aus (i) und (ii) nehme oder die beiden betas aus (iii).
Aber welche betas wären dann beim FE-Schätzer die "richtigeren"? Und genauso stellt sich dann hier die Frage ob ich dann noch aus der Signifikanz von c (aus (iii)) auf einen signifikanten Unterschied zwischen b1 (aus (i)) und b2 (aus (ii)) schließen kann.

(Ich habe unten den R Output mit den Ergebnisse mit OLS und FE eingefügt)

Viele Grüße
Anastasia

Code: Alles auswählen

> ols <-lm(invest ~ market + d + market*d, data=panel)
> ols1 <-lm(invest ~ market, data=subset(panel, time < 11))
> ols2 <-lm(invest ~ market, data=subset(panel, time > 10))
> fe <- plm(invest ~ market + d + market*d, data=panel, index=c("company", "time"), model="within")
> fe1 <- plm(invest ~ market, data=subset(panel, time < 11), index=c("company", "time"), model="within")
> fe2 <- plm(invest ~ market, data=subset(panel, time > 10), index=c("company", "time"), model="within")


> summary(ols)

Call:
lm(formula = invest ~ market + d + market * d, data = panel)

Residuals:
    Min      1Q  Median      3Q     Max 
-305.92  -78.89   -9.31   56.89  473.85 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -10.16751   31.27702  -0.325    0.746    
[b]market        0.10367[/b]    0.01363   7.605 1.93e-11 ***
d           -59.94529   44.34336  -1.352    0.180    
market:d      0.08994    0.01863   4.827 5.23e-06 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 131.2 on 96 degrees of freedom
Multiple R-squared:  0.7674,	Adjusted R-squared:  0.7601 
F-statistic: 105.6 on 3 and 96 DF,  p-value: < 2.2e-16




> summary(ols1)

Call:
lm(formula = invest ~ market, data = subset(panel, time < 11))

Residuals:
     Min       1Q   Median       3Q      Max 
-203.247  -54.508   -4.299   41.961  236.184 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -10.16751   24.18798  -0.420    0.676    
[b]market        0.10367[/b]    0.01054   9.833 4.38e-13 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 101.5 on 48 degrees of freedom
Multiple R-squared:  0.6683,	Adjusted R-squared:  0.6614 
F-statistic: 96.69 on 1 and 48 DF,  p-value: 4.379e-13



> summary(ols2)

Call:
lm(formula = invest ~ market, data = subset(panel, time > 10))

Residuals:
    Min      1Q  Median      3Q     Max 
-305.92  -93.52  -14.87   74.30  473.85 

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) -70.11281   37.21863  -1.884   0.0657 .  
[b]market        0.19361[/b]    0.01504  12.872   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 155.3 on 48 degrees of freedom
Multiple R-squared:  0.7754,	Adjusted R-squared:  0.7707 
F-statistic: 165.7 on 1 and 48 DF,  p-value: < 2.2e-16

> 0.10367+0.08994
[1] 0.19361






> summary(fe)
Oneway (individual) effect Within Model

Call:
plm(formula = invest ~ market + d + market * d, data = panel, 
    model = "within", index = c("company", "time"))

Balanced Panel: n = 5, T = 20, N = 100

Residuals:
     Min.   1st Qu.    Median   3rd Qu.      Max. 
-305.0864  -31.6257   -1.6447   31.9033  469.1906 

Coefficients:
           Estimate Std. Error t-value  Pr(>|t|)    
[b]market     0.109138 [/b]  0.021061  5.1819 1.292e-06 ***
d        -64.424333  30.022527 -2.1459   0.03452 *  
[b]market:d   0.091769[/b]   0.012691  7.2312 1.383e-10 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Total Sum of Squares:    2225300
Residual Sum of Squares: 724340
R-Squared:      0.67449
Adj. R-Squared: 0.64973
F-statistic: 63.5456 on 3 and 92 DF, p-value: < 2.22e-16



> summary(fe1)
Oneway (individual) effect Within Model

Call:
plm(formula = invest ~ market, data = subset(panel, time < 11), 
    model = "within", index = c("company", "time"))

Balanced Panel: n = 5, T = 10, N = 50

Residuals:
     Min.   1st Qu.    Median   3rd Qu.      Max. 
-101.4595  -26.9369   -0.4818   16.5078  112.6266 

Coefficients:
       Estimate Std. Error t-value  Pr(>|t|)    
[b]market 0.066904[/b]   0.018014  3.7139 0.0005718 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Total Sum of Squares:    176880
Residual Sum of Squares: 134660
R-Squared:      0.23867
Adj. R-Squared: 0.15215
F-statistic: 13.7933 on 1 and 44 DF, p-value: 0.00057181



> summary(fe2)
Oneway (individual) effect Within Model

Call:
plm(formula = invest ~ market, data = subset(panel, time > 10), 
    model = "within", index = c("company", "time"))

Balanced Panel: n = 5, T = 10, N = 50

Residuals:
     Min.   1st Qu.    Median   3rd Qu.      Max. 
-305.8877  -46.6815    3.7984   36.8720  437.2669 

Coefficients:
       Estimate Std. Error t-value  Pr(>|t|)    
[b]market 0.242255[/b]   0.032861  7.3721 3.269e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Total Sum of Squares:    1179000
Residual Sum of Squares: 527460
R-Squared:      0.55261
Adj. R-Squared: 0.50176
F-statistic: 54.3472 on 1 and 44 DF, p-value: 3.2688e-09


> 0.109138+0.091769
[1] 0.200907

Beitrag von **jogo** » Fr Jan 26, 2018 6:41 pm

Hallo Anastasia,

willkommen im Forum!
Für einen T-Test (um den Unterschied zwischen zwei ansonsten systematisch gleichen Parametern zu testen) benötigst Du nur den Schätzwert und den Standardfehler des Schätzers:
https://de.wikipedia.org/wiki/Zweistichproben-t-Test

Gruß, Jörg

Anastasia · Beitrag von **Anastasia** » Sa Jan 27, 2018 1:21 am

Hallo Jörg,

danke für die Antwort! Wenn ich mich nicht irre würde doch schon die Betrachtung der t-statistic für den Koeffizienten c in Gleichung (iii) reichen, oder? Aber wie ist das mit den betas für den 1. (Perioden 1-10) bzw. 2. (Perioden 11-20) Teilzeitraum. Wenn man ganz "einfach" per OLS schätzt ist das ja egal ob man nur (i) und (ii) hierfür nutzt oder beide betas nur aus der Schätzung von (iii) zieht, da ja die dummy Variable "dafür sorgt" das man aus:

(iii) y = a + dummy + b*x + c*x*dummy immer entweder in:

(i) y1 = a1 + b1*x1 für Periode 1-10
o.
(ii) y2 = a2 + b2*x2 für Periode 11-20

landet. Aber anders als bei der Schätzung mit OLS, macht es bei der Schätzung mit FE einen Unterschied (im Hinblick auf die Koeffizientenwerte) ob ich den Weg nur über (iii) wähle oder nur über (i) und (ii). Übersehe ich hier etwas oder gibt es hier (FE) keine "eindeutigen/richtigen" Koeffizienten?

Viele Grüße
Anastasia

Beitrag von **jogo** » Mo Jan 29, 2018 9:03 am

Hallo Anastasia,

bezüglich der OLS-Schätzung bin ich der gleichen Meinung wie Du. Bei FE fällt es mir schwer, die Situation zu beurteilen - es kann aber durchaus anders aussehen als bei OLS.

Gruß, Jörg

Deutsches R-Forum

Test eines signifikanten Unterschieds in den Koeffizienten zweier Teilsamples

Test eines signifikanten Unterschieds in den Koeffizienten zweier Teilsamples

Re: Test eines signifikanten Unterschieds in den Koeffizienten zweier Teilsamples

Re: Test eines signifikanten Unterschieds in den Koeffizienten zweier Teilsamples

Re: Test eines signifikanten Unterschieds in den Koeffizienten zweier Teilsamples