ich versuche (wie es in einigen Statistik Büchern steht) mit einem Panel Datensatz (5 Firmen über jeweils 20 Jahre) formal zu testen
ob ein signifikanter Unterschied in den Koeffizienten zwischen zwei Teilperioden (1-10 gegen 11-20) besteht. Die Regression ist eine einfache
univariate in der Form: y = a + b*x.
"Normalerweise" kann man doch einen möglichen Unterschied in den betas
((i) y1 = a1 + b1*x1 für Periode 1-10 und
(ii) y2 = a1 + b2*x2 für Periode 11-20)
über eine Regression mit einem zusätzlichen Interaktionsterm (x*dummy, wobei dummy = 1 in der Teilperiode 11 bis 20 und sonst 0) untersuchen:
(iii) y = a + dummy + b*x + c*x*dummy.
Wenn dabei c signifikant ist kann man daraus schließen, dass der Effekt zw. den Teilperioden signifikant unterschiedlich ist.
Und es spielt dabei keine Rolle ob man die beiden betas aus den beiden Teilperioden nimmt oder aus der vollen Regressione mit Interaktionsterm, weil hier "normalerweise" gilt das: b1 (aus (i)) = b (aus (iii)) und b2 (aus (ii) = b + c (aus (iii)).
Was ich aber festgestellt habe und was meine eigentliche Frage ist, dass wenn man z.B. eine Fixed Effects Schätzer (plm-Packet) verwendet diese beiden Gleichungen nicht mehr gehen.
D.h. die beiden Effekte für die beiden Teilperioden unterscheiden sich dabei je nachdem ich die beiden betas aus (i) und (ii) nehme oder die beiden betas aus (iii).
Aber welche betas wären dann beim FE-Schätzer die "richtigeren"? Und genauso stellt sich dann hier die Frage ob ich dann noch aus der Signifikanz von c (aus (iii)) auf einen signifikanten Unterschied zwischen b1 (aus (i)) und b2 (aus (ii)) schließen kann.
(Ich habe unten den R Output mit den Ergebnisse mit OLS und FE eingefügt)
Viele Grüße
Anastasia
Code: Alles auswählen
> ols <-lm(invest ~ market + d + market*d, data=panel)
> ols1 <-lm(invest ~ market, data=subset(panel, time < 11))
> ols2 <-lm(invest ~ market, data=subset(panel, time > 10))
> fe <- plm(invest ~ market + d + market*d, data=panel, index=c("company", "time"), model="within")
> fe1 <- plm(invest ~ market, data=subset(panel, time < 11), index=c("company", "time"), model="within")
> fe2 <- plm(invest ~ market, data=subset(panel, time > 10), index=c("company", "time"), model="within")
> summary(ols)
Call:
lm(formula = invest ~ market + d + market * d, data = panel)
Residuals:
Min 1Q Median 3Q Max
-305.92 -78.89 -9.31 56.89 473.85
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -10.16751 31.27702 -0.325 0.746
[b]market 0.10367[/b] 0.01363 7.605 1.93e-11 ***
d -59.94529 44.34336 -1.352 0.180
market:d 0.08994 0.01863 4.827 5.23e-06 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 131.2 on 96 degrees of freedom
Multiple R-squared: 0.7674, Adjusted R-squared: 0.7601
F-statistic: 105.6 on 3 and 96 DF, p-value: < 2.2e-16
> summary(ols1)
Call:
lm(formula = invest ~ market, data = subset(panel, time < 11))
Residuals:
Min 1Q Median 3Q Max
-203.247 -54.508 -4.299 41.961 236.184
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -10.16751 24.18798 -0.420 0.676
[b]market 0.10367[/b] 0.01054 9.833 4.38e-13 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 101.5 on 48 degrees of freedom
Multiple R-squared: 0.6683, Adjusted R-squared: 0.6614
F-statistic: 96.69 on 1 and 48 DF, p-value: 4.379e-13
> summary(ols2)
Call:
lm(formula = invest ~ market, data = subset(panel, time > 10))
Residuals:
Min 1Q Median 3Q Max
-305.92 -93.52 -14.87 74.30 473.85
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -70.11281 37.21863 -1.884 0.0657 .
[b]market 0.19361[/b] 0.01504 12.872 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 155.3 on 48 degrees of freedom
Multiple R-squared: 0.7754, Adjusted R-squared: 0.7707
F-statistic: 165.7 on 1 and 48 DF, p-value: < 2.2e-16
> 0.10367+0.08994
[1] 0.19361
> summary(fe)
Oneway (individual) effect Within Model
Call:
plm(formula = invest ~ market + d + market * d, data = panel,
model = "within", index = c("company", "time"))
Balanced Panel: n = 5, T = 20, N = 100
Residuals:
Min. 1st Qu. Median 3rd Qu. Max.
-305.0864 -31.6257 -1.6447 31.9033 469.1906
Coefficients:
Estimate Std. Error t-value Pr(>|t|)
[b]market 0.109138 [/b] 0.021061 5.1819 1.292e-06 ***
d -64.424333 30.022527 -2.1459 0.03452 *
[b]market:d 0.091769[/b] 0.012691 7.2312 1.383e-10 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Total Sum of Squares: 2225300
Residual Sum of Squares: 724340
R-Squared: 0.67449
Adj. R-Squared: 0.64973
F-statistic: 63.5456 on 3 and 92 DF, p-value: < 2.22e-16
> summary(fe1)
Oneway (individual) effect Within Model
Call:
plm(formula = invest ~ market, data = subset(panel, time < 11),
model = "within", index = c("company", "time"))
Balanced Panel: n = 5, T = 10, N = 50
Residuals:
Min. 1st Qu. Median 3rd Qu. Max.
-101.4595 -26.9369 -0.4818 16.5078 112.6266
Coefficients:
Estimate Std. Error t-value Pr(>|t|)
[b]market 0.066904[/b] 0.018014 3.7139 0.0005718 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Total Sum of Squares: 176880
Residual Sum of Squares: 134660
R-Squared: 0.23867
Adj. R-Squared: 0.15215
F-statistic: 13.7933 on 1 and 44 DF, p-value: 0.00057181
> summary(fe2)
Oneway (individual) effect Within Model
Call:
plm(formula = invest ~ market, data = subset(panel, time > 10),
model = "within", index = c("company", "time"))
Balanced Panel: n = 5, T = 10, N = 50
Residuals:
Min. 1st Qu. Median 3rd Qu. Max.
-305.8877 -46.6815 3.7984 36.8720 437.2669
Coefficients:
Estimate Std. Error t-value Pr(>|t|)
[b]market 0.242255[/b] 0.032861 7.3721 3.269e-09 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Total Sum of Squares: 1179000
Residual Sum of Squares: 527460
R-Squared: 0.55261
Adj. R-Squared: 0.50176
F-statistic: 54.3472 on 1 and 44 DF, p-value: 3.2688e-09
> 0.109138+0.091769
[1] 0.200907