Ich soll folgendes Beispiel (Angabe siehe Anhang) zu lösen - vor allem der letzte Punkt
(Vergleich empirische & theoretische Var-Cov-Matrix für Residuen bzw. Koeffizienten aller 10.000 Modelle) bereitet mir Kopfzerbrechen.
Für die ersten beiden Punkte habe ich bisher folgenden Code programmiert:
Code: Alles auswählen
set.seed(123)
x <- seq(0,1,length.out=11)
X <- matrix(c(rep(1,11),x), ncol=2, byrow=F) # Designmatrix
# Berechnung v. H
H <- X %*% solve(crossprod(X)) %*% t(X) # H = X((X'X)^-1)X'
H
diag(H) # alle Werte zwischen 0 und 1
# Berechnung v. I-H
IminusH <- diag(11)-H
IminusH
# Modellberechnungen für 10.000 Samples
SampleY <- replicate(10000,3 + 5*x + rnorm(11))
LM <- lm(SampleY ~ x)
# Berechnung der Koeffizienten & Residuen
# der Linearen Modelle für 10.000 Samples
cf <- LM$coefficients # Koeff. der 10.000 Modelle
cf[,1:4] # Koeff. der Modelle 1-4 (Ansicht&Vergleich)
rs <- LM$residuals # Residuen der 10.000 Modelle
rs[,1:4] # Residuen der Modelle 1-4 (Ansicht&Vergleich)
vcov_all <- vcov(LM)
vcov_all[1:2,1:8]
ic <- vcov(LM)[1,seq(1,5000,2)] # Varianz Interceptors der 10.000 Modelle
ic[1:4] # Varianz Interceptors der Modelle 1-4
b1 <- vcov(LM)[2,seq(2,5000,2)] # Varianz Beta1 der 10.000 Modelle
b1[1:4] # Varianz Beta1 der Modelle 1-4
# theoretische Werte???
(1) ob mein Code die Punkte 1 & 2 wirklich abdeckt
(2) wie die theoretischen Var-Cov-Matrizen bzw. die empirische Var-Cov-Matrix für die Residuen generell zu berechnen sind (siehe Punkt 3)
Vielen lieben Dank, ich freu mich über jede Unterstützung