zwei Dinge vorab: Es handelt sich hierbei um eine Hausaufgabe und es ist nicht eilig.
In einer Teilaufgabe sollen zwei lokale Regressionsfunktionen nach dem Binning-Prinzip berechnet werden. Dabei soll die Verteilung der einen mit dem 1. Quartil und die der anderen mit dem 3. Quartil charakterisiert werden. Die Intervalle werden über die Dezile bestimmt. Ich gebe zu, dass ich nicht den kleinsten Schimmer habe, wie ich R zu verstehen gebe, dass ich mit dem 1. bzw. 3. Quartil charakterisieren will. Eine Charakterisierung mit den bedingten Medianen hat funktioniert und sieht wie folgt aus:
Code: Alles auswählen
# Bins bestimmen
breaks <- quantile(dd$awhour, probs = 0:10/10)
# Bedingte Mediane berechnen
med <- tapply(dd$income, cut(dd$awhour, breaks), median)
# Einzeichnen
plot(dd$awhour, dd$income,
xlab = "Jahresarbeitsstunden", ylab = "(Arbeits-)Einkommen")
lines(breaks, c(med, tail(med,1)), "s", col="red", lwd=2)
Code: Alles auswählen
# Bins bestimmen
qbreaks <- quantile(dd$awhour, probs=0:10/10)
# Charakterisierung mit 1. Quartil
quart1 <- tapply(dd$income, cut(dd$awhour, qbreaks), quantile( ? , 0.25))
Code: Alles auswählen
Error in match.fun(FUN) :
'quantile( X , 0.25)' ist nicht Funktion, Zeichen oder Symbol