Seite 1 von 1

Berechnung von Residuen in einfacher linearer Regression

Verfasst: Mo Apr 12, 2021 7:05 pm
von franzi21
Hallo zusammen,

ich habe folgendes Problem: ich möchte eine lineare Regression berechnen und mir dann die Residuen abspeichern. Klang für mich erstmal einfach und funktioniert mit dem folgenden Befehl auch grundsätzlich:

Code: Alles auswählen

modelA <- lm(formula = A1_mean ~ A1_F, data = daten, na.action=na.exclude)
daten$A1_res <- rstandard(modelA)
Zur Überprüfung habe ich dann jedoch die Korrelation des Residuums (A1_res) und des Prädiktors (A1_F) berechnet, die ja 0 sein müsste. Dem ist aber leider nicht so. Die Korrelation ist zwar extrem niedrig aber halt nicht 0.
Ich frage mich jetzt, ob ich einen Denkfehler habe, dass es 0 ergeben muss oder ob irgendwas an dem Code nicht stimmt. Bei letzterem wüsste ich leider auch nicht, was der Fehler ist. Ich hoffe, ich finde hier Hilfe und sag schonmal im Voraus Danke!

Re: Berechnung von Residuen in einfacher linearer Regression

Verfasst: Mo Apr 12, 2021 7:51 pm
von bigben
Was verstehst Du denn unter extrem niedrig? Ist Dir bewusst, dass Computer mit einer begrenzten Genauigkeit rechnen und daher ständig Rundungsfehler machen? Ist "extrem niedrig" so klein wie beispielsweise der Rundungsfehler, wenn ich aus 3 erst die Wurzel ziehe und das Ergebnis dann wieder quadriere? Da kommt ja dann 3 raus, richtig?

Code: Alles auswählen

sqrt(3)^2
Sieht cool aus, oder? und jetzt so:

Code: Alles auswählen

3 - sqrt(3)^2
Erst nachdenken, was herauskommen sollte, dann in R rechnen.

Erklärt das Dein Problem oder noch nicht? Wenn nicht, rate ich Dir, ein reproduzierbares Beispiel zu posten.

LG,
Bernhard

Re: Berechnung von Residuen in einfacher linearer Regression

Verfasst: Mo Apr 12, 2021 10:03 pm
von EDi
Zur Überprüfung habe ich dann jedoch die Korrelation des Residuums (A1_res) und des Prädiktors (A1_F) berechnet, die ja 0 sein müsste
:?:

Wieso? Ich kann mindestens einen Fall konstruieren, bei dem das nicht der Fall ist:

Wenn z.B. die Annahme gleichbleibender Varianz nicht gegeben ist und die Residuen mit steigendem Mittelwert steigen (aber nicht linear sonderm als quadratische Funktion des Prädikators, damit man ein asymetrie reinbekommt). Das sieht man häuftig bei Zähldaten oder bei biologischen daten bei denen die Varianz mit dem Mittelwert zunimmt.