Seite 1 von 1
Missing Data bei linearer Regression
Verfasst: Di Jun 04, 2019 5:09 pm
von Klee77
Hallo zusammen,
ich möchte eine lineare Regression in R-Studio berechnen, mit folgendem Befehl:
mod1 <- lm(alkohol ~ rating + isolation, data = df)
summary(mod1)
Datensatz:
Kriterium: alkohol
Prädiktoren: rating, isolation, social status
Ich habe allerdings einige fehlende Werte (NA) auf der "rating"-Variable. Hierzu meine Frage: Was ist denn die default-Einstellung in R-Studio beim lm-Befehl, wie mit fehlenden Werten umgegangen wird?
Erfolgt ein paarweiser Fallausschluss (Entfernung aller Fälle, die fehlende Werte auf rating oder isolation haben, also den beiden im linearen Modell eingeschlossenen Prädiktoren) oder werden alle Fälle entfernt, die fehlende Werte auf irgendeinem Prädiktor im Datensatz haben?
Würde mich über eine Antwort freuen!
Re: Missing Data bei linearer Regression
Verfasst: Di Jun 04, 2019 7:00 pm
von EDi
Aus ?lm:
na.action
a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options, and is na.fail if that is unset. The ‘factory-fresh’ default is na.omit. Another possible value is NULL, no action. Value na.exclude can be useful.
Bei mir ist das
Kann aber auch unterschiedlich sein (z.b. durch eine .Rprofile Datei beim R Startup geändert).
Re: Missing Data bei linearer Regression
Verfasst: Di Jun 04, 2019 7:14 pm
von Klee77
Vielen Dank für die schnelle und hilfreiche Antwort!
Bei mir wird dasselbe angezeigt.
Könnten Sie mir übersetzen, was das bedeutet? Also wie geht R-Studio mit fehlenden Werten um?
Re: Missing Data bei linearer Regression
Verfasst: Di Jun 04, 2019 8:28 pm
von jogo
Hallo Klee,
willkommen im Forum!
Klee77 hat geschrieben: Di Jun 04, 2019 5:09 pm
ich möchte eine lineare Regression in R-Studio berechnen, mit folgendem Befehl:
Code: Alles auswählen
mod1 <- lm(alkohol ~ rating + isolation, data = df)
summary(mod1)
Datensatz:
Kriterium: alkohol
Prädiktoren: rating, isolation, social status
Ich habe allerdings einige fehlende Werte (NA) auf der "rating"-Variable. Hierzu meine Frage: Was ist denn die default-Einstellung in R-Studio beim lm-Befehl, wie mit fehlenden Werten umgegangen wird?
Erfolgt ein paarweiser Fallausschluss (Entfernung aller Fälle, die fehlende Werte auf rating oder isolation haben, also den beiden im linearen Modell eingeschlossenen Prädiktoren) oder werden alle Fälle entfernt, die fehlende Werte auf irgendeinem Prädiktor im Datensatz haben?
es werden für die Regression alle Beobachtungen entfernt, bei denen eine der beteiligten Variablen NA ist.
Die Meldung lautet bei lm() :
... Beobachtungen entfernt wegen NA (oder so ähnlich)
Code: Alles auswählen
B <- BOD
lm(demand ~ Time, data=B)
B$demand[3] <- NA
B
lm(demand ~ Time, data=B)
summary(lm(demand ~ Time, data=B))
... die Meldung gibt es erst beim summary()
(1 observation deleted due to missingness)
Gruß, Jörg
Re: Missing Data bei linearer Regression
Verfasst: Mi Jun 05, 2019 12:19 am
von EDi
Klee77 hat geschrieben: Di Jun 04, 2019 7:14 pm
Vielen Dank für die schnelle und hilfreiche Antwort!
Bei mir wird dasselbe angezeigt.
Könnten Sie mir übersetzen, was das bedeutet? Also wie geht R-Studio mit fehlenden Werten um?
Bildschirmfoto 2019-06-04 um 19.12.24.png
Auch hierfür gibt's die passende Hilfe und erläuterung (auch die Examples sind nützlich mal auszuführen und zu verstehen)
Re: Missing Data bei linearer Regression
Verfasst: So Jun 09, 2019 6:01 pm
von Klee77
Vielen Dank für die hilfreichen und schnellen Antworten!
Sie haben mir sehr weiter geholfen!!!