Missing Data bei linearer Regression

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
Klee77
Beiträge: 6
Registriert: Di Jun 04, 2019 4:57 pm

Missing Data bei linearer Regression

Beitrag von Klee77 »

Hallo zusammen,

ich möchte eine lineare Regression in R-Studio berechnen, mit folgendem Befehl:

mod1 <- lm(alkohol ~ rating + isolation, data = df)
summary(mod1)

Datensatz:
Kriterium: alkohol
Prädiktoren: rating, isolation, social status

Ich habe allerdings einige fehlende Werte (NA) auf der "rating"-Variable. Hierzu meine Frage: Was ist denn die default-Einstellung in R-Studio beim lm-Befehl, wie mit fehlenden Werten umgegangen wird?

Erfolgt ein paarweiser Fallausschluss (Entfernung aller Fälle, die fehlende Werte auf rating oder isolation haben, also den beiden im linearen Modell eingeschlossenen Prädiktoren) oder werden alle Fälle entfernt, die fehlende Werte auf irgendeinem Prädiktor im Datensatz haben?

Würde mich über eine Antwort freuen!
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Missing Data bei linearer Regression

Beitrag von EDi »

Aus ?lm:
na.action

a function which indicates what should happen when the data contain NAs. The default is set by the na.action setting of options, and is na.fail if that is unset. The ‘factory-fresh’ default is na.omit. Another possible value is NULL, no action. Value na.exclude can be useful.
Bei mir ist das

Code: Alles auswählen

R> options('na.action')
$na.action
[1] "na.omit"
Kann aber auch unterschiedlich sein (z.b. durch eine .Rprofile Datei beim R Startup geändert).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Klee77
Beiträge: 6
Registriert: Di Jun 04, 2019 4:57 pm

Re: Missing Data bei linearer Regression

Beitrag von Klee77 »

Vielen Dank für die schnelle und hilfreiche Antwort!
Bei mir wird dasselbe angezeigt.

Könnten Sie mir übersetzen, was das bedeutet? Also wie geht R-Studio mit fehlenden Werten um?
Bildschirmfoto 2019-06-04 um 19.12.24.png
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Missing Data bei linearer Regression

Beitrag von jogo »

Hallo Klee,

willkommen im Forum!
Klee77 hat geschrieben: Di Jun 04, 2019 5:09 pm ich möchte eine lineare Regression in R-Studio berechnen, mit folgendem Befehl:

Code: Alles auswählen

mod1 <- lm(alkohol ~ rating + isolation, data = df)
summary(mod1)
Datensatz:
Kriterium: alkohol
Prädiktoren: rating, isolation, social status

Ich habe allerdings einige fehlende Werte (NA) auf der "rating"-Variable. Hierzu meine Frage: Was ist denn die default-Einstellung in R-Studio beim lm-Befehl, wie mit fehlenden Werten umgegangen wird?

Erfolgt ein paarweiser Fallausschluss (Entfernung aller Fälle, die fehlende Werte auf rating oder isolation haben, also den beiden im linearen Modell eingeschlossenen Prädiktoren) oder werden alle Fälle entfernt, die fehlende Werte auf irgendeinem Prädiktor im Datensatz haben?
es werden für die Regression alle Beobachtungen entfernt, bei denen eine der beteiligten Variablen NA ist.

Die Meldung lautet bei lm() : ... Beobachtungen entfernt wegen NA (oder so ähnlich)

Code: Alles auswählen

B <- BOD
lm(demand ~ Time, data=B)

B$demand[3] <- NA
B
lm(demand ~ Time, data=B)
summary(lm(demand ~ Time, data=B))
... die Meldung gibt es erst beim summary() :roll:
(1 observation deleted due to missingness)

Gruß, Jörg
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Missing Data bei linearer Regression

Beitrag von EDi »

Klee77 hat geschrieben: Di Jun 04, 2019 7:14 pm Vielen Dank für die schnelle und hilfreiche Antwort!
Bei mir wird dasselbe angezeigt.

Könnten Sie mir übersetzen, was das bedeutet? Also wie geht R-Studio mit fehlenden Werten um?

Bildschirmfoto 2019-06-04 um 19.12.24.png
Auch hierfür gibt's die passende Hilfe und erläuterung (auch die Examples sind nützlich mal auszuführen und zu verstehen)

Code: Alles auswählen

?na.omit
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Klee77
Beiträge: 6
Registriert: Di Jun 04, 2019 4:57 pm

Re: Missing Data bei linearer Regression

Beitrag von Klee77 »

Vielen Dank für die hilfreichen und schnellen Antworten!
Sie haben mir sehr weiter geholfen!!!
Antworten