Hallo,
ich möchte bei einer logistischen Regression die Ausreißer entfernen, damit das Modell robuster wird.
Dazu habe ich die Residuen ausgeben lassen (residualPlots), allerdings fällt mir die Interpretation schwer.
Gibt es einen Wertebereich, innerhalb dessen sie 'tolerierbar' sind?
Und wie kann ich sie herausfiltern?
Erstelle ich dazu einen solchen neuen Datensatz?
mydata_new <- mydata %>% filter(v1 < , v2 > ...)
Schonmal vielen Dank und beste Grüße!
Joan
Ausreißer - Logistische Regression
Moderator: EDi
Re: Ausreißer - Logistische Regression
Das halte ich für einen nicht korrekten Schluss. Es wird in diesem Fall eher sensitiver...ich möchte bei einer logistischen Regression die Ausreißer entfernen, damit das Modell robuster wird.
Welche Art von Residuen? Die meisten sind schwer zu interpretieren. Ich würde scaled residuals nehmen (DHarma Paket), weil die recht gut zu interpretieren sind.Dazu habe ich die Residuen ausgeben lassen
Ich würde Außreißer ohne guten Grund (z. B. Gerätefehler, späte Keimung, Messung zu anderenBedingungen) und mit kleiner Datenbasis nicht entfernen.
dplyr braucht man dafür nicht, die "[" Funktion ist ausreichend (und wird im Gegensatz zu dplyr auch noch in 10Jahren genauso funktionieren).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.