Seite 1 von 1

Ausreißer entfernen

Verfasst: So Mai 24, 2020 8:05 pm
von jags962
Hallo liebe Community,

ich arbeite derzeit an einem Datensatz mithilfe von RStudio. Allerdings bin ich blutiger Anfänger und habe eine Frage zum Thema Ausreißer.
Der Datensatz enthält 7 Variablen. Für eine Variable habe ich Ausreißer mit Hilfe eines boxplot anzeigen lassen, nun möchte ich die komplette Zeile in welcher der Ausreißer vorhanden ist löschen.

Wie mache ich das? Welchen Code muss ich anwenden & wie speicher ich den "Neuen" Datensatz als neue Datei ab?

Vielen lieben dank im Voraus, bleibt gesund!

Re: Ausreißer entfernen

Verfasst: So Mai 24, 2020 8:15 pm
von bigben
Hallo jags,

das klingt nach einem Automatismus, alles löschen zu wollen, was im Boxplot Ausreißer heißt. Das ist nicht Gegenstand Deiner Frage, aber vor einem solchen Automatismus möchte ich warnen! Ausreißer sind nicht automatisch zum Löschen da. Aber nun zu Deiner Frage:

Nehmen wir an, Du hast so einen Datensatz:

Code: Alles auswählen

werte <- data.frame(a = 1:30,
                    b = rbeta(30,1,8))
boxplot(werte$b)
Den größten Wert in der Spalte b findest Du mit

Code: Alles auswählen

> which.max(werte$b)
[1] 23
Demnach ist das höchste b in der Zeile 23 vorhanden. Zeile 23 kannst Du wie folgt löschen:

Code: Alles auswählen

werte <- werte[-23,]
Vom Fehlen der 23. Zeile kannst Du Dich mit

Code: Alles auswählen

print(werte)
überzeugen.

Analog gibt es die Funktion which.min für den kleinsten Wert, anstelle des größten.

HTH,
Bernhard

Re: Ausreißer entfernen

Verfasst: Mo Mai 25, 2020 12:57 pm
von ruedi_br
Über Sinn und Unsinn der Ausreißerentfernung wurde doch erst kürzlich diskutiert:
viewtopic.php?p=10674#p10674
VG
Ruedi