Boxplot Outliers

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
wbart
Beiträge: 21
Registriert: Fr Mär 16, 2018 4:08 pm

Boxplot Outliers

Beitrag von wbart » Mo Mai 14, 2018 10:56 am

Hallo,

ich möchte meine Daten von Ausreißern befreien. Mit "boxplot" kann ich sie wunderbar visualisieren und wenn ich "outline=False" angebe habe ich einen bereinigten Datensatz. Jetzt kann ich über $out auf die Liste mit den Outliers zugreifen, ich möchte aber eine Tabelle ohne die Ausreißer als Ergebnis haben. Eine händische Elimination scheitert an der Größe des Datensatzes Geht das?

LG
Werner

bigben
Beiträge: 551
Registriert: Mi Okt 12, 2016 9:09 am

Re: Boxplot Outliers

Beitrag von bigben » Mo Mai 14, 2018 11:14 am

Hallo Werner,

schau mal unter

Code: Alles auswählen

help(boxplot.stats)
. Da siehst Du dass diese Funktion dir eine Vektor "stats" zurückliefert, in dem enthalten ist, an welcher Stelle die Whiskers aufhören. Damit kannst Du Deinen Datensatz so filtern, dass alle Werte über dem oberen und alle unter dem unteren weggefiltert werden. Ob die Definition des Boxplots für Ausreißer auch für Deinen Datensatz/Dein Vorhaben die richtigen Regeln sind, musst Du unabhängig davon für Dich entscheiden.

Code: Alles auswählen

a <- rt(200, df = 3)
boxplot(a)
boxplot.stats(a)$stats
abline(h=boxplot.stats(a)$stats, lty=3, col="red")
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

jogo
Beiträge: 660
Registriert: Fr Okt 07, 2016 8:25 am

Re: Boxplot Outliers

Beitrag von jogo » Mo Mai 14, 2018 11:59 am


bigben
Beiträge: 551
Registriert: Mi Okt 12, 2016 9:09 am

Re: Boxplot Outliers

Beitrag von bigben » Mo Mai 14, 2018 1:37 pm

...ich ergänze mein Code-Beispiel noch um den Vorgang des Filterns, möchte aber nochmal ausdrücklich jogos Argument unterstreichen!
a <- rt(200, df = 3)
boxplot(a)

stats <- boxplot.stats(a)$stats
a2 <- Filter(function(x) x>stats[1] & x<stats[5], a)
points(jitter(rep(1, length(a2))), a2, col="red")
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

wbart
Beiträge: 21
Registriert: Fr Mär 16, 2018 4:08 pm

Re: Boxplot Outliers

Beitrag von wbart » Mo Mai 14, 2018 1:43 pm

Danke schön.

Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast