Doppelte Werte entfernen, bestimmte Werte ausklammern

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Joe_Gerner

Doppelte Werte entfernen, bestimmte Werte ausklammern

Beitrag von Joe_Gerner »

Hallo,

ich arbeite momentan mit einem Datensatz der leider doppelte Werte enthält die ich löschen möchte. Diese sind bei einer voran gegangen Berechung in einem GIS entstanden. Dabei wurde auch eine Spalte erzeugt, die für jedes Objekt eine eigene Objekt ID enthält. Diese brauche ich nach der Löschung der doppelten Werte wieder.
Wenn ich die Spalte "Object ID" vorher aus dem Datensatz entferne ist das Löschen der doppelten Objekte kein Problem. Ich kann anschließend die "Object ID" Spalte nicht einfach wieder an den Datansatz anfügen. Deswegen suche ich nach einer Möglichkeit doppelte Werte aus einem Dataframe zu löschen und dabei bestimmte Spalten bei der Überprüfung auszuklammern.

Damit kann ich die doppelten Werte entfernen. Jedoch nur für den gesamten Datensatz.

Code: Alles auswählen

read_gem <- read_gem[!duplicated(read_gem),]


Vielen Dank und viele Grüße

Joe
Joe_Gerner

Re: Doppelte Werte entfernen, bestimmte Werte ausklammern

Beitrag von Joe_Gerner »

Ok ich habe wahrscheinlich selbst eine Lösung gefunden und will diese nur nochmal teilen.

Code: Alles auswählen

read_gem<-read_gem[!duplicated(read_gem[,c(2,3,4,5)]),]			# Auswahl Dataframe ohne Spalte "Object ID"
Ich hoffe meine Lösung ist richtig und kann vielleicht auch noch Jemandem weiterhelfen

Viele Grüße
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Doppelte Werte entfernen, bestimmte Werte ausklammern

Beitrag von jogo »

Hallo Joe,

wenn Dein Dataframe nur fünf Spalten hat, dann geht auch:

Code: Alles auswählen

read_gem <- read_gem[!duplicated(read_gem[, -1]),]			# Auswahl Dataframe ohne Spalte "Object ID"
Gruß, Jörg
Antworten