Seite 1 von 1

Doppelte Werte entfernen, bestimmte Werte ausklammern

Verfasst: Di Jul 03, 2018 10:05 am
von Joe_Gerner
Hallo,

ich arbeite momentan mit einem Datensatz der leider doppelte Werte enthält die ich löschen möchte. Diese sind bei einer voran gegangen Berechung in einem GIS entstanden. Dabei wurde auch eine Spalte erzeugt, die für jedes Objekt eine eigene Objekt ID enthält. Diese brauche ich nach der Löschung der doppelten Werte wieder.
Wenn ich die Spalte "Object ID" vorher aus dem Datensatz entferne ist das Löschen der doppelten Objekte kein Problem. Ich kann anschließend die "Object ID" Spalte nicht einfach wieder an den Datansatz anfügen. Deswegen suche ich nach einer Möglichkeit doppelte Werte aus einem Dataframe zu löschen und dabei bestimmte Spalten bei der Überprüfung auszuklammern.

Damit kann ich die doppelten Werte entfernen. Jedoch nur für den gesamten Datensatz.

Code: Alles auswählen

read_gem <- read_gem[!duplicated(read_gem),]


Vielen Dank und viele Grüße

Joe

Re: Doppelte Werte entfernen, bestimmte Werte ausklammern

Verfasst: Di Jul 03, 2018 11:20 am
von Joe_Gerner
Ok ich habe wahrscheinlich selbst eine Lösung gefunden und will diese nur nochmal teilen.

Code: Alles auswählen

read_gem<-read_gem[!duplicated(read_gem[,c(2,3,4,5)]),]			# Auswahl Dataframe ohne Spalte "Object ID"
Ich hoffe meine Lösung ist richtig und kann vielleicht auch noch Jemandem weiterhelfen

Viele Grüße

Re: Doppelte Werte entfernen, bestimmte Werte ausklammern

Verfasst: Di Jul 03, 2018 12:41 pm
von jogo
Hallo Joe,

wenn Dein Dataframe nur fünf Spalten hat, dann geht auch:

Code: Alles auswählen

read_gem <- read_gem[!duplicated(read_gem[, -1]),]			# Auswahl Dataframe ohne Spalte "Object ID"
Gruß, Jörg