ich wage gerade den Einstieg in R und prompt kommt eine Kollegin mit einem Problem daher, das mir wie geschaffen für erste Experimente erscheint.
Vorgegeben ist eine Adressliste inklusive Geburtsdatum der Personen.
In seltenen Fällen kommt es dabei vor, dass zwei Personen mit dem gleichen Namen an einer Adresse wohnen.
Jetzt soll in die Tabelle noch ein Feld eingefügt werden, dass beim Älteren "sen." enthält und beim Jüngeren entsprechend "jun.".
Ausgangspunkt ist der Datensatz "personen".
Mit dem folgende Code-Schnipsel erzeuge ich mir den Datensatz "doppelte", der nur die Namen der betroffenen Personen enthält.
Code: Alles auswählen
doppelte<-cbind(personen, "doppelt" = duplicated(personen[c("Nachname","Vorname","Straße","Hausnummer","Zusatz")]))
doppelte<-subset(doppelte, doppelt == TRUE)[c("Nachname","Vorname"]
Wie schon erwähnt, bin ich absoluter R-Neuling und dies ist mein erster Gehversuch.
Schönen Gruß
Benne