Seite 1 von 1

Entfernen von Zeilen mit bestimmten Merkmalen

Verfasst: Mi Aug 15, 2018 3:35 pm
von blacklabel5
Hallo liebes Forum,

ich habe folgendes Problem: Ich habe einen Data.frame mit 2 Spalten (ID, Modul), tausend Zeilen.
In der Spalte "Modul" gibt es mehrere Ausprägungen, z.B. Modul1, Modul2, alpha, beta, gamma, ..., MED Modul
Ich möchte nun alle Ausprägungen extrahieren, die das Wort "Modul" enthalten und in ein neues Excelfile geben. ABER: Nicht das "MED Modul", das soll nicht rein kommen.

Folgender bisheriger Code:
Extrahiert <- x[grep("Modul",x$Product),]
write.xlsx2(Extrahiert, file="C:\\Users\\...\\File1.xlsx", sheetName="Modul",col.names=TRUE, row.names=TRUE, append=FALSE, overwrite=TRUE)
Das würde mir zumindest die Wörter raussuchen, die "Module" enthalten. Aber wie kann ich die Teilmenge "MED Modul" rausschmeißen, sodass diese nicht in meiner neuen Excelfile drinnen sind?

Viele Grüße

Re: Entfernen von Zeilen mit bestimmten Merkmalen

Verfasst: Mi Aug 15, 2018 3:41 pm
von jogo
Hallo blacklabel5,

nutze die Macht (der regulären Ausdrücke): https://stackoverflow.com/questions/473 ... xpressions
Modul soll am Anfang vorkommen?

Code: Alles auswählen

P <- c("Modul1", "Modul2", "alpha", "beta", "gamma", "...", "MED Modul")
grepl("^Modul", P)
und natürlich grepl() für

Code: Alles auswählen

Extrahiert <- x[grepl("^Modul",x$Product),]
Gruß, Jörg

Re: Entfernen von Zeilen mit bestimmten Merkmalen

Verfasst: Mi Aug 15, 2018 3:59 pm
von blacklabel5
wunderbar, danke für die antwort!

ich habe noch viel zu lernen :geek: