Hallo zusammen,
aktuell arbeite ich an einem Text-Mining Projekt und habe dabei folgendes Problem. Nachdem ich mir nun die Worthäufigkeit von speziellen Wörtern rausgefiltert habe möchte ich diese kategorisieren indem ich Zeilen zusammenfasse.
Hier ein Beispiel:
token --> n
strukturiertes --> 52
strukturiert --> 12
strukturieren --> 7
trennen --> 5
Trennung --> 5
Nun möchte ich statt "strukturiertes", "strukturiert" und "strukturieren" nur noch das Wort "Struktur" da stehen haben, dass dann die Menge 52 + 12 +7 = 71 hat. Ist dies möglich? Wenn ja wie?
Vielen Dank schon mal im voraus!
Zeilen einer Tabelle zusammenfassen
Re: Zeilen einer Tabelle zusammenfassen
Hallo red_ma,
willkommen im Forum!
Es könnte vielleicht so aussehen:
Gruß, Jörg
willkommen im Forum!
Es könnte vielleicht so aussehen:
Code: Alles auswählen
D <- read.table(header=TRUE, stringsAsFactors = FALSE, text=
"token n
strukturiertes 52
strukturiert 12
strukturieren 7
trennen 5
Trennung 5")
Zuord <- read.table(header=TRUE, stringsAsFactors = FALSE, text=
"token neuTok
strukturiertes Struktur
strukturiert Struktur
strukturieren Struktur
trennen trennen
Trennung Trennung")
D2 <- merge(D, Zuord)
aggregate(n ~ neuTok, data=D2, FUN=sum)
Re: Zeilen einer Tabelle zusammenfassen
Danke es funktioniert