Zeilen einer Tabelle zusammenfassen

red_ma · Beitrag von **red_ma** » Di Jan 14, 2020 5:20 pm

Hallo zusammen,

aktuell arbeite ich an einem Text-Mining Projekt und habe dabei folgendes Problem. Nachdem ich mir nun die Worthäufigkeit von speziellen Wörtern rausgefiltert habe möchte ich diese kategorisieren indem ich Zeilen zusammenfasse.

Hier ein Beispiel:

token --> n
strukturiertes --> 52
strukturiert --> 12
strukturieren --> 7
trennen --> 5
Trennung --> 5

Nun möchte ich statt "strukturiertes", "strukturiert" und "strukturieren" nur noch das Wort "Struktur" da stehen haben, dass dann die Menge 52 + 12 +7 = 71 hat. Ist dies möglich? Wenn ja wie?

Vielen Dank schon mal im voraus!

Beitrag von **jogo** » Di Jan 14, 2020 7:28 pm

Hallo red_ma,

willkommen im Forum!
Es könnte vielleicht so aussehen:

Code: Alles auswählen

D <- read.table(header=TRUE, stringsAsFactors = FALSE, text=
"token  	n
strukturiertes  52
strukturiert    12
strukturieren   7
trennen    5
Trennung   5")

Zuord <- read.table(header=TRUE, stringsAsFactors = FALSE, text=
"token neuTok
strukturiertes  Struktur
strukturiert    Struktur
strukturieren   Struktur
trennen    trennen
Trennung   Trennung")

D2 <- merge(D, Zuord)
aggregate(n ~ neuTok, data=D2, FUN=sum)

Gruß, Jörg

red_ma · Beitrag von **red_ma** » Mi Jan 15, 2020 5:13 pm

Danke es funktioniert

Deutsches R-Forum

Zeilen einer Tabelle zusammenfassen

Zeilen einer Tabelle zusammenfassen

Re: Zeilen einer Tabelle zusammenfassen

Re: Zeilen einer Tabelle zusammenfassen