Wortkombinationen in tm zählen
Verfasst: Mi Jul 11, 2018 3:58 pm
Hallo zusammen!
Für meine erste Frage hier im Forum habe ich folgendes Problem:
Ich habe mit dem tm Package einen Textcorpus aus einer csv-Datei erstellt, in der ursprünglich reihenweise in den Zellen Text steht, den ich analysieren möchte. Hierzu folgende Problematik: Ich kann einfache Häufigkeitenauszählungen von bestimmten Wörtern machen, jedoch interessiert es mich auch, wie häufig Wortkombinationen vorkommen. Z.B. möchte ich wissen, ob in den einzelnen Texten "Wort1" und "Wort2" (+ "Wort3" usw.) vorkommen (muss nicht direkt hintereinander sein) und wenn ja, dass das als 1 gezählt wird, damit ich das aufsummieren kann.
Ich hoffe, ihr versteht mein Anliegen und habt eine Lösung parat.
Sofern ich im falschen Unterforum gelandet bin tut es mir Leid. Es kann gerne verschoben werden.
Beste Grüße
David
Für meine erste Frage hier im Forum habe ich folgendes Problem:
Ich habe mit dem tm Package einen Textcorpus aus einer csv-Datei erstellt, in der ursprünglich reihenweise in den Zellen Text steht, den ich analysieren möchte. Hierzu folgende Problematik: Ich kann einfache Häufigkeitenauszählungen von bestimmten Wörtern machen, jedoch interessiert es mich auch, wie häufig Wortkombinationen vorkommen. Z.B. möchte ich wissen, ob in den einzelnen Texten "Wort1" und "Wort2" (+ "Wort3" usw.) vorkommen (muss nicht direkt hintereinander sein) und wenn ja, dass das als 1 gezählt wird, damit ich das aufsummieren kann.
Ich hoffe, ihr versteht mein Anliegen und habt eine Lösung parat.
Sofern ich im falschen Unterforum gelandet bin tut es mir Leid. Es kann gerne verschoben werden.
Beste Grüße
David