Wortkombinationen in tm zählen

Wie erweitere ich R um eigene Funktionen oder Pakete? Welches Paket ist passend für meine Fragestellung?

Moderatoren: EDi, jogo

Antworten
MisterD

Wortkombinationen in tm zählen

Beitrag von MisterD »

Hallo zusammen!

Für meine erste Frage hier im Forum habe ich folgendes Problem:
Ich habe mit dem tm Package einen Textcorpus aus einer csv-Datei erstellt, in der ursprünglich reihenweise in den Zellen Text steht, den ich analysieren möchte. Hierzu folgende Problematik: Ich kann einfache Häufigkeitenauszählungen von bestimmten Wörtern machen, jedoch interessiert es mich auch, wie häufig Wortkombinationen vorkommen. Z.B. möchte ich wissen, ob in den einzelnen Texten "Wort1" und "Wort2" (+ "Wort3" usw.) vorkommen (muss nicht direkt hintereinander sein) und wenn ja, dass das als 1 gezählt wird, damit ich das aufsummieren kann.

Ich hoffe, ihr versteht mein Anliegen und habt eine Lösung parat.

Sofern ich im falschen Unterforum gelandet bin tut es mir Leid. Es kann gerne verschoben werden.


Beste Grüße
David
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Wortkombinationen in tm zählen

Beitrag von student »

Hallo David,

Deine Fragestellung kommt mir bekannt vor und ich hatte in der Vergangenheit dazu ein paar R-Funktionen geschrieben. Dabei ging es nicht nur um finden von Buchstaben/Wortkombinationen sondern auch deren Verarbeitung. Dabei hat das Paket stringr eine wesentliche Rolle gespielt.

Vielleicht hilft der Hinweis ein wenig weiter...
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Antworten