An welcher Stelle im Text steht ein bestimmtes Wort

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
jusch
Beiträge: 3
Registriert: Di Aug 27, 2019 12:26 pm

An welcher Stelle im Text steht ein bestimmtes Wort

Beitrag von jusch » Mi Aug 28, 2019 3:04 pm

Hallo zusammen,

ich analysiere derzeit 10.000 digitale Zeitungsartikel in R und möchte unter anderem der Frage nachgehen, welche Stellung das Wort "Rezo" in den jeweiligen Artikel einnimmt. Konkret möchte ich dies dadurch untersuchen, indem ich analysiere, an welcher Stelle des Artikels das Wort "Rezo" genannt wird. Dazu würde ich gern für jeden der 10.000 Zeitungsartikel wissen, in welchem Satz das Wort "Rezo" erstmals vorkommt. Taucht Rezo schon im ersten Satz des Artikels auf, erst im zweiten Satz, erst im dritten Satz oder noch später?

Könnte mir da jemand helfen? Ich habe alle Zeitungsartikel sowohl als Corpus abgespeichert in dem jeder Zeitungsartikel insgesamt die Untersuchungseinheit bildet als auch ein Corpus, in dem alle Sätze getrennt voneinander abgespeichert sind (also in dem nicht nur 10.000 Elemente beinhaltet sind sondern 10.000 x alle Sätze).

Habt vielen Dank und liebe Grüße!

jogo
Beiträge: 1479
Registriert: Fr Okt 07, 2016 8:25 am

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Beitrag von jogo » Mi Aug 28, 2019 4:15 pm

Hallo jusch,

willkommen im Forum!
Ich hänge hier gleich mal Link hin von Deiner Frage auf SO.
So kann jeder schauen, ob es nicht schon dort Antworten auf Deine Frage gibt.
https://stackoverflow.com/questions/57694347/co-occurrence-in-r-using-dictionary-instead-of-word
Oder ist die Frage auf SO eine andere?

Zum Thema textmining auf SO:
https://stackoverflow.com/questions/tagged/text-mining+r

Gruß, Jörg

jusch
Beiträge: 3
Registriert: Di Aug 27, 2019 12:26 pm

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Beitrag von jusch » Mi Aug 28, 2019 4:31 pm

Lieber Jörg,

vielen Dank für Deine Antwort - meine Frage bei SO ist tatsächlich eine vollkommen andere Frage :) Da bearbeite ich mit einer Kollegin zusammen Co-Occurrence-Analysen zu einem internationalen Thema - darum wollten wir diese Frage international stellen!

Benutzeravatar
EDi
Beiträge: 888
Registriert: Sa Okt 08, 2016 3:39 pm

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Beitrag von EDi » Mi Aug 28, 2019 9:46 pm

Mangels reproduzierbaren Beispiels hier mal eine Idee:

Code: Alles auswählen

sentences <- c("Hallo, ich bin Edi. Wer bist du? Hoffentlich nicht Rezo?! 
               Doch ich bin Rezo",
               "Hallo, Rezo! Du alter Zerstörer.",
               "https://www.youtube.com/watch?v=7KP8UqhZUJ8")


library(tokenizers)
splitted <- tokenize_sentences(sentences)
lapply(splitted, function(y) min(which(grepl('Rezo', y))))
Anpassen musst du selbst - mit Beispiel hätte ich es vielleicht schon gemacht.

PS. Unbedingt das Video anschauen ;)
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.

jusch
Beiträge: 3
Registriert: Di Aug 27, 2019 12:26 pm

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Beitrag von jusch » Do Aug 29, 2019 9:29 am

Tausend Dank! Das hat super funktioniert :)

Antworten