Seite 1 von 1

An welcher Stelle im Text steht ein bestimmtes Wort

Verfasst: Mi Aug 28, 2019 3:04 pm
von jusch
Hallo zusammen,

ich analysiere derzeit 10.000 digitale Zeitungsartikel in R und möchte unter anderem der Frage nachgehen, welche Stellung das Wort "Rezo" in den jeweiligen Artikel einnimmt. Konkret möchte ich dies dadurch untersuchen, indem ich analysiere, an welcher Stelle des Artikels das Wort "Rezo" genannt wird. Dazu würde ich gern für jeden der 10.000 Zeitungsartikel wissen, in welchem Satz das Wort "Rezo" erstmals vorkommt. Taucht Rezo schon im ersten Satz des Artikels auf, erst im zweiten Satz, erst im dritten Satz oder noch später?

Könnte mir da jemand helfen? Ich habe alle Zeitungsartikel sowohl als Corpus abgespeichert in dem jeder Zeitungsartikel insgesamt die Untersuchungseinheit bildet als auch ein Corpus, in dem alle Sätze getrennt voneinander abgespeichert sind (also in dem nicht nur 10.000 Elemente beinhaltet sind sondern 10.000 x alle Sätze).

Habt vielen Dank und liebe Grüße!

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Verfasst: Mi Aug 28, 2019 4:15 pm
von jogo
Hallo jusch,

willkommen im Forum!
Ich hänge hier gleich mal Link hin von Deiner Frage auf SO.
So kann jeder schauen, ob es nicht schon dort Antworten auf Deine Frage gibt.
https://stackoverflow.com/questions/576 ... ad-of-word
Oder ist die Frage auf SO eine andere?

Zum Thema textmining auf SO:
https://stackoverflow.com/questions/tag ... t-mining+r

Gruß, Jörg

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Verfasst: Mi Aug 28, 2019 4:31 pm
von jusch
Lieber Jörg,

vielen Dank für Deine Antwort - meine Frage bei SO ist tatsächlich eine vollkommen andere Frage :) Da bearbeite ich mit einer Kollegin zusammen Co-Occurrence-Analysen zu einem internationalen Thema - darum wollten wir diese Frage international stellen!

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Verfasst: Mi Aug 28, 2019 9:46 pm
von EDi
Mangels reproduzierbaren Beispiels hier mal eine Idee:

Code: Alles auswählen

sentences <- c("Hallo, ich bin Edi. Wer bist du? Hoffentlich nicht Rezo?! 
               Doch ich bin Rezo",
               "Hallo, Rezo! Du alter Zerstörer.",
               "https://www.youtube.com/watch?v=7KP8UqhZUJ8")


library(tokenizers)
splitted <- tokenize_sentences(sentences)
lapply(splitted, function(y) min(which(grepl('Rezo', y))))
Anpassen musst du selbst - mit Beispiel hätte ich es vielleicht schon gemacht.

PS. Unbedingt das Video anschauen ;)

Re: An welcher Stelle im Text steht ein bestimmtes Wort

Verfasst: Do Aug 29, 2019 9:29 am
von jusch
Tausend Dank! Das hat super funktioniert :)