Hallo zusammen,
ich analysiere derzeit 10.000 digitale Zeitungsartikel in R und möchte unter anderem der Frage nachgehen, welche Stellung das Wort "Rezo" in den jeweiligen Artikel einnimmt. Konkret möchte ich dies dadurch untersuchen, indem ich analysiere, an welcher Stelle des Artikels das Wort "Rezo" genannt wird. Dazu würde ich gern für jeden der 10.000 Zeitungsartikel wissen, in welchem Satz das Wort "Rezo" erstmals vorkommt. Taucht Rezo schon im ersten Satz des Artikels auf, erst im zweiten Satz, erst im dritten Satz oder noch später?
Könnte mir da jemand helfen? Ich habe alle Zeitungsartikel sowohl als Corpus abgespeichert in dem jeder Zeitungsartikel insgesamt die Untersuchungseinheit bildet als auch ein Corpus, in dem alle Sätze getrennt voneinander abgespeichert sind (also in dem nicht nur 10.000 Elemente beinhaltet sind sondern 10.000 x alle Sätze).
Habt vielen Dank und liebe Grüße!
An welcher Stelle im Text steht ein bestimmtes Wort
Re: An welcher Stelle im Text steht ein bestimmtes Wort
Hallo jusch,
willkommen im Forum!
Ich hänge hier gleich mal Link hin von Deiner Frage auf SO.
So kann jeder schauen, ob es nicht schon dort Antworten auf Deine Frage gibt.
https://stackoverflow.com/questions/576 ... ad-of-word
Oder ist die Frage auf SO eine andere?
Zum Thema textmining auf SO:
https://stackoverflow.com/questions/tag ... t-mining+r
Gruß, Jörg
willkommen im Forum!
Ich hänge hier gleich mal Link hin von Deiner Frage auf SO.
So kann jeder schauen, ob es nicht schon dort Antworten auf Deine Frage gibt.
https://stackoverflow.com/questions/576 ... ad-of-word
Oder ist die Frage auf SO eine andere?
Zum Thema textmining auf SO:
https://stackoverflow.com/questions/tag ... t-mining+r
Gruß, Jörg
Re: An welcher Stelle im Text steht ein bestimmtes Wort
Lieber Jörg,
vielen Dank für Deine Antwort - meine Frage bei SO ist tatsächlich eine vollkommen andere Frage Da bearbeite ich mit einer Kollegin zusammen Co-Occurrence-Analysen zu einem internationalen Thema - darum wollten wir diese Frage international stellen!
vielen Dank für Deine Antwort - meine Frage bei SO ist tatsächlich eine vollkommen andere Frage Da bearbeite ich mit einer Kollegin zusammen Co-Occurrence-Analysen zu einem internationalen Thema - darum wollten wir diese Frage international stellen!
Re: An welcher Stelle im Text steht ein bestimmtes Wort
Mangels reproduzierbaren Beispiels hier mal eine Idee:
Anpassen musst du selbst - mit Beispiel hätte ich es vielleicht schon gemacht.
PS. Unbedingt das Video anschauen
Code: Alles auswählen
sentences <- c("Hallo, ich bin Edi. Wer bist du? Hoffentlich nicht Rezo?!
Doch ich bin Rezo",
"Hallo, Rezo! Du alter Zerstörer.",
"https://www.youtube.com/watch?v=7KP8UqhZUJ8")
library(tokenizers)
splitted <- tokenize_sentences(sentences)
lapply(splitted, function(y) min(which(grepl('Rezo', y))))
PS. Unbedingt das Video anschauen
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: An welcher Stelle im Text steht ein bestimmtes Wort
Tausend Dank! Das hat super funktioniert