ich habe eine Frage zur Corpus-Funktion.
Und zwar möchte ich aus meinen Daten die Nummern, Punkte, .. usw. entfernen.
Am Ende bekomme ich eine Liste, siehe Bild.
Wie kann ich die Daten aus der Liste auslesen und anschließend in mein Ausgangs-Dataframe einfügen?
Kann mir jemand einen Tipp geben, wie das funktioniert. Ich habe dazu leider nicht das passende gefunden.
Aktueller Code
Code: Alles auswählen
mydata <- Corpus(VectorSource(newdata$TEXT))
# remove extra whitespace
mydata <- tm_map(mydata, stripWhitespace)
# Remove numbers
mydata <- tm_map(mydata, removeNumbers)
mydata <- as.data.frame(as.matrix(mydata))
dataframe<-data.frame(text=unlist(sapply(mydata)),
stringsAsFactors=F)