lib nicht spezifiziert/Wordcloud als PNG abspeichern
Verfasst: Mo Mai 21, 2018 2:25 pm
Hallo ihr Lieben,
Ich habe vor drei vier Tagen angefangen mir R etwas genauer anzuschauen, zu welchem Zweck?
Ich bin Historiker und promoviere gerade. Für meine Promotion dachte ich, es sei zielführend in irgendeiner Form dem digitalen Wandel und der sich veränderten Realität Rechnung zu tragen und nicht ausschließlich "klassisch historisch" zu arbeiten.
Warum ich glaube dazu befähigt zu sein?
Für einen Historiker/eine Historikerin verfüge ich über überdurchschnittlich Erfahrung im Bereich Programmierung etc. Ich verfüge über einige Vorkenntnisse in anderen Sprachen (Python, C# bspw.). Was macht der gewievte Historiker also?
Er schaut sich ein leicht verständliches Tutorial an und stößt auf Probleme:
Das besagte Tutorial: https://www.springboard.com/blog/text-mining-in-r/
Das erste Problem:
Weitere Probleme:
funktioniert problemlos, ebenso die TermDocumentMatrix, wie im Tutorial erklärt
was genau da ist was ich mir erhoffte ...
Kommen wir nun zum Problem:
Dem Erstellen der Wordcloud und abspeichern als .png file ...
jeder Befehl für sich gesehen funktioniert:
D.h. Es wird ein Fenster mit (wahrscheinlich grey30) grauem Hintergrund erstellt, es wird eine leere .png File im WOrking Directory erstellt und auch eine Wordcloud, aber alle zusammen funktionieren nicht ...
Dazu hätte ich noch einige Fragen:
das $-Zeichen, welche Funktion erfüllt das?
------ Das waren die Anfänger-Probleme -----
Jetzt eine kompliziertere Frage - eventuell brauch ich hierfür einen anderen Thread:
Ich habe bei meinem Promotionsthema in den Quellen verschlüsselte Briefe (ich vermute eine Affine Chiffre ohne das ganze wieder in Buchstaben zu übertragen... ); Was würdet ihr meinen, taugt R dazu, die Briefe zu untersuchen? (https://de.wikipedia.org/wiki/Affine_Ch ... %BCsselung)
liebe Grüße
vielen Dank im Vorraus,
verzeiht bitte falls es wirklich leichte Fragen sind - ich hab bisher keine Antworten gefunden
Ich habe vor drei vier Tagen angefangen mir R etwas genauer anzuschauen, zu welchem Zweck?
Ich bin Historiker und promoviere gerade. Für meine Promotion dachte ich, es sei zielführend in irgendeiner Form dem digitalen Wandel und der sich veränderten Realität Rechnung zu tragen und nicht ausschließlich "klassisch historisch" zu arbeiten.
Warum ich glaube dazu befähigt zu sein?
Für einen Historiker/eine Historikerin verfüge ich über überdurchschnittlich Erfahrung im Bereich Programmierung etc. Ich verfüge über einige Vorkenntnisse in anderen Sprachen (Python, C# bspw.). Was macht der gewievte Historiker also?
Er schaut sich ein leicht verständliches Tutorial an und stößt auf Probleme:
Das besagte Tutorial: https://www.springboard.com/blog/text-mining-in-r/
Das erste Problem:
was will diese Meldung mir genau sagen und wie kann ich es beheben? Falls notwendig zu wissen: geschieht bei jedemInstalliere Paket nach ‘C:/Users/xx/Documents/R/win-library/3.5’
(da ‘lib’ nicht spezifiziert)
Code: Alles auswählen
install.packages("beliebiges Package")
Code: Alles auswählen
> text <- pdf_text("Middell.pdf")
> docs <- Corpus(VectorSource(text))
> docs
<<SimpleCorpus>>
Metadata: corpus specific: 1, document level (indexed): 0
Content: documents: 23
> docs <- tm_map(docs, content_transformer(tolower))
> docs <- tm_map(docs, removeWords, stopwords("english"))
> docs <- tm_map(docs, removePunctuation)
> docs <- tm_map(docs, stripWhitespace)
> docs <- tm_map(docs, stemDocument)
Code: Alles auswählen
> tdm.midell <- TermDocumentMatrix(docs)
> tdm.midell
<<TermDocumentMatrix (terms: 2547, documents: 23)>>
Non-/sparse entries: 5368/53213
Sparsity : 91%
Maximal term length: 51
Weighting : term frequency (tf)
> m <- as.matrix(tdm.midell)
> v <- sort(rowSums(m),decreasing=TRUE)
> d <- data.frame(word=names(v),freq=v)
> head(d,10)
word freq
global global 130
spatial spatial 82
world world 75
histori histori 69
territori territori 57
new new 55
polit polit 52
studi studi 47
nation nation 44
histor histor 36
Kommen wir nun zum Problem:
Dem Erstellen der Wordcloud und abspeichern als .png file ...
Code: Alles auswählen
> par(bg="grey30")
> png(file="Wordcloud-Middell.png", width=1000,height=700,bg="grey30")
> wordcloud(d$word,d$freq,col=terrain.colors(length(d$word),alpha=0.9), random.order=FALSE,rot.per=0.3)
D.h. Es wird ein Fenster mit (wahrscheinlich grey30) grauem Hintergrund erstellt, es wird eine leere .png File im WOrking Directory erstellt und auch eine Wordcloud, aber alle zusammen funktionieren nicht ...
Dazu hätte ich noch einige Fragen:
das $-Zeichen, welche Funktion erfüllt das?
------ Das waren die Anfänger-Probleme -----
Jetzt eine kompliziertere Frage - eventuell brauch ich hierfür einen anderen Thread:
Ich habe bei meinem Promotionsthema in den Quellen verschlüsselte Briefe (ich vermute eine Affine Chiffre ohne das ganze wieder in Buchstaben zu übertragen... ); Was würdet ihr meinen, taugt R dazu, die Briefe zu untersuchen? (https://de.wikipedia.org/wiki/Affine_Ch ... %BCsselung)
liebe Grüße
vielen Dank im Vorraus,
verzeiht bitte falls es wirklich leichte Fragen sind - ich hab bisher keine Antworten gefunden