um etwas Übersichtlichkeit zu schaffen, möchte ich einen Korrelationsplot erstellen (Paket: "corrplot"), hierzu habe ich im Anhang einen Beispieldatensatz und ein Foto, wie es am Ende aussehen soll.
Meinem Datensatz liegen acht Varianten zugrunde (Pauletta:30, Pauletta:45, Pauletta:60, Pauletta:90 + das gleiche für BTS). Für jede Variante findet man in den Spalten "Messung..." vier Werte, welche real in einem Abstand von ein paar Tagen gemessen wurden. Das sich aus diesen Werten Korrelationen berechnen lassen, sieht man im Beispielbild, jedoch möchte ich den Korrelationsplot nicht für die Gesamtheit des Datensatzes erstellen, sondern spezifisch für jede Variante.
Das Ergebnis sollen acht Plots sein.
Jetzt bin ich allerdings ein bisschen am verzweifeln und weiß nicht so recht, wie ich die vier Messwerte der einzelnen Spalten in Abhängigkeit der Spalten F_1 und F_2 auswählen kann.
Hier mein bisheriger Code:
Code: Alles auswählen
dataset <- read.csv('Beispieldaten.csv',dec = ',', sep = ';')
dataset$F_2 <- as.factor(dataset$F_2)
dataset$Messung1 <- as.numeric(dataset$Messung1)
dataset$Messung2 <- as.numeric(dataset$Messung2)
dataset$Messung3 <- as.numeric(dataset$Messung3)
dataset$Messung4 <- as.numeric(dataset$Messung4)
dataset$Messung5 <- as.numeric(dataset$Messung5)
dataset$Messung6 <- as.numeric(dataset$Messung6)
str(dataset)
library(corrplot)
a<-subset(dataset,select=c("Messung1","Messung2","Messung3",
"Messung4","Messung5","Messung6"))
b<-cor(a, method = "pearson", use = "complete.obs")
corrplot(b,method="circle")
Ich sehr dankbar, wenn jemand meinen R-Horizont erweitert .
Gruß,
Sebastian