Hallo Bernhard,
vielen Dank ein weiteres Mal für deine tolle Antwort!
Genau, ich hatte mir beispielhaft neun Fälle ausgedacht, weil das genug schien, um Deine Frage zu beantworten. Für zukünftige Fragen wäre es geschickt, wenn Du gleich selbst Beispieldaten mitlieferst. EDi hat darüber mal einen lesenswerten Text verfasst, den ich Dir vor Deiner nächsten Frage ans Herz legen möchte:
http://forum.r-statistik.de/viewtopic.php?f=20&t=11
Ich habe mir den Text angesehen und hoffe, dass ich ihn so umsetzen kann
Die Frage nach der Korrelation macht nur Sinn, wenn das Geschlecht "divers" im Datensatz nicht vorkommt oder vernachlässigbar selten vorkommt. Ich vermute mal, das das so sein wird und schlage folgenden Code vor:
CODE: ALLES AUSWÄHLEN
table(daten$Geschlecht)
daten$Geschlecht_i <- as.integer(daten$Geschlecht)
Mit dieser neuen Spalte 'Geschlecht_i' sollte sich dann korrelieren lassen.
Genau, "divers" kommt tatsächlich nur einmal vonn 203 Teilnehmern vor, daher kann es außer Acht gelassen werden.
Ich habe mich nun nochmal mit R beschäftigt und mal versucht, alles in ein Skript einzugeben. Dabei habe ich das Geschlecht, die BestellhäufigkeitNegErf (ja/nein Frage in der Umfrage) und die SicherheitsmassnahmenNegErf (Ja / Nein Frage in der Umfrage) mit dem Befehl als "integer" definiert.
Die Werte, die als "factor" definiert waren, also die Risikowahrnehmung (Viele, eher viele, eher weniger, Keine), den Abschluss (Hauptschule, Realschule, Fachhochschulreife, Abitur, Ausbildung, Bachelor, Master), die Bestellhäufigkeit (weniger als 5 Mal, 5 - 10 Mal, 11 - 20 Mal, mehr als 20 Mal), die Interneterfahrung (weniger als 1 Jahr, 1 - 5 Jahre, mehr als 5 Jahre) und die Verlusthöhe (weniger als EUR 100, EUR 100 - EUR 500, mehr als EUR 500) habe ich mit folgender Eingabe bearbeitet, um sie als "numerisch" zu definieren:
Code: Alles auswählen
#Umwanlungsfunktion, um die Daten "Risikowahrnehmung" zu sortieren
wandle <- function(x){
if(x == "Keine") return(1)
if(x == "Eher weniger") return(2)
if(x == "Eher viele") return(3)
if(x == "Viele") return(4)
return(NaN)
}
#Vektorisierung der Funktion, damit jetzt nicht nur ein Wert zurückgegeben wird, sondern ganz viele auf einmal
wandle <- Vectorize(wandle)
#Anwendung auf den Vektor meines Datensatzes
Risikowahrnehmung_Num <- factor(daten$Risikowahrnehmung)
Risikowahrnehmung_gewandelt <- wandle(Risikowahrnehmung_Num)
#Umwanlungsfunktion, um die Daten "Abschluss" zu sortieren
wandle1 <- function(x){
if(x == "Hauptschule") return(1)
if(x == "Realschule") return(2)
if(x == "Fachhochschulreife") return(3)
if(x == "Abitur") return(4)
if(x == "Abgeschlossene Ausbildung") return(5)
if(x == "Abgeschlossener Bachelor") return(6)
if(x == "Abgeschlossener Master") return(7)
return(NaN)
}
#Vektorisierung der Funktion, damit jetzt nicht nur ein Wert zurückgegeben wird, sondern ganz viele auf einmal
wandle1 <- Vectorize(wandle1)
#Anwendung auf den Vektor meines Datensatzes
Abschluss_Num <- factor(daten$Abschluss)
Abschluss_gewandelt <- wandle1(Abschluss_Num)
USW. --> die anderen Variablen dann eben mit der gleichen Eingabe.
Damit habe ich dann alle Variablen wie im angefügten Bild definiert (Variablen Resultat.PNG)
.
Dann habe ich die Korrelation (spearman) zwischen verschiedenen Variablen durchgeführt:
Code: Alles auswählen
#Korrelation Geschlecht / Risikowahrnehmung
cor.test(daten$Geschlecht_i, Risikowahrnehmung_gewandelt, method = "spearman")
#Korrelation Alter / Risikowahrnehmung
cor.test(daten$Alter, Risikowahrnehmung_gewandelt, method = "spearman")
#Korrelation Abschluss / Risikowahrnehmung
cor.test(Abschluss_gewandelt, Risikowahrnehmung_gewandelt, method = "spearman")
#Korrelation Alter / Interneterfahrung
cor.test(daten$Alter, Interneterfahrung_gewandelt, method = "spearman")
Bei der Korrelation zwischen Geschlecht / Risikowahrnehmung kommt ein Wert von -0.03078043 raus. Dies würde bedeutet, dass eine sehr geringe Korrelation zwischen den beiden Variablen herrscht.
Ich würde gerne beim Geschlecht und auch beim Alter schauen, wie die Korrelation zwischen Männern und Risikowahrnehmung und Frauen und Risikowahrnehmung ist und auch wie die Korrelation zwischen verschiedenen Altersgruppen (14 - 30 Jahre, 31 - 45 Jahre, 46 - 60 Jahre, 61 und älter) und der Risikowahrnehmung ist. Ist es möglich, Männer bzw. Frauen zu isolieren oder verschiedene Altersgruppen zu definieren und mit den einzelnen Gruppen erneut eine Korrelation durchzuführen?
Ich habe einmal mein KnitDocument angehängt, damit wird es vielleicht etwas leichter?!
Vermutlich ist es schon viel zu viel, was ich als Frage stelle, würde mich aber sehr freuen, wenn du noch mal helfen könntest auch anhand meiner bisherigen Eingaben. Kann es aber auch verstehen, wenn es die Dimension sprengt.
Vielen Dank schon mal im Voraus!
Viele Grüße