Seite 1 von 1

Korrelationsmatrix mit Bedingung

Verfasst: Di Jan 23, 2018 11:05 am
von LeaNie
Liebes Forum,
ich habe leider Probleme bei der Auswertung einer Tabelle.
Ziel ist die Berechnung des Zusammenhanges von einem genutzten Verkehrsmittel und einer Aktivität und diese Korrelation in einer Tabelle auszugeben. Nun bin ich leider ein R newbe.
Ich kann die Correlation (cor.test(X,Y, method = "pearson") nicht so einfach durchführen, da ich zum einem nur Daten einbeziehen will, die in einer Spalte Y einen bestimmten Wert haben, beispielsweise 5. Außerdem muss ich doch dann eine Korrelationsmatrix erstellen (wie beispielsweise „rcorr(as.matrix(my_data))„)), um darzustellen, wie die Aktivität „1“, „2“, „3“ von dem Verkehrsmittel „A“ oder „B“ oder „C“ ab. Ich habe leider gerade keine Idee, wie ich da hinkomme. Wie kann ich die Tabelle neu erstellen, nur mit den Eintrage „5“ in einer Spalte Y und anschließend diese Korrelationsmatrix zu erstellen.
Vielen Dank für die Hilfe im Voraus

Re: Korrelationsmatrix mit Bedingung

Verfasst: Di Jan 23, 2018 12:59 pm
von bigben
Hallo LeaNie,

sind das Hausaufgaben? Dann lies und beachte bitte viewtopic.php?f=20&t=35

Wenn Du konkrete Hilfe haben willst, wie man das in R macht, dann musst Du uns auch konkret sagen, wie die Daten jetzt aussehen. Wie heißen die Spalten, sind 1, 2, 3 verschiedene Aktivitäten oder ist es das Ausmaß einer Aktivität und so weiter. Am besten ist es, wenn Du hier einen Datensatz postest, der so aufgebaut ist wie Deiner und an dem wir Dir etwas konkretes vormachen können. Das hier hilft dabei:
viewtopic.php?f=20&t=11
https://stackoverflow.com/help/mcve

LG,
Bernhard

Re: Korrelationsmatrix mit Bedingung

Verfasst: Di Jan 23, 2018 5:14 pm
von LeaNie
Hallo Bernhard,
hierbei handelt es sich nicht um Hausaufgaben. Es sind Befragungsergebnisse, die ich auswerten möchte. Ich werde versuchen hiermit meine Frage zu konkretisieren.
Ich will eine Korrelationsmatrix erstellen und habe mir dafür folgendes angesehen und wollte es nachbauen:
http://www.sthda.com/english/wiki/corre ... r-software.
Meine Ausgangstabelle sieht aber leider etwas anders aus (siehe Tabelle im Anhang), denn zunächst will ich nur diejenigen Datensätze auswerten, die den Wert 5 in der Spalte „Aufnahme“ enthalten (Operator== ?). Außerdem sind die Aktivitäten (Spalte „Schwimmen“, „Lesen“ und „Freunde besuchen“) mit einer „1“ für „gemacht“ oder einer „2“ für „nicht gemacht“ kodiert. Die Spalte „Verkehrsmittel“ enthält ebenfalls Ziffern, die für Verkehrsmittel stehen (1 steht beispielsweise für U-Bahn). Nun weiß ich leider nicht wie ich mit dieser Tabelle eine Korrelationsmatrix erstellen kann und wäre deswegen sehr dankbar für Hinweise.
Vielen lieben Dank.

Re: Korrelationsmatrix mit Bedingung

Verfasst: Mi Jan 24, 2018 8:10 am
von LeaNie
LeaNie hat geschrieben:
Di Jan 23, 2018 5:14 pm
Hallo Bernhard,
hierbei handelt es sich nicht um Hausaufgaben. Es sind Befragungsergebnisse, die ich auswerten möchte. Ich werde versuchen hiermit meine Frage zu konkretisieren.
Ich will eine Korrelationsmatrix erstellen und habe mir dafür folgendes angesehen und wollte es nachbauen:
http://www.sthda.com/english/wiki/corre ... r-software.
Meine Ausgangstabelle sieht aber leider etwas anders aus (siehe Tabelle im Anhang), denn zunächst will ich nur diejenigen Datensätze auswerten, die den Wert 5 in der Spalte „Aufnahme“ enthalten (Operator== ?). Außerdem sind die Aktivitäten (Spalte „Schwimmen“, „Lesen“ und „Freunde besuchen“) mit einer „1“ für „gemacht“ oder einer „2“ für „nicht gemacht“ kodiert. Die Spalte „Verkehrsmittel“ enthält ebenfalls Ziffern, die für Verkehrsmittel stehen (1 steht beispielsweise für U-Bahn). Nun weiß ich leider nicht wie ich mit dieser Tabelle eine Korrelationsmatrix erstellen kann und wäre deswegen sehr dankbar für Hinweise. Die Tabelle im Anhang ist nur ein Ausschnitt, insgesamt liegen ca. 1000 Datensätze vor. Sie zeigt auch die angestrebt Korrelationsmatrix.
Vielen lieben Dank.

Re: Korrelationsmatrix mit Bedingung

Verfasst: Mi Jan 24, 2018 12:25 pm
von bigben
Vielleicht hilft das hier:

Code: Alles auswählen

d <- read.csv("http://forum.r-statistik.de/download/file.php?id=219&sid=baa2db41d93e5efae87823474e81f9e6", na.strings = " ", header=TRUE, nrows=20)

aufn5 <- subset(d, d$Aufnahme == "5")
print(str(aufn5))

print(cor.test(aufn5$Schwimmen, aufn5$Lesen, method="spearman", exact = FALSE))

print(cor(aufn5[,2:5]))
Ein wesentliches Problem, ist dass Dein Datensatz nur in den ersten 20 Zeilen Information zu enthalten scheint und danach hat irgendwer in Excel irgendwas anderes getippt, was mit den Daten in dieser Spalte nichts zu tun hat. Deshalb habe ich hier gezielt nur die ersten 20 Zeilen eingelesen. Wenn Du umfangreichere Daten hast, musst Du diese Zahl ggf. anpassen.


LG,
Bernhard

Re: Korrelationsmatrix mit Bedingung

Verfasst: Mi Jan 24, 2018 1:32 pm
von LeaNie
Vielen Dank, das hilf mir schon sehr weiter.