Korrelationsmatrix mit Bedingung

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Antworten
LeaNie

Korrelationsmatrix mit Bedingung

Beitrag von LeaNie »

Liebes Forum,
ich habe leider Probleme bei der Auswertung einer Tabelle.
Ziel ist die Berechnung des Zusammenhanges von einem genutzten Verkehrsmittel und einer Aktivität und diese Korrelation in einer Tabelle auszugeben. Nun bin ich leider ein R newbe.
Ich kann die Correlation (cor.test(X,Y, method = "pearson") nicht so einfach durchführen, da ich zum einem nur Daten einbeziehen will, die in einer Spalte Y einen bestimmten Wert haben, beispielsweise 5. Außerdem muss ich doch dann eine Korrelationsmatrix erstellen (wie beispielsweise „rcorr(as.matrix(my_data))„)), um darzustellen, wie die Aktivität „1“, „2“, „3“ von dem Verkehrsmittel „A“ oder „B“ oder „C“ ab. Ich habe leider gerade keine Idee, wie ich da hinkomme. Wie kann ich die Tabelle neu erstellen, nur mit den Eintrage „5“ in einer Spalte Y und anschließend diese Korrelationsmatrix zu erstellen.
Vielen Dank für die Hilfe im Voraus
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Korrelationsmatrix mit Bedingung

Beitrag von bigben »

Hallo LeaNie,

sind das Hausaufgaben? Dann lies und beachte bitte viewtopic.php?f=20&t=35

Wenn Du konkrete Hilfe haben willst, wie man das in R macht, dann musst Du uns auch konkret sagen, wie die Daten jetzt aussehen. Wie heißen die Spalten, sind 1, 2, 3 verschiedene Aktivitäten oder ist es das Ausmaß einer Aktivität und so weiter. Am besten ist es, wenn Du hier einen Datensatz postest, der so aufgebaut ist wie Deiner und an dem wir Dir etwas konkretes vormachen können. Das hier hilft dabei:
viewtopic.php?f=20&t=11
https://stackoverflow.com/help/mcve

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
LeaNie

Re: Korrelationsmatrix mit Bedingung

Beitrag von LeaNie »

Hallo Bernhard,
hierbei handelt es sich nicht um Hausaufgaben. Es sind Befragungsergebnisse, die ich auswerten möchte. Ich werde versuchen hiermit meine Frage zu konkretisieren.
Ich will eine Korrelationsmatrix erstellen und habe mir dafür folgendes angesehen und wollte es nachbauen:
http://www.sthda.com/english/wiki/corre ... r-software.
Meine Ausgangstabelle sieht aber leider etwas anders aus (siehe Tabelle im Anhang), denn zunächst will ich nur diejenigen Datensätze auswerten, die den Wert 5 in der Spalte „Aufnahme“ enthalten (Operator== ?). Außerdem sind die Aktivitäten (Spalte „Schwimmen“, „Lesen“ und „Freunde besuchen“) mit einer „1“ für „gemacht“ oder einer „2“ für „nicht gemacht“ kodiert. Die Spalte „Verkehrsmittel“ enthält ebenfalls Ziffern, die für Verkehrsmittel stehen (1 steht beispielsweise für U-Bahn). Nun weiß ich leider nicht wie ich mit dieser Tabelle eine Korrelationsmatrix erstellen kann und wäre deswegen sehr dankbar für Hinweise.
Vielen lieben Dank.
Dateianhänge
data_befragung.csv
Daten
(181 Bytes) 122-mal heruntergeladen
LeaNie

Re: Korrelationsmatrix mit Bedingung

Beitrag von LeaNie »

LeaNie hat geschrieben: Di Jan 23, 2018 5:14 pm Hallo Bernhard,
hierbei handelt es sich nicht um Hausaufgaben. Es sind Befragungsergebnisse, die ich auswerten möchte. Ich werde versuchen hiermit meine Frage zu konkretisieren.
Ich will eine Korrelationsmatrix erstellen und habe mir dafür folgendes angesehen und wollte es nachbauen:
http://www.sthda.com/english/wiki/corre ... r-software.
Meine Ausgangstabelle sieht aber leider etwas anders aus (siehe Tabelle im Anhang), denn zunächst will ich nur diejenigen Datensätze auswerten, die den Wert 5 in der Spalte „Aufnahme“ enthalten (Operator== ?). Außerdem sind die Aktivitäten (Spalte „Schwimmen“, „Lesen“ und „Freunde besuchen“) mit einer „1“ für „gemacht“ oder einer „2“ für „nicht gemacht“ kodiert. Die Spalte „Verkehrsmittel“ enthält ebenfalls Ziffern, die für Verkehrsmittel stehen (1 steht beispielsweise für U-Bahn). Nun weiß ich leider nicht wie ich mit dieser Tabelle eine Korrelationsmatrix erstellen kann und wäre deswegen sehr dankbar für Hinweise. Die Tabelle im Anhang ist nur ein Ausschnitt, insgesamt liegen ca. 1000 Datensätze vor. Sie zeigt auch die angestrebt Korrelationsmatrix.
Vielen lieben Dank.
Dateianhänge
data_befragung.csv
Tabelle und angestrebt Korrelationsmatrix
(475 Bytes) 125-mal heruntergeladen
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Korrelationsmatrix mit Bedingung

Beitrag von bigben »

Vielleicht hilft das hier:

Code: Alles auswählen

d <- read.csv("http://forum.r-statistik.de/download/file.php?id=219&sid=baa2db41d93e5efae87823474e81f9e6", na.strings = " ", header=TRUE, nrows=20)

aufn5 <- subset(d, d$Aufnahme == "5")
print(str(aufn5))

print(cor.test(aufn5$Schwimmen, aufn5$Lesen, method="spearman", exact = FALSE))

print(cor(aufn5[,2:5]))
Ein wesentliches Problem, ist dass Dein Datensatz nur in den ersten 20 Zeilen Information zu enthalten scheint und danach hat irgendwer in Excel irgendwas anderes getippt, was mit den Daten in dieser Spalte nichts zu tun hat. Deshalb habe ich hier gezielt nur die ersten 20 Zeilen eingelesen. Wenn Du umfangreichere Daten hast, musst Du diese Zahl ggf. anpassen.


LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
LeaNie

Re: Korrelationsmatrix mit Bedingung

Beitrag von LeaNie »

Vielen Dank, das hilf mir schon sehr weiter.
Antworten