Liebes Forum,
ich habe leider Probleme bei der Auswertung einer Tabelle.
Ziel ist die Berechnung des Zusammenhanges von einem genutzten Verkehrsmittel und einer Aktivität und diese Korrelation in einer Tabelle auszugeben. Nun bin ich leider ein R newbe.
Ich kann die Correlation (cor.test(X,Y, method = "pearson") nicht so einfach durchführen, da ich zum einem nur Daten einbeziehen will, die in einer Spalte Y einen bestimmten Wert haben, beispielsweise 5. Außerdem muss ich doch dann eine Korrelationsmatrix erstellen (wie beispielsweise „rcorr(as.matrix(my_data))„)), um darzustellen, wie die Aktivität „1“, „2“, „3“ von dem Verkehrsmittel „A“ oder „B“ oder „C“ ab. Ich habe leider gerade keine Idee, wie ich da hinkomme. Wie kann ich die Tabelle neu erstellen, nur mit den Eintrage „5“ in einer Spalte Y und anschließend diese Korrelationsmatrix zu erstellen.
Vielen Dank für die Hilfe im Voraus
Korrelationsmatrix mit Bedingung
Moderator: jogo
Re: Korrelationsmatrix mit Bedingung
Hallo LeaNie,
sind das Hausaufgaben? Dann lies und beachte bitte viewtopic.php?f=20&t=35
Wenn Du konkrete Hilfe haben willst, wie man das in R macht, dann musst Du uns auch konkret sagen, wie die Daten jetzt aussehen. Wie heißen die Spalten, sind 1, 2, 3 verschiedene Aktivitäten oder ist es das Ausmaß einer Aktivität und so weiter. Am besten ist es, wenn Du hier einen Datensatz postest, der so aufgebaut ist wie Deiner und an dem wir Dir etwas konkretes vormachen können. Das hier hilft dabei:
viewtopic.php?f=20&t=11
https://stackoverflow.com/help/mcve
LG,
Bernhard
sind das Hausaufgaben? Dann lies und beachte bitte viewtopic.php?f=20&t=35
Wenn Du konkrete Hilfe haben willst, wie man das in R macht, dann musst Du uns auch konkret sagen, wie die Daten jetzt aussehen. Wie heißen die Spalten, sind 1, 2, 3 verschiedene Aktivitäten oder ist es das Ausmaß einer Aktivität und so weiter. Am besten ist es, wenn Du hier einen Datensatz postest, der so aufgebaut ist wie Deiner und an dem wir Dir etwas konkretes vormachen können. Das hier hilft dabei:
viewtopic.php?f=20&t=11
https://stackoverflow.com/help/mcve
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Korrelationsmatrix mit Bedingung
Hallo Bernhard,
hierbei handelt es sich nicht um Hausaufgaben. Es sind Befragungsergebnisse, die ich auswerten möchte. Ich werde versuchen hiermit meine Frage zu konkretisieren.
Ich will eine Korrelationsmatrix erstellen und habe mir dafür folgendes angesehen und wollte es nachbauen:
http://www.sthda.com/english/wiki/corre ... r-software.
Meine Ausgangstabelle sieht aber leider etwas anders aus (siehe Tabelle im Anhang), denn zunächst will ich nur diejenigen Datensätze auswerten, die den Wert 5 in der Spalte „Aufnahme“ enthalten (Operator== ?). Außerdem sind die Aktivitäten (Spalte „Schwimmen“, „Lesen“ und „Freunde besuchen“) mit einer „1“ für „gemacht“ oder einer „2“ für „nicht gemacht“ kodiert. Die Spalte „Verkehrsmittel“ enthält ebenfalls Ziffern, die für Verkehrsmittel stehen (1 steht beispielsweise für U-Bahn). Nun weiß ich leider nicht wie ich mit dieser Tabelle eine Korrelationsmatrix erstellen kann und wäre deswegen sehr dankbar für Hinweise.
Vielen lieben Dank.
hierbei handelt es sich nicht um Hausaufgaben. Es sind Befragungsergebnisse, die ich auswerten möchte. Ich werde versuchen hiermit meine Frage zu konkretisieren.
Ich will eine Korrelationsmatrix erstellen und habe mir dafür folgendes angesehen und wollte es nachbauen:
http://www.sthda.com/english/wiki/corre ... r-software.
Meine Ausgangstabelle sieht aber leider etwas anders aus (siehe Tabelle im Anhang), denn zunächst will ich nur diejenigen Datensätze auswerten, die den Wert 5 in der Spalte „Aufnahme“ enthalten (Operator== ?). Außerdem sind die Aktivitäten (Spalte „Schwimmen“, „Lesen“ und „Freunde besuchen“) mit einer „1“ für „gemacht“ oder einer „2“ für „nicht gemacht“ kodiert. Die Spalte „Verkehrsmittel“ enthält ebenfalls Ziffern, die für Verkehrsmittel stehen (1 steht beispielsweise für U-Bahn). Nun weiß ich leider nicht wie ich mit dieser Tabelle eine Korrelationsmatrix erstellen kann und wäre deswegen sehr dankbar für Hinweise.
Vielen lieben Dank.
- Dateianhänge
-
- data_befragung.csv
- Daten
- (181 Bytes) 200-mal heruntergeladen
Re: Korrelationsmatrix mit Bedingung
LeaNie hat geschrieben: ↑Di Jan 23, 2018 5:14 pm Hallo Bernhard,
hierbei handelt es sich nicht um Hausaufgaben. Es sind Befragungsergebnisse, die ich auswerten möchte. Ich werde versuchen hiermit meine Frage zu konkretisieren.
Ich will eine Korrelationsmatrix erstellen und habe mir dafür folgendes angesehen und wollte es nachbauen:
http://www.sthda.com/english/wiki/corre ... r-software.
Meine Ausgangstabelle sieht aber leider etwas anders aus (siehe Tabelle im Anhang), denn zunächst will ich nur diejenigen Datensätze auswerten, die den Wert 5 in der Spalte „Aufnahme“ enthalten (Operator== ?). Außerdem sind die Aktivitäten (Spalte „Schwimmen“, „Lesen“ und „Freunde besuchen“) mit einer „1“ für „gemacht“ oder einer „2“ für „nicht gemacht“ kodiert. Die Spalte „Verkehrsmittel“ enthält ebenfalls Ziffern, die für Verkehrsmittel stehen (1 steht beispielsweise für U-Bahn). Nun weiß ich leider nicht wie ich mit dieser Tabelle eine Korrelationsmatrix erstellen kann und wäre deswegen sehr dankbar für Hinweise. Die Tabelle im Anhang ist nur ein Ausschnitt, insgesamt liegen ca. 1000 Datensätze vor. Sie zeigt auch die angestrebt Korrelationsmatrix.
Vielen lieben Dank.
- Dateianhänge
-
- data_befragung.csv
- Tabelle und angestrebt Korrelationsmatrix
- (475 Bytes) 206-mal heruntergeladen
Re: Korrelationsmatrix mit Bedingung
Vielleicht hilft das hier:
Ein wesentliches Problem, ist dass Dein Datensatz nur in den ersten 20 Zeilen Information zu enthalten scheint und danach hat irgendwer in Excel irgendwas anderes getippt, was mit den Daten in dieser Spalte nichts zu tun hat. Deshalb habe ich hier gezielt nur die ersten 20 Zeilen eingelesen. Wenn Du umfangreichere Daten hast, musst Du diese Zahl ggf. anpassen.
LG,
Bernhard
Code: Alles auswählen
d <- read.csv("http://forum.r-statistik.de/download/file.php?id=219&sid=baa2db41d93e5efae87823474e81f9e6", na.strings = " ", header=TRUE, nrows=20)
aufn5 <- subset(d, d$Aufnahme == "5")
print(str(aufn5))
print(cor.test(aufn5$Schwimmen, aufn5$Lesen, method="spearman", exact = FALSE))
print(cor(aufn5[,2:5]))
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte