Probleme bei Umwandlung von CSV in Matrix
Verfasst: Di Jun 26, 2018 8:49 pm
Hallo,
ich möchte in R eine Korrelationsmatrix aus Excel einlesen, die ich in eine CSV-Datei umgewandelt habe und diese Daten dann in eine Matrix in R umwandeln.
Ich gebe dazu ein:
y <- read.csv("Irrelevanter Dateiname",FALSE,sep = ";",dec = ",")
rho <- matrix(y,10,10,dimnames=list(firmnames,firmnames),byrow=TRUE)
Wenn ich dann rho aufrufe erhalte ich:
> rho
1 2 3 4 5 6
1 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
2 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
3 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
4 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
5 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
6 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
7 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
8 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
9 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
10 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
7 8 9 10
1 factor,10 factor,10 factor,10 factor,10
2 factor,10 factor,10 factor,10 factor,10
3 factor,10 factor,10 factor,10 factor,10
4 factor,10 factor,10 factor,10 factor,10
5 factor,10 factor,10 factor,10 factor,10
6 factor,10 factor,10 factor,10 factor,10
7 factor,10 factor,10 factor,10 factor,10
8 factor,10 factor,10 factor,10 factor,10
9 factor,10 factor,10 factor,10 factor,10
10 factor,10 factor,10 factor,10 factor,10
Eigentlich sollte das Ganze aber so aussehen:
1 2 3 4 5 6 7 8 9 10
1 1.000 0.021 0.129 0.075 0.150 0.187 0.007 0.104 0.018 0.199
2 0.021 1.000 0.069 0.040 0.080 0.101 0.004 0.056 0.010 0.107
3 0.129 0.069 1.000 0.243 0.487 0.608 0.022 0.336 0.059 0.647
4 0.075 0.040 0.243 1.000 0.282 0.353 0.013 0.195 0.034 0.375
5 0.150 0.080 0.487 0.282 1.000 0.706 0.026 0.390 0.069 0.751
6 0.187 0.101 0.608 0.353 0.706 1.000 0.032 0.488 0.086 0.939
7 0.007 0.004 0.022 0.013 0.026 0.032 1.000 0.018 0.003 0.034
8 0.104 0.056 0.336 0.195 0.390 0.488 0.018 1.000 0.047 0.519
9 0.018 0.010 0.059 0.034 0.069 0.086 0.003 0.047 1.000 0.091
10 0.199 0.107 0.647 0.375 0.751 0.939 0.034 0.519 0.091 1.000
(hierfür habe ich die CSV Datei im Editor geöffnet und über copy & paste in die Funktion eingefügt. Da ich später mit einer riesigen Korrelationsmatrix mit mehreren Millionen Werten arbeiten möchte macht dieser Weg keinen Sinn)
Weiß jemand wo mein Problem liegt?
ich möchte in R eine Korrelationsmatrix aus Excel einlesen, die ich in eine CSV-Datei umgewandelt habe und diese Daten dann in eine Matrix in R umwandeln.
Ich gebe dazu ein:
y <- read.csv("Irrelevanter Dateiname",FALSE,sep = ";",dec = ",")
rho <- matrix(y,10,10,dimnames=list(firmnames,firmnames),byrow=TRUE)
Wenn ich dann rho aufrufe erhalte ich:
> rho
1 2 3 4 5 6
1 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
2 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
3 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
4 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
5 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
6 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
7 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
8 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
9 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
10 factor,10 factor,10 factor,10 factor,10 factor,10 factor,10
7 8 9 10
1 factor,10 factor,10 factor,10 factor,10
2 factor,10 factor,10 factor,10 factor,10
3 factor,10 factor,10 factor,10 factor,10
4 factor,10 factor,10 factor,10 factor,10
5 factor,10 factor,10 factor,10 factor,10
6 factor,10 factor,10 factor,10 factor,10
7 factor,10 factor,10 factor,10 factor,10
8 factor,10 factor,10 factor,10 factor,10
9 factor,10 factor,10 factor,10 factor,10
10 factor,10 factor,10 factor,10 factor,10
Eigentlich sollte das Ganze aber so aussehen:
1 2 3 4 5 6 7 8 9 10
1 1.000 0.021 0.129 0.075 0.150 0.187 0.007 0.104 0.018 0.199
2 0.021 1.000 0.069 0.040 0.080 0.101 0.004 0.056 0.010 0.107
3 0.129 0.069 1.000 0.243 0.487 0.608 0.022 0.336 0.059 0.647
4 0.075 0.040 0.243 1.000 0.282 0.353 0.013 0.195 0.034 0.375
5 0.150 0.080 0.487 0.282 1.000 0.706 0.026 0.390 0.069 0.751
6 0.187 0.101 0.608 0.353 0.706 1.000 0.032 0.488 0.086 0.939
7 0.007 0.004 0.022 0.013 0.026 0.032 1.000 0.018 0.003 0.034
8 0.104 0.056 0.336 0.195 0.390 0.488 0.018 1.000 0.047 0.519
9 0.018 0.010 0.059 0.034 0.069 0.086 0.003 0.047 1.000 0.091
10 0.199 0.107 0.647 0.375 0.751 0.939 0.034 0.519 0.091 1.000
(hierfür habe ich die CSV Datei im Editor geöffnet und über copy & paste in die Funktion eingefügt. Da ich später mit einer riesigen Korrelationsmatrix mit mehreren Millionen Werten arbeiten möchte macht dieser Weg keinen Sinn)
Weiß jemand wo mein Problem liegt?