Seite 1 von 1

Einführung in die Clusteranalyse

Verfasst: So Okt 09, 2016 3:49 pm
von student
Hier findest Du eine Einführung in die Clusteranalyse, natürlich mit R-Bezug und einem Einführungsvideo dazu!

Viel Erfolg!

Re: Einführung in die Clusteranalyse

Verfasst: So Dez 10, 2017 12:03 pm
von Kalypso
Hallo,

eine Frage zur Clusteranalyse.

Ist das Ergebnis des Clusterns normal, wenn ich immer wieder die gleichen Daten nehme und das Clustern durchführe, dass dann die geclusterten Gruppen immer wieder unterschiedlich ausfallen und gewichtet sind? Und welchen Nutzen hat dann das Verfahren?
Gibt es bessere?


Code: Alles auswählen

library(fPortfolio)
library(fEcofin)
library(corpcor)
djiData = as.timeSeries(DowJones30)
djiData.ret <- 100 * returns(djiData)
colnames(djiData)
par(mfrow = c(1, 1), ask = TRUE)
for (i in 1:3) plot(djiData.ret[, (10 * i - 9):(10 * i)])
for (i in 1:3) plot(djiData[, (10 * i - 9):(10 * i)])
assetsCorImagePlot(djiData.ret)
plot(assetsSelect(djiData.ret))
assetsCorEigenPlot(djiData.ret)
frontier <- portfolioFrontier(djiData.ret)
tailoredFrontierPlot(frontier)
weightsPlot(frontier)
selection <- assetsSelect(djiData.ret, method = "kmeans")
cluster <- selection$cluster
cluster[cluster == 1]
cluster[cluster == 2]
cluster[cluster == 3]
cluster[cluster == 4]
cluster[cluster == 5]

cl1<-cluster[cluster == 1]
cl2<-cluster[cluster == 2]
cl3<-cluster[cluster == 3]
cl4<-cluster[cluster == 4]
cl5<-cluster[cluster == 5]
names(cl1)
names(cl2)
names(cl3)
names(cl4)
names(cl5)
dim(cl1)
dim(cl2)
dim(cl3)
dim(cl4)
dim(cl5)
length(cl1)
length(cl2)
length(cl3)
length(cl4)
length(cl5)
:shock:

Re: Einführung in die Clusteranalyse

Verfasst: So Dez 10, 2017 12:45 pm
von student
Hallo Kalypso,

nein. Der Algorithmus liefert auf Basis der Parameter und den einfließenden Daten immer das gleiche Ergebnis. Ich habe es praktisch schon x-mal gemacht, eine Clusteranalyse auf Basis der mir bekannten Parametern und Daten nachzukochen. Die Zuordnung war identisch.

M. E. liegt der Unterschied in den Daten.

Ich muss allerdings auch dazusagen, dass ich ...
selection <- assetsSelect(djiData.ret, method = "kmeans")
... nicht kenne.

Re: Einführung in die Clusteranalyse

Verfasst: So Dez 10, 2017 8:30 pm
von EDi
Ist das Ergebnis des Clusterns normal, wenn ich immer wieder die gleichen Daten nehme und das Clustern durchführe, dass dann die geclusterten Gruppen immer wieder unterschiedlich ausfallen und gewichtet sind? Und welchen Nutzen hat dann das Verfahren?
Kann bei kmeans passieren, da der Anfang zufällig bestimmt wird. Um dem zu entgehen, und reproduzierbar zu sein, könntest du die Startpunkte vorgeben.

Re: Einführung in die Clusteranalyse

Verfasst: Do Dez 14, 2017 11:57 pm
von Kalypso
Hallo Edi,

"Kann bei kmeans passieren, da der Anfang zufällig bestimmt wird."

vielen Dank, dass hat schon mal geholfen, ist logisch und das wusste ich nicht aber erklärt das.

"Bitte bei fragen immer ein reproduzierbares Minimalbeispiel angeben."
Bezüglich dem reproduzierbaren Beispiel habe ich doch oben eins rein gestellt...

Grüße

Alex