Einführung in die Clusteranalyse

Beitrag von **student** » So Okt 09, 2016 3:49 pm

Hier findest Du eine Einführung in die Clusteranalyse, natürlich mit R-Bezug und einem Einführungsvideo dazu!

Viel Erfolg!

Kalypso · Beitrag von **Kalypso** » So Dez 10, 2017 12:03 pm

Hallo,

eine Frage zur Clusteranalyse.

Ist das Ergebnis des Clusterns normal, wenn ich immer wieder die gleichen Daten nehme und das Clustern durchführe, dass dann die geclusterten Gruppen immer wieder unterschiedlich ausfallen und gewichtet sind? Und welchen Nutzen hat dann das Verfahren?
Gibt es bessere?

Code: Alles auswählen

library(fPortfolio)
library(fEcofin)
library(corpcor)
djiData = as.timeSeries(DowJones30)
djiData.ret <- 100 * returns(djiData)
colnames(djiData)
par(mfrow = c(1, 1), ask = TRUE)
for (i in 1:3) plot(djiData.ret[, (10 * i - 9):(10 * i)])
for (i in 1:3) plot(djiData[, (10 * i - 9):(10 * i)])
assetsCorImagePlot(djiData.ret)
plot(assetsSelect(djiData.ret))
assetsCorEigenPlot(djiData.ret)
frontier <- portfolioFrontier(djiData.ret)
tailoredFrontierPlot(frontier)
weightsPlot(frontier)
selection <- assetsSelect(djiData.ret, method = "kmeans")
cluster <- selection$cluster
cluster[cluster == 1]
cluster[cluster == 2]
cluster[cluster == 3]
cluster[cluster == 4]
cluster[cluster == 5]

cl1<-cluster[cluster == 1]
cl2<-cluster[cluster == 2]
cl3<-cluster[cluster == 3]
cl4<-cluster[cluster == 4]
cl5<-cluster[cluster == 5]
names(cl1)
names(cl2)
names(cl3)
names(cl4)
names(cl5)
dim(cl1)
dim(cl2)
dim(cl3)
dim(cl4)
dim(cl5)
length(cl1)
length(cl2)
length(cl3)
length(cl4)
length(cl5)

Beitrag von **student** » So Dez 10, 2017 12:45 pm

Hallo Kalypso,

nein. Der Algorithmus liefert auf Basis der Parameter und den einfließenden Daten immer das gleiche Ergebnis. Ich habe es praktisch schon x-mal gemacht, eine Clusteranalyse auf Basis der mir bekannten Parametern und Daten nachzukochen. Die Zuordnung war identisch.

M. E. liegt der Unterschied in den Daten.

Ich muss allerdings auch dazusagen, dass ich ...

selection <- assetsSelect(djiData.ret, method = "kmeans")

... nicht kenne.

Beitrag von **EDi** » So Dez 10, 2017 8:30 pm

Ist das Ergebnis des Clusterns normal, wenn ich immer wieder die gleichen Daten nehme und das Clustern durchführe, dass dann die geclusterten Gruppen immer wieder unterschiedlich ausfallen und gewichtet sind? Und welchen Nutzen hat dann das Verfahren?

Kann bei kmeans passieren, da der Anfang zufällig bestimmt wird. Um dem zu entgehen, und reproduzierbar zu sein, könntest du die Startpunkte vorgeben.

Kalypso · Beitrag von **Kalypso** » Do Dez 14, 2017 11:57 pm

Hallo Edi,

"Kann bei kmeans passieren, da der Anfang zufällig bestimmt wird."

vielen Dank, dass hat schon mal geholfen, ist logisch und das wusste ich nicht aber erklärt das.

"Bitte bei fragen immer ein reproduzierbares Minimalbeispiel angeben."
Bezüglich dem reproduzierbaren Beispiel habe ich doch oben eins rein gestellt...

Grüße

Alex

Deutsches R-Forum

Einführung in die Clusteranalyse

Einführung in die Clusteranalyse

Re: Einführung in die Clusteranalyse

Re: Einführung in die Clusteranalyse

Re: Einführung in die Clusteranalyse

Re: Einführung in die Clusteranalyse