Hier findest Du eine Einführung in die Clusteranalyse, natürlich mit R-Bezug und einem Einführungsvideo dazu!
Viel Erfolg!
Einführung in die Clusteranalyse
Moderator: EDi
Einführung in die Clusteranalyse
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Re: Einführung in die Clusteranalyse
Hallo,
eine Frage zur Clusteranalyse.
Ist das Ergebnis des Clusterns normal, wenn ich immer wieder die gleichen Daten nehme und das Clustern durchführe, dass dann die geclusterten Gruppen immer wieder unterschiedlich ausfallen und gewichtet sind? Und welchen Nutzen hat dann das Verfahren?
Gibt es bessere?
eine Frage zur Clusteranalyse.
Ist das Ergebnis des Clusterns normal, wenn ich immer wieder die gleichen Daten nehme und das Clustern durchführe, dass dann die geclusterten Gruppen immer wieder unterschiedlich ausfallen und gewichtet sind? Und welchen Nutzen hat dann das Verfahren?
Gibt es bessere?
Code: Alles auswählen
library(fPortfolio)
library(fEcofin)
library(corpcor)
djiData = as.timeSeries(DowJones30)
djiData.ret <- 100 * returns(djiData)
colnames(djiData)
par(mfrow = c(1, 1), ask = TRUE)
for (i in 1:3) plot(djiData.ret[, (10 * i - 9):(10 * i)])
for (i in 1:3) plot(djiData[, (10 * i - 9):(10 * i)])
assetsCorImagePlot(djiData.ret)
plot(assetsSelect(djiData.ret))
assetsCorEigenPlot(djiData.ret)
frontier <- portfolioFrontier(djiData.ret)
tailoredFrontierPlot(frontier)
weightsPlot(frontier)
selection <- assetsSelect(djiData.ret, method = "kmeans")
cluster <- selection$cluster
cluster[cluster == 1]
cluster[cluster == 2]
cluster[cluster == 3]
cluster[cluster == 4]
cluster[cluster == 5]
cl1<-cluster[cluster == 1]
cl2<-cluster[cluster == 2]
cl3<-cluster[cluster == 3]
cl4<-cluster[cluster == 4]
cl5<-cluster[cluster == 5]
names(cl1)
names(cl2)
names(cl3)
names(cl4)
names(cl5)
dim(cl1)
dim(cl2)
dim(cl3)
dim(cl4)
dim(cl5)
length(cl1)
length(cl2)
length(cl3)
length(cl4)
length(cl5)
Re: Einführung in die Clusteranalyse
Hallo Kalypso,
nein. Der Algorithmus liefert auf Basis der Parameter und den einfließenden Daten immer das gleiche Ergebnis. Ich habe es praktisch schon x-mal gemacht, eine Clusteranalyse auf Basis der mir bekannten Parametern und Daten nachzukochen. Die Zuordnung war identisch.
M. E. liegt der Unterschied in den Daten.
Ich muss allerdings auch dazusagen, dass ich ...
nein. Der Algorithmus liefert auf Basis der Parameter und den einfließenden Daten immer das gleiche Ergebnis. Ich habe es praktisch schon x-mal gemacht, eine Clusteranalyse auf Basis der mir bekannten Parametern und Daten nachzukochen. Die Zuordnung war identisch.
M. E. liegt der Unterschied in den Daten.
Ich muss allerdings auch dazusagen, dass ich ...
... nicht kenne.selection <- assetsSelect(djiData.ret, method = "kmeans")
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Re: Einführung in die Clusteranalyse
Kann bei kmeans passieren, da der Anfang zufällig bestimmt wird. Um dem zu entgehen, und reproduzierbar zu sein, könntest du die Startpunkte vorgeben.Ist das Ergebnis des Clusterns normal, wenn ich immer wieder die gleichen Daten nehme und das Clustern durchführe, dass dann die geclusterten Gruppen immer wieder unterschiedlich ausfallen und gewichtet sind? Und welchen Nutzen hat dann das Verfahren?
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Einführung in die Clusteranalyse
Hallo Edi,
"Kann bei kmeans passieren, da der Anfang zufällig bestimmt wird."
vielen Dank, dass hat schon mal geholfen, ist logisch und das wusste ich nicht aber erklärt das.
"Bitte bei fragen immer ein reproduzierbares Minimalbeispiel angeben."
Bezüglich dem reproduzierbaren Beispiel habe ich doch oben eins rein gestellt...
Grüße
Alex
"Kann bei kmeans passieren, da der Anfang zufällig bestimmt wird."
vielen Dank, dass hat schon mal geholfen, ist logisch und das wusste ich nicht aber erklärt das.
"Bitte bei fragen immer ein reproduzierbares Minimalbeispiel angeben."
Bezüglich dem reproduzierbaren Beispiel habe ich doch oben eins rein gestellt...
Grüße
Alex