Hallo,
wirklich wenig Infos, ich versuch mich trotzdem an einer Antwort. Nehmen wir den Iris-Datensatz und clustern ihn in drei Cluster basierend auf den Messwerten der Blütenblätter ohne Einbezug der Spezies in drei Gruppen:
Code: Alles auswählen
cl <- kmeans(iris[, c("Sepal.Length", "Sepal.Width", "Petal.Length", "Petal.Width")], 3)
In unserem Ergebnis steckt nun für jede Zeile drin, in welches Cluster sie aufgenommen wurde. Das extrahiert man so:
Jetzt gibt es eine neue Spalte die allerlei Auswertungen zulässt. Wir könnten zum Beispiel zählen, wie sich die Spezies auf die Cluster verteilen (vielleicht macht sowas bei Dir Sinn mit dem Geschlecht):
Code: Alles auswählen
> table(iris$Species, iris$Cluster)
1 2 3
setosa 0 0 50
versicolor 2 48 0
virginica 36 14 0
Oder wir könnten uns die Kelchblattbreiten nach Cluster anzeigen lassen (vielleicht macht sowas bei Dir Sinn mit dem Alter):
Code: Alles auswählen
boxplot(iris$Sepal.Width ~ iris$Cluster, xlab = "kmeans Cluster mit k = 3")
oder die Clusternummer zum Einfärben einer Grafik verwenden (will sagen, ganz viel ist möglich, was Du untersuchen willst können wir nicht wissen):
Code: Alles auswählen
plot(iris$Sepal.Width ~ iris$Sepal.Length, col = iris$Cluster,
pch = 16)
HTH,
Bernhard