Anzahl Cluster, Laden der Cluster in Datensatz

Varianzanalyse, Diskriminanzanalyse, Kontingenzanalyse, Faktorenanalyse, Clusteranalyse, MDS, ....

Moderator: EDi

Luisa_33
Beiträge: 19
Registriert: Do Jun 25, 2020 3:46 pm

Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von Luisa_33 »

Hallo,

ich mache gerade eine Clusteranalyse von metrischen und nominalen Werten.
Dazu habe ich Gower und die Funktion agnes() genutzt.

1. Anzahl der Cluster
Bis jetzt habe ich nur die Möglichkeit gefunden die Anzahl der Cluster anhand des Screeplots abzulesen.
Ist es möglich bzw. gibt es einen Befehl oder eine Funktion, die mir die geeignete Clusteranzahl als Ergebnis ausgibt?
Falls nicht, kennt ihr Programme die das können?

2. Cluster in Daten laden
Ich möchte das jeweilige Cluster in meinen geladenen Datensatz kopieren.
Dazu habe ich folgenden Code gefunden und auf mein Beispiel angewendet.

# Vektor "Cluster" mit Clusterzugehörigkeit
Cluster <- cutree(as.hclust(clust_nor_a1), k=4) # Clusteranzahl k anpassen
# Vektor "Cluster" ins Datenfile "data" einfügen
dat <- numeric(length=nrow(Daten1))
dat[dat==0] <- NA dat[rownames(Daten1) %in% names(Cluster)] <- Cluster
Daten1$Cluster <- dat
Das Ergebnis in meiner Spalte ist dann überall NA, obwohl im Cluster <- 1 1 3 1 3 steht.

Was habe ich denn falsch gemacht?

Liebe Grüße
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von schubbiaschwilli »

Gude!
Ist es möglich bzw. gibt es einen Befehl oder eine Funktion, die mir die geeignete Clusteranzahl als Ergebnis ausgibt?
Bei einer Clusteranalyse gibt es kein richtig oder falsch, nur ein sinnvoll (oder eben nicht).
Falls nicht, kennt ihr Programme die das können?
Da ich mit den gleichen Problemen zu tun haben, nutze ich JASP (auf R-Basis; https://en.wikipedia.org/wiki/JASP) - Ja, ich bekenne: Manchmal mag auch ich Klickibunti.

Nachtrag:
https://jasp-stats.org/2019/09/24/intro ... ng-module/

Dank&Gruß
schubbiaschwilli
Luisa_33
Beiträge: 19
Registriert: Do Jun 25, 2020 3:46 pm

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von Luisa_33 »

Okay. Danke für die schnelle Antwort.
Das hatte ich mir schon gedacht. ;)
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von EDi »

schubbiaschwilli hat geschrieben: Do Jun 25, 2020 5:58 pm Gude!
Ist es möglich bzw. gibt es einen Befehl oder eine Funktion, die mir die geeignete Clusteranzahl als Ergebnis ausgibt?
Bei einer Clusteranalyse gibt es kein richtig oder falsch, nur ein sinnvoll (oder eben nicht).
Irgendjemand Kluges hat mal gesagt (ich finde leider nicht mehr die Referenz):
Clusteranalysis is mor an art than a Science.
:ugeek:
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von schubbiaschwilli »

Auch schön:
https://www.facebook.com/watch/?v=982761942061679
Es gibt 3 Arten von Lügen,... Ab ca. Sekunde 30

Davon ab - JASP ist echt schön gemacht, und für viele Anwender wäre es eine sinnvolle Alternative - und es ist auch geplant, dass der genutzte R-Code ausgegeben werden kann - Vielleicht wäre es eine sinnvolle Erweiterung für dieses Forum, mal eine JASP-Ecke aufzumachen - Viele der 'üblichen' Fragen 'Ich muss für meine Studienarbeit...' wären da gut aufgehoben.

Nachtrag: Falscher Link
Luisa_33
Beiträge: 19
Registriert: Do Jun 25, 2020 3:46 pm

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von Luisa_33 »

Ich verstehe, dass ihr manchmal von solchen Fragen genervt seid.
Ich fange gerade an R zu lernen und da treten natürlich noch Fragen auf.
Und wenn dann mal was nich klappt oder man Fragen hat, ist es natürlich schön, wenn man Hilfe bekommt.
Nicht jeder macht das nur, um Studienarbeiten oder Hausaufgaben zu lösen.
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von schubbiaschwilli »

Glaub mir, du warst nicht gemeint - Lies hier mal ein bisschen, dann verstehst du, was ich meine... - Ist aber kein exklusives Problem dieses Forums, für mich ist es eher so, dass die 'Sofortkultur' und 'Umsonstkultur' des Internet durchschlägt in die reale Welt (für mich ist dieses Forum hier zwar sicher auch 'Internet', aber nicht exklusiv - So, jetzt ist es raus: Ich bin real und kein Bot).

Dank&Gruß
schubbiaschwilli
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von bigben »

Hallo schubbiaschwilli,

ich bin ja nebenher auch oft im statistik-forum.de und beantworte dort seit einiger Zeit Fragen der Art "wie mache ich eine logistische Regression mit Interaktionstermen in Excel" gerne mit einem Verweis auf JASP. Klickibunti hat seine Berechtigung, aber es gibt mindstens zwei Aspekte daran, die ich nicht gut finde.

Vorrangig ist JASP m. E. noch nicht weit genug. Ein Blick auf das "Summary-Statistics" Menü zeigt: Von einer gegebenen Vierfeldertafel einen FIsher- oder auch nur einen Chi-Quadrattest rechnen geht nicht. Proportionen-Test: Sind 5 aus 10 in der einen Gruppe vergleichbar mit 7 aus 12? In JASP m. W. derzeit nicht.
Nachrangig aber auch nicht ohne: Die Betonung der guten Zusammenarbeit mit Excel für die Datenhaltung. Die Leute sollen weg von Excel für statistisches Rechnen, nicht hin. Unsere ganze Diskussion über Standard-R, data.tables und dplyr ist völlig sinnentleert für JASP-Nutzer. Die kennen kein expand.grid, kein choose und kein rnorm.

Ein eigenes Unterforum für JASP finde ich derzeit verfrüht, aber ich hätte kein Problem damit, wenn sich hier auch Threads mit JASP beschäftigen würden. Es ist wohl eher als Einstiegsdroge in Bayes-Analyse gedacht, aber warum soll es nicht auch Einstiegsdroge in R sein. Es haben ja auch schon Leute über den RCommander den Weg ins Forum gefunden. Ich sehe aber nicht, dass der sich irgendwo richtig durchgesetzt hätte.

JMTC, LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von schubbiaschwilli »

Gude!

Ich sehe deine Punkte, ziehe aber für mich andere Schlüsse - Ich komme aber aus einer anderen Ecke - Speziell da, wo ich herkomme (also meine Brötchen verdiene - Ich meine nicht meine Ausbildung), ist xl alles - Wenn man überhaupt da hinkommt.
Und so darf auch ich zum Teil mit xl arbeiten - Und teilweise bin/war ich erstaunt, was damit möglich ist. Und wenn ich den 'normalen' BWLer sehe (was ein großer Teil meiner Kollegen halt studiert hat), und auch sehe, was die machen oder was die in ihrem Studium gemacht haben, dann reicht das halt. Und bei vielen 'Studienarbeit'-Fragen in diesem Forum wäre dies meines Erachtens auch ausreichend (und ich will jetzt nicht darüber fabulieren, wie viele vom 'Summary' überfordert sind und da falsche Schlüsse ziehen) - Weswegen ich xl nicht verteufele bzw. auch kein Problem damit habe, wenn jemand xl nutzt - Man muss die Kiste ja schließlich auch fahren können, und R ist halt doch eher ein Rennpferd als ein Ackergaul.
Aber ich sehe das auch vom Ende - sprich Ergebnis - her, und da ist der Weg zwar nicht uninteressant, aber halt 'nur' der Weg.
Übrigens gilt das für mich für die ganze IT (also Sprachen, Systeme, ...) - Es gab hier ja mal ne Diskussion über Julia, Python, und das ganze Gedöns, und was in Zukunft genutzt wird, usw. - Im Zweifel wird in einem Unternehmen das genommen, was halt da ist - Und das ist im Zweifel der Mitarbeiter, der mit einem Tool umgehen kann. Und dann wird die Geburtstagsliste halt in einer Oracle über ein Web-Frontend verwaltet. Oder man zerlegt eine xl-Datei in mehrere, die dann über eine 'Master'-Datei wieder zusammengefrickelt werden (das macht ein Kumpel von mir, und damit werden die Preise für Lackieranlagen für die Autoindustrie - so richtige Fertigungsstraßen - kalkuliert). Es sei denn, das Management kauft extern ein, und verwirklicht 'Strategien' - Dann kauft man tatsächlich einen Stall Rennpferde plus Zubehör, und macht damit auf der Kirmes einen Stand für's Ponyreiten auf.

Hey, ein Text mit philosophischem Anstrich für's Wochenende!

Dank&Gruß
schubbiaschwilli
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Anzahl Cluster, Laden der Cluster in Datensatz

Beitrag von bigben »

Hallo!
schubbiaschwilli hat geschrieben: Fr Jun 26, 2020 4:25 pmIch sehe deine Punkte, ziehe aber für mich andere Schlüsse - Ich komme aber aus einer anderen Ecke - Speziell da, wo ich herkomme (also meine Brötchen verdiene - Ich meine nicht meine Ausbildung), ist xl alles
Ja, da mache ich mir keine Illusionen. Die häufigste Softwareumgebung für das Erstellen von Statistiken dürfte Excel sein. Jene Art von Statistik und das dort verbreitete Niveau haben aber gar nichts mehr mit der Natur dieses Forums hier zu tun. Wenn man hier ein Unterforum für Statistik mit Julia in deutscher Sprache eröffnen würde, dann ginge es um ähnliche Fragestellungen und ähnliche Lösungswege, nur halt mit weniger geschweiften Klammern und mit Kompilation statt Interpretation.

Datenhaltung in Excel ist halt schon ein völlig anderes Thema und würde auch ein völlig anderes Publikum anziehen (möglicherweise auch in ganz anderen Zahlen). Mir persönlich wäre das zu anders, um es im gleichen Forum zu halten.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten