Faktoranalyse mit anschließender Clusteranalyse

Varianzanalyse, Diskriminanzanalyse, Kontingenzanalyse, Faktorenanalyse, Clusteranalyse, MDS, ....

Moderator: EDi

Antworten
Monni171
Beiträge: 4
Registriert: Fr Feb 12, 2021 12:41 pm

Faktoranalyse mit anschließender Clusteranalyse

Beitrag von Monni171 »

Hallo zusammen,

Ich habe bereits eine Faktoranalyse durchgeführt und das hat auch wunderbar funktioniert. Nun würde ich gerne mit diesen Faktoren eine Clusteranalyse durchführen. Leider weiß ich nicht wie ich aus der Faktoranalyse die Werte beziehen kann mit denen ich dann weiter rechnen kann.
Darf ich einfach die einzelnen Items eines Faktors aufsummieren und durch ihre Anzahl teilen?
Oder sind das die scores die ich durch die Faktoranalyse erhalte? Allerdings sind das teilweise negative Werte und ich brauche eigentlich werte zwischen 1 und 5.

Könnt ihr mir weiterhelfen? Leider habe ich nicht das größte Statistische Verständnis.
Liebe Grüße
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Faktoranalyse mit anschließender Clusteranalyse

Beitrag von student »

Hallo Monni,

ich bin mir nicht sicher was du mit
Darf ich einfach die einzelnen Items eines Faktors aufsummieren und durch ihre Anzahl teilen?
meinst, bzw. wenn ich versuche das zu interpretieren, wie Du darauf kommst.

Auch kann ich nicht erkennen, da kein Beispiel vorliegt, was an
Allerdings sind das teilweise negative Werte ...
schlimm ist? Was bedeuten denn die Scores? ;)

Ich habe hier mal etwas zur Faktorenanalyse gemacht, vielleicht hilft es ja weiter?
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Faktoranalyse mit anschließender Clusteranalyse

Beitrag von bigben »

Hallo Monni,
Monni171 hat geschrieben: Di Mär 02, 2021 11:09 amIch habe bereits eine Faktoranalyse durchgeführt und das hat auch wunderbar funktioniert.
Nun gibt es in R nicht nur eine Möglichkeit, Faktoranalysen durchzuführen. Wir wissen also nicht, was bei Dir funktioniert hat und können auch nicht sagen, wie Du an die Faktorwerte kommst.
Nun würde ich gerne mit diesen Faktoren eine Clusteranalyse durchführen.
[...]
Allerdings sind das teilweise negative Werte
Nun gibt es sehr viele Möglichkeiten, Clusteranalysen zu rechnen. In der Regel sollten aber negative Werte dabei kein Problem darstellen.
Leider weiß ich nicht wie ich aus der Faktoranalyse die Werte beziehen kann mit denen ich dann weiter rechnen kann.
Du suchst wahrscheinlich nicht die Faktorladungen, sondern die Faktorwerte, richtig? Nun, wenn Du mit der Suche in den Beschreibungstexten zu Deinen Funktionen nicht weiterkommst, dann solltest Du überlegen, hier ein reproduzierbares Beispiel zu posten, sodass wir auf unseren Rechnern Deine Analyse nachvollziehen und nach den Faktorwerten darin suchen können. Gute Hinweise für das Erstellen reproduzierbarer Beispiele findest Du hier: viewtopic.php?f=20&t=11

Code: Alles auswählen

Darf ich einfach die einzelnen Items eines Faktors aufsummieren und durch ihre Anzahl teilen?
So machen das die Psychologen in der Klassischen Testtheorie (CTT). Ist aber nicht dasselbe wie Faktorwerte. Hängt also vom Kontext ab und davon, mit welchem Ziel Du machst, was Du da machst.

Ich finde Students Video ziemlich gut, wenn die Funktion factanal für Dich infrage kommt.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Monni171
Beiträge: 4
Registriert: Fr Feb 12, 2021 12:41 pm

Re: Faktoranalyse mit anschließender Clusteranalyse

Beitrag von Monni171 »

Danke schon einmal für die Antworten und Entschuldigung das ich das so unklar formuliert habe!

Hier die Struktur des Datensatzes:

Code: Alles auswählen

'data.frame':	
> str(PSMRisiko)
'data.frame':	152 obs. of  20 variables:
 $ BI      : num  4.06 3.24 4.36 3.69 3.19 2.62 1.46 2.75 2.91 3.49 ...
 $ pH      : num  3 5 5 2 4 3 1 3 4 3 ...
 $ pF      : num  3 4 5 2 4 3 1 3 4 3 ...
 $ pI      : num  4 4 1 2 4 3 1 3 4 4 ...
 $ pW      : num  3 4 4 3 4 3 1 3 4 2 ...
 $ AK      : num  3 2 3 4 3 3 1 2 4 4 ...
 $ EE      : num  5 3 5 5 4 4 1 4 5 4 ...
 $ maxEE   : num  3 4 3 4 4 4 2 3 4 3 ...
 $ zPa     : num  1 3 3 2 2 2 3 3 4 4 ...
 $ VRP     : num  4 5 5 2 5 4 5 4 5 4 ...
 $ wC      : num  4 5 2 3 4 2 5 3 4 3 ...
 $ Us      : num  4 5 4 3 4 3 5 3 4 4 ...
 $ SF      : num  5 3 4 4 5 4 3 4 2 4 ...
 $ PaLM    : num  2 5 1 3 2 2 5 2 2 1 ...
 $ VvG     : num  3 5 2 4 4 2 5 3 2 3 ...
 $ EMredPSM: num  3 2 4 4 3 4 1 4 3 4 ...
 $ GdLdw   : num  4 3 1 2 4 2 4 3 3 2 ...
 $ VvGTW   : num  3 4 1 4 3 2 5 2 2 2 ...
 $ SdPf    : num  3 4 2 3 4 3 3 2 3 3 ...
 $ SWTWPf  : num  2 5 2 3 3 2 5 2 4 2 ...
und die Faktoranalyse habe ich so durchgeführt:

Code: Alles auswählen

variPR<- factanal(PSMRisiko, 4, rotation = "varimax", scores = "Bartlett" )
print(variPR, digits = 2, cutoff= 0.25)
Call:
factanal(x = PSMRisiko, factors = 4, scores = "Bartlett", rotation = "varimax")

Uniquenesses:
      BI       pH       pF       pI       pW       AK       EE    maxEE      zPa      VRP       wC       Us       SF     PaLM      VvG 
    0.88     0.24     0.13     0.47     0.54     0.74     0.58     0.67     0.87     0.66     0.43     0.29     0.71     0.46     0.34 
EMredPSM    GdLdw    VvGTW     SdPf   SWTWPf 
    0.84     0.61     0.30     0.92     0.56 

Loadings:
         Factor1 Factor2 Factor3 Factor4
BI                                0.32  
pH        0.85                          
pF        0.93                          
pI        0.71                          
pW        0.63                          
AK        0.34            0.35          
EE                                0.60  
maxEE                             0.55  
zPa                       0.35          
VRP                       0.50          
wC                        0.72          
Us                        0.83          
SF                                0.53  
PaLM              0.62           -0.38  
VvG      -0.27    0.74                  
EMredPSM                          0.38  
GdLdw             0.61                  
VvGTW             0.81                  
SdPf              0.27                  
SWTWPf            0.66                  

               Factor1 Factor2 Factor3 Factor4
SS loadings       2.77    2.62    1.84    1.52
Proportion Var    0.14    0.13    0.09    0.08
Cumulative Var    0.14    0.27    0.36    0.44

Test of the hypothesis that 4 factors are sufficient.
The chi square statistic is 158.84 on 116 degrees of freedom.
The p-value is 0.00511
Mit dem Teil hatte ich keine Probleme. Jetzt würde ich allerdings gerne die Faktoren als neue Variablen abspeichern um mit diesen dann eine Korrelations und eine Clusteranalyse zu machen.
Ich habe es einmal versucht mit ungewichteten Faktorwerten, also einfach die Variablen des Faktors aufsummieren. Aber die Betreuerin meiner Arbeit möchte lieber gewichtete. Aber mit den scores die ich bei der Faktoranalyse erhalte kann ich doch nicht direkt weiter rechnen oder?

Code: Alles auswählen

str(variPR$scores)
 num [1:152, 1:4] -1.025 0.779 0.808 -2.188 0.261 ...
 - attr(*, "dimnames")=List of 2
  ..$ : NULL
  ..$ : chr [1:4] "Factor1" "Factor2" "Factor3" "Factor4"
Ich hoffe jetzt könnt ihr besser verstehen was ich meine und nochmal ENTSCHULDIGUNG!
Liebe Grüße
Monni
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Faktoranalyse mit anschließender Clusteranalyse

Beitrag von student »

Hallo Monni,

schau Dir bitte mal das von mir erwähnte Video an. Dein 20 Eingangsvariablen werden nach der Faktorenanalyse durch 4 Faktoren dargestellt. Deine 20 Variablen mit den entsprechenden Ausprägungen "laden" entsprechend der Analyse unterschiedlich auf die Faktoren "hoch" (sorry, ich weiß gerade nicht, wie ich das anders formulieren soll) und dass wird durch die Scores repräsentiert.

Du weißt sicher aufgrund Deines Datenwissens, welche Bedeutung die einzelnen Faktoren haben. Das heißt Factor1 steht für "Eigenschaft A", Factor 2 für "Eigenschaft B" usw.. Wenn es Sinn macht, kannst Du damit weiterrechnen.

Die Qualität der Analyse beurteile ich nicht, gebe nur den Hinweis, dass 44% der Varianz durch dieses Modell erklärt werden (Cumulative Var 0.44).

Ich hoffe, ich konnte Dir weiterhelfen.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Faktoranalyse mit anschließender Clusteranalyse

Beitrag von bigben »

Monni171 hat geschrieben: Mi Mär 03, 2021 9:20 amIch habe es einmal versucht mit ungewichteten Faktorwerten, also einfach die Variablen des Faktors aufsummieren.
Das war sicher keine schlaue Entscheidung wenn man sieht, dass negative Ladungen vorkommen.
Aber mit den scores die ich bei der Faktoranalyse erhalte kann ich doch nicht direkt weiter rechnen oder?
Warum nicht? Darin steht für jeden der 152 Datensätze die Ausprägung des jeweiligen Faktors. Man kann damit auch weiter arbeiten.

LG,
Bermjard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten