Seite 1 von 1

Faktoranalyse mit anschließender Clusteranalyse

Verfasst: Di Mär 02, 2021 11:09 am
von Monni171
Hallo zusammen,

Ich habe bereits eine Faktoranalyse durchgeführt und das hat auch wunderbar funktioniert. Nun würde ich gerne mit diesen Faktoren eine Clusteranalyse durchführen. Leider weiß ich nicht wie ich aus der Faktoranalyse die Werte beziehen kann mit denen ich dann weiter rechnen kann.
Darf ich einfach die einzelnen Items eines Faktors aufsummieren und durch ihre Anzahl teilen?
Oder sind das die scores die ich durch die Faktoranalyse erhalte? Allerdings sind das teilweise negative Werte und ich brauche eigentlich werte zwischen 1 und 5.

Könnt ihr mir weiterhelfen? Leider habe ich nicht das größte Statistische Verständnis.
Liebe Grüße

Re: Faktoranalyse mit anschließender Clusteranalyse

Verfasst: Di Mär 02, 2021 3:14 pm
von student
Hallo Monni,

ich bin mir nicht sicher was du mit
Darf ich einfach die einzelnen Items eines Faktors aufsummieren und durch ihre Anzahl teilen?
meinst, bzw. wenn ich versuche das zu interpretieren, wie Du darauf kommst.

Auch kann ich nicht erkennen, da kein Beispiel vorliegt, was an
Allerdings sind das teilweise negative Werte ...
schlimm ist? Was bedeuten denn die Scores? ;)

Ich habe hier mal etwas zur Faktorenanalyse gemacht, vielleicht hilft es ja weiter?

Re: Faktoranalyse mit anschließender Clusteranalyse

Verfasst: Di Mär 02, 2021 4:38 pm
von bigben
Hallo Monni,
Monni171 hat geschrieben: Di Mär 02, 2021 11:09 amIch habe bereits eine Faktoranalyse durchgeführt und das hat auch wunderbar funktioniert.
Nun gibt es in R nicht nur eine Möglichkeit, Faktoranalysen durchzuführen. Wir wissen also nicht, was bei Dir funktioniert hat und können auch nicht sagen, wie Du an die Faktorwerte kommst.
Nun würde ich gerne mit diesen Faktoren eine Clusteranalyse durchführen.
[...]
Allerdings sind das teilweise negative Werte
Nun gibt es sehr viele Möglichkeiten, Clusteranalysen zu rechnen. In der Regel sollten aber negative Werte dabei kein Problem darstellen.
Leider weiß ich nicht wie ich aus der Faktoranalyse die Werte beziehen kann mit denen ich dann weiter rechnen kann.
Du suchst wahrscheinlich nicht die Faktorladungen, sondern die Faktorwerte, richtig? Nun, wenn Du mit der Suche in den Beschreibungstexten zu Deinen Funktionen nicht weiterkommst, dann solltest Du überlegen, hier ein reproduzierbares Beispiel zu posten, sodass wir auf unseren Rechnern Deine Analyse nachvollziehen und nach den Faktorwerten darin suchen können. Gute Hinweise für das Erstellen reproduzierbarer Beispiele findest Du hier: viewtopic.php?f=20&t=11

Code: Alles auswählen

Darf ich einfach die einzelnen Items eines Faktors aufsummieren und durch ihre Anzahl teilen?
So machen das die Psychologen in der Klassischen Testtheorie (CTT). Ist aber nicht dasselbe wie Faktorwerte. Hängt also vom Kontext ab und davon, mit welchem Ziel Du machst, was Du da machst.

Ich finde Students Video ziemlich gut, wenn die Funktion factanal für Dich infrage kommt.

LG,
Bernhard

Re: Faktoranalyse mit anschließender Clusteranalyse

Verfasst: Mi Mär 03, 2021 9:20 am
von Monni171
Danke schon einmal für die Antworten und Entschuldigung das ich das so unklar formuliert habe!

Hier die Struktur des Datensatzes:

Code: Alles auswählen

'data.frame':	
> str(PSMRisiko)
'data.frame':	152 obs. of  20 variables:
 $ BI      : num  4.06 3.24 4.36 3.69 3.19 2.62 1.46 2.75 2.91 3.49 ...
 $ pH      : num  3 5 5 2 4 3 1 3 4 3 ...
 $ pF      : num  3 4 5 2 4 3 1 3 4 3 ...
 $ pI      : num  4 4 1 2 4 3 1 3 4 4 ...
 $ pW      : num  3 4 4 3 4 3 1 3 4 2 ...
 $ AK      : num  3 2 3 4 3 3 1 2 4 4 ...
 $ EE      : num  5 3 5 5 4 4 1 4 5 4 ...
 $ maxEE   : num  3 4 3 4 4 4 2 3 4 3 ...
 $ zPa     : num  1 3 3 2 2 2 3 3 4 4 ...
 $ VRP     : num  4 5 5 2 5 4 5 4 5 4 ...
 $ wC      : num  4 5 2 3 4 2 5 3 4 3 ...
 $ Us      : num  4 5 4 3 4 3 5 3 4 4 ...
 $ SF      : num  5 3 4 4 5 4 3 4 2 4 ...
 $ PaLM    : num  2 5 1 3 2 2 5 2 2 1 ...
 $ VvG     : num  3 5 2 4 4 2 5 3 2 3 ...
 $ EMredPSM: num  3 2 4 4 3 4 1 4 3 4 ...
 $ GdLdw   : num  4 3 1 2 4 2 4 3 3 2 ...
 $ VvGTW   : num  3 4 1 4 3 2 5 2 2 2 ...
 $ SdPf    : num  3 4 2 3 4 3 3 2 3 3 ...
 $ SWTWPf  : num  2 5 2 3 3 2 5 2 4 2 ...
und die Faktoranalyse habe ich so durchgeführt:

Code: Alles auswählen

variPR<- factanal(PSMRisiko, 4, rotation = "varimax", scores = "Bartlett" )
print(variPR, digits = 2, cutoff= 0.25)
Call:
factanal(x = PSMRisiko, factors = 4, scores = "Bartlett", rotation = "varimax")

Uniquenesses:
      BI       pH       pF       pI       pW       AK       EE    maxEE      zPa      VRP       wC       Us       SF     PaLM      VvG 
    0.88     0.24     0.13     0.47     0.54     0.74     0.58     0.67     0.87     0.66     0.43     0.29     0.71     0.46     0.34 
EMredPSM    GdLdw    VvGTW     SdPf   SWTWPf 
    0.84     0.61     0.30     0.92     0.56 

Loadings:
         Factor1 Factor2 Factor3 Factor4
BI                                0.32  
pH        0.85                          
pF        0.93                          
pI        0.71                          
pW        0.63                          
AK        0.34            0.35          
EE                                0.60  
maxEE                             0.55  
zPa                       0.35          
VRP                       0.50          
wC                        0.72          
Us                        0.83          
SF                                0.53  
PaLM              0.62           -0.38  
VvG      -0.27    0.74                  
EMredPSM                          0.38  
GdLdw             0.61                  
VvGTW             0.81                  
SdPf              0.27                  
SWTWPf            0.66                  

               Factor1 Factor2 Factor3 Factor4
SS loadings       2.77    2.62    1.84    1.52
Proportion Var    0.14    0.13    0.09    0.08
Cumulative Var    0.14    0.27    0.36    0.44

Test of the hypothesis that 4 factors are sufficient.
The chi square statistic is 158.84 on 116 degrees of freedom.
The p-value is 0.00511
Mit dem Teil hatte ich keine Probleme. Jetzt würde ich allerdings gerne die Faktoren als neue Variablen abspeichern um mit diesen dann eine Korrelations und eine Clusteranalyse zu machen.
Ich habe es einmal versucht mit ungewichteten Faktorwerten, also einfach die Variablen des Faktors aufsummieren. Aber die Betreuerin meiner Arbeit möchte lieber gewichtete. Aber mit den scores die ich bei der Faktoranalyse erhalte kann ich doch nicht direkt weiter rechnen oder?

Code: Alles auswählen

str(variPR$scores)
 num [1:152, 1:4] -1.025 0.779 0.808 -2.188 0.261 ...
 - attr(*, "dimnames")=List of 2
  ..$ : NULL
  ..$ : chr [1:4] "Factor1" "Factor2" "Factor3" "Factor4"
Ich hoffe jetzt könnt ihr besser verstehen was ich meine und nochmal ENTSCHULDIGUNG!
Liebe Grüße
Monni

Re: Faktoranalyse mit anschließender Clusteranalyse

Verfasst: Mi Mär 03, 2021 9:34 am
von student
Hallo Monni,

schau Dir bitte mal das von mir erwähnte Video an. Dein 20 Eingangsvariablen werden nach der Faktorenanalyse durch 4 Faktoren dargestellt. Deine 20 Variablen mit den entsprechenden Ausprägungen "laden" entsprechend der Analyse unterschiedlich auf die Faktoren "hoch" (sorry, ich weiß gerade nicht, wie ich das anders formulieren soll) und dass wird durch die Scores repräsentiert.

Du weißt sicher aufgrund Deines Datenwissens, welche Bedeutung die einzelnen Faktoren haben. Das heißt Factor1 steht für "Eigenschaft A", Factor 2 für "Eigenschaft B" usw.. Wenn es Sinn macht, kannst Du damit weiterrechnen.

Die Qualität der Analyse beurteile ich nicht, gebe nur den Hinweis, dass 44% der Varianz durch dieses Modell erklärt werden (Cumulative Var 0.44).

Ich hoffe, ich konnte Dir weiterhelfen.

Re: Faktoranalyse mit anschließender Clusteranalyse

Verfasst: Mi Mär 03, 2021 11:19 am
von bigben
Monni171 hat geschrieben: Mi Mär 03, 2021 9:20 amIch habe es einmal versucht mit ungewichteten Faktorwerten, also einfach die Variablen des Faktors aufsummieren.
Das war sicher keine schlaue Entscheidung wenn man sieht, dass negative Ladungen vorkommen.
Aber mit den scores die ich bei der Faktoranalyse erhalte kann ich doch nicht direkt weiter rechnen oder?
Warum nicht? Darin steht für jeden der 152 Datensätze die Ausprägung des jeweiligen Faktors. Man kann damit auch weiter arbeiten.

LG,
Bermjard