ich hoffe ihr könnt mir weiterhelfen! Ich habe eine dichotome AV (Bereit in Krypto zu investieren) und mehrere UVs die ich von Likert-Skalierten Fragen habe und einen Datensatz mit 302 Ergebnissen.
Bei meiner ersten Hypothese geht es darum, ob eine steigende Inflation einen signifikanten Einfluss auf die Investitionsbereitschaft von Privatanlegern in Kryptowährungen hat.
Hierzu habe ich 5 UVs (abgefragt durch Likert Fragen) mit Werten zwischen 1 (stimme ich gar nicht zu) bis 7 (stimme ich voll zu). Diese UVs habe ich nun in dichotome Dummy Variablen transformiert (0 = Ablehnung & 1 = Zustimmung).
Bevor ich nun meine logistische Regressionsanalyse durchführe, möchte ich auf Multikollinearität prüfen (ich habe auch eine starke Vermutung das mehrere Variablen korrelieren). Vermutung ist das InflationSteigt_Dummy mit InflationHoch_Dummy korreliert. Dahinter verbirgt sich, dass die Teilnehmer eine steigende Inflation wahrnehmen bzw. wahrnehmen das die Inflation hoch ist.
Für die Prüfung der Multikollinearität habe ich die VIF-Werte wie folgt ausgerechnet:
Code: Alles auswählen
model_AVDummy_UVDummy <-
glm(
BereitschaftKryptoInvest_Dummy ~ Inflation_Dummy + InflationSteigt_Dummy + InflationHoch_Dummy + InflationNegEinflussGeldanlagen_Dummy + WissenInflationsschutz_Dummy,
data = data_transformation,
family = binomial()
)
vif(model_AVDummy_UVDummy)
Inflation_Dummy: 1.032488
InflationSteigt_Dummy: 1.228656
InflationHoch_Dummy: 1.246150
InflationNegEinflussGeldanlagen_Dummy: 1.050165
WissenInflationsschutz_Dummy: 1.032407
Die Ergebnisse haben mich sehr stark gewundert, da laut Literatur (die ich gefunden habe) man erst von korrelierenden Variablen ab einem VIF-Wert von 2 oder sogar 10 spricht (zumindest bei linearen Regressionsanalysen - zu logistischen RA habe ich bislang keine Beispiele gefunden. Gibt es dafür einen Grund?). Ich hatte zumindest angenommen das InflationSteigt_Dummy mit InflationHoch_Dummy korreliert.
Aber bei diesen Werten korrelieren ja gar nichts miteinander?! Daher meine Frage: Habe ich das so richtig berechnet oder irgendwo einen Fehler gemacht? Ich bin wirklich skeptisch was die Ergebnisse angeht...
Ich frage mich ob ich es in R falsch berechnet habe, Interpretationsschwierigkeiten habe oder erst auf Korrelation prüfen sollte und dann die UVs transformieren sollte (wobei das habe ich schon ausprobiert - da kamen auch keine wirklich viel größeren Werte bei rum...)
Schöne Grüße und danke vorab für die Hilfe !
Edit: Oder kann es evtl. daran liegen, dass sehr sehr viele Teilnehmer einfach voll zugestimmt haben bei der Inflation und dementsprechend keine großen Abweichungen bei der Variable vorhanden sind und demnach keine Korrelation vernünftig berechnet werden kann? Ich bin nämlich eben den Datensatz noch einmal durchgegangen und fast alle Teilnehmer haben bei der Variable InflationHoch eine 6 oder 7 die ich dann hinterher in der DummyVariable zu 1 transformiere.