Hallo zusammen
Ich schreibe meine Masterarbeit und bin mir plötzlich nicht mehr sicher, wie ich meine Daten am besten auswerten soll. Das Ziel meiner Analyse ist es, herauszufinden wie viel der Varianz des Zweitwohnungsanteils durch jede einzelne unabhängige Variable erklärt wird. Total habe ich etwa 30 unabhängige Variablen. Alle Variablen sind metrisch. 2 unabhängige Variablen sind dummycodiert. Nun habe ich in einem ersten Schritt mal eine rückwärts Variablenselektion durchgeführt (nach dem AIC-Kriterium). Nach der Durchführung dieser Prozedur habe ich immer noch 23 unabhängige Variablen, was immer noch zu viele sind. Ursprünglich wollte ich dann eine multiple Regressionsanalyse durchführen, nur habe ich bisher nicht herausgefunden, wie man die erklärende Varianz jeder unabhängigen Variable berechnen kann.
Daher die zwei grundlegenden Fragen:
Welches Verfahren empfiehlt sich, damit ich die erklärende Varianz betreffend des Zweitwohnungsanteils jeder einzelnen Variable ermitteln kann (Durchführung einer multiplen Regressionsanalyse ist sicher mal nicht falsch)?
Und muss ich durch eine Hauptkomponentenanalyse oder eine Faktorenanalyse meine Variablen vor der Berechnung der Regression reduzieren?
Vielen Dank für eure Antworten
izappel
Wahl der Analysemethode
Moderator: EDi
Re: Wahl der Analysemethode
Multiple Regression geht natürlich, aber du solltest Dir noch mal sehr gut Gedanken darüber machen, was Du erreichen möchtest bzw. schärfer Dein Problem formulieren. Wenn es Dein Ziel ist, die erklärte Varianz jeder unabhängigen Variable herauszufinden, ist eine Hauptkomponentenanalyse um deren Anzahl zu reduzieren natürlich kontraproduktiv. Gleichwohl sind 23 sicherlich miteinander korrelierte Prädiktoren im Modell auch nicht optimal. Diese Entscheidungen musst letztlich Du nach fachlichen Erwägungen treffen. Gibt es Faktoren, deren Wirkungsweise gut bekannt ist, könnte man die zum Beispiel ggf. zusammenfassen.
Re: Wahl der Analysemethode
Hauptkomponenten macht meiner Meinung nach Sinn, wenn man wenig a priori Wissen hat und explorativ arbeiten will.
Die Hauptkomponenten können schwer interpretierbar sein, wenn man Glück hat kann man sie schön als Meta-Variablen beschreiben, weil logische Gruppen auf die Achsen laden.
Wenn man a priori Wissen hat, kann man eine der jeweils paarweise korrelierten Variablen weglassen und dann aber erwähnen, dass diese auch für die andere stehen könnte aber mit den Daten nicht auftrennbar ist. Fänd ich genauso gut wie ne par.
Die Hauptkomponenten können schwer interpretierbar sein, wenn man Glück hat kann man sie schön als Meta-Variablen beschreiben, weil logische Gruppen auf die Achsen laden.
Wenn man a priori Wissen hat, kann man eine der jeweils paarweise korrelierten Variablen weglassen und dann aber erwähnen, dass diese auch für die andere stehen könnte aber mit den Daten nicht auftrennbar ist. Fänd ich genauso gut wie ne par.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.