Seite 1 von 1

Multikollinearität

Verfasst: Di Apr 21, 2020 11:14 am
von Izappel
Hallo zusammen

Ich beschäftige mich nun schon seit mehr als einem Tag mit dem Problem der Multikollinearität. Anbei seht ihr meinen Regressions Output.
Bildschirmfoto 2020-04-21 um 11.01.52.png
Das Problem hier ist nun, dass die Variable AnteilAlte "NA" ist. Dies ist so, da die AnteilJunge + AnteilMittel + AnteilAlte = 1 (100%) ergibt. Diese Variable sind linear abhängig untereinander, weshalb R den Output automatisch anpasst. In einigen Beiträgen wurde vorgeschlagen, dass man für diesen Fall einfach eine Variable weglassen soll. Dies ist jedoch nicht mein Ziel ich möchte schlussendlich eine Interpretation für alle Anteile machen können. Ich vermute, dass dieses Problem durch die Erstellung von passenden Dummyvariablen gelöst werden kann. Leider weiss ich nicht wie das in R funktionieren soll. Zur Veranschaulichung noch einen Auszug der Rohdaten aus Excel.
Bildschirmfoto 2020-04-21 um 10.46.05.png
Kann mir jemand helfen, die Dummyvariablen in R zu implementieren? Oder hat sogar jemand einen einfacheren Vorschlag?

Vielen Dank für eure Hilfe und freundliche Grüsse izappel

Re: Multikollinearität

Verfasst: Di Apr 21, 2020 11:21 am
von bigben
Wahrscheinlich lässt sich das schon lösen, wenn man den Intercept weglässt. Das geht durch ein ' -1 ' in der Formel. Also

lm(ZWG.Anteil ~ Ausländeranteil + Reisezeit + ... + Anteil.Alte -1, ... )

LG,
Bernhard

Re: Multikollinearität

Verfasst: Di Apr 21, 2020 1:12 pm
von jogo
Die Multikollinearität befindet sich in diesem Teil der Formel:

Code: Alles auswählen

... + AnteilJunge + AnteilMittel + AnteilAlte
Eigentlich hilft nur, eine dieser Variablen wegzulassen. Die Funktion lm() hat sich auch für eine Variable entschieden, diese wegzulassen.

Gruß, Jörg

Re: Multikollinearität

Verfasst: Di Apr 21, 2020 1:24 pm
von bigben
jogo hat geschrieben: Di Apr 21, 2020 1:12 pmDas glaube ich nicht.
Ich glaube, ich habe mal eben Anteil und Anzahl verwechselt und großen Blödsinn geschrieben. Gilt es, wenn ich schreibe, ich wollte nur mal sehen, ob wer aufpasst? :oops:

Schuldbewusst,
Bernhard

Re: Multikollinearität

Verfasst: Di Apr 21, 2020 7:02 pm
von student
Mir wird immer ganz schwindelig, wenn ich diese Anzahl und Zusammensetzung der beeinflussenden Variablen sehe. Das schreit doch nach Komplexitätsreduzierung: Hauptkomponenten- oder Faktorenanalyse.

Aber auch diesen Verfahren sollten natürlich nur sinnvolle Variablen als Input dienen...

Re: Multikollinearität

Verfasst: Di Apr 21, 2020 9:03 pm
von schubbiaschwilli
Ich werf' mal ein freundliches 'Hauptkomponentenregression' in die Runde (https://cran.r-project.org/web/packages/pls/index.html).

Re: Multikollinearität

Verfasst: Fr Apr 24, 2020 11:03 am
von Izappel
Vielen herzlichen Dank euch allen für die Antwort.

Grüsse izappel