Multikollinearität

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
Izappel
Beiträge: 3
Registriert: Mo Apr 20, 2020 10:18 pm

Multikollinearität

Beitrag von Izappel »

Hallo zusammen

Ich beschäftige mich nun schon seit mehr als einem Tag mit dem Problem der Multikollinearität. Anbei seht ihr meinen Regressions Output.
Bildschirmfoto 2020-04-21 um 11.01.52.png
Das Problem hier ist nun, dass die Variable AnteilAlte "NA" ist. Dies ist so, da die AnteilJunge + AnteilMittel + AnteilAlte = 1 (100%) ergibt. Diese Variable sind linear abhängig untereinander, weshalb R den Output automatisch anpasst. In einigen Beiträgen wurde vorgeschlagen, dass man für diesen Fall einfach eine Variable weglassen soll. Dies ist jedoch nicht mein Ziel ich möchte schlussendlich eine Interpretation für alle Anteile machen können. Ich vermute, dass dieses Problem durch die Erstellung von passenden Dummyvariablen gelöst werden kann. Leider weiss ich nicht wie das in R funktionieren soll. Zur Veranschaulichung noch einen Auszug der Rohdaten aus Excel.
Bildschirmfoto 2020-04-21 um 10.46.05.png
Kann mir jemand helfen, die Dummyvariablen in R zu implementieren? Oder hat sogar jemand einen einfacheren Vorschlag?

Vielen Dank für eure Hilfe und freundliche Grüsse izappel
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Multikollinearität

Beitrag von bigben »

Wahrscheinlich lässt sich das schon lösen, wenn man den Intercept weglässt. Das geht durch ein ' -1 ' in der Formel. Also

lm(ZWG.Anteil ~ Ausländeranteil + Reisezeit + ... + Anteil.Alte -1, ... )

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Multikollinearität

Beitrag von jogo »

Die Multikollinearität befindet sich in diesem Teil der Formel:

Code: Alles auswählen

... + AnteilJunge + AnteilMittel + AnteilAlte
Eigentlich hilft nur, eine dieser Variablen wegzulassen. Die Funktion lm() hat sich auch für eine Variable entschieden, diese wegzulassen.

Gruß, Jörg
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Multikollinearität

Beitrag von bigben »

jogo hat geschrieben: Di Apr 21, 2020 1:12 pmDas glaube ich nicht.
Ich glaube, ich habe mal eben Anteil und Anzahl verwechselt und großen Blödsinn geschrieben. Gilt es, wenn ich schreibe, ich wollte nur mal sehen, ob wer aufpasst? :oops:

Schuldbewusst,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Multikollinearität

Beitrag von student »

Mir wird immer ganz schwindelig, wenn ich diese Anzahl und Zusammensetzung der beeinflussenden Variablen sehe. Das schreit doch nach Komplexitätsreduzierung: Hauptkomponenten- oder Faktorenanalyse.

Aber auch diesen Verfahren sollten natürlich nur sinnvolle Variablen als Input dienen...
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Multikollinearität

Beitrag von schubbiaschwilli »

Ich werf' mal ein freundliches 'Hauptkomponentenregression' in die Runde (https://cran.r-project.org/web/packages/pls/index.html).
Izappel
Beiträge: 3
Registriert: Mo Apr 20, 2020 10:18 pm

Re: Multikollinearität

Beitrag von Izappel »

Vielen herzlichen Dank euch allen für die Antwort.

Grüsse izappel
Antworten