Hallo zusammen
Ich beschäftige mich nun schon seit mehr als einem Tag mit dem Problem der Multikollinearität. Anbei seht ihr meinen Regressions Output. Das Problem hier ist nun, dass die Variable AnteilAlte "NA" ist. Dies ist so, da die AnteilJunge + AnteilMittel + AnteilAlte = 1 (100%) ergibt. Diese Variable sind linear abhängig untereinander, weshalb R den Output automatisch anpasst. In einigen Beiträgen wurde vorgeschlagen, dass man für diesen Fall einfach eine Variable weglassen soll. Dies ist jedoch nicht mein Ziel ich möchte schlussendlich eine Interpretation für alle Anteile machen können. Ich vermute, dass dieses Problem durch die Erstellung von passenden Dummyvariablen gelöst werden kann. Leider weiss ich nicht wie das in R funktionieren soll. Zur Veranschaulichung noch einen Auszug der Rohdaten aus Excel.
Kann mir jemand helfen, die Dummyvariablen in R zu implementieren? Oder hat sogar jemand einen einfacheren Vorschlag?
Vielen Dank für eure Hilfe und freundliche Grüsse izappel
Multikollinearität
Moderator: EDi
Re: Multikollinearität
Wahrscheinlich lässt sich das schon lösen, wenn man den Intercept weglässt. Das geht durch ein ' -1 ' in der Formel. Also
lm(ZWG.Anteil ~ Ausländeranteil + Reisezeit + ... + Anteil.Alte -1, ... )
LG,
Bernhard
lm(ZWG.Anteil ~ Ausländeranteil + Reisezeit + ... + Anteil.Alte -1, ... )
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Multikollinearität
Die Multikollinearität befindet sich in diesem Teil der Formel:
Eigentlich hilft nur, eine dieser Variablen wegzulassen. Die Funktion lm() hat sich auch für eine Variable entschieden, diese wegzulassen.
Gruß, Jörg
Code: Alles auswählen
... + AnteilJunge + AnteilMittel + AnteilAlte
Gruß, Jörg
Re: Multikollinearität
Ich glaube, ich habe mal eben Anteil und Anzahl verwechselt und großen Blödsinn geschrieben. Gilt es, wenn ich schreibe, ich wollte nur mal sehen, ob wer aufpasst?
Schuldbewusst,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Multikollinearität
Mir wird immer ganz schwindelig, wenn ich diese Anzahl und Zusammensetzung der beeinflussenden Variablen sehe. Das schreit doch nach Komplexitätsreduzierung: Hauptkomponenten- oder Faktorenanalyse.
Aber auch diesen Verfahren sollten natürlich nur sinnvolle Variablen als Input dienen...
Aber auch diesen Verfahren sollten natürlich nur sinnvolle Variablen als Input dienen...
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
-
- Beiträge: 253
- Registriert: Di Jun 27, 2017 12:09 pm
Re: Multikollinearität
Ich werf' mal ein freundliches 'Hauptkomponentenregression' in die Runde (https://cran.r-project.org/web/packages/pls/index.html).
Re: Multikollinearität
Vielen herzlichen Dank euch allen für die Antwort.
Grüsse izappel
Grüsse izappel