Linearitätsannahme für multiple Regression überprüfen

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
dieamalia
Beiträge: 3
Registriert: Sa Jul 06, 2024 9:52 am

Linearitätsannahme für multiple Regression überprüfen

Beitrag von dieamalia »

Hallo ihr Lieben,

Aktuell beschäftige ich mich mit einer linearen Regression, bei der ich ein Nullmodell, ein Baselinemodell mit Kovariaten und dann ein Finales Model mit meinen interessierenden UVs/Prädiktoren gefitted habe.

Jetzt möchte ich die Vorraussetzungen überprüfen. Bei Linearität bin ich mir nun unsicher.

Wenn ich das richtig verstanden habe, sollten bei den Boxplots die means um 0 herum sein und bei den Punktwolken ähnliche Verteilungen vorliegen. Da nirgendwo ein kurvillinearer Zusammenhang erkennbar ist, sollte meine Vorraussetzung nicht verletzt sein, oder? Das da eventuell kein wirklicher Zusammenhang ist bei Kovariaten ja dann eigentlich egal oder? Oder habe ich die plots falsch gemacht?

for (ind_var in c("v1", …)) {
plot(data[[ind_var]], residuals(modelfinal),
xlab = ind_var,
ylab = "Residuals",
main = paste("Residuals vs.", ind_var))
abline(h = 0, col = "red", lty = 2)
}

Wäre sehr dankbar für Tipps! Hab mir schon sehr viele YouTube Videos und Foren angeschaut, und bin mir leider trotzdem noch unsicher :?:

Danke euch! :mrgreen:
Liebe Grüße
Amalia
Dateianhänge
IMG_1233.jpeg
bigben
Beiträge: 2864
Registriert: Mi Okt 12, 2016 9:09 am

Re: Linearitätsannahme für multiple Regression überprüfen

Beitrag von bigben »

Hallo Amalia,

Plot 1 sieht sehr gut aus. Was ist denn mir dem Geschlecht in Plot 2 passiert? Warum gibt es da fünf Kategorien, von denen nur drei genutzt werden? Bei den weiteren frage ich mich, ob das Zahlen sind, die von 1 bis 5 reichen oder ob hier eigentlich 5 verschiedene Kategorien abgebildet werden sollten. Sieht soweit gut aus.

Und ja: Bei reinen Kontrollvariablen ist es egal, ob sie signifikant werden. Sie kontrollieren/korrigieren trotzdem.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
dieamalia
Beiträge: 3
Registriert: Sa Jul 06, 2024 9:52 am

Re: Linearitätsannahme für multiple Regression überprüfen

Beitrag von dieamalia »

Hallo Bernhard,

Danke für deine Antwort!
Bei Gender war 4 möchte keine Antwort geben und 5 war keine angabe gemacht (das war automatisch vom umfragetool). Ich habs nicht rausgelöscht, aber niemand hat es angekreuzt.
Die anderen sind Ratings von 1-5 (Likert Skalen)
Deiner Einschätzung nach ist die multiple Regression hier also i.O in diesem Punkt, also Linearitätsannahme soweit erfüllt?

Viele Grüße!
Benutzeravatar
student
Beiträge: 715
Registriert: Fr Okt 07, 2016 9:52 am

Re: Linearitätsannahme für multiple Regression überprüfen

Beitrag von student »

Hallo Amalia,

ich stolpere über Deine drängende Nachfrage, ob
...also Linearitätsannahme soweit erfüllt?
erfüllt ist und hier meine schnellen Gedanken dazu. Ich glaube, Du musst hier noch einmal einen Schritt zurück gehen. Du hast eine Fragestellung, formulierst eine Hypothese und vermutest einen linearen Zusammenhang zwischen einer Zielvariable und den Prädiktoren. Also vermutest Du einen linearen Zusammenhang und ob dieser vorliegt, ist eine Voraussetzung für Deinen gewählten Test.

Führst Du eine lineare Regressionsanalyse durch, zeigt Dir visuelle eine Grafik und die Parameter der Testdurchführung, ob Du von einem linearen Zusammenhang ausgehen kannst.

Deine Grafiken zeigen "nur" die Erfüllung der notwendigen Voraussetzungen zur linearen Regressionsanalyse: Die Normalverteilung des Fehlerterms e und Varianzhomogenität. Siehe dazu https://youtu.be/-Hdgw7RAYxA.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
dieamalia
Beiträge: 3
Registriert: Sa Jul 06, 2024 9:52 am

Re: Linearitätsannahme für multiple Regression überprüfen

Beitrag von dieamalia »

Hallo student,

Danke für den Videotipp. Ich glaub ich verstehe meinen Denkfehler nun etwas besser bzw. weiß, wo es an meiner Formulierung hakt. Meine nachfrage bezog sich darauf, ob eine lineare Regression, die einen linearen Zusammenhang annimmt als eine Voraussetzung (nicht z.B. einen kurvillinearen bzw. Einen der sich durch eine polynomiale Regression besser abbilden lässt) auf Basis der Grafiken das geeignete Mittel ist.
Anhand der Grafiken würde ich sagen, es ist gerechtfertigt
eine multiple Regression zu rechnen und dass ich keine Daten transformieren muss. Würdest du so zustimmen?

Oder was meinst du hiermit:
Führst Du eine lineare Regressionsanalyse durch, zeigt Dir visuelle eine Grafik und die Parameter der Testdurchführung, ob Du von einem linearen Zusammenhang ausgehen kannst.
-> Welche andere Grafik? Die hier sind mit den Residuen der AV. Und laut allem was ich dazu in Lehrbüchern und Internetquellen gefunden habe, sollte das die Grafik sein, von der du sprichst. NV hab ich mit QQplot überprüft. Multicollinearity über VIFs, Durbin Watson Test für Independence und Homoskedastizität über predicted vs. fitted plots des models (und auch die oben). Oder meinst du den Residuals vs Fitted Plot als die geeignete Grafik? Dort hab ich eine einigermaßen gerade rote Linie.

Viele Grüße und vielen Dank für eure Hilfe!
Benutzeravatar
student
Beiträge: 715
Registriert: Fr Okt 07, 2016 9:52 am

Re: Linearitätsannahme für multiple Regression überprüfen

Beitrag von student »

Hallo Amalia,

das hört sich ja schon gut an. Also, einer meiner ersten Schritte ist die Erstellung eines Streudiagramms zwischen Zielvariable und, ich nenne es mal so, meiner vermuteten Haupteinflussgröße. Lässt diese Grafik ein linearen Zusammenhang vermuten, ist das ein guter Hinweis.

Dann rechne ich, wie in Deinem Falle, ein multiples lineares Modell und schaue mir dann die geschätzten Parameter an. Wie sieht das Bestimmtheitsmaß aus, wie die Signifikanz der berücksichtigten Prädiktoren (hier gilt das Sparsamkeitsprinzip) und weitere Diagnostiken wie die Residuen-Verteilung.

Über diese Parameter kannst Du dann abschätzen, ob Dein Modell der Realität nahe kommt, d.h. ob die Annahme eines linearen Zusammenhangs gerechtfertigt ist. Du hast ja schon einige diagnostische Tests gemacht und mit deren Unterstützung, kannst Du sicher eine gesicherte Aussage zu Deinem Modell machen.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
bigben
Beiträge: 2864
Registriert: Mi Okt 12, 2016 9:09 am

Re: Linearitätsannahme für multiple Regression überprüfen

Beitrag von bigben »

Hi,
dieamalia hat geschrieben: So Jul 07, 2024 12:05 amDie anderen sind Ratings von 1-5 (Likert Skalen)
Also, ob das Wort Likert-Skala hier passt, kann man streiten: http://www.statistik-forum.de/nutzung-d ... t9192.html
Deiner Einschätzung nach ist die multiple Regression hier also i.O in diesem Punkt, also Linearitätsannahme soweit erfüllt?
Ja, Deine Residuenplots sehen sehr gut aus. Fast ein wenig zu gut, wenn der Haupteffekt und das Gesamtmodell dabei signifikant sind. Sind das simulierte oder echte Daten?

GLG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten