Hallo ihr Lieben,
Aktuell beschäftige ich mich mit einer linearen Regression, bei der ich ein Nullmodell, ein Baselinemodell mit Kovariaten und dann ein Finales Model mit meinen interessierenden UVs/Prädiktoren gefitted habe.
Jetzt möchte ich die Vorraussetzungen überprüfen. Bei Linearität bin ich mir nun unsicher.
Wenn ich das richtig verstanden habe, sollten bei den Boxplots die means um 0 herum sein und bei den Punktwolken ähnliche Verteilungen vorliegen. Da nirgendwo ein kurvillinearer Zusammenhang erkennbar ist, sollte meine Vorraussetzung nicht verletzt sein, oder? Das da eventuell kein wirklicher Zusammenhang ist bei Kovariaten ja dann eigentlich egal oder? Oder habe ich die plots falsch gemacht?
for (ind_var in c("v1", …)) {
plot(data[[ind_var]], residuals(modelfinal),
xlab = ind_var,
ylab = "Residuals",
main = paste("Residuals vs.", ind_var))
abline(h = 0, col = "red", lty = 2)
}
Wäre sehr dankbar für Tipps! Hab mir schon sehr viele YouTube Videos und Foren angeschaut, und bin mir leider trotzdem noch unsicher
Danke euch!
Liebe Grüße
Amalia
Linearitätsannahme für multiple Regression überprüfen
Moderator: EDi
Re: Linearitätsannahme für multiple Regression überprüfen
Hallo Amalia,
Plot 1 sieht sehr gut aus. Was ist denn mir dem Geschlecht in Plot 2 passiert? Warum gibt es da fünf Kategorien, von denen nur drei genutzt werden? Bei den weiteren frage ich mich, ob das Zahlen sind, die von 1 bis 5 reichen oder ob hier eigentlich 5 verschiedene Kategorien abgebildet werden sollten. Sieht soweit gut aus.
Und ja: Bei reinen Kontrollvariablen ist es egal, ob sie signifikant werden. Sie kontrollieren/korrigieren trotzdem.
LG,
Bernhard
Plot 1 sieht sehr gut aus. Was ist denn mir dem Geschlecht in Plot 2 passiert? Warum gibt es da fünf Kategorien, von denen nur drei genutzt werden? Bei den weiteren frage ich mich, ob das Zahlen sind, die von 1 bis 5 reichen oder ob hier eigentlich 5 verschiedene Kategorien abgebildet werden sollten. Sieht soweit gut aus.
Und ja: Bei reinen Kontrollvariablen ist es egal, ob sie signifikant werden. Sie kontrollieren/korrigieren trotzdem.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Linearitätsannahme für multiple Regression überprüfen
Hallo Bernhard,
Danke für deine Antwort!
Bei Gender war 4 möchte keine Antwort geben und 5 war keine angabe gemacht (das war automatisch vom umfragetool). Ich habs nicht rausgelöscht, aber niemand hat es angekreuzt.
Die anderen sind Ratings von 1-5 (Likert Skalen)
Deiner Einschätzung nach ist die multiple Regression hier also i.O in diesem Punkt, also Linearitätsannahme soweit erfüllt?
Viele Grüße!
Danke für deine Antwort!
Bei Gender war 4 möchte keine Antwort geben und 5 war keine angabe gemacht (das war automatisch vom umfragetool). Ich habs nicht rausgelöscht, aber niemand hat es angekreuzt.
Die anderen sind Ratings von 1-5 (Likert Skalen)
Deiner Einschätzung nach ist die multiple Regression hier also i.O in diesem Punkt, also Linearitätsannahme soweit erfüllt?
Viele Grüße!
Re: Linearitätsannahme für multiple Regression überprüfen
Hallo Amalia,
ich stolpere über Deine drängende Nachfrage, ob
Führst Du eine lineare Regressionsanalyse durch, zeigt Dir visuelle eine Grafik und die Parameter der Testdurchführung, ob Du von einem linearen Zusammenhang ausgehen kannst.
Deine Grafiken zeigen "nur" die Erfüllung der notwendigen Voraussetzungen zur linearen Regressionsanalyse: Die Normalverteilung des Fehlerterms e und Varianzhomogenität. Siehe dazu https://youtu.be/-Hdgw7RAYxA.
ich stolpere über Deine drängende Nachfrage, ob
erfüllt ist und hier meine schnellen Gedanken dazu. Ich glaube, Du musst hier noch einmal einen Schritt zurück gehen. Du hast eine Fragestellung, formulierst eine Hypothese und vermutest einen linearen Zusammenhang zwischen einer Zielvariable und den Prädiktoren. Also vermutest Du einen linearen Zusammenhang und ob dieser vorliegt, ist eine Voraussetzung für Deinen gewählten Test....also Linearitätsannahme soweit erfüllt?
Führst Du eine lineare Regressionsanalyse durch, zeigt Dir visuelle eine Grafik und die Parameter der Testdurchführung, ob Du von einem linearen Zusammenhang ausgehen kannst.
Deine Grafiken zeigen "nur" die Erfüllung der notwendigen Voraussetzungen zur linearen Regressionsanalyse: Die Normalverteilung des Fehlerterms e und Varianzhomogenität. Siehe dazu https://youtu.be/-Hdgw7RAYxA.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Re: Linearitätsannahme für multiple Regression überprüfen
Hallo student,
Danke für den Videotipp. Ich glaub ich verstehe meinen Denkfehler nun etwas besser bzw. weiß, wo es an meiner Formulierung hakt. Meine nachfrage bezog sich darauf, ob eine lineare Regression, die einen linearen Zusammenhang annimmt als eine Voraussetzung (nicht z.B. einen kurvillinearen bzw. Einen der sich durch eine polynomiale Regression besser abbilden lässt) auf Basis der Grafiken das geeignete Mittel ist.
Anhand der Grafiken würde ich sagen, es ist gerechtfertigt
eine multiple Regression zu rechnen und dass ich keine Daten transformieren muss. Würdest du so zustimmen?
Oder was meinst du hiermit:
Führst Du eine lineare Regressionsanalyse durch, zeigt Dir visuelle eine Grafik und die Parameter der Testdurchführung, ob Du von einem linearen Zusammenhang ausgehen kannst.
-> Welche andere Grafik? Die hier sind mit den Residuen der AV. Und laut allem was ich dazu in Lehrbüchern und Internetquellen gefunden habe, sollte das die Grafik sein, von der du sprichst. NV hab ich mit QQplot überprüft. Multicollinearity über VIFs, Durbin Watson Test für Independence und Homoskedastizität über predicted vs. fitted plots des models (und auch die oben). Oder meinst du den Residuals vs Fitted Plot als die geeignete Grafik? Dort hab ich eine einigermaßen gerade rote Linie.
Viele Grüße und vielen Dank für eure Hilfe!
Danke für den Videotipp. Ich glaub ich verstehe meinen Denkfehler nun etwas besser bzw. weiß, wo es an meiner Formulierung hakt. Meine nachfrage bezog sich darauf, ob eine lineare Regression, die einen linearen Zusammenhang annimmt als eine Voraussetzung (nicht z.B. einen kurvillinearen bzw. Einen der sich durch eine polynomiale Regression besser abbilden lässt) auf Basis der Grafiken das geeignete Mittel ist.
Anhand der Grafiken würde ich sagen, es ist gerechtfertigt
eine multiple Regression zu rechnen und dass ich keine Daten transformieren muss. Würdest du so zustimmen?
Oder was meinst du hiermit:
Führst Du eine lineare Regressionsanalyse durch, zeigt Dir visuelle eine Grafik und die Parameter der Testdurchführung, ob Du von einem linearen Zusammenhang ausgehen kannst.
-> Welche andere Grafik? Die hier sind mit den Residuen der AV. Und laut allem was ich dazu in Lehrbüchern und Internetquellen gefunden habe, sollte das die Grafik sein, von der du sprichst. NV hab ich mit QQplot überprüft. Multicollinearity über VIFs, Durbin Watson Test für Independence und Homoskedastizität über predicted vs. fitted plots des models (und auch die oben). Oder meinst du den Residuals vs Fitted Plot als die geeignete Grafik? Dort hab ich eine einigermaßen gerade rote Linie.
Viele Grüße und vielen Dank für eure Hilfe!
Re: Linearitätsannahme für multiple Regression überprüfen
Hallo Amalia,
das hört sich ja schon gut an. Also, einer meiner ersten Schritte ist die Erstellung eines Streudiagramms zwischen Zielvariable und, ich nenne es mal so, meiner vermuteten Haupteinflussgröße. Lässt diese Grafik ein linearen Zusammenhang vermuten, ist das ein guter Hinweis.
Dann rechne ich, wie in Deinem Falle, ein multiples lineares Modell und schaue mir dann die geschätzten Parameter an. Wie sieht das Bestimmtheitsmaß aus, wie die Signifikanz der berücksichtigten Prädiktoren (hier gilt das Sparsamkeitsprinzip) und weitere Diagnostiken wie die Residuen-Verteilung.
Über diese Parameter kannst Du dann abschätzen, ob Dein Modell der Realität nahe kommt, d.h. ob die Annahme eines linearen Zusammenhangs gerechtfertigt ist. Du hast ja schon einige diagnostische Tests gemacht und mit deren Unterstützung, kannst Du sicher eine gesicherte Aussage zu Deinem Modell machen.
das hört sich ja schon gut an. Also, einer meiner ersten Schritte ist die Erstellung eines Streudiagramms zwischen Zielvariable und, ich nenne es mal so, meiner vermuteten Haupteinflussgröße. Lässt diese Grafik ein linearen Zusammenhang vermuten, ist das ein guter Hinweis.
Dann rechne ich, wie in Deinem Falle, ein multiples lineares Modell und schaue mir dann die geschätzten Parameter an. Wie sieht das Bestimmtheitsmaß aus, wie die Signifikanz der berücksichtigten Prädiktoren (hier gilt das Sparsamkeitsprinzip) und weitere Diagnostiken wie die Residuen-Verteilung.
Über diese Parameter kannst Du dann abschätzen, ob Dein Modell der Realität nahe kommt, d.h. ob die Annahme eines linearen Zusammenhangs gerechtfertigt ist. Du hast ja schon einige diagnostische Tests gemacht und mit deren Unterstützung, kannst Du sicher eine gesicherte Aussage zu Deinem Modell machen.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Re: Linearitätsannahme für multiple Regression überprüfen
Hi,
GLG,
Bernhard
Also, ob das Wort Likert-Skala hier passt, kann man streiten: http://www.statistik-forum.de/nutzung-d ... t9192.html
Ja, Deine Residuenplots sehen sehr gut aus. Fast ein wenig zu gut, wenn der Haupteffekt und das Gesamtmodell dabei signifikant sind. Sind das simulierte oder echte Daten?Deiner Einschätzung nach ist die multiple Regression hier also i.O in diesem Punkt, also Linearitätsannahme soweit erfüllt?
GLG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte