Seite 1 von 1

Breusch Pagan Test

Verfasst: Mi Nov 13, 2019 5:01 pm
von MarinaGrey02
Hallo,

ich bin gerade dabei meine Regression auf Heteroskedasticity mithilfe des Breusch Pagan Tests zu überprüfen.
Könnte mir jemand vielleicht den Unterschied zwischen studentized Breusch Pagan und Breusch Pagan erklären?

Bei R habe ich mir das Package "lmtest" heruntergeladen und mit der Funktion "bp.test()" weitergearbeitet.

Wenn ich nicht weiter eingebe als bp.test("meine regression") bekomme ich den standardized Breusch Pagan Test mit einem p-Value von 0.885 und sobald ich bp.test("meine regression", studentized = FALSE) eingebe, bekomme ich einen p-Value von 0,0002. Was ist denn nun richtig, um die Nullhypothese von Homoskedasticity abzulehnen/zu bestätigen?

Liebe Grüße

Re: Breusch Pagan Test

Verfasst: Mi Nov 13, 2019 7:45 pm
von EDi
Was ist denn nun richtig, um die Nullhypothese von Homoskedasticity abzulehnen/zu bestätigen?
Weißt du denn was der unterschied ist? Siehe z.b. hier...


Ich bin generell kein Freund von solchen Tests und bevorzuge eine grafische Diagnose. Hast du dir mal den plot aus fitted-values vs residuals angeschaut? Sieht man da eine Heteroskedasticität?

Re: Breusch Pagan Test

Verfasst: Fr Nov 15, 2019 10:10 am
von student
Hallo Marina,

ich habe zur Homoskedastizität (Varianzhomogenität) / Heteroskedastizität mal hier etwas mit mehr Prosa gemacht.

Re: Breusch Pagan Test

Verfasst: Fr Nov 15, 2019 10:55 am
von MarinaGrey02
Hallo nochmal,

also ich werde jetzt den studentized Breusch Pagan Test zur Überprüfung von Heteroskedastizität nutzen.
Da der p-value bei 0,833 (also größer als 5 Prozent) liegt, kann die Nullhypothese von Homoskedastizität nicht abgelehnt werden und somit liegt keine Heteroskedastizität vor.

Anbei noch einmal eine Grafik mit den residuals vs. fitted
residuals vs fitted.png
Habe ich das richtig interpretiert?

LG

Re: Breusch Pagan Test

Verfasst: Fr Nov 15, 2019 12:16 pm
von bigben
Wenn ich das richtig sehe, dann hast Du da weit über 1400 Beobachtungen. Die lassen sich in diesem Plot natürlich nicht mehr einzeln verfolgen und wahrscheinlich scheint die Streuung in der Mitte nur etwas breiter, weil da halt mehr Punkte sind und deshalb Extreme häufiger vorkommen.
Anders gesagt: Wenn der Test bei sovielen Datensätzen so weit weg von signifikant ist, dann ist da auch nichts.

Ich würde Deiner linearen Regression in Sachen Homoskedastizität jederzeit vertrauen.

Datensatz Nr 76 würde ich mir nochmal genau anschauen, ob da nicht vielleicht ein Tippfehler beim Erfassen passiert ist oder ob es irgendeinen anderen erkennbaren Grund gibt, warum der anders ist. Frei nach dem Motto: "Immer wenn ich einen Ausreißer sehe weiß ich nicht, ob ich ihn löschen oder patentieren lassen soll."

LG,
Bernhard