Homoskedastizität bptest / gqtest

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
Ries
Beiträge: 6
Registriert: Di Aug 06, 2019 7:32 pm

Homoskedastizität bptest / gqtest

Beitrag von Ries »

Hallo zusammen,
ich habe einen Stichprobenumfang von ca. 250.000 Datensätzen und möchte nun auf Homoskedastizität prüfen. Der gqtest wirft mir einen p-wert von 0,319 aus also die Bestätigung der Homoskedastizität. Beim bptest erhalte ich allerdings einen p-wert < 2.2e-16 und somit würde Heteroskedastizität vorliegen.

Der Plot sieht wie folgt aus:

Bild

Was ist denn nun richtig, um die Nullhypothese von Homoskedastizität zu bestätigen?
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Homoskedastizität bptest / gqtest

Beitrag von EDi »

Da sind schon (kleinere) Muster zu erkennen:

* wellenmuster maximum residuen - hast du irgendwelche hypothesen dafür (z.b. jahreszeit, Nutzergruppen, etc) und lohnt es sich diese ins model zu nehmen?
* "Fahnenmuster" links unten - das kommt machmal wenn es eine untere Grenze gibt unter welche die Daten nicht gehen können (z.b. kann eine Konzentration nicht negativ werden) - hast die irgendwelche hypothesen dafür und lohnt es sich diese ins model zu nehmen?
* Es scheint auch eine nicht-linearität drinzu sein - Mittelwert der residuen geht nach unten?

Wie gesagt, alles kleinere/minimale Muster. Kommt drauf an was du mit dem Modell anstellen willst obes gut genug für dich ist...
Bei der Datenmenge würde ich gar keine tests / p-werte anschauen, sonder grafisch bzw. mit hold-outs arbeiten...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Homoskedastizität bptest / gqtest

Beitrag von student »

Hallo Ries,

beide Tests haben einen funktional unterschiedlichen Ansatz, siehe hier für bptest und für gqtest. Wenn Du eine Regression schätzen möchtest und über die "Form" der Heteroskedastizität (ich breche mir immer die Finger ab ;) )nichts bekannt ist, hilft vielleicht die Funktion hccm() des car-Paketes weiter.

@Edi, ich bin begeistert, was Du alles siehst! ;)
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Homoskedastizität bptest / gqtest

Beitrag von EDi »

@Edi, ich bin begeistert, was Du alles siehst! ;)
Ich bin immer auch der Suche nach dem allerbesten Model :lol:

Die Muster sind minimal (relativ zum Datenumfang), und vermutlich nicht von Belange für die Fragestellung - aber ich weiß ja nicht was der Fragensteller vorhat...

Man kann die Muster aber erkennen (es ist kein "Sternenhimmel") und wenn man die Daten kennt kann man vermutlich Schlüsse daraus ziehen. Residuen sind sehr informativ! [Viel informativer als ein blöder p-Wert]
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Ries
Beiträge: 6
Registriert: Di Aug 06, 2019 7:32 pm

Re: Homoskedastizität bptest / gqtest

Beitrag von Ries »

EDi hat geschrieben: So Dez 22, 2019 8:49 pm Da sind schon (kleinere) Muster zu erkennen:

* wellenmuster maximum residuen - hast du irgendwelche hypothesen dafür (z.b. jahreszeit, Nutzergruppen, etc) und lohnt es sich diese ins model zu nehmen?
* "Fahnenmuster" links unten - das kommt machmal wenn es eine untere Grenze gibt unter welche die Daten nicht gehen können (z.b. kann eine Konzentration nicht negativ werden) - hast die irgendwelche hypothesen dafür und lohnt es sich diese ins model zu nehmen?
* Es scheint auch eine nicht-linearität drinzu sein - Mittelwert der residuen geht nach unten?

Wie gesagt, alles kleinere/minimale Muster. Kommt drauf an was du mit dem Modell anstellen willst obes gut genug für dich ist...
Bei der Datenmenge würde ich gar keine tests / p-werte anschauen, sonder grafisch bzw. mit hold-outs arbeiten...
Hallo EDi, danke für die Rückmeldung.
Der RESET-Test führt auch zu dem Ergebnis, dass keine Linearität vorliegt. Ich glaube, ich nehme nur einen Auszug von 500 Datensätzen aus dem gesamten Sample. Damit würde ich alle Tests bestehen und meine Regressionsgleichung wäre gültig... Das Regressionsmodell ist auch nicht kriegsentscheidend. Das ganze dient nur als Nachweis, dass man praktisch mit R arbeiten kann.
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Homoskedastizität bptest / gqtest

Beitrag von EDi »

Das ganze dient nur als Nachweis, dass man praktisch mit R arbeiten kann.
Das hätte ich dir auch schon vorher sagen können, dass R für praktische Arbeiten geeignet ist :lol: :lol: :lol:
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten