Varianz Koeffizient 500 Probit Regressionen

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
Rularg
Beiträge: 2
Registriert: So Dez 08, 2019 4:00 pm

Varianz Koeffizient 500 Probit Regressionen

Beitrag von Rularg »

Hallo,

dies ist mein erster Post und ich bin mir nicht 100% sicher, ob das hier der richtige Bereich ist, falls nicht, möchte ich mich dafür schon vorher entschuldigen.
Zu meinem Problem:
Ich habe einen Datensatz von 50.000 Beobachtungen über eines Handy Service Providers. Der Datensatz soll als gesamte Population betrachtet werden.
Nun habe ich den Zusammenhang zwischen einer binären Variable (wurde in den letzten 90 Tagen der Provider gewechselt: Ja/Nein) und einer anderen Variable mittels Probit geschätzt und anschließend der Koeffizient, sowie seine Varianz abgespeichert.
Jetzt habe ich mittels einer Schleife 500 Stichproben von 25.000 Beobachtungen aus dem Datensatz gezogen und für jeden einzelnen die selben Berechnungen durchgeführt und alle berechneten Regressionskoeffizienten in einem Vektor abgespeichert.
Von diesen 500 Beobachtungen habe ich nun mittels der Funktion density() die Dichtefunktion plotten lassen. Das Ergebnis (inklusive Mittelwert im Vergleich zum "wahren Koeffizienten", welcher mit allen Beobachtungen berechnet wurde) erscheint plausibel, es entspricht (wie ich erwartet hatte) ANNÄHERND einer Normalverteilung.
Nun zu meinem Problem: ich möchte nun den selben Vergleich mit der Varianz für den Koeffizienten durchführen. Ich stehe aber absolut auf dem Schlauch, wie ich die Varianz bestimmen kann. Ich könnte z.B. die gängige Formel für die Stichprobenvarianz verwenden, allerdings glaube ich nicht, dass das in diesem Fall korrekt wäre. Gibt es eventuell eine Möglichkeit, sich mit der Funktion density() zusätzlich zu den automatisch angezeigten Werten ebenfalls die Varianz anzeigen zu lassen? In der Dokumentation konnte ich dazu nichts finden.
Falls dies nicht möglich sein sollte, bin ich für jeden Hinweis sehr dankbar.
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Varianz Koeffizient 500 Probit Regressionen

Beitrag von EDi »

Nimm doch einfach die Varianz deiner 500 bootstraps?

?var
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Rularg
Beiträge: 2
Registriert: So Dez 08, 2019 4:00 pm

Re: Varianz Koeffizient 500 Probit Regressionen

Beitrag von Rularg »

Vielen Dank für Deine Antwort.
Es geht in unserer Aufgabe wohl darum, zunächst das gesamte Sample als "wahren Zusammenhang" zu sehen, vorher eine Verteilung für die mittels Maximum Likelihood ermittelten Koeffizienten zu vermuten (Asymptotisch normal mit Erwartungswert und Varianz dessen, was wir mittels der geschätzten Regression für das gesamte Sample dann erhalten) und anschließend mittels der Stichproben zu überprüfen. Dabei ist eben wichtig (wieso auch immer), das wir das alles von Hand berechnen und nicht auf diese Funktionen zurückgreifen. Aber nur um hier sicher zu gehen: die Funktion var() verwendet die Stichprobenvarianzformel, oder? Also die Summe der Differenz aller Beobachtungen abzüglich des Mittelwertes quadriert und anschließend durch die Anzahl der Beobachtungen (abzüglich der Freiheitsgrade) geteilt? Ich war mir in diesem Fall nicht sicher, ob es richtig ist diese Formel hier anzuwenden, da in unserer Aufgabenstellung explizit angesprochen wird, dass man eine sinnvolle Methode zur Varianzbestimmung auswählen und diese begründen solle. Ich hatte mir hier schon über die Delta Methode Gedanken gemacht (wie zur Bestimmung der Varianz von average marginal probability effects), aber so richtig Sinn ergab das für mich wiederum auch nicht.
Antworten