Varianz Koeffizient 500 Probit Regressionen
Verfasst: So Dez 08, 2019 4:15 pm
Hallo,
dies ist mein erster Post und ich bin mir nicht 100% sicher, ob das hier der richtige Bereich ist, falls nicht, möchte ich mich dafür schon vorher entschuldigen.
Zu meinem Problem:
Ich habe einen Datensatz von 50.000 Beobachtungen über eines Handy Service Providers. Der Datensatz soll als gesamte Population betrachtet werden.
Nun habe ich den Zusammenhang zwischen einer binären Variable (wurde in den letzten 90 Tagen der Provider gewechselt: Ja/Nein) und einer anderen Variable mittels Probit geschätzt und anschließend der Koeffizient, sowie seine Varianz abgespeichert.
Jetzt habe ich mittels einer Schleife 500 Stichproben von 25.000 Beobachtungen aus dem Datensatz gezogen und für jeden einzelnen die selben Berechnungen durchgeführt und alle berechneten Regressionskoeffizienten in einem Vektor abgespeichert.
Von diesen 500 Beobachtungen habe ich nun mittels der Funktion density() die Dichtefunktion plotten lassen. Das Ergebnis (inklusive Mittelwert im Vergleich zum "wahren Koeffizienten", welcher mit allen Beobachtungen berechnet wurde) erscheint plausibel, es entspricht (wie ich erwartet hatte) ANNÄHERND einer Normalverteilung.
Nun zu meinem Problem: ich möchte nun den selben Vergleich mit der Varianz für den Koeffizienten durchführen. Ich stehe aber absolut auf dem Schlauch, wie ich die Varianz bestimmen kann. Ich könnte z.B. die gängige Formel für die Stichprobenvarianz verwenden, allerdings glaube ich nicht, dass das in diesem Fall korrekt wäre. Gibt es eventuell eine Möglichkeit, sich mit der Funktion density() zusätzlich zu den automatisch angezeigten Werten ebenfalls die Varianz anzeigen zu lassen? In der Dokumentation konnte ich dazu nichts finden.
Falls dies nicht möglich sein sollte, bin ich für jeden Hinweis sehr dankbar.
dies ist mein erster Post und ich bin mir nicht 100% sicher, ob das hier der richtige Bereich ist, falls nicht, möchte ich mich dafür schon vorher entschuldigen.
Zu meinem Problem:
Ich habe einen Datensatz von 50.000 Beobachtungen über eines Handy Service Providers. Der Datensatz soll als gesamte Population betrachtet werden.
Nun habe ich den Zusammenhang zwischen einer binären Variable (wurde in den letzten 90 Tagen der Provider gewechselt: Ja/Nein) und einer anderen Variable mittels Probit geschätzt und anschließend der Koeffizient, sowie seine Varianz abgespeichert.
Jetzt habe ich mittels einer Schleife 500 Stichproben von 25.000 Beobachtungen aus dem Datensatz gezogen und für jeden einzelnen die selben Berechnungen durchgeführt und alle berechneten Regressionskoeffizienten in einem Vektor abgespeichert.
Von diesen 500 Beobachtungen habe ich nun mittels der Funktion density() die Dichtefunktion plotten lassen. Das Ergebnis (inklusive Mittelwert im Vergleich zum "wahren Koeffizienten", welcher mit allen Beobachtungen berechnet wurde) erscheint plausibel, es entspricht (wie ich erwartet hatte) ANNÄHERND einer Normalverteilung.
Nun zu meinem Problem: ich möchte nun den selben Vergleich mit der Varianz für den Koeffizienten durchführen. Ich stehe aber absolut auf dem Schlauch, wie ich die Varianz bestimmen kann. Ich könnte z.B. die gängige Formel für die Stichprobenvarianz verwenden, allerdings glaube ich nicht, dass das in diesem Fall korrekt wäre. Gibt es eventuell eine Möglichkeit, sich mit der Funktion density() zusätzlich zu den automatisch angezeigten Werten ebenfalls die Varianz anzeigen zu lassen? In der Dokumentation konnte ich dazu nichts finden.
Falls dies nicht möglich sein sollte, bin ich für jeden Hinweis sehr dankbar.