Fehlender p-Value bei einer logistischen Regression

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
Hesave

Fehlender p-Value bei einer logistischen Regression

Beitrag von Hesave »

Hallo Zusammen,

da ich ein absoluter R-Neuling bin, benötige ich Hilfe bei der Durchführung einer logistischen Regression. Sollte dieser Beitrag an dieser Stelle unangemessen sein, bitte ich dies zu entschuldigen.

Im Rahmen meines Studiums führe ich eine Untersuchung hinsichtlich der Einflussfaktoren auf die Trefferwahrscheinlichkeit in K.O. Runden bei Elfmeterschießen im Fußball durch. Da die abhängige Variable ordinal skaliert ist (O= Treffer, 1= kein Treffer) möchte ich eine logistische Regression durchführen. Meine nicht metrischen Werte habe ich zuvor in Faktoren konvertiert. Sobald ich nun eine Auswahl meiner Variablen in die logistische Regression schicke, passiert Folgendes:

glm(formula = ï..Turnier ~ Alter + Anzahl_LÃ.nderspiele, family = binomial(logit),
data = Datenmatrix)

Deviance Residuals:
Min 1Q Median 3Q Max
-1.8901 -1.4750 0.8123 0.8691 0.9446

Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.12239 1.45271 0.084 0.933
Alter 0.01924 0.05390 0.357 0.721
Anzahl_LÃ.nderspiele 0.01512 0.01365 1.108 0.268

(Dispersion parameter for binomial family taken to be 1)

Null deviance: 181.53 on 149 degrees of freedom
Residual deviance: 179.74 on 147 degrees of freedom
AIC: 185.74

Number of Fisher Scoring iterations: 4

Zum Einen haben die beiden getesteten Variablen in diesem Fall keinen Einfluss (was ja auch tatsächlich sein kann) und zum Anderen bekomme ich keinen p-Value und kein R-squared etc. angezeigt. Sobald ich alle Variablen auf einmal teste steht in der Spalte Pr(>|z|) nur noch 0,99 oder 1,0, was ja auch nicht richtig sein kann. Mein Professor konnte mir diesbezüglich leider nicht weiterhelfen, er sagte, mein Datensatz sein okay und auch die Vorgehensweise ist korrekt. Aber irgendwas muss ich ja falsch machen..

Falls jemand eine Idee hat, bin ich über jeden Ratschlag und Tipp sehr dankbar!!!
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Fehlender p-Value bei einer logistischen Regression

Beitrag von student »

Hallo Hesave,

Du kennst da ja, ohne einem Datenbeispiel ist es schwierig, das Modell zu beurteilen (Shit in -> Modell -> Shit out). Bemerkenswert finde ich auch...
Mein Professor konnte mir diesbezüglich leider nicht weiterhelfen, er sagte, mein Datensatz sein okay und auch die Vorgehensweise ist korrekt.
... aber vielleicht gehört das ja zur Aufgabe? ;)

Zur logistischen Regression habe ich hier mal etwas gemacht. Vielleicht hilft es ein wenig weiter...

Ach ja, der Titel ist verwirrend. Und vielleicht stellst Du beim nächsten Post den Code formatiert dar?
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Fehlender p-Value bei einer logistischen Regression

Beitrag von EDi »

Sobald ich alle Variablen auf einmal teste steht in der Spalte Pr(>|z|) nur noch 0,99 oder 1,0, was ja auch nicht richtig sein kann.
Kann schon sein: Ich vermute, dass Alter und Anzahl der Spiele hochgradig kolinear sind.
Dann kann das Modell die Koeffizienten nicht stabil schätzen (weil es eigentlich nur einer ist) und du bekommst die Antwort auf die Frage:"Wenn ich Alter/Anzahl kenne, was lerne ich aus Anzahl/Alter noch zusätzlich?" Da bei die selbe Information in beiden enthalten, ist das nicht viel und die p-Werte werden entsprechend groß.
zum Anderen bekomme ich keinen p-Value und kein R-squared etc. angezeigt.
p-Werte für die Koeffizienten sind doch da?!
R2 gibt es nicht für logistische Modelle, nur eine pseudoR2 (aus der Devianz).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten