Fehlender p-Value bei einer logistischen Regression
Verfasst: Sa Dez 09, 2017 9:14 pm
Hallo Zusammen,
da ich ein absoluter R-Neuling bin, benötige ich Hilfe bei der Durchführung einer logistischen Regression. Sollte dieser Beitrag an dieser Stelle unangemessen sein, bitte ich dies zu entschuldigen.
Im Rahmen meines Studiums führe ich eine Untersuchung hinsichtlich der Einflussfaktoren auf die Trefferwahrscheinlichkeit in K.O. Runden bei Elfmeterschießen im Fußball durch. Da die abhängige Variable ordinal skaliert ist (O= Treffer, 1= kein Treffer) möchte ich eine logistische Regression durchführen. Meine nicht metrischen Werte habe ich zuvor in Faktoren konvertiert. Sobald ich nun eine Auswahl meiner Variablen in die logistische Regression schicke, passiert Folgendes:
glm(formula = ï..Turnier ~ Alter + Anzahl_LÃ.nderspiele, family = binomial(logit),
data = Datenmatrix)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8901 -1.4750 0.8123 0.8691 0.9446
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.12239 1.45271 0.084 0.933
Alter 0.01924 0.05390 0.357 0.721
Anzahl_LÃ.nderspiele 0.01512 0.01365 1.108 0.268
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 181.53 on 149 degrees of freedom
Residual deviance: 179.74 on 147 degrees of freedom
AIC: 185.74
Number of Fisher Scoring iterations: 4
Zum Einen haben die beiden getesteten Variablen in diesem Fall keinen Einfluss (was ja auch tatsächlich sein kann) und zum Anderen bekomme ich keinen p-Value und kein R-squared etc. angezeigt. Sobald ich alle Variablen auf einmal teste steht in der Spalte Pr(>|z|) nur noch 0,99 oder 1,0, was ja auch nicht richtig sein kann. Mein Professor konnte mir diesbezüglich leider nicht weiterhelfen, er sagte, mein Datensatz sein okay und auch die Vorgehensweise ist korrekt. Aber irgendwas muss ich ja falsch machen..
Falls jemand eine Idee hat, bin ich über jeden Ratschlag und Tipp sehr dankbar!!!
da ich ein absoluter R-Neuling bin, benötige ich Hilfe bei der Durchführung einer logistischen Regression. Sollte dieser Beitrag an dieser Stelle unangemessen sein, bitte ich dies zu entschuldigen.
Im Rahmen meines Studiums führe ich eine Untersuchung hinsichtlich der Einflussfaktoren auf die Trefferwahrscheinlichkeit in K.O. Runden bei Elfmeterschießen im Fußball durch. Da die abhängige Variable ordinal skaliert ist (O= Treffer, 1= kein Treffer) möchte ich eine logistische Regression durchführen. Meine nicht metrischen Werte habe ich zuvor in Faktoren konvertiert. Sobald ich nun eine Auswahl meiner Variablen in die logistische Regression schicke, passiert Folgendes:
glm(formula = ï..Turnier ~ Alter + Anzahl_LÃ.nderspiele, family = binomial(logit),
data = Datenmatrix)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8901 -1.4750 0.8123 0.8691 0.9446
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.12239 1.45271 0.084 0.933
Alter 0.01924 0.05390 0.357 0.721
Anzahl_LÃ.nderspiele 0.01512 0.01365 1.108 0.268
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 181.53 on 149 degrees of freedom
Residual deviance: 179.74 on 147 degrees of freedom
AIC: 185.74
Number of Fisher Scoring iterations: 4
Zum Einen haben die beiden getesteten Variablen in diesem Fall keinen Einfluss (was ja auch tatsächlich sein kann) und zum Anderen bekomme ich keinen p-Value und kein R-squared etc. angezeigt. Sobald ich alle Variablen auf einmal teste steht in der Spalte Pr(>|z|) nur noch 0,99 oder 1,0, was ja auch nicht richtig sein kann. Mein Professor konnte mir diesbezüglich leider nicht weiterhelfen, er sagte, mein Datensatz sein okay und auch die Vorgehensweise ist korrekt. Aber irgendwas muss ich ja falsch machen..
Falls jemand eine Idee hat, bin ich über jeden Ratschlag und Tipp sehr dankbar!!!