Hallo Zusammen,
da ich ein absoluter R-Neuling bin, benötige ich Hilfe bei der Durchführung einer logistischen Regression. Sollte dieser Beitrag an dieser Stelle unangemessen sein, bitte ich dies zu entschuldigen.
Im Rahmen meines Studiums führe ich eine Untersuchung hinsichtlich der Einflussfaktoren auf die Trefferwahrscheinlichkeit in K.O. Runden bei Elfmeterschießen im Fußball durch. Da die abhängige Variable ordinal skaliert ist (O= Treffer, 1= kein Treffer) möchte ich eine logistische Regression durchführen. Meine nicht metrischen Werte habe ich zuvor in Faktoren konvertiert. Sobald ich nun eine Auswahl meiner Variablen in die logistische Regression schicke, passiert Folgendes:
glm(formula = ï..Turnier ~ Alter + Anzahl_LÃ.nderspiele, family = binomial(logit),
data = Datenmatrix)
Deviance Residuals:
Min 1Q Median 3Q Max
-1.8901 -1.4750 0.8123 0.8691 0.9446
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 0.12239 1.45271 0.084 0.933
Alter 0.01924 0.05390 0.357 0.721
Anzahl_LÃ.nderspiele 0.01512 0.01365 1.108 0.268
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 181.53 on 149 degrees of freedom
Residual deviance: 179.74 on 147 degrees of freedom
AIC: 185.74
Number of Fisher Scoring iterations: 4
Zum Einen haben die beiden getesteten Variablen in diesem Fall keinen Einfluss (was ja auch tatsächlich sein kann) und zum Anderen bekomme ich keinen p-Value und kein R-squared etc. angezeigt. Sobald ich alle Variablen auf einmal teste steht in der Spalte Pr(>|z|) nur noch 0,99 oder 1,0, was ja auch nicht richtig sein kann. Mein Professor konnte mir diesbezüglich leider nicht weiterhelfen, er sagte, mein Datensatz sein okay und auch die Vorgehensweise ist korrekt. Aber irgendwas muss ich ja falsch machen..
Falls jemand eine Idee hat, bin ich über jeden Ratschlag und Tipp sehr dankbar!!!
Fehlender p-Value bei einer logistischen Regression
Moderator: EDi
Re: Fehlender p-Value bei einer logistischen Regression
Hallo Hesave,
Du kennst da ja, ohne einem Datenbeispiel ist es schwierig, das Modell zu beurteilen (Shit in -> Modell -> Shit out). Bemerkenswert finde ich auch...
Zur logistischen Regression habe ich hier mal etwas gemacht. Vielleicht hilft es ein wenig weiter...
Ach ja, der Titel ist verwirrend. Und vielleicht stellst Du beim nächsten Post den Code formatiert dar?
Du kennst da ja, ohne einem Datenbeispiel ist es schwierig, das Modell zu beurteilen (Shit in -> Modell -> Shit out). Bemerkenswert finde ich auch...
... aber vielleicht gehört das ja zur Aufgabe?Mein Professor konnte mir diesbezüglich leider nicht weiterhelfen, er sagte, mein Datensatz sein okay und auch die Vorgehensweise ist korrekt.
Zur logistischen Regression habe ich hier mal etwas gemacht. Vielleicht hilft es ein wenig weiter...
Ach ja, der Titel ist verwirrend. Und vielleicht stellst Du beim nächsten Post den Code formatiert dar?
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Re: Fehlender p-Value bei einer logistischen Regression
Kann schon sein: Ich vermute, dass Alter und Anzahl der Spiele hochgradig kolinear sind.Sobald ich alle Variablen auf einmal teste steht in der Spalte Pr(>|z|) nur noch 0,99 oder 1,0, was ja auch nicht richtig sein kann.
Dann kann das Modell die Koeffizienten nicht stabil schätzen (weil es eigentlich nur einer ist) und du bekommst die Antwort auf die Frage:"Wenn ich Alter/Anzahl kenne, was lerne ich aus Anzahl/Alter noch zusätzlich?" Da bei die selbe Information in beiden enthalten, ist das nicht viel und die p-Werte werden entsprechend groß.
p-Werte für die Koeffizienten sind doch da?!zum Anderen bekomme ich keinen p-Value und kein R-squared etc. angezeigt.
R2 gibt es nicht für logistische Modelle, nur eine pseudoR2 (aus der Devianz).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.