Multiple Regression mit Jahres- und Teamdummies

schubbiaschwilli · Beitrag von **schubbiaschwilli** » Sa Jan 05, 2019 2:28 am

Gude!

Da einem die besten Ideen ja... später kommen.

Ich hab' mal die Zuordnung Tabellenplatz zu Liga erstellt, also:
y := Tabellenplatz = 1, 2, ... , 56
x := Liga = 1, ... ,1, 2, ... , 2, 3, ... , 3

Im Prinzip also eine Null-Information.

Und damit eine lineare Regression in R durchgeführt:

Code: Alles auswählen

Tabellenplatz <- 1:56
Liga <- c(rep(1, times=18), rep(2, times=18), rep(3, times=20))

result <- lm(Tabellenplatz ~ Liga)

summary(result)

Ergebnis:

Code: Alles auswählen

Call:
lm(formula = Tabellenplatz ~ Liga)

Residuals:
    Min      1Q  Median      3Q     Max 
-9.3475 -4.4703 -0.0847  4.6568  9.6525 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   -9.178      1.963  -4.675    2e-05 ***
Liga          18.509      0.894  20.702   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5.506 on 54 degrees of freedom
Multiple R-squared:  0.8881,    Adjusted R-squared:  0.886 
F-statistic: 428.6 on 1 and 54 DF,  p-value: < 2.2e-16

(Kann das bitte mal jemand verifizieren?)

Ergibt ein r^2 von 0,88... - Mit ohne irgendwas. Wenn ich jetzt irgendwelche Zufallsgrößen hinzufüge - Anzahl der Vereinsmitglieder, Gründungsjahr, PLZ, der 2. Stelle der PLZ, Rang des ersten Buchstaben der Adresse der Vereinsheims, des 2. Buchstabens, des 3., ... - werde ich (mit positiver Wahrscheinlichkeit) auf eine höheres r^2 kommen (weniger geht nicht).

Dank&Gruß
schubbiaschwilli

P.S.: Lineare Regressionen machen Spaß, ich lerne gerade.

Beitrag von **EDi** » Sa Jan 05, 2019 11:40 am

(Kann das bitte mal jemand verifizieren?)

Ergibt ein r^2 von 0,88... - Mit ohne irgendwas. Wenn ich jetzt irgendwelche Zufallsgrößen hinzufüge - Anzahl der Vereinsmitglieder, Gründungsjahr, PLZ, der 2. Stelle der PLZ, Rang des ersten Buchstaben der Adresse der Vereinsheims, des 2. Buchstabens, des 3., ... - werde ich (mit positiver Wahrscheinlichkeit) auf eine höheres r^2 kommen (weniger geht nicht).

Macht soweit alles Sinn.

Zeigt aber auch das R2 alleine betrachtet nicht gut geeignet ist um ein gutes Model anzuzeigen. Wobei "gut" auch vom Ziel des Models abhängt.

schubbiaschwilli · Sa Jan 05, 2019 12:58 pm

Gude!

Sicher kann man sich über das r^2 streiten, aber der Knackpunkt sind die verletzten Voraussetzungen - Die abhängige Variable muss nun mal metrisch sein.

Dank&Gruß
schubbiaschwilli

Deutsches R-Forum

Multiple Regression mit Jahres- und Teamdummies

Re: Multiple Regression mit Jahres- und Teamdummies

Re: Multiple Regression mit Jahres- und Teamdummies

Re: Multiple Regression mit Jahres- und Teamdummies