Multiple Regression mit Jahres- und Teamdummies

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Multiple Regression mit Jahres- und Teamdummies

Beitrag von schubbiaschwilli »

Gude!

Da einem die besten Ideen ja... später kommen.

Ich hab' mal die Zuordnung Tabellenplatz zu Liga erstellt, also:
y := Tabellenplatz = 1, 2, ... , 56
x := Liga = 1, ... ,1, 2, ... , 2, 3, ... , 3

Im Prinzip also eine Null-Information.

Und damit eine lineare Regression in R durchgeführt:

Code: Alles auswählen

Tabellenplatz <- 1:56
Liga <- c(rep(1, times=18), rep(2, times=18), rep(3, times=20))

result <- lm(Tabellenplatz ~ Liga)

summary(result)
Ergebnis:

Code: Alles auswählen

Call:
lm(formula = Tabellenplatz ~ Liga)

Residuals:
    Min      1Q  Median      3Q     Max 
-9.3475 -4.4703 -0.0847  4.6568  9.6525 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   -9.178      1.963  -4.675    2e-05 ***
Liga          18.509      0.894  20.702   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 5.506 on 54 degrees of freedom
Multiple R-squared:  0.8881,    Adjusted R-squared:  0.886 
F-statistic: 428.6 on 1 and 54 DF,  p-value: < 2.2e-16
(Kann das bitte mal jemand verifizieren?)

Ergibt ein r^2 von 0,88... - Mit ohne irgendwas. Wenn ich jetzt irgendwelche Zufallsgrößen hinzufüge - Anzahl der Vereinsmitglieder, Gründungsjahr, PLZ, der 2. Stelle der PLZ, Rang des ersten Buchstaben der Adresse der Vereinsheims, des 2. Buchstabens, des 3., ... - werde ich (mit positiver Wahrscheinlichkeit) auf eine höheres r^2 kommen (weniger geht nicht).

Dank&Gruß
schubbiaschwilli

P.S.: Lineare Regressionen machen Spaß, ich lerne gerade.
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Multiple Regression mit Jahres- und Teamdummies

Beitrag von EDi »

(Kann das bitte mal jemand verifizieren?)

Ergibt ein r^2 von 0,88... - Mit ohne irgendwas. Wenn ich jetzt irgendwelche Zufallsgrößen hinzufüge - Anzahl der Vereinsmitglieder, Gründungsjahr, PLZ, der 2. Stelle der PLZ, Rang des ersten Buchstaben der Adresse der Vereinsheims, des 2. Buchstabens, des 3., ... - werde ich (mit positiver Wahrscheinlichkeit) auf eine höheres r^2 kommen (weniger geht nicht).
Macht soweit alles Sinn.

Zeigt aber auch das R2 alleine betrachtet nicht gut geeignet ist um ein gutes Model anzuzeigen. Wobei "gut" auch vom Ziel des Models abhängt.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Multiple Regression mit Jahres- und Teamdummies

Beitrag von schubbiaschwilli »

Gude!

Sicher kann man sich über das r^2 streiten, aber der Knackpunkt sind die verletzten Voraussetzungen - Die abhängige Variable muss nun mal metrisch sein.

Dank&Gruß
schubbiaschwilli
Antworten