Da einem die besten Ideen ja... später kommen.
Ich hab' mal die Zuordnung Tabellenplatz zu Liga erstellt, also:
y := Tabellenplatz = 1, 2, ... , 56
x := Liga = 1, ... ,1, 2, ... , 2, 3, ... , 3
Im Prinzip also eine Null-Information.
Und damit eine lineare Regression in R durchgeführt:
Code: Alles auswählen
Tabellenplatz <- 1:56
Liga <- c(rep(1, times=18), rep(2, times=18), rep(3, times=20))
result <- lm(Tabellenplatz ~ Liga)
summary(result)
Code: Alles auswählen
Call:
lm(formula = Tabellenplatz ~ Liga)
Residuals:
Min 1Q Median 3Q Max
-9.3475 -4.4703 -0.0847 4.6568 9.6525
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -9.178 1.963 -4.675 2e-05 ***
Liga 18.509 0.894 20.702 <2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 5.506 on 54 degrees of freedom
Multiple R-squared: 0.8881, Adjusted R-squared: 0.886
F-statistic: 428.6 on 1 and 54 DF, p-value: < 2.2e-16
Ergibt ein r^2 von 0,88... - Mit ohne irgendwas. Wenn ich jetzt irgendwelche Zufallsgrößen hinzufüge - Anzahl der Vereinsmitglieder, Gründungsjahr, PLZ, der 2. Stelle der PLZ, Rang des ersten Buchstaben der Adresse der Vereinsheims, des 2. Buchstabens, des 3., ... - werde ich (mit positiver Wahrscheinlichkeit) auf eine höheres r^2 kommen (weniger geht nicht).
Dank&Gruß
schubbiaschwilli
P.S.: Lineare Regressionen machen Spaß, ich lerne gerade.