Seite 1 von 1

Regressionsmodelle - Hilfe !

Verfasst: Fr Apr 23, 2021 9:47 pm
von vananh97
Hallo,

für mein Seminararbeit in der Uni soll ich folgende Modelle zu den Umsteigezeiten von ÖVPN untersuchen. Da ich vorher noch nie was mit R Studio zu tun habe, weiß ich nicht wo ich anfangen sollen.

Code: Alles auswählen

library(stargazer)
library(ggplot2)

aee <- read_excel("Access_Egress_Exp_2019_01_09.xlsx")
names(aee)
summary(aee)
aee$exp <- as.factor(aee$comments)
levels(aee$exp) <- c("1","2","3","4","5","6")

m1 <- lm(Time_Sec ~ Total, aee)
summary(m1)

m2 <- lm(Time_Sec ~ Access, aee)
summary(m2)

m3 <- lm(Time_Sec ~ Access + Egress, aee)
summary(m3)

m4 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1), aee)
summary(m4)

m5 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m5)

m6 <- lm(log(Time_Sec) ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m6)

sink("results.html")
stargazer(m1,m2,m3,m4,m5, no.space=T, type="html")
sink()

ggplot(aee, aes(x=Time_Sec)) + 
  geom_histogram(aes(y=..density..), colour="black", fill="white", binwidth = .25)+
  geom_density(alpha=.2, fill="#FF6666")
 
Ich habe schon einige Einführungsvideos angeschaut und bin nicht wirklich schlauer geworden. Zwar kann ich durch den summary Befehl einige Daten aufrufen, aber die Zusammenhänge von Modell 4, 5 und 6 verstehe ich nicht ganz. Was bedeutet poly(...,3) ? Auf die Frage will mein Prof nicht eingehen, da er der Meinung ist, dass man googlen kann.

Außerdem wird von mir erwartet, dass ich die Modelle testen soll, ob die Modelle/ welche gut funktionieren. Wie sehen die Vorhersagequalitäten aus und ob die sich noch verbessern lässt (K-fold cross validation). Zu dem meinte mein Prof, dass es dafür gut dokumentierte Packages, aber welche will er mir nicht verraten.

Könnt ihr mir bitte helfen?
Vielen Dank.

Re: Regressionsmodelle - Hilfe !

Verfasst: Fr Apr 23, 2021 10:14 pm
von bigben
vananh97 hat geschrieben: Fr Apr 23, 2021 9:47 pm Hallo,

für mein Seminararbeit in der Uni soll ich folgende Modelle zu den Umsteigezeiten von ÖVPN untersuchen. Da ich vorher noch nie was mit R Studio zu tun habe, weiß ich nicht wo ich anfangen sollen.

Code: Alles auswählen

library(stargazer)
library(ggplot2)

aee <- read_excel("Access_Egress_Exp_2019_01_09.xlsx")
names(aee)
summary(aee)
aee$exp <- as.factor(aee$comments)
levels(aee$exp) <- c("1","2","3","4","5","6")

m1 <- lm(Time_Sec ~ Total, aee)
summary(m1)

m2 <- lm(Time_Sec ~ Access, aee)
summary(m2)

m3 <- lm(Time_Sec ~ Access + Egress, aee)
summary(m3)

m4 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1), aee)
summary(m4)

m5 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m5)

m6 <- lm(log(Time_Sec) ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m6)

sink("results.html")
stargazer(m1,m2,m3,m4,m5, no.space=T, type="html")
sink()

ggplot(aee, aes(x=Time_Sec)) + 
  geom_histogram(aes(y=..density..), colour="black", fill="white", binwidth = .25)+
  geom_density(alpha=.2, fill="#FF6666")
 
Ich habe schon einige Einführungsvideos angeschaut und bin nicht wirklich schlauer geworden. Zwar kann ich durch den summary Befehl einige Daten aufrufen, aber die Zusammenhänge von Modell 4, 5 und 6 verstehe ich nicht ganz. Was bedeutet poly(...,3) ? Auf die Frage will mein Prof nicht eingehen, da er der Meinung ist, dass man googlen kann.

Außerdem wird von mir erwartet, dass ich die Modelle testen soll, ob die Modelle/ welche gut funktionieren. Wie sehen die Vorhersagequalitäten aus und ob die sich noch verbessern lässt (K-fold cross validation). Zu dem meinte mein Prof, dass es dafür gut dokumentierte Packages, aber welche will er mir nicht verraten.

Könnt ihr mir bitte helfen?
Vielen Dank.
Hallo!

Und? Was ist beim Googlen herausgekommen? Wenn ich nach "R lm poly" Google habe ich eine ganze Reihe brauchbarer Treffer. Hast Du diesen Treffer schon gefunden und gelesen: https://datascienceplus.com/fitting-pol ... ression-r/ :?:

Gut online dokumentiert ist beispielsweise das Paket caret. https://topepo.github.io/caret/ Welche anderen Pakete hast Du Dir denn schon ergoogled?

LG, Bernhard

Re: Regressionsmodelle - Hilfe !

Verfasst: Fr Apr 23, 2021 10:29 pm
von EDi
Gut online dokumentiert ist beispielsweise das Paket caret
Oder den (besseren) Nachfolger tidymodels. Zum lesen gibt's dazu zuhauf, z.B. https://www.tmwr.org/ oder https://www.tidymodels.org/books/