für mein Seminararbeit in der Uni soll ich folgende Modelle zu den Umsteigezeiten von ÖVPN untersuchen. Da ich vorher noch nie was mit R Studio zu tun habe, weiß ich nicht wo ich anfangen sollen.
Code: Alles auswählen
library(stargazer)
library(ggplot2)
aee <- read_excel("Access_Egress_Exp_2019_01_09.xlsx")
names(aee)
summary(aee)
aee$exp <- as.factor(aee$comments)
levels(aee$exp) <- c("1","2","3","4","5","6")
m1 <- lm(Time_Sec ~ Total, aee)
summary(m1)
m2 <- lm(Time_Sec ~ Access, aee)
summary(m2)
m3 <- lm(Time_Sec ~ Access + Egress, aee)
summary(m3)
m4 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1), aee)
summary(m4)
m5 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1)
#+I(exp=="2")
+I(exp=="5")
#+I(exp=="6")
, aee)
summary(m5)
m6 <- lm(log(Time_Sec) ~ poly(Access,3) + poly(Egress,1)
#+I(exp=="2")
+I(exp=="5")
#+I(exp=="6")
, aee)
summary(m6)
sink("results.html")
stargazer(m1,m2,m3,m4,m5, no.space=T, type="html")
sink()
ggplot(aee, aes(x=Time_Sec)) +
geom_histogram(aes(y=..density..), colour="black", fill="white", binwidth = .25)+
geom_density(alpha=.2, fill="#FF6666")
Außerdem wird von mir erwartet, dass ich die Modelle testen soll, ob die Modelle/ welche gut funktionieren. Wie sehen die Vorhersagequalitäten aus und ob die sich noch verbessern lässt (K-fold cross validation). Zu dem meinte mein Prof, dass es dafür gut dokumentierte Packages, aber welche will er mir nicht verraten.
Könnt ihr mir bitte helfen?
Vielen Dank.