Regressionsmodelle - Hilfe !

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
vananh97
Beiträge: 1
Registriert: Mo Apr 19, 2021 9:59 pm

Regressionsmodelle - Hilfe !

Beitrag von vananh97 »

Hallo,

für mein Seminararbeit in der Uni soll ich folgende Modelle zu den Umsteigezeiten von ÖVPN untersuchen. Da ich vorher noch nie was mit R Studio zu tun habe, weiß ich nicht wo ich anfangen sollen.

Code: Alles auswählen

library(stargazer)
library(ggplot2)

aee <- read_excel("Access_Egress_Exp_2019_01_09.xlsx")
names(aee)
summary(aee)
aee$exp <- as.factor(aee$comments)
levels(aee$exp) <- c("1","2","3","4","5","6")

m1 <- lm(Time_Sec ~ Total, aee)
summary(m1)

m2 <- lm(Time_Sec ~ Access, aee)
summary(m2)

m3 <- lm(Time_Sec ~ Access + Egress, aee)
summary(m3)

m4 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1), aee)
summary(m4)

m5 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m5)

m6 <- lm(log(Time_Sec) ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m6)

sink("results.html")
stargazer(m1,m2,m3,m4,m5, no.space=T, type="html")
sink()

ggplot(aee, aes(x=Time_Sec)) + 
  geom_histogram(aes(y=..density..), colour="black", fill="white", binwidth = .25)+
  geom_density(alpha=.2, fill="#FF6666")
 
Ich habe schon einige Einführungsvideos angeschaut und bin nicht wirklich schlauer geworden. Zwar kann ich durch den summary Befehl einige Daten aufrufen, aber die Zusammenhänge von Modell 4, 5 und 6 verstehe ich nicht ganz. Was bedeutet poly(...,3) ? Auf die Frage will mein Prof nicht eingehen, da er der Meinung ist, dass man googlen kann.

Außerdem wird von mir erwartet, dass ich die Modelle testen soll, ob die Modelle/ welche gut funktionieren. Wie sehen die Vorhersagequalitäten aus und ob die sich noch verbessern lässt (K-fold cross validation). Zu dem meinte mein Prof, dass es dafür gut dokumentierte Packages, aber welche will er mir nicht verraten.

Könnt ihr mir bitte helfen?
Vielen Dank.
Dateianhänge
Access_Egress_Exp_2019_01_09.xlsx
(16.49 KiB) 105-mal heruntergeladen
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Regressionsmodelle - Hilfe !

Beitrag von bigben »

vananh97 hat geschrieben: Fr Apr 23, 2021 9:47 pm Hallo,

für mein Seminararbeit in der Uni soll ich folgende Modelle zu den Umsteigezeiten von ÖVPN untersuchen. Da ich vorher noch nie was mit R Studio zu tun habe, weiß ich nicht wo ich anfangen sollen.

Code: Alles auswählen

library(stargazer)
library(ggplot2)

aee <- read_excel("Access_Egress_Exp_2019_01_09.xlsx")
names(aee)
summary(aee)
aee$exp <- as.factor(aee$comments)
levels(aee$exp) <- c("1","2","3","4","5","6")

m1 <- lm(Time_Sec ~ Total, aee)
summary(m1)

m2 <- lm(Time_Sec ~ Access, aee)
summary(m2)

m3 <- lm(Time_Sec ~ Access + Egress, aee)
summary(m3)

m4 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1), aee)
summary(m4)

m5 <- lm(Time_Sec ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m5)

m6 <- lm(log(Time_Sec) ~ poly(Access,3) + poly(Egress,1) 
         #+I(exp=="2")
         +I(exp=="5")
         #+I(exp=="6")
         , aee)
summary(m6)

sink("results.html")
stargazer(m1,m2,m3,m4,m5, no.space=T, type="html")
sink()

ggplot(aee, aes(x=Time_Sec)) + 
  geom_histogram(aes(y=..density..), colour="black", fill="white", binwidth = .25)+
  geom_density(alpha=.2, fill="#FF6666")
 
Ich habe schon einige Einführungsvideos angeschaut und bin nicht wirklich schlauer geworden. Zwar kann ich durch den summary Befehl einige Daten aufrufen, aber die Zusammenhänge von Modell 4, 5 und 6 verstehe ich nicht ganz. Was bedeutet poly(...,3) ? Auf die Frage will mein Prof nicht eingehen, da er der Meinung ist, dass man googlen kann.

Außerdem wird von mir erwartet, dass ich die Modelle testen soll, ob die Modelle/ welche gut funktionieren. Wie sehen die Vorhersagequalitäten aus und ob die sich noch verbessern lässt (K-fold cross validation). Zu dem meinte mein Prof, dass es dafür gut dokumentierte Packages, aber welche will er mir nicht verraten.

Könnt ihr mir bitte helfen?
Vielen Dank.
Hallo!

Und? Was ist beim Googlen herausgekommen? Wenn ich nach "R lm poly" Google habe ich eine ganze Reihe brauchbarer Treffer. Hast Du diesen Treffer schon gefunden und gelesen: https://datascienceplus.com/fitting-pol ... ression-r/ :?:

Gut online dokumentiert ist beispielsweise das Paket caret. https://topepo.github.io/caret/ Welche anderen Pakete hast Du Dir denn schon ergoogled?

LG, Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Regressionsmodelle - Hilfe !

Beitrag von EDi »

Gut online dokumentiert ist beispielsweise das Paket caret
Oder den (besseren) Nachfolger tidymodels. Zum lesen gibt's dazu zuhauf, z.B. https://www.tmwr.org/ oder https://www.tidymodels.org/books/
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten