Seite 1 von 1

Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Mi Jan 20, 2021 2:35 pm
von Dennis_Hey
Hallo zusammen,

ich habe den angehangenen Datensatz vorliegen und möchte diesen anhand einer linearen Regression untersuchen.

Ich möchte nachweisen, ob die Wintermonate (Oktober-März) eine höhere Performance aufweisen als die Sommermonate (April-September).
Dementsprechend hätte ich die abhängige Variable (Rendite) und die unabhängige Variable (Monat).

Allerdings habe ich Probleme bei der Erfassung in "r".

Ich glaube ich muss für die Winter- und Sommermonate eine Dummyvariable erzeugen (1 und 0), wobei ich Schwierigkeiten habe diese später in die lineare Regression einzubeziehen.

Hat hier jemand schon Erfahrungen in dieser Beziehung gemacht und kann mir einen Tipp geben? Muss vielleicht der Excel-Datensatz umgebaut werden?

Ich bin für jede Antwort dankbar!

LG
Performanceübersicht.png

Re: Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Mi Jan 20, 2021 3:23 pm
von schubbiaschwilli
Gude!

Dazu gab es schon mal was - Inklusive der Diskussion: Warum Regression?

viewtopic.php?f=19&t=2216

Dank&Gruß
schubbiaschwilli

Re: Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Mi Jan 20, 2021 4:14 pm
von EDi
Die Daten müssen erst ins lange format (Jahr, Monat, Wert) => tidyr::pivot_longer

Dann die dummy variable erzeugen (z.b. mit %in%).

Dann bissl grafische exploration.

Dann das lineare Model drauf loslassen.

Re: Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Mi Jan 20, 2021 4:47 pm
von Dennis_Hey
EDi hat geschrieben: Mi Jan 20, 2021 4:14 pm Die Daten müssen erst ins lange format (Jahr, Monat, Wert) => tidyr::pivot_longer

Dann die dummy variable erzeugen (z.b. mit %in%).

Dann bissl grafische exploration.

Dann das lineare Model drauf loslassen.
Vielen Dank!

Werde ich direkt mal ausprobieren :)

Re: Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Mi Jan 20, 2021 5:07 pm
von Dennis_Hey
EDi hat geschrieben: Mi Jan 20, 2021 4:14 pm Die Daten müssen erst ins lange format (Jahr, Monat, Wert) => tidyr::pivot_longer

Dann die dummy variable erzeugen (z.b. mit %in%).

Dann bissl grafische exploration.

Dann das lineare Model drauf loslassen.
Hey EDI,

vielen Dank nochmal für deine Tipps.. das mit der Umwandlung ins lange Format hat geklappt :mrgreen:
leider tue ich mich mit den Dummy-Variablen schwer... nach der Umwandlung sieht meine Tabelle so aus:
Longperformance.png
Longperformance.png (37.72 KiB) 736 mal betrachtet
.
.
.
Kannst du mir noch einen Tipp zur Erzeugung der Dummy-Variable geben?

Vielen Dank im Voraus und einen schönen Abend.

LG

Re: Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Mi Jan 20, 2021 11:27 pm
von EDi
Kannst du mir noch einen Tipp zur Erzeugung der Dummy-Variable geben?
Klar. Das sollte weiterhelfen:

Code: Alles auswählen

x <- LETTERS[1:12]
x
x %in% c("A", "C", "E", "F", "H")

Re: Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Do Jan 21, 2021 11:19 am
von Dennis_Hey
EDi hat geschrieben: Mi Jan 20, 2021 11:27 pm
Kannst du mir noch einen Tipp zur Erzeugung der Dummy-Variable geben?
Klar. Das sollte weiterhelfen:

Code: Alles auswählen

x <- LETTERS[1:12]
x
x %in% c("A", "C", "E", "F", "H")
Hey EDI,

vielen Dank!

Ich habe mich die letzten Stunden intensiv damit beschäftigt.. bekomme es aber leider nicht hin :|

Kannst du mir vielleicht die aufgeführten Befehle genauer erklären?

Vielen Dank im Voraus und einen schönen Tag.

EDIT: Hat funktioniert und ich habe den folgenden Output erhalten:
Winter-Sommermonate.png
Nur weiß ich jetzt nicht, wie ich mit diesen Daten weiter arbeiten kann.. hast du da noch einen Tipp für mich?

Liebe Grüße

Re: Lineare Regression zur Kalenderanoamlie "Sell-in-May-Effekt"

Verfasst: Do Jan 21, 2021 8:39 pm
von EDi
Nur weiß ich jetzt nicht, wie ich mit diesen Daten weiter arbeiten kann.. hast du da noch einen Tipp für mich?
Ich vermute du willst irgendeine Art von Model an die Daten anpassen. Das einfachste wäre lm()...