Lineares Modell, Korrelation und 2 Datensätze plotten

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
tprobst
Beiträge: 2
Registriert: Mi Nov 20, 2019 3:08 pm

Lineares Modell, Korrelation und 2 Datensätze plotten

Beitrag von tprobst »

Guten Tag liebe Experten,

ich soll für die Universität ein Regressionsmodell mit R erstellen, habe aber weder Unterlagen noch Vorkenntnisse.

in dem Chart möchte ich zuerst die historischen Goldkurse plotten und danach ein lineares regressionsmodell daraus basteln.

Im Anschluss dann den Dow Jones Kurs mit dem Goldkurs in eine Grafik bringen und eventuell die Korrelation berechnen.

Kann mir da jemand weiterhelfen ? ich bin jetzt so weit, dass ich die Daten einlesen kann, habe 2 CSV Dateien mit den Datensätzen. (im Anhang)
DJ_1969_2019_BY.csv
(589 Bytes) 72-mal heruntergeladen
Gold_1969_2019_BY.csv
(454 Bytes) 71-mal heruntergeladen
Vielen vielen Dank vorab für jede Hilfe
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Lineares Modell, Korrelation und 2 Datensätze plotten

Beitrag von EDi »

Kann mir da jemand weiterhelfen ? ich bin jetzt so weit, dass ich die Daten einlesen kann, habe 2 CSV Dateien mit den Datensätzen. (im Anhang)
Gut, was willst du als nächstes tun und wo happert es dabei?
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
tprobst
Beiträge: 2
Registriert: Mi Nov 20, 2019 3:08 pm

Re: Lineares Modell, Korrelation und 2 Datensätze plotten

Beitrag von tprobst »

ich wollte als nächstes eine typische Zeitreihe mit verbundenen linien aus den Daten erstellen,
wenn ich aber DJ30=data(1:50,1) eingebe bekomme ich eine Fehlermeldung

ich möchte also, dass 50 Zeilen aus Spalte 1 des Datensatzes meine Daten für den Dow Jones sind. und möchte die Zeit definieren auf 1969-2019
das geht vermutlich über die time series funktion, aber da weiß ich nicht was die frequenz sein soll bei Jahresdaten :roll: , im Monat schreib ich ja freq=12 aber was mache ich bei Jahreswerten ?
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Lineares Modell, Korrelation und 2 Datensätze plotten

Beitrag von bigben »

Hallo,
tprobst hat geschrieben: Mi Nov 20, 2019 8:43 pmich bin jetzt so weit, dass ich die Daten einlesen kann
Mich interessiert, wie Du das machst. Da sind Kommas als Tausendertrennzeichen und ich kenne noch keinen richtig eleganten Weg, sowas einzulesen:

Code: Alles auswählen

> gold <- read.csv("http://forum.r-statistik.de/download/file.php?id=776")
> str(gold)
'data.frame':	51 obs. of  1 variable:
 $ Year.Open: Factor w/ 51 levels "1,075.20","1,113.00",..: 6 7 3 1 4 5 10 9 8 2 ...
bekomme ich eine Fehlermeldung
Bei Fehlermeldungen bitte immer genau den auslösenden Code (hast Du gemacht) und den genauen Wortlaut der Fehlermeldung (hast Du nicht gemacht) mit posten. Der Wortlaut der Fehlermeldung verrät oft sehr viel.
DJ30=data(1:50,1)
Ich denke, Du wolltest da eckige Klammern verwenden, keine runden. Die Fehlermeldung lautete wahrscheinlich "Error: could not find function "data"". Wenn man sich das durchliest kommt man automatisch auf die Frage: Warum sucht R eine Funktion? Die Antwort lautet dann: Runde Klammern zeigen einen Funktionsaufruf an. Spätestens da taucht dann die Frage auf, warum man eigentlich runde Klammern gesetzt hat.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Hufeisen
Beiträge: 162
Registriert: Fr Aug 31, 2018 6:34 pm

Re: Lineares Modell, Korrelation und 2 Datensätze plotten

Beitrag von Hufeisen »

Puh, das Problem mit dem Zahlenformat solltest Du hier gut klären können, das ist schon trickreich. Aber für die Darstellung von Daten mit einem einfachen Plot oder für das erste lineare Modell halte ich ein Format wie das Forum hier für nicht so gut geeignet. Diese Dinge sind so einfach, dass uns da fast keine Möglichkeit bleibt, als eine fertige Lösung hinzuschreiben. Da bleibt dann bei Dir vermutlich wenig hängen. Wenn ihr keine Lernmaterialien bekommen habt, schlage ich angesichts eines möglicherweise knappen Zeitbudgets die Videoserie von Mike Marin vor. Hier die ganze Playlist: https://www.youtube.com/watch?v=riONFzJ ... Y6OXmsXAHU. Ab 2.0 geht es um Plots und 5.1 behandelt die einfache lineare Regression.
ruedi_br
Beiträge: 159
Registriert: Do Mär 01, 2018 3:53 pm

Re: Lineares Modell, Korrelation und 2 Datensätze plotten

Beitrag von ruedi_br »

Das Zahlenformat in den anliegenden CSVs ist allerdings kein Zahlenformat und lässt sich mit einfachen Umwandlungsfunktionen in Excel auch nicht zu einem solchen machen. Heißt also konkret: ohne Stringmanipulationen geht da wohl nichts. Zum Glück braucht es ein Tausendertrennzeichen nicht wirklich, insofern wird es mit dem Ersetzen kein Hexenwerk.
Und eine winzigkleine Anregung für den nächsten Schritt: wenn Du schon Daten zusammen grafisch auswerten willst, sollten die auch zusammen in einen Dataframe ....
Grüße
Ruedi
fortune(111)
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Lineares Modell, Korrelation und 2 Datensätze plotten

Beitrag von EDi »

ohne Stringmanipulationen geht da wohl nichts. Zum Glück braucht es ein Tausendertrennzeichen nicht wirklich, insofern wird es mit dem Ersetzen kein Hexenwerk.
So hier zum Beispiel?

Code: Alles auswählen

# Download file to disk
file <- tempfile(fileext = '.csv')
download.file("http://forum.r-statistik.de/download/file.php?id=776", file)

# read file with replace comma
library(data.table)
fread(paste0("sed 's/,//g' ", file))
      
Essentiell ein one-liner... jogo wirds bestimmt freuen...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten