Zeitreihen, Vorhersagen und plot von dataset mit Gruppen

Methoden der Zeitreihenanalyse

Moderator: schubbiaschwilli

Antworten
stani1984
Beiträge: 1
Registriert: Mi Mär 22, 2023 6:02 am

Zeitreihen, Vorhersagen und plot von dataset mit Gruppen

Beitrag von stani1984 »

Hallo zusammen,

seit einiger Zeit bin ich "Mitleser" und habe mir schon viele nützliche Infos und Lösungen eingeholt. Ich bin Anfänger und stehe bei manchen Fragen echt auf dem Schlauch und bin sehr dankbar, dass ich hier immer wieder fündig geworden bin. Bei meinen jetztigen Problem(en) komme ich aber weder im Forum noch Internet weiter.

Ich habe 3 Tabellen (datasets) eingelesen. Jede hat 3 Spalten (Time, Location und Value). Time=Jahreszahlen (2005 bis 2021), Location=Länder. Demenstprechend befinden sich Jahreszahlen und Länder mehrfach im dataset nur die Einträge von Value variieren., und dies eben bei allen 3 Tabellen.

1. Daten aufbereiten und in Zeitreihe darstellen

Ich habe die Tabellen (für die Regressionsanalyse und Korrelation) via merge und by (Time und Location) zusammengefügt. Mittel ggplot kann ich diese auch in Zeitreihen grafisch darstellen (x=Time, y=Value und colour=Location). Soweit ich weiß, brächte ich die Tabelle nicht zusammenfügen, da ich via subset mit die Daten wieder in eine Variable schreiben kann. Wie wäre hier eine optimaler plot als Zeitreihe machbar oder ist ggplot schon mehr oder minder die optimale Darstellung? Zudem beschäftigt mich die Frage, ob es sinnvoller wäre, die Jahre als Zeilen und die Monate als Spalten zu verwenden für die Analyse. Aber da für habe ich auch keine Lösung gefunden.

2. Die Berechnung der Korrelation unter den values stellt nicht ds Problem dar. Aber wie kann ich diese in Abhängigkeit von der Time oder Location setzen? Also korrelieren Value 1 und Value 2 durch die Time oder Location?

3. Vorhersage für 2 Jahre (also 2022 und 2023) hier hänge ich total, denn mit dem aktuellen Aufbau der Tabellen bekomme ich das nicht hin. Ich müsste also umbauen aber wie?

Anbei der Aufbau der 3 Tabellen

> str(population)

'data.frame': 4030 obs. of 3 variables:

$ TIME : int 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 ...

$ LOCATION: chr "AUS" "AUS" "AUS" "AUS" ...

$ PopValue: num 8.18 8.42 8.64 8.82 8.99 ...

> str(spending)

'data.frame': 5994 obs. of 3 variables:

$ TIME : int 1970 1971 1972 1973 1974 1975 1976 1977 1978 1979 ...

$ LOCATION : chr "AUS" "AUS" "AUS" "AUS" ...

$ SpendValue: num 30477 32800 35590 41114 48462 ...

> str(access)

'data.frame': 665 obs. of 3 variables:

$ TIME : int 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 ...

$ LOCATION : chr "BEL" "BEL" "BEL" "BEL" ...

$ AccdValue: num 50.2 54 60.2 63.6 67.4 ...
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Zeitreihen, Vorhersagen und plot von dataset mit Gruppen

Beitrag von EDi »

Wie wäre hier eine optimaler plot als Zeitreihe machbar oder ist ggplot schon mehr oder minder die optimale Darstellung? Zudem beschäftigt mich die Frage, ob es sinnvoller wäre, die Jahre als Zeilen und die Monate als Spalten zu verwenden für die Analyse. Aber da für habe ich auch keine Lösung gefunden.
ggplot ist schon optimal. Wenn du ein Zeit/Datumvariable hast noch besser.
Format würde ich lang lassen und nur wenn benötig breit machen - geht ja einfach mit tidyr::pivot_longer.
Aber wie kann ich diese in Abhängigkeit von der Time oder Location setzen? Also korrelieren Value 1 und Value 2 durch die Time oder Location?
Verstehe ich glaube ich nicht ganz. Du kannst das Gruppenweise machen (group_by & purrr sind da vermutlich nützlich) oder packst das alles in ein großes Model?
Vorhersage für 2 Jahre (also 2022 und 2023) hier hänge ich total, denn mit dem aktuellen Aufbau der Tabellen bekomme ich das nicht hin. 
Ich würde alles in eine Tabelle joinen und dann ein Modell anpassen (arima? GAM? lm?).
Mit dem Modell kann man dann vorhersagen...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten