Tageswerte über Uhrzeit aggregieren
Verfasst: Do Jun 10, 2021 5:19 pm
Hallo liebes R - Forum,
ich habe folgende Frage und hoffe, dass mir jemand weiterhelfen kann.
Ich verwende Daten zu Kraftstoffpreisen an verschiedenen Tankstellen in ganz Deutschland.
Dazu ist in den Daten jede Änderung der Kraftstoffpreise pro Tag angegeben.
Da ich die Werte aber in einem Paneldatensatz mit täglichen Werten betrachten möchte, muss ich auch die Werte der Kraftstoffpreise zu täglichen Werten aggregieren.
In einem Ersten Ansatz habe ich die dazu einfach die gemittelten Werte über den Tag gebildet (dafür habe ich die Packages lubridate und dlyr verwendet). Das hat auch wunderbar funktioniert.
In einem weiteren Ansatz möchte ich nun versuchen, jeder Tankstelle immer einen Preis pro Tag zuordnen, der zeitlich am nächsten an 13 Uhr liegt.
Mein Datensatz ist folgendermaßen aufgebaut, ich denke damit wird mein Vorhaben deutlicher.
date | Tankstelle | Preis Diesel
2018-01-01 10:43:06 | A | 1.199
2018-01-01 11:19:06 | A | 1.229
2018-01-01 12:43:05 | A | 1.209
2018-01-01 15:29:06 | A | 1.199
So werden die Daten dann für jede Tankstelle, für jede Änderung der Preise für jeden Tag dargestellt. Mein Ziel ist es, jeder Tankstelle aber eben nur einen Wert pro Tag zuzuordnen und zwar immer den Wert, der am nächsten an 13 Uhr liegt. Für die Tankstelle A im Beispiel also den Preis um 12:43 Uhr von 1.209€
Hat jemand eine Idee oder einen Ansatz, wie man sowas lösen könnte?
Ich hoffe ich konnte meine Frage verständlich formulieren und bedanke mich jetzt schonmal für eure Unterstützung
ich habe folgende Frage und hoffe, dass mir jemand weiterhelfen kann.
Ich verwende Daten zu Kraftstoffpreisen an verschiedenen Tankstellen in ganz Deutschland.
Dazu ist in den Daten jede Änderung der Kraftstoffpreise pro Tag angegeben.
Da ich die Werte aber in einem Paneldatensatz mit täglichen Werten betrachten möchte, muss ich auch die Werte der Kraftstoffpreise zu täglichen Werten aggregieren.
In einem Ersten Ansatz habe ich die dazu einfach die gemittelten Werte über den Tag gebildet (dafür habe ich die Packages lubridate und dlyr verwendet). Das hat auch wunderbar funktioniert.
In einem weiteren Ansatz möchte ich nun versuchen, jeder Tankstelle immer einen Preis pro Tag zuordnen, der zeitlich am nächsten an 13 Uhr liegt.
Mein Datensatz ist folgendermaßen aufgebaut, ich denke damit wird mein Vorhaben deutlicher.
date | Tankstelle | Preis Diesel
2018-01-01 10:43:06 | A | 1.199
2018-01-01 11:19:06 | A | 1.229
2018-01-01 12:43:05 | A | 1.209
2018-01-01 15:29:06 | A | 1.199
So werden die Daten dann für jede Tankstelle, für jede Änderung der Preise für jeden Tag dargestellt. Mein Ziel ist es, jeder Tankstelle aber eben nur einen Wert pro Tag zuzuordnen und zwar immer den Wert, der am nächsten an 13 Uhr liegt. Für die Tankstelle A im Beispiel also den Preis um 12:43 Uhr von 1.209€
Hat jemand eine Idee oder einen Ansatz, wie man sowas lösen könnte?
Ich hoffe ich konnte meine Frage verständlich formulieren und bedanke mich jetzt schonmal für eure Unterstützung