Hallo zusammen
ich bin leider absoluter R-Neuling und komme mit meiner Auswertung nicht weiter Bin mir sicher, dass es ziemlich banal ist...
Ich habe bereits aus meinen Rohdaten ein Subset erstellt, welches meinen Datensatz nach einem Kriterium gefiltert hat.
Jetzt möchte ich in diesem Subset ein weiteres Kriterium anwenden, nämlich Tagesabfolgen. In meinem Datensatz liegt das Datum im Format JJJJMMTT vor, also z.B. 20201103.
Ich möchte nun meinen Datensatz dahingehend untersuchen, wie oft in diesem Subset mindestens 5 aufeinanderfolgende Tage auftauchen.
Sieht bis jetzt erstmal so aus:
Oder kann man das viel eleganter ohne Subset durchführen?
Vielen Dank für eure Hilfe
Ninaj
Tagesfolgen
Re: Tagesfolgen
Hallo Nina,
willkommen im Forum!
Mein Vorgehen für diese Aufgabe wäre:
1. Datum in einen richtigen Datum-Typ umwandeln, damit man Differenzen berechnen kann.
2. eine neue Spalte mit den Differenzen der Datumsangaben. diff()
3. Die Funktion rle() auf diese Differenzen anwenden und das Ergebnis in einen kleinen Dataframe stecken.
4. Diesen Dataframe entsprechend filtern (wann hat die Differenz 1 eine Lauflänge >=5 ?)
Gruß, Jörg
willkommen im Forum!
Mein Vorgehen für diese Aufgabe wäre:
1. Datum in einen richtigen Datum-Typ umwandeln, damit man Differenzen berechnen kann.
2. eine neue Spalte mit den Differenzen der Datumsangaben. diff()
3. Die Funktion rle() auf diese Differenzen anwenden und das Ergebnis in einen kleinen Dataframe stecken.
4. Diesen Dataframe entsprechend filtern (wann hat die Differenz 1 eine Lauflänge >=5 ?)
Gruß, Jörg