Erstellen einer neuer Spalte mit der Differenz
Verfasst: Mo Jun 28, 2021 12:39 pm
Moin,
ich bin neu hier und habe folgendes Problem.
Ich möchte gerne die neusten Corona-Daten auswerten und würde gerne aus den aufkumulierten Fallzahlen pro Tag eine neue Spalte erstellen in der ich sehen kann wie viele Fälle pro Land am Tag dazugekommen sind. Es handelt sich hierbei um Paneldaten.
Meine bisherigen Vorgehensweise
Bei confirmed_cases_Covid tauchen dann irgendwann Zahlen auf. In der Spalte diff wird die Different allerdings nicht berechnet.
Sorry für die wilde Bezeichung der df's. Kann mir jmd weiterhelfen?
Vielen Dank!
Liebe Grüße
Thorben
ich bin neu hier und habe folgendes Problem.
Ich möchte gerne die neusten Corona-Daten auswerten und würde gerne aus den aufkumulierten Fallzahlen pro Tag eine neue Spalte erstellen in der ich sehen kann wie viele Fälle pro Land am Tag dazugekommen sind. Es handelt sich hierbei um Paneldaten.
Meine bisherigen Vorgehensweise
Code: Alles auswählen
confirmed_cases <- read_csv("https://github.com/OxCGRT/covid-policy-tracker/raw/master/data/timeseries/confirmed_cases.csv", na="na")
confirmed_cases_new <- confirmed_cases %>%
pivot_longer(-c('country_code', 'country_name'),
names_to ="date",
values_to="confirmed_cases_Covid") %>%
select(-c(country_code))
conf_cases<- confirmed_cases_new[!(confirmed_cases_new$date=="X1"),]
conf_cases[is.na(conf_cases)]<-0
conf_cases$date <- format (dmy(conf_cases$date), "%Y-%m-%d")
conf_cases$date <-as.Date(conf_cases$date)
hallo <-conf_cases %>%
group_by(date) %>%
mutate (diff = confirmed_cases_Covid - lag(confirmed_cases_Covid, default = confirmed_cases_Covid[1]))
hallo ## hier spuckt er eine neue Tabelle aus mit der Spalte diff. Allerdings sind alle Werte in der Spalte 0,
country_name date confirmed_cases_Covid diff
<chr> <date> <dbl> <dbl>
1 Aruba 2020-01-01 0 0
2 Aruba 2020-01-02 0 0
3 Aruba 2020-01-03 0 0
4 Aruba 2020-01-04 0 0
Sorry für die wilde Bezeichung der df's. Kann mir jmd weiterhelfen?
Vielen Dank!
Liebe Grüße
Thorben