ich bin neu hier und habe folgendes Problem.
Ich möchte gerne die neusten Corona-Daten auswerten und würde gerne aus den aufkumulierten Fallzahlen pro Tag eine neue Spalte erstellen in der ich sehen kann wie viele Fälle pro Land am Tag dazugekommen sind. Es handelt sich hierbei um Paneldaten.
Meine bisherigen Vorgehensweise
Code: Alles auswählen
confirmed_cases <- read_csv("https://github.com/OxCGRT/covid-policy-tracker/raw/master/data/timeseries/confirmed_cases.csv", na="na")
confirmed_cases_new <- confirmed_cases %>%
pivot_longer(-c('country_code', 'country_name'),
names_to ="date",
values_to="confirmed_cases_Covid") %>%
select(-c(country_code))
conf_cases<- confirmed_cases_new[!(confirmed_cases_new$date=="X1"),]
conf_cases[is.na(conf_cases)]<-0
conf_cases$date <- format (dmy(conf_cases$date), "%Y-%m-%d")
conf_cases$date <-as.Date(conf_cases$date)
hallo <-conf_cases %>%
group_by(date) %>%
mutate (diff = confirmed_cases_Covid - lag(confirmed_cases_Covid, default = confirmed_cases_Covid[1]))
hallo ## hier spuckt er eine neue Tabelle aus mit der Spalte diff. Allerdings sind alle Werte in der Spalte 0,
country_name date confirmed_cases_Covid diff
<chr> <date> <dbl> <dbl>
1 Aruba 2020-01-01 0 0
2 Aruba 2020-01-02 0 0
3 Aruba 2020-01-03 0 0
4 Aruba 2020-01-04 0 0
Sorry für die wilde Bezeichung der df's. Kann mir jmd weiterhelfen?
Vielen Dank!
Liebe Grüße
Thorben