dies ist mein erster Beitrag in dem Form deshalb erstmal Hallo
Ich helfe einer Bekannten bei einer Bachelor-Arbeit, da sie nicht so fit in Sachen programmieren ist. Ich selbst bin Softwareentwickler aber mit R kenne ich mich nicht aus. Habe erst begonnen.
Nun zu meinem Problem:
Ich habe aus der WHO-Datenbank Daten zur Sterberate von Menschen aus Süd-Afrika exportiert. Diese Daten möchte ich nun analysieren.
Ich habe festgestellt, dass in der Altersgruppe um 30 in einigen Jahren viele Menschen starben. Das möchte ich nun näher untersuchen.
Dabei bin ich auch schon recht weit gekommen, aber ich komme jetzt einfach nicht mehr weiter. Ich habe folgende Struktur der Daten (Auszug)
ich möchte jetzt alle Altersgruppen ausummieren also 0, 1, 2, 3 aber nicht komplett sondern sortiert nach Cause. Im Ergebniss soll die Spalte Sex verschwinden, da ich nicht nach Geschlecht trennen möchte sondern alle Personen mich interessieren.
Man könnte das mit Schleifen etc. machen, aber so wie ich R bisher kennengelernt habe gibt es da bistimmt ne elegante Lösung.
Danke
Grüße Florian
PS: Das ist mein bisheriger Code
Code: Alles auswählen
#Lade CSV Daten der WHO
data = read.csv2("Mortality_2015_1999_Germany_SouthAfrica.csv", header = TRUE, sep = ",", check.names = FALSE)
# Hole Daten f?r ein Land
data_country = subset(data, Country == country_val)
data_countryYear = subset(data_country, Cause != "TOT")
# Take Data for one year
# data_countryYear = subset(data_countryYear, Year %in% c(2004, 2005, 2006))
# Get data where many peaple died at group 30
data_manyDeaths = subset(data_countryYear, `30` > 2000)
data_manyDeaths[is.na(data_manyDeaths)] = 0
data_manyDeaths = data_manyDeaths[order(data_manyDeaths$`30`), ]
# extract causes for death
data_manyDeathsCause = data_manyDeaths$Cause
# remove duplicated causes
data_manyDeathsCause = data_manyDeathsCause[!duplicated(data_manyDeathsCause)]
# drop levels which are 0
data_manyDeathsCause = droplevels(data_manyDeathsCause)
# get data with vector of causes (many deaths) from all years
data_cause = data_country[data_country$Cause %in% data_manyDeathsCause, ]