mal wieder hat sich ein Problem ergeben.
Ich habe Daten mehrerer Stationen und Jahre , diese sind über die Monate Dez/Jän/Feb/März gemittelt. Jetzt ist leider das Problem aufgetreten, dass die Datenverfügbarkeit nicht besonders gut ist und ich deshalb jene Stationen "ausmisten" möchte, die eine zu geringe Dichte aufweisen.
Bisher habe ich mal folgendes probiert:
Code: Alles auswählen
#Daten einlesen (gekürztes Datenfile, da sonst zu groß)
cory <- read.csv(daten_test.csv", dec = ",", sep = ";")
## data.frame': 677499 obs. of 9 variables:
### $ Datum : Factor w/ 12784 levels "","01.01.1981",..: 2 422 842 1262 1682 2102 2522 2942 3362 3782 ...
### $ DoY : int 1 2 3 4 5 6 7 8 9 10 ...
### $ Pollen : int -1 -1 -1 -1 -1 -1 -1 -1 -1 -1 ...
### $ Codename: Factor w/ 7 levels "","ATKRIM","ATLINZ",..: 2 2 2 2 2 2 2 2 2 2 ...
### $ Rest : Factor w/ 2 levels "","txt": 2 2 2 2 2 2 2 2 2 2 ...
### $ Jahr : int 1981 1981 1981 1981 1981 1981 1981 1981 1981 1981 ...
### $ Monat : Factor w/ 13 levels "","April","August",..: 6 6 6 6 6 6 6 6 6 6 ...
### $ Tag : int 1 2 3 4 5 6 7 8 9 10 ...
### $ dm : int 101 201 301 401 501 601 701 801 901 1001 ...
### Daten der entsprechenden Monate
DJFM <- subset(cory, coryT$Monat == "Dezember" | cory$Monat == "Januar" | cory$Monat == "Februar" | cory$Monat == "März")
mittel_DJFM <- aggregate(DJFM$Pollen ~ Codename + Jahr, DJFM, mean)
### data.frame': 210 obs. of 3 variables:
### $ Codename : Factor w/ 7 levels "","ATKRIM","ATLINZ",..: 2 3 4 5 6 7 2 3 4 5 ...
### $ Jahr : int 1981 1981 1981 1981 1981 1981 1982 1982 1982 1982 ...
### $ DJFM$Pollen: num -1 1.37 -1 -1 -1 ...
### Aufsplitten nach Stationen
station_DJF <- split(mittel_DJFM, paste(mittel_DJFM$Codename))
Code: Alles auswählen
round(table(station_DJFM[[15]]$Pollen_DJFM)/length(station_DJFM)*100,2)
Danke für eure Hilfe.
Grüße, Jessi