Anzahl an Datensätzen berechnen

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Antworten
baroso
Beiträge: 12
Registriert: Di Mär 06, 2018 11:11 am

Anzahl an Datensätzen berechnen

Beitrag von baroso »

hallo,
ich stehe mal wieder auf dem Schlauch.
ich möchte einfach nur die Anzahl an Datensätzen für bestimmte Aggregation bestimmen.
das folgende Beispiel zeigt wie ich zunächst den Mittelwert bestimme, mit der Funktion "mean", das klappt wunderbar.
Aber wie bestimme ich die Anzahl?

Code: Alles auswählen

###Mittelwert berechnen:
dat1=aggregate(dat[,c(11)], list(ag1=dat$a1, ag2=dat$a2,ag3=dat$a3), mean, na.rm=T)
names(dat2)=c("ag1","ag2","ag3","mean")

###Anzahl berechnen:
dat3=aggregate(dat[,c(4)], list(ag1=dat$a1, ag2=dat$a2,ag3=dat$a3), ????????, na.rm=T) ####Welche Funktion kommt hier rein? count.list, nrow???
names(dat3)=c("ag1","ag2","ag3","number")
gibt es zur Berchnung der Anzahl in aggregate eine Funktion?
Danke.
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Anzahl an Datensätzen berechnen

Beitrag von jogo »

Code: Alles auswählen

aggregate(..., FUN=length, ...)
Hierbei werden aber die NAs mitgezählt.
Wenn man dies nicht möchte, dann vielleicht so:

Code: Alles auswählen

ggregate(!is.na(dat[, 4]), list(ag1=dat$a1, ag2=dat$a2,ag3=dat$a3), FUN=sum)
... schade, dass Du nicht generell mit Spaltennamen arbeitest - es hätte so aussehen können:

Code: Alles auswählen

aggregate(!is.na(Spalte4) ~ a1 + a2 + a3, data=dat, FUN=sum)
Gruß, Jörg
Antworten