Seite 1 von 1

Altersgruppen auf Basis von Quantilen bilden

Verfasst: Mo Jan 20, 2020 5:27 pm
von HelloR
Hallo zusammen,

ich habe eine eigentlich ganz simple Frage:
Ich würde gerne bei einem Datensatz vier Altersgruppen auf Basis der Quantile bilden möchte.
Das sind meine Favstats:

favstats(~age, data = data)
min Q1 median Q3 max mean sd n missing
15 26 35 49 94 38.41778 13.81684 225 0

Meine Frage ist nun:
Gehört der angegebene Wert unter "Q1" , "Median" und "Q3" noch zur vorhergehenden Altersgruppe dazu oder beginnt die Altersgruppe bereits mit dem angegebenen Wert?

Also
Möglichkeit 1: 15-26, 27-35, 36-49, 50-94
oder
Möglichkeit 2: 15-25, 26-34, 35-48, 49-94

Welche der beiden Möglichkeite wäre hier die korrekte Einteilung?

Re: Altersgruppen auf Basis von Quantilen bilden

Verfasst: Mo Jan 20, 2020 7:56 pm
von bigben
Die quantile() Funktion kennt 9 verschiedene Definitionen für ein Quantil und es gibt wohl keinen allgemeinen Standard. Würde mich wundern, wenn es eine allgemeingültige Definition für Quantilsbildung gäbe. Ich vermute, Du hast da Freiheit und solltest sie so einsetzen, dass alle Gruppen möglichst gleich groß werden.

Oft gibt es bessere Alternativen zur Quantilsbildung in der Statistik, aber das war nicht Deine Frage.

LG Bernhard