Hallo zusammen,
ich habe eine eigentlich ganz simple Frage:
Ich würde gerne bei einem Datensatz vier Altersgruppen auf Basis der Quantile bilden möchte.
Das sind meine Favstats:
favstats(~age, data = data)
min Q1 median Q3 max mean sd n missing
15 26 35 49 94 38.41778 13.81684 225 0
Meine Frage ist nun:
Gehört der angegebene Wert unter "Q1" , "Median" und "Q3" noch zur vorhergehenden Altersgruppe dazu oder beginnt die Altersgruppe bereits mit dem angegebenen Wert?
Also
Möglichkeit 1: 15-26, 27-35, 36-49, 50-94
oder
Möglichkeit 2: 15-25, 26-34, 35-48, 49-94
Welche der beiden Möglichkeite wäre hier die korrekte Einteilung?
Altersgruppen auf Basis von Quantilen bilden
Re: Altersgruppen auf Basis von Quantilen bilden
Die quantile() Funktion kennt 9 verschiedene Definitionen für ein Quantil und es gibt wohl keinen allgemeinen Standard. Würde mich wundern, wenn es eine allgemeingültige Definition für Quantilsbildung gäbe. Ich vermute, Du hast da Freiheit und solltest sie so einsetzen, dass alle Gruppen möglichst gleich groß werden.
Oft gibt es bessere Alternativen zur Quantilsbildung in der Statistik, aber das war nicht Deine Frage.
LG Bernhard
Oft gibt es bessere Alternativen zur Quantilsbildung in der Statistik, aber das war nicht Deine Frage.
LG Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte