Seite 1 von 1

Gruppierung innerhalb einer Variable

Verfasst: So Nov 27, 2016 1:04 pm
von Amelio
Liebe R-Community,

Leider finde ich keine passende Lösung hierfür im Internet.
Ich versuche Einkommen zu gruppieren in "niedrig", "mittel" und "hoch", hierfür habe ich einen Datensatz.
Nun möchte ich gerne eine weiter Variable erstellen die für 0-1000€ "niedrig", für 1000-3000 "mittel" und 3000-10000 "hoch" besagt.

Wie kann ich dieses Problem angehen?


Mit besten Grüßen

Re: Gruppierung innerhalb einer Variable

Verfasst: So Nov 27, 2016 5:44 pm
von EDi
Das geht z.B. mit ?cut:

Code: Alles auswählen

# some data
set.seed(1234)
x <- sort(runif(n = 10, min = 0, max = 10000))
x

# assign groups
cut(x, 
    breaks = c(0, 1000, 3000, 10000), 
    labels = c('niedrig', 'mittel', 'hoch'))
die für 0-1000€ "niedrig", für 1000-3000 "mittel" und 3000-10000 "hoch" besagt.
Was ist mit den Grenzen? ist 1000 nun niedrig oder mittel?
Schaue dir dazu auch unbedingt an wie ?cut() damit umgeht (nicht, dass ein böses erwachen kommt).

Re: Gruppierung innerhalb einer Variable

Verfasst: So Nov 27, 2016 8:43 pm
von bigben
Hallo Amelio,

Du wirst Dir was bei der Frage gedacht haben, aber sehr oft sind solche Unterteilungen ungünstig, weil damit Informationen verloren gehen. Wenn Du Dir ganz sicher bist, dann hat EDi die Antwort gegeben. Wenn Du Dir nicht ganz sicher bist, kannst Du gerne schildern, wozu Du das brauchst und wir überlegen gerne mit, ob das der cleverste Weg ist.

LG,
Bernhard

Re: Gruppierung innerhalb einer Variable

Verfasst: Mo Nov 28, 2016 8:12 am
von student
Hallo Amelio,

ich bin unterwegs, deswegen nur in Kürze und ein Link zu einem Video, indem ich so etwas beschrieben habe.

Viel Erfolg!