Seite 1 von 1
Histogram erstellen pro Ausprägung einer Variable
Verfasst: Fr Dez 11, 2020 3:07 pm
von BAURIA
Hallo Zusammen
Ich möchte für eine Arbeit ein Histogramm erstellen, welches darstellt wie die Ausbildungsjahre der ProbandInnen verteilt sind. Das mache ich mit dem Befehl: hist(daten$Ausbildungsjahre)
Mein Problem ist jetzt das ic pro Proband 8 Werte habe und es mir also die Dauer der Ausbildungsjahre für jeden Probanden immer acht mal darstellt. Was ist der Befehl, damit die Ausbildungsjahre pro Proband nur einmal dargestellt werden?
Liebe Grüsse und vielen Dank
Bauria
Re: Histogram erstellen pro Ausprägung einer Variable
Verfasst: Fr Dez 11, 2020 3:18 pm
von bigben
Hmmm...
schreib doch mal ein Beispiel, wie die Daten derzeit konkret vorliegen, am besten direkt in R einlesbaren Code. Dann wird sich da eine Lösung finden. Du hattest früher mal was mit ggplot2 gepostet - magst Du lieber eine Lösung mit hist oder eine mit geom_histogram?
LG,
Bernhard
Re: Histogram erstellen pro Ausprägung einer Variable
Verfasst: Fr Dez 11, 2020 3:46 pm
von BAURIA
Lieber Bernhard
Vielen Dank für deine Hilfe:) Ich habe bisher den folgenden Befehl verwendet:
hist(x = daten$Ausbildungsjahre,
main = "Verteilung Ausbildungsjahre",
xlab = "Jahre Ausbildung",
ylab = "Anz. Personen",
breaks = 14,
xlim = c(5,25),
col = "lightgray")
Zudem sende ich dir einen Ausschnitt meines Datensatzes, damit du weisst was ich meine mit jeder Proband ist 8 mal im Datensatz. Im graphischen Output, welches ich auch angefügt habe, sieht man dann das die Anzahl die Anz. Personen extrem hoch ist in Anbetracht das ich nur 238 Probanden habe.
Ich hoffe du verstehst was ich meine.
Und es wäre auch ok, die Grafik mit ggplot2 zu machen. Das ist mir eigentlich ganz gleich.
Liebe Grüsse
Bauria
Re: Histogram erstellen pro Ausprägung einer Variable
Verfasst: Fr Dez 11, 2020 4:11 pm
von bigben
Hallo Bauria,
Daten aus Screenshots sind immer die unhandlichste Form. Am besten postest Du beispieldaten als in R lesbaren Code, wie Eduard das hier beschrieben hat:
viewtopic.php?f=20&t=11
Da ich Deinen Screenshot jetzt nicht abtippen möchte, mache ich mir ein vereinfachtes Beispiel mit 4 Personen:
Code: Alles auswählen
daten <- data.frame(id = c(1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4),
jahre = c(5, 5, 5, 1, 1, 1, 2, 2, 2, 5, 5, 5))
Viele Wege führen nach Rom. Ich nehme jetzt die Funktion aggregate und lasse sie für jede id den Mittelwert der Jahre berechnen. Da alle Jahre gleich sind, ist das ein bequemer Weg, sie zusammenzufassen:
Code: Alles auswählen
jahre.einfach <- aggregate(daten$jahre, by = list(daten$id), mean)
plot(table(jahre.einfach$x))
hist(jahre.einfach$x)
HTH,
Bernhard