Boxplot für Verhaltenstypen

Varianzanalyse, Diskriminanzanalyse, Kontingenzanalyse, Faktorenanalyse, Clusteranalyse, MDS, ....

Moderator: EDi

Antworten
Dominique
Beiträge: 1
Registriert: Di Feb 18, 2020 1:04 pm

Boxplot für Verhaltenstypen

Beitrag von Dominique »

Im Rahmen meiner Umfrage haben wir Verhaltenstypen analysiert. Unser Professor hat unter seiner Forschung 6 Verhaltenstypen definiert und wir haben bereits herausgefunden wie wir unsere Befragten den einzelnen Verhaltenstypen zuordnen können.
Beispiel: 6 Befragte waren "Hedonisten, 15 Geniesser etc."

Unsere gesamte Analyse des Datensatzes findet in R statt. Wir wissen bereits die absoluten Zahlen pro Verhaltenstypen (siehe unten).

Unser Ziel ist nun eine Varianzanalyse und Boxplot für eine bestimmte Frage des Fragebogens: Beispiel: Wie haben die einzelnen Verhaltenstypen (Hedonisten etc.) für Frage E001_26geantwortet. Am Ende wollen wir für genau die einzelne Fragen Boxplots erstellen können.

Wir freuen uns über kleine Tipps und entschuldigen uns bereits, wenn wir wichtige Infos vergessen haben an Euch weiterzugeben.

Unser Code sieht aktuell so aus:


> View(ds)
> t(colnames(ds))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11]
[1,] "SERIAL" "REF" "QUESTNNR" "MODE" "STARTED" "W001_01" "W001_02" "W001_03" "W001_04" "W001_05" "W001_06"
[,12] [,13] [,14] [,15] [,16] [,17] [,18] [,19] [,20] [,21]
[1,] "W001_07" "W001_08" "W001_09" "W001_10" "W001_11" "E001_01" "E001_02" "E001_03" "E001_04" "E001_05"
[,22] [,23] [,24] [,25] [,26] [,27] [,28] [,29] [,30] [,31]
[1,] "E001_06" "E001_07" "E001_08" "E001_09" "E001_10" "E001_11" "E001_12" "E001_13" "E001_14" "E001_15"
[,32] [,33] [,34] [,35] [,36] [,37] [,38] [,39] [,40] [,41] [,42]
[1,] "E001_16" "E001_17" "E001_18" "E001_20" "E001_21" "E001_22" "E001_23" "E001_24" "E001_25" "E001_26" "SD01"
[,43] [,44] [,45] [,46] [,47] [,48] [,49] [,50] [,51] [,52] [,53]
[1,] "SD02_01" "SD12" "SD13" "SD13_12" "TIME001" "TIME002" "TIME003" "TIME004" "TIME_SUM" "MAILSENT" "LASTDATA"
[,54] [,55] [,56] [,57] [,58]
[1,] "FINISHED" "Q_VIEWER" "LASTPAGE" "MAXPAGE" "progNB.class"
> head(ds)
SERIAL REF QUESTNNR MODE STARTED W001_01 W001_02 W001_03 W001_04 W001_05 W001_06 W001_07
15 <NA> <NA> base interview 2020-01-08 23:29:29 NA NA NA NA NA NA NA
34 <NA> <NA> base interview 2020-01-09 16:38:34 NA NA NA NA NA NA NA
35 <NA> <NA> base interview 2020-01-09 16:40:57 1 3 3 3 3 3 3
37 <NA> <NA> base interview 2020-01-09 16:41:38 7 6 5 3 1 5 4
38 <NA> <NA> base interview 2020-01-09 16:55:57 5 6 5 6 1 4 1
40 <NA> <NA> base interview 2020-01-09 16:56:09 7 6 3 3 4 5 3
W001_08 W001_09 W001_10 W001_11 E001_01 E001_02 E001_03 E001_04 E001_05 E001_06 E001_07 E001_08 E001_09
15 NA NA NA NA NA NA NA NA NA NA NA NA NA
34 NA NA NA NA NA NA NA NA NA NA NA NA NA
35 3 3 3 3 NA NA NA NA NA NA NA NA NA
37 6 4 7 6 4 7 4 1 3 1 6 3 2
38 5 7 7 7 2 7 7 2 1 1 7 5 3
40 6 5 6 6 3 6 3 2 2 4 4 3 3
E001_10 E001_11 E001_12 E001_13 E001_14 E001_15 E001_16 E001_17 E001_18 E001_20 E001_21 E001_22 E001_23
15 NA NA NA NA NA NA NA NA NA NA NA NA NA
34 NA NA NA NA NA NA NA NA NA NA NA NA NA
35 NA NA NA NA NA NA NA NA NA NA NA NA NA
37 1 4 6 2 6 4 3 6 3 2 6 7 7
38 6 7 3 4 7 6 3 7 7 2 5 7 7
40 3 3 2 2 4 5 4 5 4 4 4 4 4
E001_24 E001_25 E001_26 SD01 SD02_01 SD12 SD13 SD13_12 TIME001 TIME002
15 NA NA NA [NA] nicht beantwortet NA [NA] nicht beantwortet <NA> <NA> 2 2
34 NA NA NA [NA] nicht beantwortet NA [NA] nicht beantwortet <NA> <NA> 16 4
35 NA NA NA [NA] nicht beantwortet NA [NA] nicht beantwortet <NA> <NA> 5 11
37 3 5 1 weiblich 26 1.000 € bis unter 2.000 € <NA> <NA> 5 84
38 7 7 7 männlich 26 [NA] nicht beantwortet <NA> <NA> 2 79
40 4 4 3 weiblich 18 Bis unter 500 <NA> <NA> 11 74
TIME003 TIME004 TIME_SUM MAILSENT LASTDATA FINISHED Q_VIEWER LASTPAGE MAXPAGE
15 2 3 9 <NA> 2020-01-08 23:29:38 FALSE FALSE 4 4
34 2 17 39 <NA> 2020-01-09 16:39:13 FALSE FALSE 4 4
35 4 5 25 <NA> 2020-01-09 16:41:22 FALSE FALSE 4 4
37 111 12 212 <NA> 2020-01-09 16:45:10 TRUE FALSE 4 4
38 209 16 306 <NA> 2020-01-09 17:01:03 TRUE FALSE 4 4
40 300 8 393 <NA> 2020-01-09 17:02:42 TRUE FALSE 4 4
progNB.class
15 Geniesser
34 Geniesser
35 Verantwortungsverweigerer
37 Geniesser
38 Hedonisten
40 Geniesser


> tally(~progNB.class, data = ds)
progNB.class
Harmoniesuchende Selbstbestimmte Hedonisten Verantwortungsverweigerer
24 19 15 17
Konformisten Geniesser Wertschaetzende
19 47 10
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Boxplot für Verhaltenstypen

Beitrag von bigben »

Hallo Dominique,

zunächst wäre es schön, wenn Du uns die Daten in einem Format posten könntest, das wir mit unseren R Installationen anschauen und unsere Antwortvorschläge prüfen könnten. Siehe dazu viewtopic.php?f=20&t=11 Insbesondere die Abschnitte über str und dput.

Dann wäre es schön, Code als solchen mit Code-Tags zu markieren. Siehe dazu viewtopic.php?f=20&t=29

Was passiert bei

Code: Alles auswählen

boxplot(E001_26 ~ progNB.class, data = ds)
von mir aus auch bei

Code: Alles auswählen

ggplot(ds, aes(x = prog.NB.class, y =  E001_26)) + geom_boxplot() + theme_fivethirtyeight()
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
ruedi_br
Beiträge: 159
Registriert: Do Mär 01, 2018 3:53 pm

Re: Boxplot für Verhaltenstypen

Beitrag von ruedi_br »

Hallo,
unklar ist mir bei der Fragestellung folgendes: sind "W001xxx" tatsächlich numerisch oder diskrete Werte? Das Aussehen des Datensatzes erinnert mich an SoSciSurvey und da war das m.E. der Standardtyp.
Weiterhin: es liest sich so, als könntet Ihr der SERIAL (also Testperson) - wie auch immer - den Verhaltenstyp zuordnen, warum dann nicht als weitere Variable? Dann ließe sich ein Plot der Ergebnisse anhand der Farbe den Verhaltenstypen zuordnen - oder eben x Boxen für jeden Verhaltenstyp nebeneinander.
HTH
Ruedi
fortune(111)
Antworten