Dummy Variable aus mehreren Dummy Variablen erstellen
Verfasst: Do Mai 21, 2020 3:46 pm
Hallo,
ich habe eine eher sehr spezifische Frage, weshalb ich auch nicht im Internet fündig geworden bin.
Ich habe mehrere Dummy Variablen, die die Mitgliedschaft in verschiedenen Organisationen angeben (Jugendorganisation, Umweltorganisation, Menschenrechtsorganisation etc.). Diese möchte ich in einer Dummy Variable zusammenfassen (sie soll also nur sagen, ob der Teilnehmende in einer/mehreren Organisationen ein Mitglied ist oder nicht). Ich habe dazu den folgenden (vielleicht auch etwas umständlichen) Weg gewählt:
Ist das so korrekt? Oder gibt das ein Problem mit den NA's? Weil falls ein Teilnehmer in einer der anderen Variablen außer in 18_1_1 ein NA hatte, wird dieses nicht in der neuen Variable übernommen, wenn ich das richtig sehe. Falls dann ein Teilnehmer ausschließlich "0 no" oder NA's angegeben hat, wird dann ja eventuell in der neuen Variablen eine 0 angegeben, obwohl eigentlich ein NA nötig wäre (ich weiß ja dann durch die NA's nicht, ob der Teilnehmende nicht vielleicht doch ein Mitglied in einer Organisation ist). Habe ich das so richtig verstanden? Und falls ja, wie kann ich das Problem dann beheben? Ich konnte dazu leider in Eigenrecherche gar nichts finden.
Vielen Dank schon einmal im Voraus
LG Eva
ich habe eine eher sehr spezifische Frage, weshalb ich auch nicht im Internet fündig geworden bin.
Ich habe mehrere Dummy Variablen, die die Mitgliedschaft in verschiedenen Organisationen angeben (Jugendorganisation, Umweltorganisation, Menschenrechtsorganisation etc.). Diese möchte ich in einer Dummy Variable zusammenfassen (sie soll also nur sagen, ob der Teilnehmende in einer/mehreren Organisationen ein Mitglied ist oder nicht). Ich habe dazu den folgenden (vielleicht auch etwas umständlichen) Weg gewählt:
Code: Alles auswählen
data_ger$memberorg <- NA
table(data_ger$q18_1_1)
data_ger$memberorg[which(data_ger$q18_1_1 == "1 yes")]<-1
data_ger$memberorg[which(data_ger$q18_1_1 == "0 no")]<-0 # youth organisation or youth association
table(data_ger$memberorg)#check
data_ger$memberorg[which(data_ger$q18_2_1 == "1 yes")]<-1 # youth organisation of a political party
data_ger$memberorg[which(data_ger$q18_3_1 == "1 yes")]<-1 # Religious or church organisation, including religious youth organisation
data_ger$memberorg[which(data_ger$q18_4_1 == "1 yes")]<-1 # Trade Union, including youth organisation of a trade union
##. usw. (insgesamt 17)
Ist das so korrekt? Oder gibt das ein Problem mit den NA's? Weil falls ein Teilnehmer in einer der anderen Variablen außer in 18_1_1 ein NA hatte, wird dieses nicht in der neuen Variable übernommen, wenn ich das richtig sehe. Falls dann ein Teilnehmer ausschließlich "0 no" oder NA's angegeben hat, wird dann ja eventuell in der neuen Variablen eine 0 angegeben, obwohl eigentlich ein NA nötig wäre (ich weiß ja dann durch die NA's nicht, ob der Teilnehmende nicht vielleicht doch ein Mitglied in einer Organisation ist). Habe ich das so richtig verstanden? Und falls ja, wie kann ich das Problem dann beheben? Ich konnte dazu leider in Eigenrecherche gar nichts finden.
Vielen Dank schon einmal im Voraus
LG Eva