Dummy Variable aus mehreren Dummy Variablen erstellen

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
Eva123
Beiträge: 3
Registriert: Do Mai 21, 2020 12:37 pm

Dummy Variable aus mehreren Dummy Variablen erstellen

Beitrag von Eva123 »

Hallo,

ich habe eine eher sehr spezifische Frage, weshalb ich auch nicht im Internet fündig geworden bin.

Ich habe mehrere Dummy Variablen, die die Mitgliedschaft in verschiedenen Organisationen angeben (Jugendorganisation, Umweltorganisation, Menschenrechtsorganisation etc.). Diese möchte ich in einer Dummy Variable zusammenfassen (sie soll also nur sagen, ob der Teilnehmende in einer/mehreren Organisationen ein Mitglied ist oder nicht). Ich habe dazu den folgenden (vielleicht auch etwas umständlichen) Weg gewählt:

Code: Alles auswählen

data_ger$memberorg <- NA
table(data_ger$q18_1_1)
data_ger$memberorg[which(data_ger$q18_1_1 == "1 yes")]<-1
data_ger$memberorg[which(data_ger$q18_1_1 == "0 no")]<-0 # youth organisation or youth association
table(data_ger$memberorg)#check
data_ger$memberorg[which(data_ger$q18_2_1 == "1 yes")]<-1 # youth organisation of a political party
data_ger$memberorg[which(data_ger$q18_3_1 == "1 yes")]<-1 # Religious or church organisation, including religious youth organisation
data_ger$memberorg[which(data_ger$q18_4_1 == "1 yes")]<-1 # Trade Union, including youth organisation of a trade union
##. usw. (insgesamt 17) 

Ist das so korrekt? Oder gibt das ein Problem mit den NA's? Weil falls ein Teilnehmer in einer der anderen Variablen außer in 18_1_1 ein NA hatte, wird dieses nicht in der neuen Variable übernommen, wenn ich das richtig sehe. Falls dann ein Teilnehmer ausschließlich "0 no" oder NA's angegeben hat, wird dann ja eventuell in der neuen Variablen eine 0 angegeben, obwohl eigentlich ein NA nötig wäre (ich weiß ja dann durch die NA's nicht, ob der Teilnehmende nicht vielleicht doch ein Mitglied in einer Organisation ist). Habe ich das so richtig verstanden? Und falls ja, wie kann ich das Problem dann beheben? Ich konnte dazu leider in Eigenrecherche gar nichts finden.


Vielen Dank schon einmal im Voraus :)

LG Eva
Zuletzt geändert von jogo am Sa Mai 23, 2020 8:04 am, insgesamt 1-mal geändert.
Grund: formatierung verbessert, siehe http://forum.r-statistik.de/viewtopic.php?f=20&t=29

ruedi_br
Beiträge: 96
Registriert: Do Mär 01, 2018 3:53 pm

Re: Dummy Variable aus mehreren Dummy Variablen erstellen

Beitrag von ruedi_br »

Spontan angeschaut: q18_1_1 bis q18_4_1 summieren und schauen, was da größer (1 -alle) oder gleich null (keine) ist?
VG Ruedi
fortune(111)

Athomas
Beiträge: 388
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Dummy Variable aus mehreren Dummy Variablen erstellen

Beitrag von Athomas »

Du könntest Deine Variablen so umstricken, dass dort für die jeweiligen Organisation der Wert 1 „Mitglied“ bedeutet, 0 „kein Mitglied“ – und 0.5 „möglicherweise Mitglied“.

Der Wert von „Mitglied in irgendeiner Organisation“ für eine Person wäre dann das Maximum der Einzelwerte…

Eva123
Beiträge: 3
Registriert: Do Mai 21, 2020 12:37 pm

Re: Dummy Variable aus mehreren Dummy Variablen erstellen

Beitrag von Eva123 »

ruedi_br hat geschrieben:
Fr Mai 22, 2020 9:06 am
Spontan angeschaut: q18_1_1 bis q18_4_1 summieren und schauen, was da größer (1 -alle) oder gleich null (keine) ist?
VG Ruedi
Hi,

Vielen Dank für die schnelle Antwort :) allerdings habe ich leider noch nicht ganz verstanden, was mit der Summierung gemeint ist? Meinst du, dass ich einen additiven Index erstellen soll und alle Werte >= 1 als 1 kodiere, Werte von 0 als 0 und NA als NA? Würde dann nicht wieder das gleiche Problem auftauchen, weil NA einfach ignoriert wird und NA's nach der Addition mit 0 nicht als 0 ausgegeben werden? Oder liege ich da falsch?

Liebe Grüße

Eva
Zuletzt geändert von Eva123 am Fr Mai 22, 2020 3:19 pm, insgesamt 1-mal geändert.

Eva123
Beiträge: 3
Registriert: Do Mai 21, 2020 12:37 pm

Re: Dummy Variable aus mehreren Dummy Variablen erstellen

Beitrag von Eva123 »

Athomas hat geschrieben:
Fr Mai 22, 2020 9:08 am
Du könntest Deine Variablen so umstricken, dass dort für die jeweiligen Organisation der Wert 1 „Mitglied“ bedeutet, 0 „kein Mitglied“ – und 0.5 „möglicherweise Mitglied“.

Der Wert von „Mitglied in irgendeiner Organisation“ für eine Person wäre dann das Maximum der Einzelwerte…
Hi,

vielen Dank für die schnelle Antwort :) Bei meiner Methode weiß ich aber leider nicht, welche Werte im Endeffekt diese "möglicherweise Mitglieder" wären. Allerdings würde ich diese auch gerne einfach ganz aus der Analyse rausschmeißen, weil sie die Fragen nicht vollständig beantwortet haben. Fällt dir dazu spontan noch eine Möglichkeit ein?

Liebe Grüße

Eva

Antworten