Referenzkategorie GLM
Verfasst: Di Jan 23, 2018 10:02 am
Hallo zusammen,
bei der Durchführung einer logistischen Regression bzw. deren Vorbereitung im Datenmanagement bin ich auf folgendes Problem gestoßen:
Zunächst haben wir zu Bildlung (im Datensatz in 6 Leveln angegeben) Dummy-Variablen erstellt:
Ist das soweit richtig?
Muss ich beim Rechnen der GLM alle dummies angeben oder eine Referenzkategorie festlegen? Wie mache ich das?
Wenn ich alle dummies angebe, ist das Output nicht das gewünschte.
Vielen Dank für eure Hilfe! Beste Grüße, Joan
bei der Durchführung einer logistischen Regression bzw. deren Vorbereitung im Datenmanagement bin ich auf folgendes Problem gestoßen:
Zunächst haben wir zu Bildlung (im Datensatz in 6 Leveln angegeben) Dummy-Variablen erstellt:
Code: Alles auswählen
allbus_data <- allbus_data %>%
mutate (bildung_2 = ifelse(bildung == 2, 1, 0) %>% as.integer(),
bildung_3 = ifelse(bildung == 3, 1, 0) %>% as.integer(),
bildung_4 = ifelse (bildung == 4, 1, 0) %>% as.integer(),
bildung_5 = ifelse (bildung == 5, 1, 0) %>% as.integer(),
bildung_6 = ifelse (bildung == 6, 1, 0) %>% as.integer())
Muss ich beim Rechnen der GLM alle dummies angeben oder eine Referenzkategorie festlegen? Wie mache ich das?
Wenn ich alle dummies angebe, ist das Output nicht das gewünschte.
Vielen Dank für eure Hilfe! Beste Grüße, Joan