bei der Durchführung einer logistischen Regression bzw. deren Vorbereitung im Datenmanagement bin ich auf folgendes Problem gestoßen:
Zunächst haben wir zu Bildlung (im Datensatz in 6 Leveln angegeben) Dummy-Variablen erstellt:
Code: Alles auswählen
allbus_data <- allbus_data %>%
mutate (bildung_2 = ifelse(bildung == 2, 1, 0) %>% as.integer(),
bildung_3 = ifelse(bildung == 3, 1, 0) %>% as.integer(),
bildung_4 = ifelse (bildung == 4, 1, 0) %>% as.integer(),
bildung_5 = ifelse (bildung == 5, 1, 0) %>% as.integer(),
bildung_6 = ifelse (bildung == 6, 1, 0) %>% as.integer())
Muss ich beim Rechnen der GLM alle dummies angeben oder eine Referenzkategorie festlegen? Wie mache ich das?
Wenn ich alle dummies angebe, ist das Output nicht das gewünschte.
Vielen Dank für eure Hilfe! Beste Grüße, Joan