vorab direkt die Info, dass es sich bei meiner Frage (in meinem Fall) um eine Hausarbeit handelt und es nicht eilt!
Ich habe aus einen reduzierten Datensatz aus einem anderen Datensatz erstellt. Die Reduktion basiert darauf das var1 und var2 = 1 sind (siehe Code unten). Der Datensatz wird auch ohne Fehler erstellt, jedoch hat R die Zeilen in denen für var1 oder var2 = NA steht mit übernommen. Warum ist das so? Kann NA nicht direkt adressiert werden, wie ein numerischer Wert?
Code: Alles auswählen
dat2 <- dat1[(dat1$var1 == "1") &
(dat1$var2 == "1"), ]
Code: Alles auswählen
dat2 <- dat1[(dat1$var1 == "1") &
(dat1$var1 != "NA") &
(dat1$var2 == "1") &
(dat1$var2 != "NA"), ]
Ich möchte aus einem Datensatz der aus knapp 9000 Beobachtungen und 10 Variablen besteht, bestimmte Zeilen löschen, wenn eine von zwei Variablen = NA ist. Mit "complete.cases" wird jede Zeile gelöscht in der ein NA auftritt, egal für welche Variable.
Code: Alles auswählen
dat2 <- dat2[complete.cases(dat2), ] # Löscht alle Zeilen in denen ein NA steht, egal bei welcher Variable
Code: Alles auswählen
drops <- dat2[(dat2$var1 == "NA") & (dat2$var2 == "NA")]
Danke im Voraus für eure Hilfe!