Hallo,
ich habe eine Frage zum Importieren von Daten, welche ich in SPSS vorbereitet habe und in R importiert habe (mittels dem Paket "haven"). Es handelt sich hierbei um eine Tagebuchstudie, dem entsprechend sind in der Ansicht relativ viele NA's (in SPSS werden mir diese als Punkte angezeigt), weil beim Fragebogen am Abend natürlich nicht die Fragebogen von in der Früh vorgegeben werden. Beim Importiere scheinen die Daten ohne Problem auf und die NA's werden auch als solche angezeigt. Wenn ich aber die Daten filtern möchte mit dem folgenden Code:
data_neu <- data_neu %>% filter(if_all(c(AE04_01, AE04_02, AE04_03, AE04_04,
AE05_01, AE05_02, AE05_03, AE05_04,
AE06_01, AE06_02, AE06_03, AE06_04,
AE07_01, AE07_03, AE07_04, AE07_05,
FR03_01, FR03_02, FR03_03, FR03_04,
FR04_01, FR04_02, FR04_03,
FR05_01, FR05_02, FR05_03, FR05_04), ~ !is.na("NA")))
werden mir alle Daten rausgelöscht, sprich vorher:
> dim(data_neu)
[1] 2068 60
und danach
[1] 0 60
Weiß jemand woran das liegen kann? Ich habe die Daten auch schon direkt vom Erhebungsprogramm in R importiert (SoSciSurvey), aber hier passiert mir auch immer dasselbe und auch wenn ich im Code "NA" mit . austausche.
Ich wäre für jeden Tipp dankbar!
Liebe Grüße
Steffi
Problem beim Importieren von Daten
Re: Problem beim Importieren von Daten
Hallo Steffi,
ich kenne mich im dplyr Dialekt von R nicht aus. Was soll der Code denn leisten? Was mir ins Auge springt ist der Teil " is.na("NA") ". Das sollte doch eigentlich immer False sein, oder?
LG, Bernhard
ich kenne mich im dplyr Dialekt von R nicht aus. Was soll der Code denn leisten? Was mir ins Auge springt ist der Teil " is.na("NA") ". Das sollte doch eigentlich immer False sein, oder?
LG, Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Problem beim Importieren von Daten
Hallo Steffi,
das Verhalten erinnert mich an die R-Base-Funktion na.exclude(). Kann es sein, dass in jeder Datenzeile ein oder mehrere Merkmale mit NA's vorliegen? Wenn ja, gehe ich davon aus, dass durch Deine beschriebene Anweisung dann die komplette Zeile entfernt wird.
Kannst Du aus Deinen Daten Subsets aus Früh und Abend bilden, um so möglicherweise das Problem zu umgehen?
das Verhalten erinnert mich an die R-Base-Funktion na.exclude(). Kann es sein, dass in jeder Datenzeile ein oder mehrere Merkmale mit NA's vorliegen? Wenn ja, gehe ich davon aus, dass durch Deine beschriebene Anweisung dann die komplette Zeile entfernt wird.
Kannst Du aus Deinen Daten Subsets aus Früh und Abend bilden, um so möglicherweise das Problem zu umgehen?
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)