Problem beim Importieren von Daten

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Steffi123
Beiträge: 1
Registriert: Mo Nov 18, 2024 1:14 pm

Problem beim Importieren von Daten

Beitrag von Steffi123 »

Hallo,

ich habe eine Frage zum Importieren von Daten, welche ich in SPSS vorbereitet habe und in R importiert habe (mittels dem Paket "haven"). Es handelt sich hierbei um eine Tagebuchstudie, dem entsprechend sind in der Ansicht relativ viele NA's (in SPSS werden mir diese als Punkte angezeigt), weil beim Fragebogen am Abend natürlich nicht die Fragebogen von in der Früh vorgegeben werden. Beim Importiere scheinen die Daten ohne Problem auf und die NA's werden auch als solche angezeigt. Wenn ich aber die Daten filtern möchte mit dem folgenden Code:

data_neu <- data_neu %>% filter(if_all(c(AE04_01, AE04_02, AE04_03, AE04_04,
AE05_01, AE05_02, AE05_03, AE05_04,
AE06_01, AE06_02, AE06_03, AE06_04,
AE07_01, AE07_03, AE07_04, AE07_05,
FR03_01, FR03_02, FR03_03, FR03_04,
FR04_01, FR04_02, FR04_03,
FR05_01, FR05_02, FR05_03, FR05_04), ~ !is.na("NA")))


werden mir alle Daten rausgelöscht, sprich vorher:

> dim(data_neu)
[1] 2068 60

und danach
[1] 0 60

Weiß jemand woran das liegen kann? Ich habe die Daten auch schon direkt vom Erhebungsprogramm in R importiert (SoSciSurvey), aber hier passiert mir auch immer dasselbe und auch wenn ich im Code "NA" mit . austausche.

Ich wäre für jeden Tipp dankbar! :D

Liebe Grüße
Steffi
bigben
Beiträge: 2864
Registriert: Mi Okt 12, 2016 9:09 am

Re: Problem beim Importieren von Daten

Beitrag von bigben »

Hallo Steffi,

ich kenne mich im dplyr Dialekt von R nicht aus. Was soll der Code denn leisten? Was mir ins Auge springt ist der Teil " is.na("NA") ". Das sollte doch eigentlich immer False sein, oder?

LG, Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
student
Beiträge: 715
Registriert: Fr Okt 07, 2016 9:52 am

Re: Problem beim Importieren von Daten

Beitrag von student »

Hallo Steffi,

das Verhalten erinnert mich an die R-Base-Funktion na.exclude(). Kann es sein, dass in jeder Datenzeile ein oder mehrere Merkmale mit NA's vorliegen? Wenn ja, gehe ich davon aus, dass durch Deine beschriebene Anweisung dann die komplette Zeile entfernt wird.

Kannst Du aus Deinen Daten Subsets aus Früh und Abend bilden, um so möglicherweise das Problem zu umgehen?
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Antworten