Teilnehmer mit immer die selber Fragebogenantwort identifizieren bzw. ausschliessen

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
Carmen08115
Beiträge: 4
Registriert: Di Jul 20, 2021 4:03 pm

Teilnehmer mit immer die selber Fragebogenantwort identifizieren bzw. ausschliessen

Beitrag von Carmen08115 »

Hallo,,

ich bin RStudio Anfänger und würde gerne wissen wie ich Zeilen (Teilnehmer eines Fragebogens) mit immer dem selben Wert (selber Antwortwert in einem Fragebogen)in meinem Dataframe auswählen bzw. entfernen kann ?

Mein Dataframe (n=25000) besteht aus den 8-stufigen Antworten von Teilnehmern (Zeilen) eines 40-Item langen Fragebogens (Spalten sind die 40 Fragen und Geschlecht und Alter). Leider hänge ich bei dem Problem fest nun alle Personen auszuschliessen die offenbare unplausible Antworten bzw. bei jeder Frage die gleiche Antwort gegeben haben (z.B. alle Fragen wurden mit der 2. Antwortstufe beantwortet, obwohl einige der Fragen negativ gepolt sind).

Hoffe jemand kann mir weiterhelfen, da ich keine geeignete Funktion dazu finden kann und langsam verzweifle :).

Viele Grüsse,

Carmen
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Teilnehmer mit immer die selber Fragebogenantwort identifizieren bzw. ausschliessen

Beitrag von bigben »

Hallo Carmen,

herzlich willkommen im Forum. Für solche Fragen ist es meistens sinnvoll, ein paar Beispieldaten einzustellen und anhand des Beispiels zu schreiben, wie das erwartete Ergebnis sein soll. Im FAQ-Unterforum findest Du einen Beitrag, wie man gute reproduzierbare Beispiele programmiert.

In Ermangelung Deiner Daten hier ein Beispieldatensatz von mir:

Code: Alles auswählen

mein_df <- data.frame(id = 1:5,
                      item1 = c(1, 2, 3, 4, 5),
                      item2 = c(4, 5, 3, 2, 5),
                      item3 = c(1, 1, 3, 1, 5))
print(mein_df)
Man sieht, dass zwei Teilnehmer Deinen Kriterien entsprechen. Die müssen wir nun entsprechend markieren. Dazu kann man mit apply folgende Funktion über die Spalten 2 bis 4, also die mit den Items, laufen lassen:

Code: Alles auswählen

mein_df$vorsicht <- apply(mein_df[, 2:4], 1, 
                          function(zeile) all(zeile == zeile[1]))
            
print(mein_df)              
Wie Du siehst, wurde dem Datensatz eine neue Spalte hinzugefügt die sagt, bei welchen Kandidaten man vorsichtig sein muss. Ob man die alle löschen darf? Wenn man darf, kann man das so machen:

Code: Alles auswählen

mein_df <- subset(mein_df, !vorsicht)
print(mein_df)
HTH,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Carmen08115
Beiträge: 4
Registriert: Di Jul 20, 2021 4:03 pm

Re: Teilnehmer mit immer die selber Fragebogenantwort identifizieren bzw. ausschliessen

Beitrag von Carmen08115 »

Vielen Dank, die Antwort war sehr hilfreich :)
Antworten