Beobachtungen der gleichen Person soll nur einfach zählen

JonasBodmer · Beitrag von **JonasBodmer** » Mo Jun 08, 2020 6:17 pm

Liebe Mitglieder des R-Forums

Ich bin gerade an der Auswertung meiner Masterarbeit (Psychologie). Ich bin dabei auf folgendes Problem gestossen, das ich bisher leider nicht alleine lösen konnte.
Insgesamt liegen von 101 Personen Daten vor. Es gibt jedoch den Fall, dass gewisse Personen bei unterschiedliche Bedingungen zweimal geantwortet haben. Ich habe die Daten im Long-Format angelegt, sodass ich nun 144 Beobachtungen in den Zeilen habe. So weit so gut!
Wenn ich nun aber mit den Variablen aus der Spalte rechnen möchte, dann werden ja immer alle 144 Beobachtungen mit einbezogen. Kann mir jemand weiterhelfen, wie ich es hinkriege, dass die Werte der gleichen Person nicht doppelt, sondern nur einmal gezählt werden, sodass ich schliesslich für jede Variable mit den 101 Werten rechnen kann.

Herzlichen Dank schon im Voraus!

Jonas Bodmer

Beitrag von **bigben** » Mo Jun 08, 2020 6:46 pm

Welche der Mehrfachäußerungen soll denn zählen? Die erste? Die letzte? Der Durchschnitt? Der Median?

https://databraineo.com/ki-training-res ... er-gruppe/

JonasBodmer · Beitrag von **JonasBodmer** » Mo Jun 08, 2020 7:30 pm

Vielen Dank für die schnelle Antwort.
Bei gewissen Variablen wie z.B. condition_scenario (kategoriale Variable) und severity_av (intervallskalierte Variable) sollen alle Werte zählen.
Bei sex und age hingegen sollen diejenige Werte, die der gleichen Person (vpn_id) angehören, nur einmal zählen, wenn man die Deskriptivstatistiken berechnet, z.B. den mean von age.

Ich hoffe, ich habe mich klar ausgedrückt

Beitrag von **jogo** » Mo Jun 08, 2020 9:25 pm

Hallo Jonas,

ich empfehle eine Trennung der Daten:
ein Dataframe mit den Daten, die sich auf die Person Ansicht beziehen (pro vpn_id je eine Zeile),
der andere Dataframe für die Beobachtungen (ggf. pro vpn_id mehrere).

Code: Alles auswählen

df1 <- unique(Daten[1:3])
df2 <- Daten[-(2:3)]

Dann sollte Ordnung im Laden sein; nochmal kontrollieren, ob in df1 jede vpn_id nur einmal vorkommt:

Code: Alles auswählen

nrow(df1)
length(unique(df1$vpn_id))

beide Zahlen sollten gleich sein.

Gruß, Jörg

JonasBodmer · Beitrag von **JonasBodmer** » Mi Jun 10, 2020 12:05 pm

Hat funktioniert!

Herzlichen Dank!

Deutsches R-Forum

Beobachtungen der gleichen Person soll nur einfach zählen

Beobachtungen der gleichen Person soll nur einfach zählen

Re: Beobachtungen der gleichen Person soll nur einfach zählen

Re: Beobachtungen der gleichen Person soll nur einfach zählen

Re: Beobachtungen der gleichen Person soll nur einfach zählen

Re: Beobachtungen der gleichen Person soll nur einfach zählen