Liebe Mitglieder des R-Forums
Ich bin gerade an der Auswertung meiner Masterarbeit (Psychologie). Ich bin dabei auf folgendes Problem gestossen, das ich bisher leider nicht alleine lösen konnte.
Insgesamt liegen von 101 Personen Daten vor. Es gibt jedoch den Fall, dass gewisse Personen bei unterschiedliche Bedingungen zweimal geantwortet haben. Ich habe die Daten im Long-Format angelegt, sodass ich nun 144 Beobachtungen in den Zeilen habe. So weit so gut!
Wenn ich nun aber mit den Variablen aus der Spalte rechnen möchte, dann werden ja immer alle 144 Beobachtungen mit einbezogen. Kann mir jemand weiterhelfen, wie ich es hinkriege, dass die Werte der gleichen Person nicht doppelt, sondern nur einmal gezählt werden, sodass ich schliesslich für jede Variable mit den 101 Werten rechnen kann.
Herzlichen Dank schon im Voraus!
Jonas Bodmer
Beobachtungen der gleichen Person soll nur einfach zählen
-
- Beiträge: 3
- Registriert: Fr Mai 22, 2020 10:01 am
Re: Beobachtungen der gleichen Person soll nur einfach zählen
Welche der Mehrfachäußerungen soll denn zählen? Die erste? Die letzte? Der Durchschnitt? Der Median?
https://databraineo.com/ki-training-res ... er-gruppe/
https://databraineo.com/ki-training-res ... er-gruppe/
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
-
- Beiträge: 3
- Registriert: Fr Mai 22, 2020 10:01 am
Re: Beobachtungen der gleichen Person soll nur einfach zählen
Vielen Dank für die schnelle Antwort.
Bei gewissen Variablen wie z.B. condition_scenario (kategoriale Variable) und severity_av (intervallskalierte Variable) sollen alle Werte zählen.
Bei sex und age hingegen sollen diejenige Werte, die der gleichen Person (vpn_id) angehören, nur einmal zählen, wenn man die Deskriptivstatistiken berechnet, z.B. den mean von age.
Ich hoffe, ich habe mich klar ausgedrückt
Bei gewissen Variablen wie z.B. condition_scenario (kategoriale Variable) und severity_av (intervallskalierte Variable) sollen alle Werte zählen.
Bei sex und age hingegen sollen diejenige Werte, die der gleichen Person (vpn_id) angehören, nur einmal zählen, wenn man die Deskriptivstatistiken berechnet, z.B. den mean von age.
Ich hoffe, ich habe mich klar ausgedrückt
- Dateianhänge
-
- Bildschirmfoto 2020-06-08 um 19.22.53.png (17.65 KiB) 363 mal betrachtet
Re: Beobachtungen der gleichen Person soll nur einfach zählen
Hallo Jonas,
ich empfehle eine Trennung der Daten:
ein Dataframe mit den Daten, die sich auf die Person Ansicht beziehen (pro vpn_id je eine Zeile),
der andere Dataframe für die Beobachtungen (ggf. pro vpn_id mehrere).
Dann sollte Ordnung im Laden sein; nochmal kontrollieren, ob in df1 jede vpn_id nur einmal vorkommt:
beide Zahlen sollten gleich sein.
Gruß, Jörg
ich empfehle eine Trennung der Daten:
ein Dataframe mit den Daten, die sich auf die Person Ansicht beziehen (pro vpn_id je eine Zeile),
der andere Dataframe für die Beobachtungen (ggf. pro vpn_id mehrere).
Code: Alles auswählen
df1 <- unique(Daten[1:3])
df2 <- Daten[-(2:3)]
Code: Alles auswählen
nrow(df1)
length(unique(df1$vpn_id))
Gruß, Jörg
-
- Beiträge: 3
- Registriert: Fr Mai 22, 2020 10:01 am
Re: Beobachtungen der gleichen Person soll nur einfach zählen
Hat funktioniert!
Herzlichen Dank!
Herzlichen Dank!