ich habe einen Längschnitts-Datensatz im long-format, d.h. jeder Teilnahme an der mehrwelligen Befragung wird in einer Zeile gespeichert. So wird die Teilnahme der Person x mit Teilnahmecode "AH2D" zum ersten Messzeitpunkt in einer Zeile gespeichert und die Teilnahme derselben Person zum zweiten Messzeitpunkt in einer neuen Zeile gespeichert. Insgesamt gab es drei Messzeitpunkt.
Der Datensatz könnte beispielhaft so aussehen:
Code: Alles auswählen
dat<-data.frame(
"id" = c("A","A","A", "B","B","C","C","D"),
"time" = c("1", "2","3", "1", "2","1","3","2"),
"gender" = c("male","male", "male", "female", "female","male","male", "female"),
"age" = c(22,22,23,45,46,67,68,29))
Ich würde nun gern zwei Spalten erstellen:
In der Spalte "Anzahl Teilnahme" würde ich gern festhalten, wie oft die Person teilgenommen hat. In der zweiten Spalte "Teilnahme" würde ich gern die Kombination der Teilnahme festhalten. Hier gäbe es die Werte: T1, T2, T3, T1&2, T1&3, T2&3, sowie T1&2&3.
Das Ziel ist, dass ich den Datensatz später entsprechend filtern kann.
Ich habe bereits mit dem Package "plm" und der Funktion pdata.frame() versucht so etwas zu erstellen. Mit einem Table-Befehl konnte ich mir sogar für jeden Teilnehmenden anzeigen lassen, zu welchen Zeitpunkten er/sie teilgenommen hat (siehe Bild unten; Anmerkung Datensatz heißt im Bild sub_dat_wide2 und Teilnahmecodes sind etwas komplexer als im Beispiel oben)
Mir gelingt es jedoch nicht, die entsprechenden Spalten, die ich gern hätte, zu erstellen.
Weißt jemand, wie man das am besten macht?
Vielen Dank vorab.