ich hätte eine Frage zur Variablengruppierung in einer Tabelle. Eine Spalte (Variable .id) enthält die Nummer der Versuchspersonen (kodiert: P1.csv = Versuchsperson 1, P2.csv = Versuchsperson 2…). Mein Ziel ist, dass ich mehrere bestimmte Versuchspersonen zu Gruppen zusammenfassen möchte. Dafür würde ich gerne in derselben Tabelle eine neue Spalte (Gruppenvariable) erstellen, welche z.B. den Wert 1 immer bei P1.csv und P2.csv hat und den Wert 2 bei P3.csv und P4.csv. Weiß jemand vielleicht einen R-Befehl, wie sich dieses Problem lösen lässt?
Hier ein Screenshot von der Tabelle:
Ich habe die Tabelle mit einem automatischen Einlesebefehl erstellt, welcher im angegebenen Verzeichnis jede einzelne CSV-Datei einliest und zu einer großen Tabelle zusammenfügt. Deshalb kommen die "komischen" Werte Px.csv zustande, da der Name der Datei als Wert genommen wird.
Hier nochmal der Einlesebefehl:
Code: Alles auswählen
library("plyr")
paths <- dir("C:/Users/RobinAOE/Desktop/", pattern = "\\.csv$", full.names = TRUE)
names(paths) <- basename(paths)
datengesamt <- ldply(paths, read.csv, stringsAsFactors = FALSE)
Robin