ich habe einen Datensatz mit 1,3 Mio Objekten. Für eine Berechnung möchte ich zunächst eine Stichprobe von diesem Datensatz ziehen, die 70% vom Datensatz umfasst. Für eine Überprüfung meiner Berechnungen brauche ich jetzt die restlichen 30% des Datensatzes, wie stelle ich das am besten an?
Eine erneute Stichprobe zu ziehen macht ja keinen Sinn, da es sich um eine zufällige Stichprobenziehung handelt oder?
Hier mal mein Skript:
Code: Alles auswählen
#Stichprobe
read_gem <- read.csv2("Data.csv")
smp_size <- floor(0.70 * nrow(read_gem))
set.seed(123)
read_gem_1<-read_gem[sample(nrow(read_gem), smp_size), ]
Felix