Stichprobe ziehen

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Joe_Gerner

Stichprobe ziehen

Beitrag von Joe_Gerner »

Hallo,

ich habe einen Datensatz mit 1,3 Mio Objekten. Für eine Berechnung möchte ich zunächst eine Stichprobe von diesem Datensatz ziehen, die 70% vom Datensatz umfasst. Für eine Überprüfung meiner Berechnungen brauche ich jetzt die restlichen 30% des Datensatzes, wie stelle ich das am besten an?
Eine erneute Stichprobe zu ziehen macht ja keinen Sinn, da es sich um eine zufällige Stichprobenziehung handelt oder?
Hier mal mein Skript:

Code: Alles auswählen

#Stichprobe 
read_gem <- read.csv2("Data.csv")
smp_size <- floor(0.70 * nrow(read_gem))
set.seed(123)
read_gem_1<-read_gem[sample(nrow(read_gem), smp_size), ]
Vielen Dank für eure Hilfe und viele Grüße

Felix
Zuletzt geändert von jogo am Fr Jun 15, 2018 9:33 am, insgesamt 1-mal geändert.
Grund: Code formatiert
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Stichprobe ziehen

Beitrag von jogo »

Hallo Felix,

Du solltest die Indexmenge der 70%-Auswahl Dir irgendwo speichern:

Code: Alles auswählen

#Stichprobe 
read_gem <- read.csv2("Data.csv")
smp_size <- floor(0.70 * nrow(read_gem))
set.seed(123)
I.70vH <- sample(nrow(read_gem), smp_size)
read_gem_1 <- read_gem[I.70vH, ] ### 70% der Daten
read_gem_2 <- read_gem[-I.70vH, ] ### die restlichen 30% der Daten
Gruß, Jörg
p.s.:
bitte lies viewtopic.php?f=20&t=29
(Nutzung der entsprechenden Formatierungstags)
Joe_Gerner

Re: Stichprobe ziehen

Beitrag von Joe_Gerner »

Hallo Jörg,

vielen Dank für deine schnelle Hilfe und den Hinweis bezüglich der richtigen Formatierung von Beiträgen werde ich in Zukunft auch umsetzen :)

Viele Grüße

Felix
Antworten