Stichprobenbeschreibung mit R

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Gottchen
Beiträge: 20
Registriert: Sa Mai 16, 2020 7:22 pm

Stichprobenbeschreibung mit R

Beitrag von Gottchen »

Hallo liebe User,

und zwar will ich mich nun an einen einfachen Datensatz tun, um eine Stichprobe zu beschreiben. Was sind hier die nötigen Befehle für sowas wie:
1. Wie viele männlich, wie viele weiblich sind
2. Wie das Alter ("alter_selbst") verteilt ist (evtl. auch sinnvoll: wie das Alter allgemein sowie jeweils bei männlich und weiblich verteilt ist)
3. Wie viele unter anderen Variablen (nennt man das so?:D) z.B. der Variable(?) "hoestsch_selbst" (höchste Schulausbildung) welche Ausprägung (Ausbildung) haben, also auch hier wieder Verteilung. Ist dann wahrscheinlich ähnlich oder sogar gleich wie bei Alter?

Bei 1 könnte ich mir vorstellen, die Daten einfach mit table(daten$Geschlecht_selbst) zu erlangen, richtig? Bei 2 dasselbe und vielleicht noch mit Boxplots, dann aber keine Ahnung wie ich das in Bezug zu jeweils einzeln Mann und Frau hinkriege?

Bin für jede Antwort dankbar und euch noch einen schönen Sonntag! :)
Dateianhänge
StichprobeUmfrage.csv
(2.11 KiB) 37-mal heruntergeladen
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Stichprobenbeschreibung mit R

Beitrag von bigben »

Erst Daten einlesen, dann auf die Daten str und summary anwenden und dann schauen, was damit schon beantwortet ist und was nicht.
LG,Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Gottchen
Beiträge: 20
Registriert: Sa Mai 16, 2020 7:22 pm

Re: Stichprobenbeschreibung mit R

Beitrag von Gottchen »

Danke, ja gibt mir schon mal ein paar Antworten, aber wie kann ich denn z.B. hier sehen wie viele Probanden welche Ausprägung gewählt haben?

Code: Alles auswählen

 $ Muttersprache_selbst: int  1 1 1 1 1 1 1 1 1 1 ...
 $ hoestsch_selbst     : int  3 5 1 5 3 5 5 3 5 5 ...
Mit table(daten$Muttersprache_selbst), oder?

Glaube nur das hier wird nicht beantwortet: Wie das Alter jeweils bei männlich und weiblich verteilt ist.
Zuletzt geändert von Gottchen am So Mai 31, 2020 10:05 pm, insgesamt 2-mal geändert.
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Stichprobenbeschreibung mit R

Beitrag von bigben »

Hallo!

Eben am Smartphone war die Antwort etwas maulfaul, jetzt bin ich am Computer und habe die Daten eingelesen.
Bei 1 könnte ich mir vorstellen, die Daten einfach mit table(daten$Geschlecht_selbst) zu erlangen, richtig?


Ja, das funktioniert wunderbar und gibt ein Geschlechterverhältnis von 18 zu 29. Wieviel von welchem Geschlecht kann man so nicht sagen, da braucht man das data dictionary, in dem müsste stehen, wie welches Geschlecht codiert wurde.
Mit table(daten$Muttersprache_selbst), oder?
Ja, genauso.
Bei 2 dasselbe und vielleicht noch mit Boxplots, dann aber keine Ahnung wie ich das in Bezug zu jeweils einzeln Mann und Frau hinkriege?

Code: Alles auswählen

boxplot(daten$Alter_selbst ~ daten$Geschlecht_selbst, xlab = "Geschlecht", ylab = "Alter")
3. Wie viele unter anderen Variablen (nennt man das so?:D) z.B. der Variable(?) "hoestsch_selbst" (höchste Schulausbildung) welche Ausprägung (Ausbildung) haben, also auch hier wieder Verteilung. Ist dann wahrscheinlich ähnlich oder sogar gleich wie bei Alter?
Die höchste Schulausbildung ist ja nicht metrisch, wie das Alter, deshalb macht ein Boxplot da keinen Sinn. Eine Tabelle aber sehr wohl

Code: Alles auswählen

table(daten$hoestsch_selbst, daten$Geschlecht_selbst)
pie(table(daten$hoestsch_selbst), main="Schulbildung über alle")
barplot(table(daten$hoestsch_selbst, daten$Geschlecht_selbst), 
        legend.text = c("Kindergarten", "Grundschule", "Hauptschule",
                        "mittlere Reife", "Habilitation"),
        xlab="Geschlecht", ylab="Anzahl", main="Schulbildung nach Geschlecht")
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Gottchen
Beiträge: 20
Registriert: Sa Mai 16, 2020 7:22 pm

Re: Stichprobenbeschreibung mit R

Beitrag von Gottchen »

Danke sehr, Bernhard. Sehr einsichtig. Wie kann ich die genauen Daten dafür in Textform erhalten? Um z.B. bei dem Boxplot oder der Schulausbildung die genaue Zahlen ablesen zu können. Auch mit table?
Zuletzt geändert von Gottchen am So Mai 31, 2020 10:16 pm, insgesamt 1-mal geändert.
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Stichprobenbeschreibung mit R

Beitrag von bigben »

Gottchen hat geschrieben: So Mai 31, 2020 10:08 pm Danke sehr, Bernhard. Sehr einsichtig. Wie kann ich die genauen Daten dafür in Textform erhalten? Um z.B. bei dem Boxplot oder der Schulausbildung die genaue Zahlen ablesen zu können.
Hi,

beim Boxplot geht das recht einfach:

Code: Alles auswählen

boxplot.stats(subset(daten, daten$Geschlecht_selbst ==1)$Alter_selbst)
boxplot.stats(subset(daten, daten$Geschlecht_selbst ==2)$Alter_selbst)
Aber die Bedeutung der Ausgabe erschließt sich erst mit dem Eklärungstext unter

Code: Alles auswählen

help(boxplot.stats)
Bei der Schulausbildung steht die Antwort oben schon.

Viel Erfolg damit,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten