Hey,
folgendes ist mein Problem:
Ich habe eine Stichprobe (N=298), bei der ich den Zusammenhang zwischen soziodemografischen Variablen und der Inanspruchnahme medizinischer Leistungen untersuchen möchte. Dafür erhebe ich diverse Variablen (z.B. Inanspruchnahmewahrscheinlichkeit Herz-Kreis) bei allen Teilnehmer*innen.
Es gibt jedoch zusätzliche Filter, so dass unterschiedliche Gruppen verschiedene Fragen erhalten.
Filter 1: Gehst du noch zur Schule?
--> ja (n=280): Welche Schulform?
--> nein (n=18): Welchen Schulabschluss hast du gemacht?
Filter 2: Hast du schon mal jemals eine kardiologische Untersuchung in Anspruch genommen?
--> Ja: Wie häufig? Wie hilfreich fandest du es? Hast du in den letzten 12 Monaten eine kardiol. Untersuchung in Anspruch genommen?
-->wenn ja: wie häufig? Wie hilfreich fandest du es?
Soweit zur Datenstruktur.
Mein Ziel sind Regressionsanalysen von z.B. Inanspruchnhamewahrscheinlichkeit Herz-Kreis auf Schulform / Schulabschluss.
Ich habe jetzt keine Ahnung, wie ich dabei mit den Missings umgehen soll. Ich kann ja nicht einfach alle missings ausschließen.
Bis jetzt habe ich mehrere Datensätze erstellt (1 für Schüler*innen, 1 für Nicht-Schüler*innen, 1 für Inanspruchnehmer*innen etc) - gibt es eine andere Möglichkeit? Gibt es die Möglichkeit partieller Ausschlüsse für einzelne Regressionen?
Ich freue mich über jede Idee und Unterstützung. Danke!
Viele Grüße,
robyn
Arbeiten mit geschachtelten Missings im Datensatz
Re: Arbeiten mit geschachtelten Missings im Datensatz
Hallo robyn,
willkommen im Forum!
Hast Du die Daten bereits eingelesen und kannst uns die Struktur zeigen
Gruß, Jörg
willkommen im Forum!
Hast Du die Daten bereits eingelesen und kannst uns die Struktur zeigen

Code: Alles auswählen
str(DeinDataframe)
Re: Arbeiten mit geschachtelten Missings im Datensatz
klar, hier ein Ausschnitt:
> str(dat)
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 298 obs. of 162 variables:
$ gender : Factor w/ 5 levels "1","2","4","5",..: 1 1 2 1 1 1 1 1 1 1 ...
$ sexuelle_orientierung : num 1 1 2 4 1 3 2 1 2 1 ...
$ age : num 14 16.2 15.3 14.2 17.3 ...
$ schulbesuch : num 1 1 1 1 1 2 2 1 1 1 ...
$ schulform : num 5 5 5 2 5 NA NA 3 5 5 ...
$ klassenstufe : num 8 10 10 8 12 NA NA 10 12 13 ...
$ schulabschluss : num NA NA NA NA NA 1 1 NA NA NA ...
$ taetigkeit : num NA NA NA NA NA 5 6 NA NA NA ...
$ wohnort_size : num 1 1 5 1 1 2 1 1 1 2 ...
$ job_mutter : num 4 4 6 2 5 5 1 5 4 5 ...
$ job_vater : num 5 5 5 2 5 5 5 5 5 5 ...
$ ses_schule : num 7 9 5 10 8 NA NA 8 4 6 ...
$ ses_arbeit : num NA NA NA NA NA 4 4 NA NA NA ...
$ inanspruchnahme_ever : num 1 1 3 1 1 4 8 1 3 1 ...
$ inanspruchnahme_ever_count : num NA NA 15 NA NA NA NA NA 4 NA ...
$ inanspruchnahme_beruf : num NA NA 1 NA NA 1 2 NA 1 NA ...
$ inanspruchnahme_hilfreich : num NA NA 4 NA NA 4 4 NA 2 NA ...
$ inanspruchnahme_12mo : num NA NA 3 NA NA 3 3 NA 3 NA ...
$ inanspruchnahme_12mo_count : num NA NA 15 NA NA 40 50 NA 4 NA ...
> str(dat)
Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 298 obs. of 162 variables:
$ gender : Factor w/ 5 levels "1","2","4","5",..: 1 1 2 1 1 1 1 1 1 1 ...
$ sexuelle_orientierung : num 1 1 2 4 1 3 2 1 2 1 ...
$ age : num 14 16.2 15.3 14.2 17.3 ...
$ schulbesuch : num 1 1 1 1 1 2 2 1 1 1 ...
$ schulform : num 5 5 5 2 5 NA NA 3 5 5 ...
$ klassenstufe : num 8 10 10 8 12 NA NA 10 12 13 ...
$ schulabschluss : num NA NA NA NA NA 1 1 NA NA NA ...
$ taetigkeit : num NA NA NA NA NA 5 6 NA NA NA ...
$ wohnort_size : num 1 1 5 1 1 2 1 1 1 2 ...
$ job_mutter : num 4 4 6 2 5 5 1 5 4 5 ...
$ job_vater : num 5 5 5 2 5 5 5 5 5 5 ...
$ ses_schule : num 7 9 5 10 8 NA NA 8 4 6 ...
$ ses_arbeit : num NA NA NA NA NA 4 4 NA NA NA ...
$ inanspruchnahme_ever : num 1 1 3 1 1 4 8 1 3 1 ...
$ inanspruchnahme_ever_count : num NA NA 15 NA NA NA NA NA 4 NA ...
$ inanspruchnahme_beruf : num NA NA 1 NA NA 1 2 NA 1 NA ...
$ inanspruchnahme_hilfreich : num NA NA 4 NA NA 4 4 NA 2 NA ...
$ inanspruchnahme_12mo : num NA NA 3 NA NA 3 3 NA 3 NA ...
$ inanspruchnahme_12mo_count : num NA NA 15 NA NA 40 50 NA 4 NA ...
Re: Arbeiten mit geschachtelten Missings im Datensatz
Kommt für Dich sowas wie ein Chi²-Test in Frage?
(eventuell müssen einige Variablen wieder in Faktoren umgewandelt werden)
Gruß, Jörg
Code: Alles auswählen
?chisq.test
Gruß, Jörg
Re: Arbeiten mit geschachtelten Missings im Datensatz
Nein, das bringt mir leider nichts, danke. Mir geht es ja gerade um eine Datensatzerstellung trotz serieller Missings und nicht um ein geeignetes Analyseverfahren.
Re: Arbeiten mit geschachtelten Missings im Datensatz
klar, denn die Funktion lm() hat einen Parameter subset=, mit dem bestimmt wird, dass nur eine Teilmenge der Beobachtungen des Dataframes (Parameter data=) verwendet wird.Gibt es die Möglichkeit partieller Ausschlüsse für einzelne Regressionen?
Gruß, Jörg