Binäre logistische Regression

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Yve237
Beiträge: 3
Registriert: Fr Jan 06, 2023 8:53 am

Binäre logistische Regression

Beitrag von Yve237 »

Hallo, ich führe eine binäre logistische Regression in R durch.

Meine abhängige Variable ist Spende (1=Ja,0=Nein) und meine zweite unabhängige Variable ist Bild (auch binär für Bild=1 und 0= kein Bild sondern Text). Ich habe in meinem Datenfile zwei Sample Gruppen, Gruppe 1 hat Text bekommen und Gruppe 2 ein Bild und ich messe den Einfluss dieser beiden Darstellungen (neben meiner ersten unabhängigen Variable Transparenz) auf die Spende. Dementsprechend lautet die Dummy Variable in meinem Datafile für Gruppe 1 =0 und für Gruppe 2 =1. Nun führe ich eben meine Codes für die log. Regression aus, was auch an sich alles funktioniert, allerdings bekomme ich für die Bild Variable bei summary des Modells keine Koeffizienten sondern nur NA-Werte. (siehe Screenshots)
Ich vermute das liegt daran, dass ich Gruppe 1&2 natürlich in einem file habe und R wegen der NA-Werte für die eine Gruppe für die entsprechenden Fragen nicht die richtigen Ergebnisse der anderen Gruppe erkennt. Allerdings erkennt das Programm bei der Variable Transparenz schon die numerischen Werte und ignoriert die NA Werte für die entsprechende andere Gruppe einfach, so wie es sein soll.
Also ich möchte testen wie das Bild (in Gruppe 2) im Gegensatz zum Text (in Gruppe 1), also meine Referenzkategorie, wirkt und die Spendenw'keit erhöht.
Was kann ich dagegen tun? Gibts einen na.rm = TRUE Befehl, nur für eine Regression? Oder muss ich den Datensatz für die Regression in Gruppe 1 und 2 aufteilen..?

Hier ein paar meiner Codes:
model0 <- glm(Spende1.1~1, data = data, family = binomial())
summary(model0)
model1 <- glm(Spende1.1~Transparenz1.1 + Bild, data = data, family = binomial())
summary(model1)

Ich hoffe man versteht was mein Problem ist :D Danke im Voraus!
Bildschirm­foto 2023-01-06 um 09.01.10.png
Bildschirm­foto 2023-01-06 um 09.00.38.png
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Binäre logistische Regression

Beitrag von schubbiaschwilli »

Gude!

Ich vermute mal, das liegt an den Daten bzw. am (fehlenden) Zusammenhang von 'Spende1.1' und 'Bild' - Hast du mal die Korrelation berechnet oder auf einen Zusammenhang getestet (ich kenne jetzt deine Daten nicht, aber ich tippe, ein Vierfeldertest würde funktionieren)?

Nachtrag: Wobei ich in dem Bildschirmfoto gerade sehe, die Spalte 'Transparenz1.1' enthält 'NA' - Also fehlen da Werte - Dir ist schon klar, dass bei einer Regression keine NAs zulässig sind?

Dank&Gruß
schubbiaschwilli
Yve237
Beiträge: 3
Registriert: Fr Jan 06, 2023 8:53 am

Re: Binäre logistische Regression

Beitrag von Yve237 »

Huhu, danke für die schnelle Antwort. Ich glaube ich scheine grundlegend etwas falsch zu machen (kenne mich leider auch überhaupt nicht damit aus), als Fehlermeldung für den Test kommt, dass meine Variablen keine 2 Level haben, aber sie sind doch binär?
Bildschirm­foto 2023-01-06 um 11.06.39.png
Das Problem bei Transparenz1.1 mit NA habe ich bereits gelöst, ich hatte nun einen einzelnen Datensatz für Gruppe 1 und 2 erstellt ohne NA's, aber das NA bei Bild in der Regression bleibt.
LG
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Binäre logistische Regression

Beitrag von schubbiaschwilli »

Deine Variable 'Bild' enthält nur den Wert '0'... - Ich würde mir mal meine Daten genau anschauen (und dazu plotten) - Ich tippe mal, das hast du nicht gemacht.
Yve237
Beiträge: 3
Registriert: Fr Jan 06, 2023 8:53 am

Re: Binäre logistische Regression

Beitrag von Yve237 »

Danke ich glaube ich hatte einfach einen Denkfehler, in Gruppe 1 (Text) kann die Variable Bild ja auch nur die Ausprägung 0 haben und in Gruppe 2 (Bild) dementsprechend nur 1. Ich habe gerade versucht Bild nochmal innerhalb der Gruppen als Dummy zu erstellen mit

> data$Bild <- recode(data$Bild, "1=1; 0=0")
> data$Bild <- as.factor(data$Bild)

aber das hat auch nicht geklappt, ich kriege es nicht hin :( Könntest du mir evtl. erklären wie ich das beheben kann ..?

Bzw. Nachtrag die Variable Bild ergibt so in der Ausführung eigentlich gar keinen Sinn, da die Gruppen ja eh schon nach der Variable aufgeteilt sind. Wenn ich den Datensatz wieder zusammenführe als ein ganzer mit Gruppe 1 und 2 hätte ich ja die Ausprägungen 1 und 0, aber da sind die NA-Werte aus der jeweils anderen Gruppe das Problem ..
Antworten