Neue Variable berechnen und Regression durchführen
Verfasst: Mi Jan 11, 2017 4:46 pm
Moin zusammen,
ich muss für eine binäre logistische Regression die zu erklärende Variable berechnen. Dazu stehen mir Daten aus einer zuvor durchgeführten Umfrage zur Verfügung und sehen wie folgt aus:
1. Variable ist die Fallnummer. Jede Fallnummer (1-110) kommt doppelt vor, da jeder Teilnehmer zweimal befragt wurde. Die zu erklärende Variable soll die Stabilitsrate sein. Diese wird errechnet aus der Häufigkeit, mit der eine Antwort in beiden Befragungswellen identisch gegeben wurde. Gefragt waren 7 Assoziationen zu 6 Automodellen. Es ergeben sich somit 42 Assoziationsvariablen.
Bsp.: Assoziation Langlebigkeit beim VW Golf.
1:Welle: Ja
2.Welle: Ja => Stabilität erfüllt.
1.Welle: Ja
2.Welle: Nein (oder umgekehrt) => Stabilität nicht erfüllt
Wird von einem Teilnehmer in beiden Wellen Nein angegeben, soll dies nicht in die Stabilitätsrate einfließen.
R soll diese Berechnung für jeden Teilnehmer (= gleiche Fallnummer) durchführen.
Jetzt kommt noch dazu, dass es drei verschiedene Fragebogendesigns gab.
D.h. Für gleiche Fallnummern soll R rechnen: Stabilitätsrate = Anzahl "Ja und Ja"-Fälle / (alle Teilnehmer des Designs x - Anzahl "Nein/Nein"-Fälle im Design x).
Unterschiede in der Stabilität der Antworten zwischen den Fragebogendesigns sind der eigentliche Grund für die Studie, d.h. es geht insb. nicht darum, welche Assoziation mit welchem Automodell verbunden wird.
Hier soll R für jedes Design (dazu gibt es eine entsprechende Variable mit Ausprägungen 1,2,3) die Stabilitätsrate berechnen.
Dann gibt es noch weitere Faktoren, wie allgemeine Meinung zum Modell, Vertrauen in den Hersteller oder wahrgenommene Schwierigkeit des Fragebogens. Diese müssen teilweise nach Fallnummer und Welle unterschieden werden, teilweise nur nach Fallnummer.
Ziel ist für mich ein Modell der Form
Modell<- glm(Stabilitätsrate ~ Design 1 + Design 2 + Design 3 + Meinung zum Modell + ... + Vertrauen in den Hersteller, data = meineDaten, family = "binomial").
Dieses soll den Einfluss der Designs und der weiteren Variablen auf die Stabilität der Antworten zeigen. Krönender Abschluss wäre ein Balkendiagramm, bei dem das schlechteste Design auf Null liegt (d.h. im Intercept) und die Balken die Regressionskoeffizienten enthalten und somit den positiven Einfluss der anderen Variablen auf die Stabilität wiederspiegeln.
Die Aufgabenstellung ist hier sehr eng, die Auswertung soll so aussehen, also binäre logistische Regression und Einfluss der Variablen auf die Stabilität zeigen. Tja und das kriege ich nicht hin
Freue mich über Tipps und Hilfestellung
ich muss für eine binäre logistische Regression die zu erklärende Variable berechnen. Dazu stehen mir Daten aus einer zuvor durchgeführten Umfrage zur Verfügung und sehen wie folgt aus:
1. Variable ist die Fallnummer. Jede Fallnummer (1-110) kommt doppelt vor, da jeder Teilnehmer zweimal befragt wurde. Die zu erklärende Variable soll die Stabilitsrate sein. Diese wird errechnet aus der Häufigkeit, mit der eine Antwort in beiden Befragungswellen identisch gegeben wurde. Gefragt waren 7 Assoziationen zu 6 Automodellen. Es ergeben sich somit 42 Assoziationsvariablen.
Bsp.: Assoziation Langlebigkeit beim VW Golf.
1:Welle: Ja
2.Welle: Ja => Stabilität erfüllt.
1.Welle: Ja
2.Welle: Nein (oder umgekehrt) => Stabilität nicht erfüllt
Wird von einem Teilnehmer in beiden Wellen Nein angegeben, soll dies nicht in die Stabilitätsrate einfließen.
R soll diese Berechnung für jeden Teilnehmer (= gleiche Fallnummer) durchführen.
Jetzt kommt noch dazu, dass es drei verschiedene Fragebogendesigns gab.
D.h. Für gleiche Fallnummern soll R rechnen: Stabilitätsrate = Anzahl "Ja und Ja"-Fälle / (alle Teilnehmer des Designs x - Anzahl "Nein/Nein"-Fälle im Design x).
Unterschiede in der Stabilität der Antworten zwischen den Fragebogendesigns sind der eigentliche Grund für die Studie, d.h. es geht insb. nicht darum, welche Assoziation mit welchem Automodell verbunden wird.
Hier soll R für jedes Design (dazu gibt es eine entsprechende Variable mit Ausprägungen 1,2,3) die Stabilitätsrate berechnen.
Dann gibt es noch weitere Faktoren, wie allgemeine Meinung zum Modell, Vertrauen in den Hersteller oder wahrgenommene Schwierigkeit des Fragebogens. Diese müssen teilweise nach Fallnummer und Welle unterschieden werden, teilweise nur nach Fallnummer.
Ziel ist für mich ein Modell der Form
Modell<- glm(Stabilitätsrate ~ Design 1 + Design 2 + Design 3 + Meinung zum Modell + ... + Vertrauen in den Hersteller, data = meineDaten, family = "binomial").
Dieses soll den Einfluss der Designs und der weiteren Variablen auf die Stabilität der Antworten zeigen. Krönender Abschluss wäre ein Balkendiagramm, bei dem das schlechteste Design auf Null liegt (d.h. im Intercept) und die Balken die Regressionskoeffizienten enthalten und somit den positiven Einfluss der anderen Variablen auf die Stabilität wiederspiegeln.
Die Aufgabenstellung ist hier sehr eng, die Auswertung soll so aussehen, also binäre logistische Regression und Einfluss der Variablen auf die Stabilität zeigen. Tja und das kriege ich nicht hin

Freue mich über Tipps und Hilfestellung
