multinominal logit model - singularity problem

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
konrad

multinominal logit model - singularity problem

Beitrag von konrad »

Hey,
Ich habe ein choice based conjoint experiment durchgeführt, bei dem die Teilnehmer eine Auswahl zwischen 3 Optionen eine und einer 'keine'- Möglichkeit treffen. Ich habe eine abhängige Variable (Choice) und 4 unabhängige Variablen(Brand, Features, Volume und Valence) mit jeweils 3 leveln. Die 'keine' option hab ich als wert 0 bei jedem Attribut hinzugefügt.
Mein Set kann unter diesem Link abgerufen werden: https://docs.google.com/spreadsheets/d/ ... edit#gid=0

Es sind zwei Sheets. Im ersten sind die variablen als zahlen gecoded (t1), im zweiten als Faktoren (t2).
Ich habe anfangs nicht darüber und einfach die Zahlen Version genommen:
Mit folgendem code habe ich versucht die Attribute zu schätzen https://cran.r-project.org/web/packages ... mlogit.pdf:

Code: Alles auswählen

datenset <- read_csv("~/Dokumente/UvA/Thesis/R/t1.csv")
datenset <- mlogit.data(data=datenset, opposite="Valence", choice="choice", shape="long",varying=4:5, alt.levels=paste("pos",1:4),id.var="id")

m1 <- mlogit(choice~ 0 + Brand+ Features+ Valence+ Volume, datenset)
summary(m1)
folgender Output wurde mir über stargazer geliefert:
https://i.stack.imgur.com/GuUYM.jpg
Ich habe dann gemerk dass ich keine level estimates bekomme und daraufhin gesehen, dass R meine Daten als integer interpretiert und nicht als factors. Wenn ich jedoch a) die Zahlen als factor speicher oder b) sheet t2 nutze, bekomme ich einen singularity error angezeigt...

Ich habe kene Erfahrung mit multinominalen logits und mit R, daher denke ich dass ich einige grundlegende Fehler mache wenn ich versuche als Faktoren zu schätzen.
Ich bin etwas am Verzweifeln und würde mich über Hilfe freuen!
Konrad
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: multinominal logit model - singularity problem

Beitrag von EDi »

a) die Zahlen als factor speicher
Sind das wirklich kategorische Prädikatoren? Wie viele verschiedene Kombinationen hast du? Der Fehler könnte daher rühren, dass das Modell zu komplex für die Daten ist. Aber ohne ein reproduzierbares Beispiel und weitergehende Infos kann man nicht mehr sagen...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
konrad

Re: multinominal logit model - singularity problem

Beitrag von konrad »

Ich bin gerade etwas verwirrt da ich von verschiedenen Seiten verschiedenes feedback bekomme und mir bei allem unsicher bin.
- Einige raten mir dazu das mlogit package mit der mlogit() funktion zu nutzen, andere behaupten ein einfaches logit (da binary outcome) ist richtig und meine Wahl ist falsch?

Meine abhängige variable is choice(0/1). Meine unabhängigen Variablen sind Brand, Features, Valence und Volume. Alle haben 3 level.
Brand: maps, bing, GeoLocate; Features: non, oauth und cache; Volume (low, medium und high); Valence(low, medium and high).
Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: multinominal logit model - singularity problem

Beitrag von Athomas »

Das ist eine ganz popelige logistische Regression, mit der auch glm klarkommt :shock: !
Lustigerweise hat die "binäre" Variable die Werte 0,1, und (einmal) 10!
Antworten