Seite 1 von 1

Sind GLMM die richtige Wahl?

Verfasst: Mo Mai 10, 2021 2:23 pm
von Obitan
Hallo zusammen, ich gebe euch einen kurzen Überblick über meine Studie:

Wir haben (theoretisch) mehrere mögliche Funktionalitäten zu einem existierenden Produkt entwickelt.
Wie zufrieden die Teilnehmer mit den Funktionalitäten und dem bestehenden Produkt (Baseline ) sind, erfassen wir mit einem KPI Wert (1-7).

Die Produkte werden den Teilnehmern in zufälliger Zusammensetzung vorgestellt, das sieht wie folgt aus:
  • Produktmerkmal 1 = 3 Ausprägungen
  • Produktmerkmal 2 = 6 Ausprägungen
  • Produktmerkmal 3 = 2 Ausprägungen
  • Produktmerkmal 4 = 4 Ausprägungen
Aus den den jeweiligen Ausprägungen wird eine zufällig ausgewählt und kombiniert dem Teilnehmer präsentiert.
Das heißt Teilnehmer A kriegt: Merkmal1, Ausprägung1, Merkmal2, Ausprägung3, usw. Teilnehmer B kriegt hingegen: Merkmal1, Ausprägung2, Merkmal2, Ausprägung2, usw.

Die einzelnen Ausprägungen liegen als Faktoren in R vor.

Code: Alles auswählen

str(data_test$scenario1_type)
 Factor w/ 3 levels "praeg1","praeg2",..: 1 1 1 1 2 3 

Meine Forschungsfrage lautet:
Welche Kombination von Ausprägungen führt zum höchsten KPI Wert.

Kann ich die Funktion glmer nutzen um vorauszusagen, dass bspw Merkmal1, Ausprägung2 einen besonders starken Einfluss auf den KPI Wert hat?
Oder gibt es andere Funktionen die mir das zuverlässiger sagen können?
Falls jemand eine Funktion kennt, würde ich mich auch darüber freuen wenn ihr mir Infos geben könntet in welcher Form meine Daten vorliegen müssen.
Bei Fragen, einfach raus damit. Ich versuche sie bestmöglich zu beantworten.
Beste Grüße,
Nils

Re: Sind GLMM die richtige Wahl?

Verfasst: Mo Mai 10, 2021 2:50 pm
von bigben
Hallo Nils,

wieviele Menschen glaubst Du denn befragen zu können? Das sind 144 Kombinationen von Merkmalsausprägungen - wird jedem Teilnehmer nur eine Merkmalsausprägungskombination vorgestellt?

Die nächste Frage müsste m. E. lauten: Erwartest Du, dass die verschiedenen Produktmerkmale unabhängig voneinander sind, oder gibt es da Interaktionen? Also ein Rückwärtsgang ist eine schöne Sache und ein Rückspiegel sind schöne Sachen, aber erst gemeinsam sind sie mehr Wert als die Summe der Teile. Ein Rückspiegel ist vielleicht nicht mehr ganz so wichtig, wenn man auch schon eine Rückfahrkamera hat. Da verliert das eine an Wert, wenn das andere schon da ist. Rechnest Du damit, dass solche Interaktionen zu berücksichtigen sind oder eher nicht?

Wenn ich Dich richtig verstanden habe willst Du jeden Teilnehmer nach dem Baseline-Wert ohne Zusatzentwicklung und jeden Teilnehmer nach dem Wert mit einer zufälligen Weiterentwicklungskombinationbefragen. Warum beides, warum nicht nur eines? Welche Annahme steht dahinter?

Wenn Du jeden Teilnehmer nur nach der Baseline und dem Wert einer Kombination befragst, wofür glaubst Du einen random effect zu brauchen?

Ich bin sicher, Du hast Dir über solche Dinge implizit Gedanken gemacht und ich glaube es könnte bei der Modellbildung helfen, die explizit aufzuschreiben.

LG,
Bernhard

Re: Sind GLMM die richtige Wahl?

Verfasst: Mo Mai 10, 2021 3:17 pm
von Obitan
Hallo Bernhard, die Befragung läuft schon und liegt aktuell bei ca. 200 Teilnehmern. Jeder Teilnehmer bekommt die Baseline +3 zufällige Produkte präsentiert.
Ich gehe davon aus, dass die Merkmale unabhängig voneinander sind (zumindest habe ich sie so konzipiert).

Die Baseline habe ich berechnet um später meine Hypothese zu prüfen, dass es einen Unterschied zwischen Baseline und den verschiedenen neuen Produkten gibt. Die möchte ich aber aktuell nicht in die Berechnung einfließen lassen (oder macht das Sinn?).

Dieser Random Effect den ich gebaut habe stammt von meinem Betreuer, der möchte, dass ich für meine Masterarbeit eine Studie in dem Vignetten Stil durchführe :lol:
Wir sind jedoch beides keine Statistiker sondern Informatiker aus dem Data Privacy Bereich und unsere Erfahrungen sind begrenzt.
Ich hoffe ich konnte dir etwas Klarheit mit meinen Antworten verschaffen.

Re: Sind GLMM die richtige Wahl?

Verfasst: Mo Mai 10, 2021 5:01 pm
von bigben
Obitan hat geschrieben: Mo Mai 10, 2021 3:17 pmHallo Bernhard, die Befragung läuft schon und liegt aktuell bei ca. 200 Teilnehmern. Jeder Teilnehmer bekommt die Baseline +3 zufällige Produkte präsentiert.
Ok, das ist dann auch der Grund für den random effect auf dem Teilnehmer.
Ich gehe davon aus, dass die Merkmale unabhängig voneinander sind (zumindest habe ich sie so konzipiert).
Das ist schön, weil das macht das Modell einfach: neuer Preis = alter Preis plus Mehrwert Merkmal1 plus Mehrwert Merkmal2 plus Mehrwert Merkmal3 plus MEhrwert Merkmal4 + Begeisterungsfähigkeit jedes Teilnehmers als random effect.

So ein Modell ließe sich mit glmer oder lme4 bestimmt erstellen und kann könnte man pro Produktmerkmal jeweils die wertvollste Ausprägung aussuchen.
Die Baseline habe ich berechnet um später meine Hypothese zu prüfen, dass es einen Unterschied zwischen Baseline und den verschiedenen neuen Produkten gibt. Die möchte ich aber aktuell nicht in die Berechnung einfließen lassen (oder macht das Sinn?).
Könnte man sich überlegen, ob man als abhängigen Wert die Wertsteigerung als neuen_wert minus alten_wert in die Regression einsetzen möchte.
Dieser Random Effect den ich gebaut habe stammt von meinem Betreuer, der möchte, dass ich für meine Masterarbeit eine Studie in dem Vignetten Stil durchführe
Ja, es fehlte vorher die Information, dass jeder Teilnehmer drei Zufallsprodukte bewertet. Damit entstammen diese drei je einer eigenen Quelle und die Daten sind in Ihrer Gänze nicht mehr i.i.d. sondern hierarchische Daten. Deshalb z. B: glmer

LG,
Bernhard

Re: Sind GLMM die richtige Wahl?

Verfasst: Mi Mai 12, 2021 10:00 am
von Obitan
Hallo Bernhard, ich danke die für deine Antworten. Ich habe die letzten 2 Tage versucht mir ein Modell zu erstellen, es läuft leider nicht so ganz nach Plan.
bigben hat geschrieben: Mo Mai 10, 2021 5:01 pm
Das ist schön, weil das macht das Modell einfach: neuer Preis = alter Preis plus Mehrwert Merkmal1 plus Mehrwert Merkmal2 plus Mehrwert Merkmal3 plus MEhrwert Merkmal4 + Begeisterungsfähigkeit jedes Teilnehmers als random effect.

So ein Modell ließe sich mit glmer oder lme4 bestimmt erstellen und kann könnte man pro Produktmerkmal jeweils die wertvollste Ausprägung aussuchen.
Meinst du mit Preis meinen KPI Wert?
Genau das habe ich probiert, in meinem Kopf habe ich an 3 Ebenen gedacht:
  • Ebene 1: Teilnehmer
  • Ebene 2: Produkt(1,2,3)
  • Ebene 3: Die einzelnen Merkmale
Könnte man sich überlegen, ob man als abhängigen Wert die Wertsteigerung als neuen_wert minus alten_wert in die Regression einsetzen möchte.
Ja, es fehlte vorher die Information, dass jeder Teilnehmer drei Zufallsprodukte bewertet. Damit entstammen diese drei je einer eigenen Quelle und die Daten sind in Ihrer Gänze nicht mehr i.i.d. sondern hierarchische Daten. Deshalb z. B: glmer
Im Buch R für Einsteiger habe ich die folgende Syntax entdeckt:

Code: Alles auswählen

modell.1 <- lmer(AV~ 1 + (1 | nation), data = kultur)
1 für Achsenabschnitt und 1 | nation steht für die Mehrebenenstruktur.
Sie baut mehrere Modelle und nutzt später Anova auf beide Ebenen, leider jedoch nur für einen Faktor und ich kriege es nicht hin ihre Struktur auf meine anzupassen.
Mein Code gibt mir nur ein Nullpointer Objekt zurück und vergleichen kann ich damit auch nichts...

Code: Alles auswählen

modell_1 <- lmer(kpi_1 ~ prod1_type + prod1_metric + prod1_conf +prod1_set + (1|Random_effect???), data=data_test)
Die Faktoren nach der Tilde sind die Merkmale, diese habe ich jeweils für alle 3 Produkte, genau wie ich auch vom KPI Wert 3 Stück habe.
Liebe Grüße,
Nils

Re: Sind GLMM die richtige Wahl?

Verfasst: Mi Mai 12, 2021 10:24 am
von bigben
Hallo Obitan,
Obitan hat geschrieben: Mi Mai 12, 2021 10:00 amMeinst du mit Preis meinen KPI Wert?
Ja. Ich habe keine Ahnung, was ein KPI-Wert ist und da habe ich Kopf wohl Preis/Wert ersetzt, weil ich mir darunter was vorstellen kann.
Genau das habe ich probiert, in meinem Kopf habe ich an 3 Ebenen gedacht:
  • Ebene 1: Teilnehmer
  • Ebene 2: Produkt(1,2,3)
  • Ebene 3: Die einzelnen Merkmale
War bisher irgendwo von mehreren Produkten die Rede? Ich lese im Eingangspost von einem Produkt, dass durch Merkmale ergänzt wird.
Im Buch R für Einsteiger habe ich die folgende Syntax entdeckt: [...] und ich kriege es nicht hin ihre Struktur auf meine anzupassen.
Niemand hat gesagt, dass es einfach ist, ein oder gar das beste Mehrebenenmodell zu definieren. Weder inhaltlich noch in R.
Die Faktoren nach der Tilde sind die Merkmale, diese habe ich jeweils für alle 3 Produkte, genau wie ich auch vom KPI Wert 3 Stück habe.
Aus jahrelanger Forumserfahrung darf ich Dir versichern: Das wird so nichts. (1) Wenn Du Hilfe beim Aufstellen des Modells haben willst, dann muss das Problem besser beschrieben sein. Unsicherheiten ob es nun ein Produkt gibt oder drei Produkte müssen sicher alle aus dem Weg geräumt sein. (2) Wenn Du Hilfe beim Aufstellen von R-Befehlen willst wirst Du die hier nicht ohne ein konkretes Datenbeispiel bekommen. Siehe dazu: viewtopic.php?f=20&t=11m . Alle, die hier regelmäßig antworten haben das schon durch, dass sie ein in Text beschriebenen Problem lösen nur um dann nachher vom Fragesteller zu erfahren, dass er wichtige Details ausgelassen oder missverständlich dargestellt hat. Das ist eine wenig amüsante Erfahrung und Beispieldaten sind unser bester Weg, sowas zu erkennen.

LG,
Bernhard