Sind GLMM die richtige Wahl?

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Obitan
Beiträge: 3
Registriert: Mo Mai 10, 2021 12:44 pm

Sind GLMM die richtige Wahl?

Beitrag von Obitan »

Hallo zusammen, ich gebe euch einen kurzen Überblick über meine Studie:

Wir haben (theoretisch) mehrere mögliche Funktionalitäten zu einem existierenden Produkt entwickelt.
Wie zufrieden die Teilnehmer mit den Funktionalitäten und dem bestehenden Produkt (Baseline ) sind, erfassen wir mit einem KPI Wert (1-7).

Die Produkte werden den Teilnehmern in zufälliger Zusammensetzung vorgestellt, das sieht wie folgt aus:
  • Produktmerkmal 1 = 3 Ausprägungen
  • Produktmerkmal 2 = 6 Ausprägungen
  • Produktmerkmal 3 = 2 Ausprägungen
  • Produktmerkmal 4 = 4 Ausprägungen
Aus den den jeweiligen Ausprägungen wird eine zufällig ausgewählt und kombiniert dem Teilnehmer präsentiert.
Das heißt Teilnehmer A kriegt: Merkmal1, Ausprägung1, Merkmal2, Ausprägung3, usw. Teilnehmer B kriegt hingegen: Merkmal1, Ausprägung2, Merkmal2, Ausprägung2, usw.

Die einzelnen Ausprägungen liegen als Faktoren in R vor.

Code: Alles auswählen

str(data_test$scenario1_type)
 Factor w/ 3 levels "praeg1","praeg2",..: 1 1 1 1 2 3 

Meine Forschungsfrage lautet:
Welche Kombination von Ausprägungen führt zum höchsten KPI Wert.

Kann ich die Funktion glmer nutzen um vorauszusagen, dass bspw Merkmal1, Ausprägung2 einen besonders starken Einfluss auf den KPI Wert hat?
Oder gibt es andere Funktionen die mir das zuverlässiger sagen können?
Falls jemand eine Funktion kennt, würde ich mich auch darüber freuen wenn ihr mir Infos geben könntet in welcher Form meine Daten vorliegen müssen.
Bei Fragen, einfach raus damit. Ich versuche sie bestmöglich zu beantworten.
Beste Grüße,
Nils
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Sind GLMM die richtige Wahl?

Beitrag von bigben »

Hallo Nils,

wieviele Menschen glaubst Du denn befragen zu können? Das sind 144 Kombinationen von Merkmalsausprägungen - wird jedem Teilnehmer nur eine Merkmalsausprägungskombination vorgestellt?

Die nächste Frage müsste m. E. lauten: Erwartest Du, dass die verschiedenen Produktmerkmale unabhängig voneinander sind, oder gibt es da Interaktionen? Also ein Rückwärtsgang ist eine schöne Sache und ein Rückspiegel sind schöne Sachen, aber erst gemeinsam sind sie mehr Wert als die Summe der Teile. Ein Rückspiegel ist vielleicht nicht mehr ganz so wichtig, wenn man auch schon eine Rückfahrkamera hat. Da verliert das eine an Wert, wenn das andere schon da ist. Rechnest Du damit, dass solche Interaktionen zu berücksichtigen sind oder eher nicht?

Wenn ich Dich richtig verstanden habe willst Du jeden Teilnehmer nach dem Baseline-Wert ohne Zusatzentwicklung und jeden Teilnehmer nach dem Wert mit einer zufälligen Weiterentwicklungskombinationbefragen. Warum beides, warum nicht nur eines? Welche Annahme steht dahinter?

Wenn Du jeden Teilnehmer nur nach der Baseline und dem Wert einer Kombination befragst, wofür glaubst Du einen random effect zu brauchen?

Ich bin sicher, Du hast Dir über solche Dinge implizit Gedanken gemacht und ich glaube es könnte bei der Modellbildung helfen, die explizit aufzuschreiben.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Obitan
Beiträge: 3
Registriert: Mo Mai 10, 2021 12:44 pm

Re: Sind GLMM die richtige Wahl?

Beitrag von Obitan »

Hallo Bernhard, die Befragung läuft schon und liegt aktuell bei ca. 200 Teilnehmern. Jeder Teilnehmer bekommt die Baseline +3 zufällige Produkte präsentiert.
Ich gehe davon aus, dass die Merkmale unabhängig voneinander sind (zumindest habe ich sie so konzipiert).

Die Baseline habe ich berechnet um später meine Hypothese zu prüfen, dass es einen Unterschied zwischen Baseline und den verschiedenen neuen Produkten gibt. Die möchte ich aber aktuell nicht in die Berechnung einfließen lassen (oder macht das Sinn?).

Dieser Random Effect den ich gebaut habe stammt von meinem Betreuer, der möchte, dass ich für meine Masterarbeit eine Studie in dem Vignetten Stil durchführe :lol:
Wir sind jedoch beides keine Statistiker sondern Informatiker aus dem Data Privacy Bereich und unsere Erfahrungen sind begrenzt.
Ich hoffe ich konnte dir etwas Klarheit mit meinen Antworten verschaffen.
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Sind GLMM die richtige Wahl?

Beitrag von bigben »

Obitan hat geschrieben: Mo Mai 10, 2021 3:17 pmHallo Bernhard, die Befragung läuft schon und liegt aktuell bei ca. 200 Teilnehmern. Jeder Teilnehmer bekommt die Baseline +3 zufällige Produkte präsentiert.
Ok, das ist dann auch der Grund für den random effect auf dem Teilnehmer.
Ich gehe davon aus, dass die Merkmale unabhängig voneinander sind (zumindest habe ich sie so konzipiert).
Das ist schön, weil das macht das Modell einfach: neuer Preis = alter Preis plus Mehrwert Merkmal1 plus Mehrwert Merkmal2 plus Mehrwert Merkmal3 plus MEhrwert Merkmal4 + Begeisterungsfähigkeit jedes Teilnehmers als random effect.

So ein Modell ließe sich mit glmer oder lme4 bestimmt erstellen und kann könnte man pro Produktmerkmal jeweils die wertvollste Ausprägung aussuchen.
Die Baseline habe ich berechnet um später meine Hypothese zu prüfen, dass es einen Unterschied zwischen Baseline und den verschiedenen neuen Produkten gibt. Die möchte ich aber aktuell nicht in die Berechnung einfließen lassen (oder macht das Sinn?).
Könnte man sich überlegen, ob man als abhängigen Wert die Wertsteigerung als neuen_wert minus alten_wert in die Regression einsetzen möchte.
Dieser Random Effect den ich gebaut habe stammt von meinem Betreuer, der möchte, dass ich für meine Masterarbeit eine Studie in dem Vignetten Stil durchführe
Ja, es fehlte vorher die Information, dass jeder Teilnehmer drei Zufallsprodukte bewertet. Damit entstammen diese drei je einer eigenen Quelle und die Daten sind in Ihrer Gänze nicht mehr i.i.d. sondern hierarchische Daten. Deshalb z. B: glmer

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Obitan
Beiträge: 3
Registriert: Mo Mai 10, 2021 12:44 pm

Re: Sind GLMM die richtige Wahl?

Beitrag von Obitan »

Hallo Bernhard, ich danke die für deine Antworten. Ich habe die letzten 2 Tage versucht mir ein Modell zu erstellen, es läuft leider nicht so ganz nach Plan.
bigben hat geschrieben: Mo Mai 10, 2021 5:01 pm
Das ist schön, weil das macht das Modell einfach: neuer Preis = alter Preis plus Mehrwert Merkmal1 plus Mehrwert Merkmal2 plus Mehrwert Merkmal3 plus MEhrwert Merkmal4 + Begeisterungsfähigkeit jedes Teilnehmers als random effect.

So ein Modell ließe sich mit glmer oder lme4 bestimmt erstellen und kann könnte man pro Produktmerkmal jeweils die wertvollste Ausprägung aussuchen.
Meinst du mit Preis meinen KPI Wert?
Genau das habe ich probiert, in meinem Kopf habe ich an 3 Ebenen gedacht:
  • Ebene 1: Teilnehmer
  • Ebene 2: Produkt(1,2,3)
  • Ebene 3: Die einzelnen Merkmale
Könnte man sich überlegen, ob man als abhängigen Wert die Wertsteigerung als neuen_wert minus alten_wert in die Regression einsetzen möchte.
Ja, es fehlte vorher die Information, dass jeder Teilnehmer drei Zufallsprodukte bewertet. Damit entstammen diese drei je einer eigenen Quelle und die Daten sind in Ihrer Gänze nicht mehr i.i.d. sondern hierarchische Daten. Deshalb z. B: glmer
Im Buch R für Einsteiger habe ich die folgende Syntax entdeckt:

Code: Alles auswählen

modell.1 <- lmer(AV~ 1 + (1 | nation), data = kultur)
1 für Achsenabschnitt und 1 | nation steht für die Mehrebenenstruktur.
Sie baut mehrere Modelle und nutzt später Anova auf beide Ebenen, leider jedoch nur für einen Faktor und ich kriege es nicht hin ihre Struktur auf meine anzupassen.
Mein Code gibt mir nur ein Nullpointer Objekt zurück und vergleichen kann ich damit auch nichts...

Code: Alles auswählen

modell_1 <- lmer(kpi_1 ~ prod1_type + prod1_metric + prod1_conf +prod1_set + (1|Random_effect???), data=data_test)
Die Faktoren nach der Tilde sind die Merkmale, diese habe ich jeweils für alle 3 Produkte, genau wie ich auch vom KPI Wert 3 Stück habe.
Liebe Grüße,
Nils
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Sind GLMM die richtige Wahl?

Beitrag von bigben »

Hallo Obitan,
Obitan hat geschrieben: Mi Mai 12, 2021 10:00 amMeinst du mit Preis meinen KPI Wert?
Ja. Ich habe keine Ahnung, was ein KPI-Wert ist und da habe ich Kopf wohl Preis/Wert ersetzt, weil ich mir darunter was vorstellen kann.
Genau das habe ich probiert, in meinem Kopf habe ich an 3 Ebenen gedacht:
  • Ebene 1: Teilnehmer
  • Ebene 2: Produkt(1,2,3)
  • Ebene 3: Die einzelnen Merkmale
War bisher irgendwo von mehreren Produkten die Rede? Ich lese im Eingangspost von einem Produkt, dass durch Merkmale ergänzt wird.
Im Buch R für Einsteiger habe ich die folgende Syntax entdeckt: [...] und ich kriege es nicht hin ihre Struktur auf meine anzupassen.
Niemand hat gesagt, dass es einfach ist, ein oder gar das beste Mehrebenenmodell zu definieren. Weder inhaltlich noch in R.
Die Faktoren nach der Tilde sind die Merkmale, diese habe ich jeweils für alle 3 Produkte, genau wie ich auch vom KPI Wert 3 Stück habe.
Aus jahrelanger Forumserfahrung darf ich Dir versichern: Das wird so nichts. (1) Wenn Du Hilfe beim Aufstellen des Modells haben willst, dann muss das Problem besser beschrieben sein. Unsicherheiten ob es nun ein Produkt gibt oder drei Produkte müssen sicher alle aus dem Weg geräumt sein. (2) Wenn Du Hilfe beim Aufstellen von R-Befehlen willst wirst Du die hier nicht ohne ein konkretes Datenbeispiel bekommen. Siehe dazu: viewtopic.php?f=20&t=11m . Alle, die hier regelmäßig antworten haben das schon durch, dass sie ein in Text beschriebenen Problem lösen nur um dann nachher vom Fragesteller zu erfahren, dass er wichtige Details ausgelassen oder missverständlich dargestellt hat. Das ist eine wenig amüsante Erfahrung und Beispieldaten sind unser bester Weg, sowas zu erkennen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten