Methode/Befehle gesucht

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Antworten
primele
Beiträge: 4
Registriert: So Aug 04, 2019 11:49 am

Methode/Befehle gesucht

Beitrag von primele »

Hallo zusammen,

ich muss mich erneut mit RStudio begnügen - leider absolut nicht mein Steckenpferd.
Ich habe einen A-/B-Test vorgenommen bei dem die Befragten zwei Produktbeschreibungen lesen (T1 und T2) sollten. Zu beiden Texten haben sie jeweils 5 Fragen gestellt bekommen haben. Bei der Variable P1_001 sollten sie sich dann schlussendlich entscheiden, anhand welchen Textes ein Kauf in Betracht käme.

Mir ist nicht klar, was ich machen muss, dass ich z.B. heraus finde, ob sich die Sympathie des Textes (T1_003 und T2_003) auf die Kaufentscheidung auswirkt (P1_001) - und ganz wichtig wie ich dann die beiden Ergebnisse gegenüberstelle.

Classes ‘tbl_df’, ‘tbl’ and 'data.frame': 30 obs. of 14 variables:
$ TN : num 1 2 3 4 5 6 7 8 9 10 ...
$ T2_001: num 5 4 4 5 4 5 5 5 5 3 ...
$ T2_002: num 3 3 3 2 3 5 5 5 5 3 ...
$ T2_003: num 3 3 4 4 3 5 5 3 5 3 ...
$ T2_004: num 3 4 3 4 3 5 5 5 5 3 ...
$ T2_005: num 3 3 4 3 2 5 5 5 5 3 ...
$ T1_001: num 5 4 3 5 4 4 5 4 5 4 ...
$ T1_002: num 5 5 3 4 5 2 4 5 4 3 ...
$ T1_003: num 5 5 3 4 4 3 5 5 5 4 ...
$ T1_004: num 5 5 3 5 5 5 5 4 5 3 ...
$ T1_005: num 4 5 3 4 5 3 4 5 4 3 ...
$ P1_001: num 1 1 2 1 1 2 2 2 2 2 ...
$ sd_001: chr "female" "male" "female" "female" ...
$ sd_002: num 57 60 57 50 50 60 42 21 24 24 ...

Ich hoffe ihr habt ein paar Tipps für mich - und vielleicht auch eine kurze Erklärung wann man welchen Befehl anwendet.

Viele Grüße
Primel
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Methode/Befehle gesucht

Beitrag von bigben »

Wenn Du Dich nicht mit RStudio begnügen müsstest, sondern alle Software der Welt nützen könntest, welche statistischen Verfahren würdest Du gerne anwenden? Oder gilt das mit dem Steckenpferd nicht nur für R und RStudio sondern auch für Statistik?

Wie schätzt Du denn die Skalenniveaus ein? Könnte man eine Differenz der beiden Sympathiewerte berechnen? Oder sollen wir bei ordinalem Skalenniveau bleiben?
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Methode/Befehle gesucht

Beitrag von ruppy »

Wenn ich dich richtig verstehe willst du die Kaufentscheidung (P1_001) durch die "Sympathie" (T1_003 und T2_003) erklären?
P1_001 ist binär (entweder Produkt 1 oder Produkt 2, bzw. Text 1 oder Text 2, verstehe deine Formulierung nicht ganz)

Wenn wir unterstellen, dass T1_003 und T2_003 (quasi-)metrisch sind, könnte man die Mittelwerte je Gruppe (Produkt 1 vs. Produkt 2) vergleichen.
Ich unterstelle dabei verbundene Stichproben und rechne dann t-tests btw. Wilcoxon-Tests.

Code: Alles auswählen

library(tidyverse)

# Dummy-Daten
P1_001 <- c(1,1,2,1,1,2,2,1)
T1_003 <- c(3,2,5,4,1,4,2,1)
T2_003 <- c(1,1,3,4,4,1,1,5)

df <- as_tibble(cbind(P1_001, T1_003, T2_003))

# Deskriptive Statistiken für die T1_003 und T2_003 für P1_001=1
df %>%
  filter(P1_001==1) %>%
  select(-P1_001) %>%
  summary()

# # Deskriptive Statistiken für die T1_003 und T2_003 für P1_001=2
df %>%
  filter(P1_001==2) %>%
  select(-P1_001) %>%
  summary()

# Gleichheit der Varianzen prüfen
var.test(df$T1_003[P1_001==1],df$T2_003[P1_001==1])
var.test(df$T1_003[P1_001==2],df$T2_003[P1_001==2])
# Varianzen scheinen gleich zu sein
# Also t.test mit var.equal = TRUE

# t-tests 
# paired = TRUE, da ich von verbundenen Stichproben ausgehe
t.test(df$T1_003[P1_001==1], df$T2_003[P1_001==1], paired = TRUE, var.equal = TRUE)
t.test(df$T1_003[P1_001==2], df$T2_003[P1_001==2], paired = TRUE, var.equal = TRUE)

# Bei ordinalem Skalenniveau Wilcoxon-Test
# paired = TRUE, da ich von verbundenen Stichproben ausgehe
wilcox.test(df$T1_003[P1_001==1], df$T2_003[P1_001==1], paired = TRUE)
wilcox.test(df$T1_003[P1_001==2], df$T2_003[P1_001==2], paired = TRUE)
Alle Angaben ohne Gewähr! Klassische Testtheorie ist nicht mein Steckenpferd (um bei dem Begriff zu bleiben :D)
Aber zumindest kannst du mal die Stichwörter weiter recherchieren und den Code ggf. adaptieren.

Was ich mich nur frage:
Warum habt ihr die Produktbeschreibungen nicht zufällig ausgesteuert (50/50 Split) und schaut dann welche im Mittel die bessere Bewertung bekommt? So verstehe ich einen A/B-Test. Bei diesem Design hätte es einfacher Chi-Quadrat-Test getan (alternativ ein G-Test).
Vllt verstehe ich aber auch immer noch nicht euer Erhebungsdesign.

BG ruppy
primele
Beiträge: 4
Registriert: So Aug 04, 2019 11:49 am

Re: Methode/Befehle gesucht

Beitrag von primele »

Hallo ihr beiden,

danke erstmal für eure Rückmeldung.

@ruppy - jetzt wo du das schreibst, fällt mir auf, dass da mehr Input von mir gefehlt hat.
Also, wir haben einen A-/B Test gemacht bei dem meine Befragungsgruppe zuerst T1 + Fragen und danach T2 + Fragen gelesen und beantwortet hat. Die andere Gruppe hat die Texte in der umgekehrten Reihenfolge erhalten.

Wir möchten gerne folgendes herausfinden:
- bei welchem Text wären die Befragten eher gewillt das Produkt zu kaufen
- Gibt es einen Zusammenhang zwischen dem Geschlecht (sd_001) und dem eventuellen Kauf (P1_001).
- Gibt es einen Zusammenhang zwischen dem Alter (sd_002) und dem eventuellen Kauf
- Gibt es einen Zusammenhang zwischen der Sympathie des Textes und dem Kauf

Ich möchte anhand der o.g. Fragen erklären, ob es jeweils einen Zusammenhang gibt.
P1_001 ist binär, genau.
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Methode/Befehle gesucht

Beitrag von bigben »

Hi!
primele hat geschrieben: So Feb 02, 2020 9:31 pm Wir möchten gerne folgendes herausfinden:
- bei welchem Text wären die Befragten eher gewillt das Produkt zu kaufen
- Gibt es einen Zusammenhang zwischen dem Geschlecht (sd_001) und dem eventuellen Kauf (P1_001).
- Gibt es einen Zusammenhang zwischen dem Alter (sd_002) und dem eventuellen Kauf
- Gibt es einen Zusammenhang zwischen der Sympathie des Textes und dem Kauf
Soll das alles in 4 verschiedenen bivariaten Vergleichen untersucht werden, oder soll ein multivariates Modell aufgestellt werden?

Was hat es mit der Reihenfolge auf sich. Sie wurde wohl gewechselt, um Reihenfolgeeffekte auszuschließen. Ist sie auch irgendwo codiert? Sollen mögliche Reihenfolgeeffekte in die Analyse miteinbezogen werden?

Und es bleibt die Frage, ob die Sympathie der Texte als quasi-metrisch betrachtet werden soll, oder nicht.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Methode/Befehle gesucht

Beitrag von bigben »

ruppy hat geschrieben: So Feb 02, 2020 8:56 pmAlle Angaben ohne Gewähr! Klassische Testtheorie ist nicht mein Steckenpferd (um bei dem Begriff zu bleiben :D)
Hallo ruppy,

ich bin zwar auch kein Psychologe/Soziologe, aber über Klassische Testtheorie (KTT) habe ich mal ein ganzes Buch gelesen. Da werden unter gewissen Umständen die Antworten auf Items für metrisch genug gehalten, um sie aufzuaddieren und solche Summern mehrerer Items gelten dann als quasi-metrisch. Aber auch nur, wenn die Antwortformate gleich waren, man versucht hat, die Antworten aequidistant zu halten und wenn die Items in einer Faktorenanalyse gezeigt haben, dass sie ähnliches erfragen und so weiter.
Für "Meine Fragen wurden auf einer Skala von 1 bis 5 beantwortet, das verwende ich quasi-metrisch", kann man die KTT meines Erachtens nicht einfach so zitieren. Da muss man als Studierende(r) seine Betreuer fragen und sich als Forscher eigene Gedanken machen.

JMTC,
Bernhard (der auch glaubt, dass es am Ende als quasi-metrisch gelten soll ;) )
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Methode/Befehle gesucht

Beitrag von ruppy »

Hey bigben,

kann deinen Ausführungen nur zustimmen.
Die Aussage mit der KTT habe ich eher darauf bezogen, dass ich mir nicht sicher bin,
ob die von mir vorgeschlagenen Tests auch angebracht sind (bei jeweils gegebenen Annahmen).

@primele
Zu deinen vier Fragen:
1. Da tut es ein Chi-Quadrat bzw. G-Test
Würde mal mit

Code: Alles auswählen

chisq.test()
anfangen.
Wie das funktioniert siehst du hier:

Code: Alles auswählen

?chisq.test
2. Würde sagen, dass auch hier der X²/ G-Test passend ist
3. Hier gilt das gleiche wie bei meinem 1.Post mit dem Unterschied, dass das Skalenniveau imho unproblematisch ist
4. Siehe meinen ersten Post

BG ruppy
Antworten