Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

RRechnende
Beiträge: 7
Registriert: Mi Dez 18, 2019 11:16 pm

Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von RRechnende »

Guten Abend werte Statistik-Liebhaber*Innen

Wir untersuchen in einer Online-Studie unter anderem, ob die Empathie gegenüber Nutztieren ein Mediator zwischen Tierbesitz und nachhaltiger Ernährung ist.
Nun haben wir heute (fast am Ende unserer Erhebung) bemerkt, dass unsere Ernährungs-Items, die sich nur aus zwei Fragen zusammensetzen (ja, dumm), aus denen wir wiederum einen Sumscore machen, nur ordinal-skaliert sein werden. Das ist sehr ärgerlich, weil wir sie als AV nutzen für unsere Regressionsanalyse.

Damit ihr euch leichter vorstellen könnt, wovon ich spreche:

Der nachhaltige Ernährungs-Score setzt sich zusammen aus:

1. Ernährungsverhalten gescored (Scores von min. 1 - max. 6 Punkte)
https://imgur.com/Cayr2OS

2. nachhaltiges Kaufverhalten gescored (Scores von min. 4 - max. 7 Punkte)
https://imgur.com/dt9eyr3
= min. 5 Punkte / max. 13 Punkte


Ernährungs-Score momentan:

1. Ernährungsweise:
“Ich esse…”: 1 Punkt für “alles” bis 6 Punkte für “keine tierischen Produkte” (6 Stufen)
Speziell: “nichts vom Obengenannten, sondern..” (muss von uns eingeordnet werden?!) (im R-Code das != "7")

2. nachhaltiges Kaufverhalten bei tierischen Produkten, Miteinbezug in Score (4 - 7 Pkte):
Biologische Aufzucht (1 oder 2)
Regionale Produkte (1 oder 2)
Labels (1 oder 2)
Ich kaufe keinerlei tierische Lebensmittel (1 oder 4)


Der Score ist ordinal, weil sich ein Veganer nicht 6x so nachhaltig ernährt wie ein alles-Esser.
Die Idee hinter dem Scoring von 2. ist, dass man mit "keinerlei tierischen Lebensmitteln" immer noch nachhaltiger einkauft, als wenn man die anderen drei Möglichkeiten alle berücksichtigt. Aber auch hier klar ordinal.

Ernährungs-Score momentan:

1. ER03: Ernährungsweise:
“Ich esse…”: 1 Punkt für “alles” bis 6 Punkte für “keine tierischen Produkte” (Antwortmöglichkeit 2 und 3 würden umgepolt)

2. ER02: nachhaltiges Kaufverhalten bei tierischen Produkten, Miteinbezug in Score (3 - 7 Pkte):
Biologische Aufzucht (1 oder 2)
Regionale Produkte (1 oder 2)
Labels (1 oder 2)
Ich kaufe keinerlei tierische Lebensmittel (1 oder 4)
= Ernährungs-Score: min 4 / max 13 Punkte

so ist der Sumscore von nachhaltiger Ernährung momentan:
ER <- subset(data, data$ER03 != "7")
ER$ER_sum <- (rowSums(ER[,c("ER02_01", "ER02_03", "ER02_04", "ER02_07", "ER03")],na.rm = TRUE))
Habt ihr eventuell eine Idee, wie ich den Ernährungs-Score gestalten könnte, damit er "nicht mehr ordinal" ist (klar, das geht nicht, aber wir wollen doch rechnen!), oder zumindest besser, als unsere bisherigen Ideen zu dem Scoring? Wir möchten damit wie gesagt eine Regression rechnen, in der Ernährung die AV ist.
Dass wir mit 1 oder 2 Punkten bisher rechnen, liegt an der Ausgabe von Sosci-Survey, das kann aber umkodiert werden (wobei es eigentlich keinen Unterschied macht, ob wir nun "0 und 1" oder "1 und 2" nutzen, oder?)

Ich habe mich schon Stunden durch Infos gelesen, lande bei der multinomialen logistischen Regression. Aber auch hier ist die Frage nach "schlauen" Kategorien mit den beiden Ernährungs-Items offen. Falls ihr Gedanken und Ideen, Lösungsvorschläge oder auch einfach nur Tadel habt, immer her damit, ich nehm alles!


evtl. wissenswertes OT: Schon viel habe ich aus diesem Projektseminar gelernt! Gerne möchte ich dennoch das Beste aus den Fehlern machen. Der Prof meinte, dass wir im schlimmsten Fall, wenn gar nichts anderes mehr geht und wir mit unseren Nerven komplett am Ende sind, dennoch die ordinale Variable als metrische annehmen sollen, was natürlich unglaublich schade wäre, wenn es eine Möglichkeit gäbe, das doch noch irgendwie richtig zu machen. Es sei dazu gesagt, dass dies eine nicht-benotete und nicht-veröffentlichte Studie ist, die nur zu "Testzwecken" für die Bachelor-Arbeit ihren Kopf hinhalten soll. Also ist es gut, hier solche gravierenden Fehler zu machen.

Herzlichen Dank, dass du dir die Zeit genommen hast, meinen Thread durchzulesen :mrgreen:
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von bigben »

Hi!
RRechnende hat geschrieben: Do Dez 19, 2019 1:09 am... aus zwei Fragen zusammensetzen (ja, dumm), aus denen wir wiederum einen Sumscore machen, nur ordinal-skaliert sein werden.
Das finde ich inkonsistent, weil das Bilden einer Summe bei ordinalskalierten Daten schon ein unzulässiger Vorgang ist.
Der Score ist ordinal


Da bin ich mir nicht so sicher. "Ich achte auf den Preis von Tierprodukten" als Argument für Nachhaltigkeit? Wenn ich immer darauf schaue, ob ich bei Lidl oder Aldi heute das billigere Steak kaufen kann, dann ist das doch kein Punkt für die Nachhaltigkeit meiner Ernährung. Wenn ich markenbewusst kaufe, dann kann das Mineralwasser sein, dass in LKW aus Süditalien hierher gefahren wird. Das ist dann nicht nachhaltig.

Wenn ich zuhause nur vegan esse, auf Partys aber alles, wonach mir ist, dann sind das nur zwei Punkte, wenn ich aber auf das Essen von Insekten verzichte, dann sind das drei Punkte auf der Veganskala.

Warum setzt mich das Essen von Honig in meiner Veganität mehr zurück als das Essen von Eiern?

Also ob das ordinale Daten sind, da habe ich meine Zweifel.


Habt ihr eventuell eine Idee, wie ich den Ernährungs-Score gestalten könnte, damit er "nicht mehr ordinal" ist (klar, das geht nicht, aber wir wollen doch rechnen!), oder zumindest besser, als unsere bisherigen Ideen zu dem Scoring?
Wenn Ihr das als ordinal betrachtet, dann kommt es auf Eure Beobachtungszahlen an. Natürlich kann man jede einzelne Antwort als dummycodiert als unabhängige Variable einbringen oder eine ordinal logistische Regression rechnen, um der ordinal skalierten abhängigen Variable Rechnung zu trachen. Dabei sind dann halt ganz viele Koeffizienten zu berechnen, was nur geht, wenn Ihr sehr viele Leute befragt habt.

Ein anderer, sauberer Ansatz zum metrisieren von Fragebogendaten ist die Item Response Theory, kurz IRT. Das erfordert aber auch ausreichende Beobachtungsskalen, erfordert, dass sich die fraglich ordinale Natur der Items in den Daten auch wiederfindet und ist kein kleines Kapitel, das man sich ganz schnell mal eben anliest. Spannend und lehrreich ist es allemal.

Code: Alles auswählen

Prof meinte, dass wir im schlimmsten Fall, wenn gar nichts anderes mehr geht und wir mit unseren Nerven komplett am Ende sind, dennoch die ordinale Variable als metrische annehmen sollen, was natürlich unglaublich schade wäre, wenn es eine Möglichkeit gäbe, das doch noch irgendwie richtig zu machen.
Dummycodierung und ordinale Regression, IRT oder Augen zu und metrisch durch.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
RRechnende
Beiträge: 7
Registriert: Mi Dez 18, 2019 11:16 pm

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von RRechnende »

Lieber Bernhard,

ich schätze deine Antwort sehr! Herzlichen Dank!

bigben hat geschrieben: Do Dez 19, 2019 8:29 am "Ich achte auf den Preis von Tierprodukten" als Argument für Nachhaltigkeit? Wenn ich immer darauf schaue, ob ich bei Lidl oder Aldi heute das billigere Steak kaufen kann, dann ist das doch kein Punkt für die Nachhaltigkeit meiner Ernährung. Wenn ich markenbewusst kaufe, dann kann das Mineralwasser sein, dass in LKW aus Süditalien hierher gefahren wird. Das ist dann nicht nachhaltig.
Du hast hier genau die beiden Antwortmöglichkeiten herausgegriffen, die wir nicht als nachhaltiges Kaufverhalten interpretieren und deswegen würden diese auch nicht in den Score mit einfliessen. Es würden nur folgende Items gescored werden:
2. nachhaltiges Kaufverhalten bei tierischen Produkten, Miteinbezug in Score (4 - 7 Pkte):
Biologische Aufzucht (1 oder 2)
Regionale Produkte (1 oder 2)
Labels (1 oder 2)
Ich kaufe keinerlei tierische Lebensmittel (1 oder 4)
bigben hat geschrieben: Do Dez 19, 2019 8:29 am Wenn ich zuhause nur vegan esse, auf Partys aber alles, wonach mir ist, dann sind das nur zwei Punkte, wenn ich aber auf das Essen von Insekten verzichte, dann sind das drei Punkte auf der Veganskala.

Warum setzt mich das Essen von Honig in meiner Veganität mehr zurück als das Essen von Eiern?

Also ob das ordinale Daten sind, da habe ich meine Zweifel.
Vegetarisch zuhause essen, aber auswärts nicht: Ja, das ist in der Tat auch etwas, über das ich mir Gedanken gemacht habe. Wie wäre es denn, einfach drei Gruppen zu erstellen, zum Beispiel eine Fleischess-Gruppe, eine Wenig-Fleischess-Gruppe und eine Kein-Fleischess-Gruppe? Aber dann könnte man dies nicht mehr Scoren mit dem Kaufverhalten-Item, oder? :?

Honig: Ja, das ist tatsächlich ein Fehler im (vegetarischen) Item. Das ist ein schwerwiegender Fehler, denn als "richtiger" Vegetarier kann man Honig essen, und der ist in dem "ich esse Eier und Milchprodukte" leider vergessen gegangen.
Wenn Ihr das als ordinal betrachtet, dann kommt es auf Eure Beobachtungszahlen an. Natürlich kann man jede einzelne Antwort als dummycodiert als unabhängige Variable einbringen oder eine ordinal logistische Regression rechnen, um der ordinal skalierten abhängigen Variable Rechnung zu trachen. Dabei sind dann halt ganz viele Koeffizienten zu berechnen, was nur geht, wenn Ihr sehr viele Leute befragt habt.
Sehr viele Leute sind es nicht. Wir werden am Schluss wahrscheinlich etwas über 200 Versuchspersonen haben.
Ein anderer, sauberer Ansatz zum metrisieren von Fragebogendaten ist die Item Response Theory, kurz IRT. Das erfordert aber auch ausreichende Beobachtungsskalen, erfordert, dass sich die fraglich ordinale Natur der Items in den Daten auch wiederfindet und ist kein kleines Kapitel, das man sich ganz schnell mal eben anliest. Spannend und lehrreich ist es allemal.
Ich werde das nun mal versuchen zu verstehen, danke.
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von bigben »

Hallo!
RRechnende hat geschrieben: Do Dez 19, 2019 4:03 pmDu hast hier genau die beiden Antwortmöglichkeiten herausgegriffen, die wir nicht als nachhaltiges Kaufverhalten interpretieren und deswegen würden diese auch nicht in den Score mit einfliessen.
Darf ich sagen, dass ich den Scoring-Vorgang im Ganzen etwas undeutlich beschrieben finde? Die Ernährungsfrage scheint Likert-artig zu funktionieren mit einem irrtümlich eingeschlichenen Honig und einem zusätzlichen offenen Item, das ich als Ausfüllender kaum verstehe (sollen sich hier die Fruktarier erklären oder die Gluten-Vermeider??) und als Auswerter nicht mit der intendiert ordinalen Auswertung übereinbringe. Die Lebensmittelfrage ermöglicht Mehrfachantworten von denen aber ein Viertel nicht mitgezählt wird und unklar ist, bei welchen Antworten die offene Antwortalternative mitgezählt wird.
Wie wäre es denn, einfach drei Gruppen zu erstellen, zum Beispiel eine Fleischess-Gruppe, eine Wenig-Fleischess-Gruppe und eine Kein-Fleischess-Gruppe?
Eine solche Gruppierung wäre m. E. ganz klar ordinal, aber beim Formulieren Eurer Items wolltet Ihr ja wahrscheinlich was bestimmtes erreichen, als Ihr nach all diesen Details gefragt habt. Das sollt ihr nicht über Bord werfen, weil einer im Internet das nicht gut fand.
Aber dann könnte man dies nicht mehr Scoren mit dem Kaufverhalten-Item, oder?
Bitte nicht falsch verstehen, aber wie ich oben geschrieben habe, erscheint mir Euer erster Scoringansatz reichlich arbiträr. Wenn man das Addieren eines Likert-artigen Items mit einem Zählitem mit Hintertürchen akzeptabel findet, warum sollte man nicht eine vergleichbar arbiträre Verrechnung dieser drei Stufen mit dem Zählitem konstruieren können?
Sehr viele Leute sind es nicht. Wir werden am Schluss wahrscheinlich etwas über 200 Versuchspersonen haben.
Auch die zu rekrutieren hat wahrscheinlich viel Mühe gekostet.

Im Grunde ist es ungerecht. Wenn man einen Haufen Fragen im Likert-Format stellt und Unidimensionalität nachweist, dann darf man per Konvention diese ordinalen Daten aufaddieren und wie metrische Verwenden, weil das in Likert, R. “A technique for the measurement of attitudes”.Archives of Psychology, 1932;Vol 22, No. 140, p 55 so steht und weil alle das machen.

Entwickelt man aber selbst ordinale Formate, wie Ihr das oben macht, dann müssen die nicht schlechter sein als Likert-Items, aber man hat halt nicht so eine schöne, trotz ihrer mathematischen Fragwürdigkeit allgemein akzeptierte Publikation, die man anführen kann.

Mein Eindruck, aber YMMV: Der wichtigste Lerninhalt dieses Projektseminars ist, dass Ihr bei Eurer Bachelorarbeit beim Erstellen der Items besonders achtsam sein solltet und Euch rechtzeitig über eine Auswertestrategie und Rechtfertigung der Auswertestrategie Gedanken machen solltet. Für die Seminararbeit würde ich wahrscheinlich tatsächlich aus den Items "irgendwie" einen Score machen, den als metrisch annehmen, vielleicht noch mit einer Korrelationsrechnung oder eine Cronbach alpha die Zusammengehörigkeit beider Items dokumentieren und dann die Auswertung abschließen.

JMTC,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
RRechnende
Beiträge: 7
Registriert: Mi Dez 18, 2019 11:16 pm

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von RRechnende »

Hallo Bernhard,
die letzten Wochen habe ich mir Gedanken zu dem Problem gemacht, hier sind meine Ausführungen an deinen Ansätzen:
bigben hat geschrieben: Do Dez 19, 2019 4:36 pm Bitte nicht falsch verstehen, aber wie ich oben geschrieben habe, erscheint mir Euer erster Scoringansatz reichlich arbiträr. Wenn man das Addieren eines Likert-artigen Items mit einem Zählitem mit Hintertürchen akzeptabel findet, warum sollte man nicht eine vergleichbar arbiträre Verrechnung dieser drei Stufen mit dem Zählitem konstruieren können?
Da dies nun nicht mehr zu ändern ist, müssen wir dennoch irgendwie damit klarkommen. In einer Präregistrierung hätte man beim Kaufverhalten die Items, die gar nicht zur Berechnung eines Scores einbezogen werden würden, direkt ausschliessen können. So im Nachhinein, ohne jegliche Dokumentation, wirkt das wirklich sehr arbiträr. Nunja. Wenn man nun also eine Reliabilitätsprüfung der beiden ER-Items durchführt, dann kommt leider nur ein alpha = .51 heraus. Das ist mangelhaft. Damit macht es dann wohl gar keinen Sinn, die zusammen zu scoren, oder? :shock: Ich bin recht frustriert darüber, dass irgendwie nichts zu gehen scheint mit den doofen Dingern! ...

Auch eine Korrelationsrechnung habe ich durchgeführt. Eine Rangkorrelation nach Spearman, weil auch mit der Annahme, dass die Items metrisch seien, leider keine Normalverteilung der beiden Items vorliegt (und das wäre die Voraussetzung für eine Pearson-Korrelation).
Wir erhalten hier ein rho = .31. Der Zusammenhang zwischen den beiden Items weist also einen mittleren Effekt auf.


In die Item Response Theorie habe ich mich eingelesen. Jedoch geht es hierbei vor allem um eine Vorhersage über die Probabilität einer VP, eine Frage richtig zu beantworten. Bei unseren Fragen gibt es weder ein "richtig", noch ein "falsch" und da wir nur zwei Items haben, bringt uns diese Theorie in diesem Problem leider nicht weiter. Vielleicht habe ich es nur teilweise verstanden, aber das, was ich verstanden habe, löst leider keine Probleme, vor denen ich gerade stehe. :(
Mein Eindruck, aber YMMV: Der wichtigste Lerninhalt dieses Projektseminars ist, dass Ihr bei Eurer Bachelorarbeit beim Erstellen der Items besonders achtsam sein solltet und Euch rechtzeitig über eine Auswertestrategie und Rechtfertigung der Auswertestrategie Gedanken machen solltet. Für die Seminararbeit würde ich wahrscheinlich tatsächlich aus den Items "irgendwie" einen Score machen, den als metrisch annehmen, vielleicht noch mit einer Korrelationsrechnung oder eine Cronbach alpha die Zusammengehörigkeit beider Items dokumentieren und dann die Auswertung abschließen.
Ja, vielleicht hast du recht.. Ganz aufgeben will ich dennoch noch nicht. :mrgreen:
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von bigben »

Hallo RRechnende,
RRechnende hat geschrieben: So Jan 12, 2020 2:54 pm Nunja. Wenn man nun also eine Reliabilitätsprüfung der beiden ER-Items durchführt, dann kommt leider nur ein alpha = .51 heraus. Das ist mangelhaft. Damit macht es dann wohl gar keinen Sinn, die zusammen zu scoren, oder? :shock: Ich bin recht frustriert darüber, dass irgendwie nichts zu gehen scheint mit den doofen Dingern! ...
Ich habe ja oben beschrieben, dass und warum mir Eure Antwortmöglichkeiten nicht passen und deshalb finde ich es auch nicht verwunderlich, wenn die Antworten der Gefragten hier keine überzeugende Faktorenstruktur/Korrelation/Konsistenz zeigen. Ich finde Deine Hartnäckigkeit, nicht aufgeben zu wollen, im Grundsatz sehr gut. Statistik heißt aber, Informationen aus Daten herauslesen, nicht sie hineinschreiben. Du musst offen bleiben für das mögliche Ergebnis, dass das ERgebnis lautet, dass sich aus den Daten leider keine Informationen herausfiltern lassen.
In die Item Response Theorie habe ich mich eingelesen. Jedoch geht es hierbei vor allem um eine Vorhersage über die Probabilität einer VP, eine Frage richtig zu beantworten. Bei unseren Fragen gibt es weder ein "richtig", noch ein "falsch"
Man kann die Verfahren auch ohne richtig/falsch anwenden. Die nicht direkt beobachtbare Ernährungsnachhaltigkeit beeinflusst die Wahrscheinlichkeit, diese oder eine andere Antwort anzukreuzen. Es geht auch nicht um die Vorhersage von Antworten sondern darum, den Antwortmöglichkeiten Wahrscheinlichkeiten zuzuordnen, um dei gegebene Antwort mit den Mitteln der Wahrscheinlichkeitsrechnung untersuchen zu können.
und da wir nur zwei Items haben
Ihr habt deutlich mehr als zwei Items. Ihr habt nur zwei Fragen.
Vielleicht habe ich es nur teilweise verstanden, aber das, was ich verstanden habe, löst leider keine Probleme, vor denen ich gerade stehe. :(
Die Eingangsfrage war die nach einer metrischen Auswertung von Kreuzchen auf einem Fragebogen. Da wäre es falsch gewesen, die IRT nicht zu erwähnen. Sich "schnell mal eben" die IRT so draufzuschaffen, dass man sie selbständig anwenden kann, ist sicher eine zu große Forderung.

Viel Glück,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
RRechnende
Beiträge: 7
Registriert: Mi Dez 18, 2019 11:16 pm

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von RRechnende »

Ich habe sehr viel gelernt von dir, Bernhard! Vielen Dank hierfür!

Nun bin ich an der Analyse dran. Wir haben uns entschieden, eine ordinale logistische Regression zu berechnen und dies nur mit der Frage nach der Ernährungsweise zu tun (also ohne Ernährungs-Score, sondern einfach von Fleischesser bis zu Veganer als eine ordinalskalierte Variable).

Nun, so viel finde ich über diese Art der Regression leider gar nicht. Auch der R-Output ist mehr als spärlich.

Hier mein R-Input:
# ordinale logistische Regression: gibt es einen Zusammenhang zwischen EM und Ernaehrungsitems(ordinal)
model1 = polr(ER03 ~ EM_sum, data=ER, Hess=TRUE)
summary(model1)
# signifikant, wenn Modell = (|t|>1.96), weil zweiseitige Testung (somit: .975 auf mehr als 120 df -> 180 df insg.)
# Die Empathie zu Nutztieren zeigt ein signifikantes Ergebnis im Zusammenhang zur
# (ordinalen) Ernaehrungsvariable
und der R-Output:
Call:
polr(formula = ER03 ~ EM_sum, data = ER, Hess = TRUE)

Coefficients:
Value Std. Error t value
EM_sum 0.1967 0.02537 7.753

Intercepts:
Value Std. Error t value
1|2 10.0566 1.3343 7.5370
2|3 10.6170 1.3552 7.8344
3|4 12.2730 1.4402 8.5219
4|5 12.8924 1.4706 8.7667
5|6 14.5236 1.5557 9.3358

Residual Deviance: 449.228
AIC: 461.228
Darf ich t angeben als: (t = |7.75| > 1.96)? Mir ist ein wenig schleierhaft, wie ich auf den p-Wert kommen soll .. Und hier im Output wird dieser nicht einmal ausgegeben. Wie berichte ich diesen Wert am ehesten?
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von EDi »

Mir ist ein wenig schleierhaft, wie ich auf den p-Wert kommen soll ..
Wer p-Werte unbeding braucht :roll: Die bringen sowie keinen Mehrwert...

Bei großer sample size, nähert sich die t-Verteilung der Normalverteilung an und man könnte diese nehmen.
Ich weiß nämlich nicht wie das mit den Freiheitsgraden hier ist :(

Man könnte also sowas machen:

Code: Alles auswählen

2 * pnorm(abs(tvalues), lower.tail = FALSE)
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
RRechnende
Beiträge: 7
Registriert: Mi Dez 18, 2019 11:16 pm

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von RRechnende »

:D Also findest du, ich soll den Wert einfach berichten, wie ich ihn oben geschrieben habe? (da der Output nicht einmal die Freiheitsgrade auswirft, überlege ich, ob die überhaupt in den Bericht hier mit dazu geschrieben werden können/sollen. Wie gesagt, ich finde zum Thema Berichten einer ordinal logistischen Regression genau nichts.)
Mit deiner Zeile wird der p-Wert kleiner als .001 - findest du, der ist nicht bericht-gen? :ugeek:

Ich danke dir EDi und dir Bernhard für eure Hilfe!
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Items zu ordinalem Sum-Score, jedoch nicht mehr für Regression geeignet?

Beitrag von bigben »

EDi hat geschrieben: Mo Feb 03, 2020 8:27 pmWer p-Werte unbeding braucht :roll: Die bringen sowie keinen Mehrwert...
Na doch, die helfen ganz erheblich wenn man publizieren möchte und gute Noten bekommen möchte.

@RRechnende p-Werte werden von vielen Seiten stark und berechtigt kritisiert. Insbesondere, weil sie dem menschlichen Gehirn etwas suggerieren, was sie nicht sind und weil das zu einer Überschätzung ihrer Bedeutung geführt hat. Das ändert nichts daran, dass man als Studierende*r zeigen muss, dass man die üblichen Publikationsregeln verstanden hat, zu denen ein p-Wert nunmal gehört, ob wir das gut finden oder nicht.
Bei großer sample size, nähert sich die t-Verteilung der Normalverteilung an und man könnte diese nehmen.
Ich weiß nämlich nicht wie das mit den Freiheitsgraden hier ist :(
Mit deiner Zeile wird der p-Wert kleiner als .001 - findest du, der ist nicht bericht-gen?
Auch wenn ich den letzten Satz nicht verstehe: Du hast bestimmt mehr als 50 Freiheitsgrade und wenn Du Dir einfach mal die Verteilungskurve der Normalverteilung und der t-Verteilung mit 50 Freiheitsgraden aufzeichnen lässt ist ganz schnell klar, dass EDis Näherung völlig valide ist:

Code: Alles auswählen

curve(dnorm(x), from = -5, to = 5, col="blue")
curve(dt(x, 50), from = -5, to = 5, col="red", add = TRUE)
curve(dt(x, 100), from = -5, to = 5, col="violet", , lty=2, add = TRUE)
legend("topright", fill = c("blue", "red", "violet"), 
       legend = c("Normal", "t mit df = 50", "t mit df = 100"))
Vielleicht erhöht es Dein Vertrauen in EDis Ansatz wenn Du liest, dass Stata das genause handhabt wie EDi. Zumindest ist das die Behauptung auf dieser Website:
Some people are not satisfied without a p value. One way to calculate a p-value in this case is by comparing the t-value against the standard normal distribution, like a z test. Of course this is only true with infinite degrees of freedom, but is reasonably approximated by large samples, becoming increasingly biased as sample size decreases. This approach is used in other software packages such as Stata...
https://stats.idre.ucla.edu/r/dae/ordin ... egression/

Auch wenn ich nicht alles gelesen habe scheint mir das generell kein schlechter Text zum Thema zu sein ('worthwhile read')

Da es sich jetzt um eine bivariate Analyse handelt frage ich mich allerdings schon, ob eine Spearman-Korrelation nicht auch gereicht hätte. Da bräuchte man dann auch kein Theater um die Angemessenheit des p-Wertes machen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten