Mediansplit

FCuhls · Beitrag von **FCuhls** » Fr Jan 31, 2020 11:50 pm

Hallihallo! Ich brauche Hilfe mit dem Mediansplit.. Meine Hypothese lautet : "Ineffektive Copingstrategien werden häufiger von Studierenden mit dem höheren Stresserleben verwendet als von Studierende mit einem geringeren Stresserleben“. Ich würde nun gerne im ersten Schritt einen Mediansplit durchführen, um zwei homogene Gruppen zu bilden und anschließend dann den Wilcoxon Test. Kann mir jemand helfen? Irgendwie funktioniert das nicht.

Meine Datensatz heißt: Stresserleben_Studierende
Variablen : Stress.Index und Ineffektiv.Index

Vielen Dank vorab

Fenja

Beitrag von **bigben** » Sa Feb 01, 2020 2:12 pm

Beispiel für einen Wilcoxon-Test nach Mediansplit:

Code: Alles auswählen

werte <- data.frame(buchstaben = LETTERS,
                    messwerte = runif(26),
                    zahlen = 1:26)

werte$split <- cut(werte$messwerte, breaks = c(-Inf, median(werte$messwerte), Inf),
                   labels = c("niedriger als Median", "höher als Median"))

head(werte)
boxplot(werte$messwerte ~ werte$split)

wilcox.test(werte$zahlen ~ werte$split)

Ich muss aber unbedingt einmal dazu sagen, dass ein Median-Split fast nie die bessere Auswertungsstrategie ist.

HTH,
Bernhard

FCuhls · Beitrag von **FCuhls** » Sa Feb 01, 2020 2:57 pm

Hey Bernhard, vielen vielen Dank! Es hat geklappt.

Ps: Welches Vorgehen würdest du denn empfehlen, anstelle des Mediansplits?

Lieben Gruß

Fenja

Beitrag von **bigben** » Sa Feb 01, 2020 3:08 pm

Stellen wir uns eine Studierende mit ganz niedrigem Stresserleben vor und nennen Sie A. Jetzt stellen wir uns eine Studierende mit Stresserleben ganz knapp unter dem Median vor und nennen sie B. Eine dritte hat ein Stresserleben ganz knapp über dem Median, die nennen wir C.
A und B sind sehr unterschiedlich im Stresserleben, B und C sind sehr ähnlich. Dennoch fallen A und B bei Deinem Mediansplit in dieselbe Gruppe und B und C in verschiedene. Das ist offensichtlich nicht sinnvoll.
Eine einfache Korrelationsrechnung beantwortet Deine Frage und hat das genannte Problem nicht. Deshalb würde ich da die Korrelation

Code: Alles auswählen

cor.test(Stress.Index, Ineffektiv.Index, data = Stresserleben_Studierende)

besser finden. Die Information, dass A und B unterschiedlich sind geht dabei nicht verloren, beim Mediansplit wird diese Information verworfen.

LG,
Bernhard

FCuhls · Beitrag von **FCuhls** » Sa Feb 01, 2020 4:04 pm

Hey, super! Dann werde ich das so machen. Eine Frage noch zum Schluss, weißt du wie ich den "Steigungsparameter" berechnen kann? also:

Die Regressionsgerade stellt den positiven Zusammenhang dar. Mit der Zunahme an ineffektiven Copingstrategien nimmt das Stresserleben um einen Wert von xy zu (Steigungsparameter = .xy) ?

Lieben Gruß

ruppy · Beitrag von **ruppy** » Sa Feb 01, 2020 4:05 pm

Die Idee mit dem Mediansplit und dem Wilcoxon-Test basiert wahrscheinlich auf dem Umstand, dass die Daten eigentlich ordinales Skalenniveau haben.
Also sollte man bei der Berechnung der Korrelation voranstellen, dass man metrisches Skalenniveau unterstellt ("quasi-metrisch").

Ändert aber nichts daran, dass bigben Recht hat.

Ich weiß ist off-top, da es nichts mit R zu tun hat, aber ich wollte auch meinen Senf dazugeben.

Beitrag von **bigben** » Sa Feb 01, 2020 8:13 pm

Der Hinweis auf das Skalenniveau ist wichtig, insbesondere vor dem Hintergrund der Frage nach der "Steigung". Korrelation könnte man auch auf ordinalem Niveau nach Spearman berechnen, eine Steigung beruht Ihrer Natur nach darauf, dass man sie multiplizieren kann.

@Fenja

Code: Alles auswählen

bsp <- data.frame(a = c(1, 2, 3, 4.5, 5, 6, 7.2),
                  b = 1:7*pi)

lineares.modell <- lm(b ~ a, data = bsp)
print(summary(lineares.modell))
print(coef(lineares.modell))

plot(b ~ a, data = bsp, main = "Steigung ist 3.05")
abline(lineares.modell, col = "blue")

LG,
Bernhard

FCuhls · Beitrag von **FCuhls** » Sa Feb 01, 2020 9:20 pm

Hey! Vielen Dank @ruppy, wie genau lautet der Befehl bzgl. der Korrelation dann? Nur mit quasi-metrisch davor funktioniert es nicht.

Vielen vielen Dank vorab!

Fenja

ruppy · Beitrag von **ruppy** » So Feb 02, 2020 10:54 am

Hi Fenja,

meine Antwort hatte nichts mit R, sondern mit Statistik zu tun.
Für die Berechnung einer Korrelation nach Bravais-Pearson sollten die Daten metrisches Niveau aufweisen (das ist die Art von Korrelation an die der Laie bei der Nennung dieses Begriffs i.d.R. denkt)

Ich gehe davon aus, dass deine Daten aber eher ordinales Skalenniveau haben, da sie wahrscheinlich mittels Fragebogen erhoben wurden ("stimme zu", "stimme sehr zu").

Daher darfst du eigentlich nicht die Korrelation nach Bravais-Pearson berechnen, außer du unterstellst, dass die Daten "quasi-metrisch" sind.
Siehe hierzu:

https://studlib.de/4498/medien/ordinale_skalierung

Dementsprechend kannst du in deinem R-Code auch nicht den String "quasi-metrisch" verwenden. Du solltest aber in deinem Bericht, deiner Hausarbeit, was auch immer schreiben, dass du diese Annahme triffst unabhängig davon, ob du Korrelationen oder Regressionen rechnest.

Oder: Du berechnest die Korrelation nach Spearman, die auf Rängen basiert und somit ordinales Skalenniveau zulässt.

Hier ein bisschen Code für Korrelationen und entsprechende Test nach Bravais-Pearson sowie Spearman:

Code: Alles auswählen

x <- c(1,2,3,4,5,6)
y <- c(6,5,4,3,2,1)

cor(x, y, method = "pearson")
cor(x, y, method = "spearman")

cor.test(x, y, method = "pearson")
cor.test(x, y, method = "spearman")

Beachte bitte, dass in diesem Beispiel die Werte der Vektoren x und y ein bisschen dämlich gewählt sind (perfekt negativ korreliert).

BG ruppy

Cancermind · Beitrag von **Cancermind** » So Mär 01, 2020 3:43 pm

bigben hat geschrieben: ↑Sa Feb 01, 2020 2:12 pm Beispiel für einen Wilcoxon-Test nach Mediansplit:
Code: Alles auswählen
werte <- data.frame(buchstaben = LETTERS,
                    messwerte = runif(26),
                    zahlen = 1:26)

werte$split <- cut(werte$messwerte, breaks = c(-Inf, median(werte$messwerte), Inf),
                   labels = c("niedriger als Median", "höher als Median"))

head(werte)
boxplot(werte$messwerte ~ werte$split)

wilcox.test(werte$zahlen ~ werte$split)
Ich muss aber unbedingt einmal dazu sagen, dass ein Median-Split fast nie die bessere Auswertungsstrategie ist.

HTH,
Bernhard

Hey Bernhard,

wäre dann nicht ein Mediansplit in drei Gruppen (niedrig, mittel und hoch) eine Alternative?
Wüsstest du auch hierzu den Befehl? Ich habe bisher ausschließlich Zusammenhangshypothesen formuliert und bereits die Korrelation zwischen der Aufgabenvielfalt und der Gesamtzufriedenheit nachgewiesen. Jetzt würde ich gerne prüfen, ob Mitarbeiter mit eine hohen Aufgabenvielfalt zufriedener sind, als Mitarbeiter mit einer mittleren oder geringen Aufgabenvielfalt.

LG, Hannah

Deutsches R-Forum

Mediansplit

Mediansplit

Re: Mediansplit

Re: Mediansplit

Re: Mediansplit

Re: Mediansplit

Re: Mediansplit

Re: Mediansplit

Re: Mediansplit

Re: Mediansplit

Re: Mediansplit