Kruskal-Wallis-Test und All Pairs Conover Test

Josephine · Beitrag von **Josephine** » Mo Okt 04, 2021 6:29 pm

Hallo,
ich soll für eine Statistikaufgabe Gesamtfangmengen von 4 Fischereihäfen vergleichen und habe dazu den Kruskal-Wallis-Test verwendet. Dabei kam heraus, dass es signifikante Unterschiede zwischen den 4 Häfen gibt. Um herauszufinden, wo genau diese Unterschiede liegen, habe ich die kwAllPairsConoverTest-Funktion verwendet. Jedoch bekomme ich die Warnmeldung "Ties are present. Quantiles were corrected for ties". Wie werde ich diese Bindungen los? Und wie genau interpretiere ich die Ergebnisse des Tests? Bin für jede Hilfe dankbar!
LG

Beitrag von **EDi** » Mo Okt 04, 2021 11:13 pm

Jedoch bekomme ich die Warnmeldung "Ties are present. Quantiles were corrected for ties". Wie werde ich diese Bindungen los?

Gar nicht, ist ja ein Eigenschaft deiner Daten, weil es Ränke doppelt gibt.
Z.B. im vektor c(1,2,3,3,4,5,5) sind 3 und 5 "ties", d.h. haben den selben Rank:

Code: Alles auswählen

❯ rank( c(1,2,3,3,4,5,5))
[1] 1.0 2.0 3.5 3.5 5.0 6.5 6.5

Man kann diese unterschiedlich behandeln. Die ?rank function nutzt "averging" als Standart (aus 3+4 wird 3.5 und auch 6 +7 wird 6.5).
Man kann aber auch andere nehmen:

Code: Alles auswählen

❯ rank( c(1,2,3,3,4,5,5), ties.method = "max")
[1] 1 2 4 4 5 7 7
❯ rank( c(1,2,3,3,4,5,5), ties.method = "first")
[1] 1 2 3 4 5 6 7

Und wie genau interpretiere ich die Ergebnisse des Tests?

Das sollte idealerweise schon bevor man irgendwelche Daten erhebt schon bekannt sein.
Kruskal-Wallis vergleicht bei symmetrischen Verteilungen Mediane (bei nicht symmetrischen den ähnlichen pseudo-median.
Die zu vergleichenden Daten sollten aber ähnlich Verteilungen haben, sonst misst der auch noch die ungleichheit der Verteilungen (nicht parameterisch != Ohne Annahmen)

Josephine · Beitrag von **Josephine** » Di Okt 05, 2021 9:56 am

Vielen Dank für die Hilfe.
An welcher "Stelle" baue ich denn die rank-Funktion ein? Wenn ich die Kruskal-Wallis-Funktion und die All Pairs Conover-Funktion anwende, gebe ich da ja quasi nur die "Rohdaten" ein. Oder kann ich die Bindungen quasi einfach da lassen? Bzw. hat das einen Einfluss auf das Ergebnis des Conover Tests?

Leider waren die Verteilungen der Stichproben nicht allzu ähnlich.. es gab ja 4 Gruppen (Häfen), zu denen jeweils 50 Messwerte (Fangmengen) vorhanden sind. Ich habe für jede der Gruppen die Normalverteilung geprüft, auf 2 Gruppen trifft sie zu und auf 2 nicht. Wäre es besser einen anderen Test anzuwenden und wenn ja welchen?
Ich bin bei der Wahl des Tests ein wenig nach dem Ausschlussprinzip vorgegangen:
Da ja nicht alle Daten normalverteilt sind, kommen ja nur nicht parametrische Tests infrage. Die Stichproben sind zueinander unabhängig und es gibt mehr als 2 Gruppen. Es muss außerdem ein Test sein, den wir in der Vorlesung behandelt hatten, und da ist dann nur noch der Kruskal-Wallis-Test übriggeblieben. Wir hatten außerdem ANOVAs (die ja rausfallen weil die Daten nicht normalverteilt sind), Wilcoxon (der ja nur für 2 Gruppen funktioniert), Friedman (nur für abhängige Stichproben), Mann-Whitney-U- und Mediantest (nur für 2 Gruppen) und halt Kruskal-Wallis.

Beitrag von **student** » Di Okt 05, 2021 11:26 am

Hallo Josephine,

ich habe den Wilcoxon-Test hier in einem Video beschrieben und ab Minute 9:55 wird auf das Thema Bindungen eingegangen. Vielleicht hilft es Dir zum Verständnis weiter...

Josephine · Beitrag von **Josephine** » Mi Okt 06, 2021 9:06 am

Vielen Dank, das werde ich mir auf jeden Fall mal anschauen.
LG

Beitrag von **EDi** » Mi Okt 06, 2021 8:37 pm

Wäre es besser einen anderen Test anzuwenden und wenn ja welchen?
[...]
Da ja nicht alle Daten normalverteilt sind, kommen ja nur nicht parametrische Tests infrage.

Die Normalverteilund ist nicht die einzigste Verteilung auf dieser Welt- es gibt auch noch viele andere Verteilungen!
Fangmengen sind ja per se nicht normalverteilt, da diese nicht negativ werden können und diskret sind (es gibt keine 0.375Fische).
Solche Zähldaten kann man mit der Poisson oder (häufig passender) negativ-binomial Verteilung modellieren.
Das Stichwort hierzu lautet "Generalized Linear Models".

Was du mit Zähldaten auch machen kannst: log-transformation.
Häufig sind die nämlich bisschen schief und zeigen eine größere Varianz bei größerem Mittelwert. Ein log-transformation kann beides etwas gerade rücken.

Deutsches R-Forum

Kruskal-Wallis-Test und All Pairs Conover Test

Kruskal-Wallis-Test und All Pairs Conover Test

Re: Kruskal-Wallis-Test und All Pairs Conover Test

Re: Kruskal-Wallis-Test und All Pairs Conover Test

Re: Kruskal-Wallis-Test und All Pairs Conover Test

Re: Kruskal-Wallis-Test und All Pairs Conover Test

Re: Kruskal-Wallis-Test und All Pairs Conover Test