Hallo,
ich soll für eine Statistikaufgabe Gesamtfangmengen von 4 Fischereihäfen vergleichen und habe dazu den Kruskal-Wallis-Test verwendet. Dabei kam heraus, dass es signifikante Unterschiede zwischen den 4 Häfen gibt. Um herauszufinden, wo genau diese Unterschiede liegen, habe ich die kwAllPairsConoverTest-Funktion verwendet. Jedoch bekomme ich die Warnmeldung "Ties are present. Quantiles were corrected for ties". Wie werde ich diese Bindungen los? Und wie genau interpretiere ich die Ergebnisse des Tests? Bin für jede Hilfe dankbar!
LG
Kruskal-Wallis-Test und All Pairs Conover Test
Re: Kruskal-Wallis-Test und All Pairs Conover Test
Gar nicht, ist ja ein Eigenschaft deiner Daten, weil es Ränke doppelt gibt.Jedoch bekomme ich die Warnmeldung "Ties are present. Quantiles were corrected for ties". Wie werde ich diese Bindungen los?
Z.B. im vektor c(1,2,3,3,4,5,5) sind 3 und 5 "ties", d.h. haben den selben Rank:
Code: Alles auswählen
❯ rank( c(1,2,3,3,4,5,5))
[1] 1.0 2.0 3.5 3.5 5.0 6.5 6.5
Man kann aber auch andere nehmen:
Code: Alles auswählen
❯ rank( c(1,2,3,3,4,5,5), ties.method = "max")
[1] 1 2 4 4 5 7 7
❯ rank( c(1,2,3,3,4,5,5), ties.method = "first")
[1] 1 2 3 4 5 6 7
Das sollte idealerweise schon bevor man irgendwelche Daten erhebt schon bekannt sein.Und wie genau interpretiere ich die Ergebnisse des Tests?
Kruskal-Wallis vergleicht bei symmetrischen Verteilungen Mediane (bei nicht symmetrischen den ähnlichen pseudo-median.
Die zu vergleichenden Daten sollten aber ähnlich Verteilungen haben, sonst misst der auch noch die ungleichheit der Verteilungen (nicht parameterisch != Ohne Annahmen)
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Kruskal-Wallis-Test und All Pairs Conover Test
Vielen Dank für die Hilfe.
An welcher "Stelle" baue ich denn die rank-Funktion ein? Wenn ich die Kruskal-Wallis-Funktion und die All Pairs Conover-Funktion anwende, gebe ich da ja quasi nur die "Rohdaten" ein. Oder kann ich die Bindungen quasi einfach da lassen? Bzw. hat das einen Einfluss auf das Ergebnis des Conover Tests?
Leider waren die Verteilungen der Stichproben nicht allzu ähnlich.. es gab ja 4 Gruppen (Häfen), zu denen jeweils 50 Messwerte (Fangmengen) vorhanden sind. Ich habe für jede der Gruppen die Normalverteilung geprüft, auf 2 Gruppen trifft sie zu und auf 2 nicht. Wäre es besser einen anderen Test anzuwenden und wenn ja welchen?
Ich bin bei der Wahl des Tests ein wenig nach dem Ausschlussprinzip vorgegangen:
Da ja nicht alle Daten normalverteilt sind, kommen ja nur nicht parametrische Tests infrage. Die Stichproben sind zueinander unabhängig und es gibt mehr als 2 Gruppen. Es muss außerdem ein Test sein, den wir in der Vorlesung behandelt hatten, und da ist dann nur noch der Kruskal-Wallis-Test übriggeblieben. Wir hatten außerdem ANOVAs (die ja rausfallen weil die Daten nicht normalverteilt sind), Wilcoxon (der ja nur für 2 Gruppen funktioniert), Friedman (nur für abhängige Stichproben), Mann-Whitney-U- und Mediantest (nur für 2 Gruppen) und halt Kruskal-Wallis.
An welcher "Stelle" baue ich denn die rank-Funktion ein? Wenn ich die Kruskal-Wallis-Funktion und die All Pairs Conover-Funktion anwende, gebe ich da ja quasi nur die "Rohdaten" ein. Oder kann ich die Bindungen quasi einfach da lassen? Bzw. hat das einen Einfluss auf das Ergebnis des Conover Tests?
Leider waren die Verteilungen der Stichproben nicht allzu ähnlich.. es gab ja 4 Gruppen (Häfen), zu denen jeweils 50 Messwerte (Fangmengen) vorhanden sind. Ich habe für jede der Gruppen die Normalverteilung geprüft, auf 2 Gruppen trifft sie zu und auf 2 nicht. Wäre es besser einen anderen Test anzuwenden und wenn ja welchen?
Ich bin bei der Wahl des Tests ein wenig nach dem Ausschlussprinzip vorgegangen:
Da ja nicht alle Daten normalverteilt sind, kommen ja nur nicht parametrische Tests infrage. Die Stichproben sind zueinander unabhängig und es gibt mehr als 2 Gruppen. Es muss außerdem ein Test sein, den wir in der Vorlesung behandelt hatten, und da ist dann nur noch der Kruskal-Wallis-Test übriggeblieben. Wir hatten außerdem ANOVAs (die ja rausfallen weil die Daten nicht normalverteilt sind), Wilcoxon (der ja nur für 2 Gruppen funktioniert), Friedman (nur für abhängige Stichproben), Mann-Whitney-U- und Mediantest (nur für 2 Gruppen) und halt Kruskal-Wallis.
Re: Kruskal-Wallis-Test und All Pairs Conover Test
Hallo Josephine,
ich habe den Wilcoxon-Test hier in einem Video beschrieben und ab Minute 9:55 wird auf das Thema Bindungen eingegangen. Vielleicht hilft es Dir zum Verständnis weiter...
ich habe den Wilcoxon-Test hier in einem Video beschrieben und ab Minute 9:55 wird auf das Thema Bindungen eingegangen. Vielleicht hilft es Dir zum Verständnis weiter...
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Re: Kruskal-Wallis-Test und All Pairs Conover Test
Vielen Dank, das werde ich mir auf jeden Fall mal anschauen.
LG
LG
Re: Kruskal-Wallis-Test und All Pairs Conover Test
Die Normalverteilund ist nicht die einzigste Verteilung auf dieser Welt- es gibt auch noch viele andere Verteilungen!Wäre es besser einen anderen Test anzuwenden und wenn ja welchen?
[...]
Da ja nicht alle Daten normalverteilt sind, kommen ja nur nicht parametrische Tests infrage.
Fangmengen sind ja per se nicht normalverteilt, da diese nicht negativ werden können und diskret sind (es gibt keine 0.375Fische).
Solche Zähldaten kann man mit der Poisson oder (häufig passender) negativ-binomial Verteilung modellieren.
Das Stichwort hierzu lautet "Generalized Linear Models".
Was du mit Zähldaten auch machen kannst: log-transformation.
Häufig sind die nämlich bisschen schief und zeigen eine größere Varianz bei größerem Mittelwert. Ein log-transformation kann beides etwas gerade rücken.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.