Seite 1 von 1

Tukey post-hoc Test

Verfasst: Fr Jul 24, 2020 8:11 am
von Stefan
Hallo,

ich möchte gerne fünf verschiedene Datensätze mit jeweils der gleichen Variable auf Signifikanten Unterschied untersuchen.
Ursprünglich hatte ich einen Datensatz, den ich aber in verschiedene Dekaden aufgeteilt habe.

Hierbei habe ich eine 70er, 80er, 90er, 00er und 10er Dekade erstellt.
Alle Datensätze haben die Variable "points".
Diese Variable möchte ich gerne mit dem Tukey post-hoc Test untersuchen ob hier ein signifikanter Unterschied bei den Punkten besteht.

Im Internet habe ich folgenden Code gefunden:

Code: Alles auswählen

TukeyHSD(aov(iris$Sepal.Length ~ iris$Species))
Hier handelt es sich um einen Datensatz.
Kann ich diesen Code auch auf verschiedene Datensätze anwenden und jeweils die gleiche Variable vergleichen?

Viele Grüße

Stefan

Re: Tukey post-hoc Test

Verfasst: Fr Jul 24, 2020 8:50 am
von Stefan
Eine andere Überlegung wäre, wenn ich die relevanten Daten der verschiedenen Datensätze wieder zusammenführe und dann einen Datensatz habe.

Dies würde dann folgendermaßen aussehen:

data_alle_Dekaden

Dekade points
70er 36
80er 502
90er 1650
00er 586
10er 436

Mit diesen Daten könnte ich ja dann einen post-hoc Test durchführen und auf Signifikante Unterschiede bei den Punkten untersuchen.

Viele Grüße

Stefan

Re: Tukey post-hoc Test

Verfasst: Fr Jul 24, 2020 11:26 am
von bigben
Stefan hat geschrieben: Fr Jul 24, 2020 8:50 amDekade points
70er 36
80er 502
90er 1650
00er 586
10er 436
Hallo Stefan,

Du kannst aber nicht die Zahl 36 mit der Zahl 502 vergleichen, wenn Du keine Daten über die Streubreite (Varianz) der Zahlen innerhalb der Dekaden hast. Im Idealfall solltest Du alle einzelnen Punktwerte aus jedem Jahrzehnt haben und nicht nur deren Punktesummen. Bitte stell noch einmal eindeutig und zweifelsfrei dar, wie die Daten jetzt vorliegen und wie Du die ANOVA gerechnet hast, auf die jetzt die posthoc-Tests folgen sollen.

LG,
Bernhard

Re: Tukey post-hoc Test

Verfasst: Fr Jul 24, 2020 2:54 pm
von Stefan
Hallo Bernhard,

vielen Dank für deine Antwort.

Mir liegen alle Punktewerte aus jedem Jahrzehnt auch einzeln vor.

Ich habe einen Datensatz der alle Punktewerte der einzelnen Jahre beinhaltet.
Ebenfalls habe ich neue Datensätze von den einzelnen Dekaden mit allen Punktewerten der einzelnen Jahre erstellt.

Eine ANOVA habe ich noch gar nicht durchgeführt, da mir bisher nur zwei numerische Variablen (Jahr und Punkte) vorliegen.
Wenn ich die ANOVA aber richtig verstanden habe, werden hier mehrere kategoriale Variablen verglichen und hierzu eine numerische Variable.

Hat hierzu jemand einen Lösungsvorschlag?

Viele Grüße

Stefan

Re: Tukey post-hoc Test

Verfasst: Fr Jul 24, 2020 3:33 pm
von Stefan
Um eine ANOVA durchführen zu können habe ich einen neuen Datensatz mit den Variablen "Dekaden" und "PunkteDekaden" erstellt.
Hierzu der komplette Code:

Code: Alles auswählen

# Signifikante Unterschiede zwischen den Dekaden
Dekaden <-c(rep("1970er", 1), rep("1980er", 32), rep("1990er", 138),
            rep("2000er", 73), rep("2010er", 67))

PunkteDekaden <-c(data_70er_Dekade$points, data_80er_Dekade$points,
                  data_90er_Dekade$points, data_00er_Dekade$points,
                  data_10er_Dekade$points)

df <- data.frame(Dekaden, PunkteDekaden)

plot(PunkteDekaden ~ Dekaden, data = df)

rankings.aov <- aov(PunkteDekaden ~ Dekaden, data = df)
summary(rankings.aov)
Nach der Ausführung der ANOVA habe ich folgende Daten erhalten:

Df Sum Sq Mean Sq F value Pr(>F)
Dekaden 4 3309 827.1 4.008 0.00348 **
Residuals 306 63147 206.4
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Re: Tukey post-hoc Test

Verfasst: Fr Jul 24, 2020 3:38 pm
von bigben
Kein reproduzierbares Beispiel:

Code: Alles auswählen

> # Signifikante Unterschiede zwischen den Dekaden
> Dekaden <-c(rep("1970er", 1), rep("1980er", 32), rep("1990er", 138),
+             rep("2000er", 73), rep("2010er", 67))
> 
> PunkteDekaden <-c(data_70er_Dekade$points, data_80er_Dekade$points,
+                   data_90er_Dekade$points, data_00er_Dekade$points,
+                   data_10er_Dekade$points)
Error: object 'data_70er_Dekade' not found

Re: Tukey post-hoc Test

Verfasst: Fr Jul 24, 2020 4:39 pm
von EDi
Für post-Hoc tests nehme ich immer das emmeans Paket. Ohne ein reproduzierbares Beispiel kann ich aber nicht mehr Hilfe geben...