Tukey post-hoc Test

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Stefan
Beiträge: 22
Registriert: So Apr 12, 2020 9:49 am

Tukey post-hoc Test

Beitrag von Stefan »

Hallo,

ich möchte gerne fünf verschiedene Datensätze mit jeweils der gleichen Variable auf Signifikanten Unterschied untersuchen.
Ursprünglich hatte ich einen Datensatz, den ich aber in verschiedene Dekaden aufgeteilt habe.

Hierbei habe ich eine 70er, 80er, 90er, 00er und 10er Dekade erstellt.
Alle Datensätze haben die Variable "points".
Diese Variable möchte ich gerne mit dem Tukey post-hoc Test untersuchen ob hier ein signifikanter Unterschied bei den Punkten besteht.

Im Internet habe ich folgenden Code gefunden:

Code: Alles auswählen

TukeyHSD(aov(iris$Sepal.Length ~ iris$Species))
Hier handelt es sich um einen Datensatz.
Kann ich diesen Code auch auf verschiedene Datensätze anwenden und jeweils die gleiche Variable vergleichen?

Viele Grüße

Stefan
Zuletzt geändert von jogo am Fr Jul 24, 2020 8:32 am, insgesamt 1-mal geändert.
Grund: Formatierung verbessert. http://forum.r-statistik.de/viewtopic.php?f=20&t=29
Stefan
Beiträge: 22
Registriert: So Apr 12, 2020 9:49 am

Re: Tukey post-hoc Test

Beitrag von Stefan »

Eine andere Überlegung wäre, wenn ich die relevanten Daten der verschiedenen Datensätze wieder zusammenführe und dann einen Datensatz habe.

Dies würde dann folgendermaßen aussehen:

data_alle_Dekaden

Dekade points
70er 36
80er 502
90er 1650
00er 586
10er 436

Mit diesen Daten könnte ich ja dann einen post-hoc Test durchführen und auf Signifikante Unterschiede bei den Punkten untersuchen.

Viele Grüße

Stefan
bigben
Beiträge: 2780
Registriert: Mi Okt 12, 2016 9:09 am

Re: Tukey post-hoc Test

Beitrag von bigben »

Stefan hat geschrieben: Fr Jul 24, 2020 8:50 amDekade points
70er 36
80er 502
90er 1650
00er 586
10er 436
Hallo Stefan,

Du kannst aber nicht die Zahl 36 mit der Zahl 502 vergleichen, wenn Du keine Daten über die Streubreite (Varianz) der Zahlen innerhalb der Dekaden hast. Im Idealfall solltest Du alle einzelnen Punktwerte aus jedem Jahrzehnt haben und nicht nur deren Punktesummen. Bitte stell noch einmal eindeutig und zweifelsfrei dar, wie die Daten jetzt vorliegen und wie Du die ANOVA gerechnet hast, auf die jetzt die posthoc-Tests folgen sollen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Stefan
Beiträge: 22
Registriert: So Apr 12, 2020 9:49 am

Re: Tukey post-hoc Test

Beitrag von Stefan »

Hallo Bernhard,

vielen Dank für deine Antwort.

Mir liegen alle Punktewerte aus jedem Jahrzehnt auch einzeln vor.

Ich habe einen Datensatz der alle Punktewerte der einzelnen Jahre beinhaltet.
Ebenfalls habe ich neue Datensätze von den einzelnen Dekaden mit allen Punktewerten der einzelnen Jahre erstellt.

Eine ANOVA habe ich noch gar nicht durchgeführt, da mir bisher nur zwei numerische Variablen (Jahr und Punkte) vorliegen.
Wenn ich die ANOVA aber richtig verstanden habe, werden hier mehrere kategoriale Variablen verglichen und hierzu eine numerische Variable.

Hat hierzu jemand einen Lösungsvorschlag?

Viele Grüße

Stefan
Stefan
Beiträge: 22
Registriert: So Apr 12, 2020 9:49 am

Re: Tukey post-hoc Test

Beitrag von Stefan »

Um eine ANOVA durchführen zu können habe ich einen neuen Datensatz mit den Variablen "Dekaden" und "PunkteDekaden" erstellt.
Hierzu der komplette Code:

Code: Alles auswählen

# Signifikante Unterschiede zwischen den Dekaden
Dekaden <-c(rep("1970er", 1), rep("1980er", 32), rep("1990er", 138),
            rep("2000er", 73), rep("2010er", 67))

PunkteDekaden <-c(data_70er_Dekade$points, data_80er_Dekade$points,
                  data_90er_Dekade$points, data_00er_Dekade$points,
                  data_10er_Dekade$points)

df <- data.frame(Dekaden, PunkteDekaden)

plot(PunkteDekaden ~ Dekaden, data = df)

rankings.aov <- aov(PunkteDekaden ~ Dekaden, data = df)
summary(rankings.aov)
Nach der Ausführung der ANOVA habe ich folgende Daten erhalten:

Df Sum Sq Mean Sq F value Pr(>F)
Dekaden 4 3309 827.1 4.008 0.00348 **
Residuals 306 63147 206.4
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
bigben
Beiträge: 2780
Registriert: Mi Okt 12, 2016 9:09 am

Re: Tukey post-hoc Test

Beitrag von bigben »

Kein reproduzierbares Beispiel:

Code: Alles auswählen

> # Signifikante Unterschiede zwischen den Dekaden
> Dekaden <-c(rep("1970er", 1), rep("1980er", 32), rep("1990er", 138),
+             rep("2000er", 73), rep("2010er", 67))
> 
> PunkteDekaden <-c(data_70er_Dekade$points, data_80er_Dekade$points,
+                   data_90er_Dekade$points, data_00er_Dekade$points,
+                   data_10er_Dekade$points)
Error: object 'data_70er_Dekade' not found
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Tukey post-hoc Test

Beitrag von EDi »

Für post-Hoc tests nehme ich immer das emmeans Paket. Ohne ein reproduzierbares Beispiel kann ich aber nicht mehr Hilfe geben...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten