Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Antworten
LeaNie

Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von LeaNie »

Hallo,
ich habe die Mittelwerte von zwei Raster wie folgt mit dem Welch’s t-test verglichen:

Code: Alles auswählen

> t.test(oq_table$GRID_CODE, rq_table$GRID_CODE, 
+        alternative="two.sided", conf=0.95, var.eq=F, paired=F)
Da ich von dem “central limit theorem” gelesen habe, bin ich davon ausgegangen, dass sehr große Datensätze nicht auf Normalverteilung getestet werden müssen. Das „central limit theorem“ besagt doch, dass der t-test immer angewandt werden kann, wenn die Stichprobe sehr groß ist. Folgende Literatur und Diskussion habe ich diesbezüglich gelesen: Nun wurde mir gesagt, dass ich dennoch auf Normalverteilung testen solle und ich frage mich, ob ich da etwas mißverstanden habe oder mit dem „central limit theorem“ dagegen argumentieren darf/sollte? Meine Pixelanzahl ist über 3 Millionen und die Pixel können Werte zwischen 0 und 100 annehmen. Ich würde mich sehr über eine Antwort freuen.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von bigben »

LeaNie hat geschrieben: Di Sep 11, 2018 4:07 pm Nun wurde mir gesagt, dass ich dennoch auf Normalverteilung testen solle und ich frage mich, ob ich da etwas mißverstanden habe oder mit dem „central limit theorem“ dagegen argumentieren darf/sollte?
Bei 3 Mio unabhängigen(?) Beobachtungen kann man sicher streiten, ob man überhaupt den t-Test braucht, weil der bei den geringsten Abweichungen natürlich signifikant wird. Keinen Zweifel kann es daran geben, dass der t-Test extrem robust gegen Normalverteilungsverletzungen wird, so dass man da keinen Test auf Normalverteilung braucht, der seinerseit auch mit an Sicherheit grenzender Wahrscheinlichkeit signifikant ausfallen würde (im Sinne einer sicheren aber irrelevanten Abweichung von der Normalverteilung).

Stelle sich nur die Frage, wer Dir das gesagt hat. Mir hat das vor kurzem ein Reviewer geschrieben und als ich mit ähnlichen Literaturbelegen zurück geschrieben habe, dass ich mein Vorgehen für richtig halte, hat er seit Monaten nicht mehr geantwortet. Mit anderen Worten: Manche Leute haben faktische Macht, falsches durchzusetzen. Wenn Dein Doktorvater eine Normalverteilungstestung will, dann mach die und weiche danach auf eine Mann-Whitney-Test aus. Wenn Dein Kommilitone Dir den Tipp gegeben hat, dann lass das.

LG,
Bernhard


Nachtrag: Bitte gewöhne Dir gar nicht erst an, TRUE mit T und FALSE mit F abzukürzen. Du musst nur einmal in Deiner R Sitzung sowas schreiben wie 'F <- 1' und schon ändert sich das Ergebnis Deines oben zitierten Aufrufs von t.test und Du wunderst Dich, warum gerade eben noch beim gleichen Aufruf was anderes rausgekommen ist.
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
LeaNie

Re: Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von LeaNie »

Hallo Bernhard,
vielen Dank für die Antwort. Es ist ein anonymer Reviewer, und da ich keine Erfahrung habe, wie ich darauf reagieren soll, hatte ich die Frage hier gestellt. Ich weiß leider immer noch nicht, was ich machen soll, da die eine Stichprobe nicht Normalverteilt ist, ich aber weiß, dass der t-test dennoch angewandt werden kann. Ich würde jetzt auch am liebsten den t-test streichen, da er bei dieser großen Datenmenge nicht unbedingt nötig ist. Aber hier weiß ich leider noch nicht, wie ich das gut begründen kann.
Ich weiß gerade nicht so richtig weiter und habe nun noch mehr Literatur gesucht und diese zitiert. Ich würde mich sehr über Erfahrungen und Vorschläge freuen.
Viele Grüße
LeaNie
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von bigben »

Tja, anonymer Reviewer ist schwierig. Du kannst mit geeigneter Literatur und unter Verweis auf das Zentrale Grenzwerttheorem etc. den t-Test beibehalten oder stattdessen einen Rangsummentest rechnen:

Code: Alles auswählen

wilcox.test(oq_table$GRID_CODE, rq_table$GRID_CODE)
Der wird natürlich auch hächst signifikant.

Ich würde es mit der Argumentation mit Literaturbeleg versuchen, aber die Entscheidung kann Dir keiner abnehmen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von Athomas »

Code: Alles auswählen

Meine Pixelanzahl ist über 3 Millionen und die Pixel können Werte zwischen 0 und 100 annehmen.
Wenn es Dir um diese "Werte" geht: eine beschränkte Größe kann nicht normalverteilt sein, und jeder Test wird Dir das "bestätigen" - wenn Du nur genug Werte hast. Das gilt auch für jede diskrete Zufallsvariable...
LeaNie

Re: Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von LeaNie »

Hallo, der Wilcoxon –Test hat exakt das gleiche Ergebnis wie der Welch’s t- test . Ich werde wohl mit der Literatur für die Verwendung des Welch’s t- test argumentieren und dennoch das Testergebnis vom Wilcoxon –Test in der Tabelle erwähnen.
Viele Grüße
Antworten