Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Antworten
LeaNie
Beiträge: 9
Registriert: Do Apr 13, 2017 12:55 pm

Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von LeaNie » Di Sep 11, 2018 4:07 pm

Hallo,
ich habe die Mittelwerte von zwei Raster wie folgt mit dem Welch’s t-test verglichen:

Code: Alles auswählen

> t.test(oq_table$GRID_CODE, rq_table$GRID_CODE, 
+        alternative="two.sided", conf=0.95, var.eq=F, paired=F)
Da ich von dem “central limit theorem” gelesen habe, bin ich davon ausgegangen, dass sehr große Datensätze nicht auf Normalverteilung getestet werden müssen. Das „central limit theorem“ besagt doch, dass der t-test immer angewandt werden kann, wenn die Stichprobe sehr groß ist. Folgende Literatur und Diskussion habe ich diesbezüglich gelesen: Nun wurde mir gesagt, dass ich dennoch auf Normalverteilung testen solle und ich frage mich, ob ich da etwas mißverstanden habe oder mit dem „central limit theorem“ dagegen argumentieren darf/sollte? Meine Pixelanzahl ist über 3 Millionen und die Pixel können Werte zwischen 0 und 100 annehmen. Ich würde mich sehr über eine Antwort freuen.

bigben
Beiträge: 658
Registriert: Mi Okt 12, 2016 9:09 am

Re: Welch’s t-test auf möglich bei großen Stichproben (central limit theorem)?

Beitrag von bigben » Mi Sep 12, 2018 11:41 am

LeaNie hat geschrieben:
Di Sep 11, 2018 4:07 pm
Nun wurde mir gesagt, dass ich dennoch auf Normalverteilung testen solle und ich frage mich, ob ich da etwas mißverstanden habe oder mit dem „central limit theorem“ dagegen argumentieren darf/sollte?
Bei 3 Mio unabhängigen(?) Beobachtungen kann man sicher streiten, ob man überhaupt den t-Test braucht, weil der bei den geringsten Abweichungen natürlich signifikant wird. Keinen Zweifel kann es daran geben, dass der t-Test extrem robust gegen Normalverteilungsverletzungen wird, so dass man da keinen Test auf Normalverteilung braucht, der seinerseit auch mit an Sicherheit grenzender Wahrscheinlichkeit signifikant ausfallen würde (im Sinne einer sicheren aber irrelevanten Abweichung von der Normalverteilung).

Stelle sich nur die Frage, wer Dir das gesagt hat. Mir hat das vor kurzem ein Reviewer geschrieben und als ich mit ähnlichen Literaturbelegen zurück geschrieben habe, dass ich mein Vorgehen für richtig halte, hat er seit Monaten nicht mehr geantwortet. Mit anderen Worten: Manche Leute haben faktische Macht, falsches durchzusetzen. Wenn Dein Doktorvater eine Normalverteilungstestung will, dann mach die und weiche danach auf eine Mann-Whitney-Test aus. Wenn Dein Kommilitone Dir den Tipp gegeben hat, dann lass das.

LG,
Bernhard


Nachtrag: Bitte gewöhne Dir gar nicht erst an, TRUE mit T und FALSE mit F abzukürzen. Du musst nur einmal in Deiner R Sitzung sowas schreiben wie 'F <- 1' und schon ändert sich das Ergebnis Deines oben zitierten Aufrufs von t.test und Du wunderst Dich, warum gerade eben noch beim gleichen Aufruf was anderes rausgekommen ist.
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste