Seite 1 von 1

Histogramm Anzahl Intervalle

Verfasst: Mi Nov 25, 2020 3:39 pm
von Ries
Hallo,
ich habe eine Variable mit folgenden Parametern:

Code: Alles auswählen

mean -0.002186442
sd	0.03016339
IQR	0.02566935
0%	-0.09994293
25%	-0.0149532
50%	-0.001737356
75%	0.01071615
100% 0.099796
n	7145
Nun erstelle ich ein Histogramm mit der Klassenbreite nach FD (breaks=FD) allgemeinen Regel: 2IQRn^(-1/3)=0,00266452154

Das Histogramm gibt mir nun über die Spannweite von 0,2 genau 100 Intervalle aus. Also eine Breite von genau 0,002 was ja zu 0,00266... etwas abweicht.

Weiß jemand nach welcher Logik die FD-Ermittlung in R funktioniert? Eigentlich müsste das Histogramm ca. 75 Intervalle generieren?

Re: Histogramm Anzahl Intervalle

Verfasst: Do Nov 26, 2020 1:37 pm
von jogo
Hallo Ries,

wer oder was ist FD :?:

Gruß, Jörg

Re: Histogramm Anzahl Intervalle

Verfasst: Do Nov 26, 2020 2:09 pm
von bigben
Ich vermute die Antwort lässt sich aus der Hilfe zu hist entnehmen
Other names for which algorithms are supplied are "Scott" and "FD" / "Freedman-Diaconis" (with corresponding functions nclass.scott and nclass.FD).
In der Hilfe zu nclass.FD findet man dann
nclass.FD uses the Freedman-Diaconis choice based on the inter-quartile range (IQR(signif(x, 5))) unless that's zero where it uses increasingly more extreme symmetric quantiles up to c(1,511)/512 and if that difference is still zero, reverts to using Scott's choice.
LG,
Bernhard

Re: Histogramm Anzahl Intervalle

Verfasst: Do Nov 26, 2020 2:19 pm
von jogo
dann muss es aber

Code: Alles auswählen

hist(..., breaks="FD", ...)
heißen.

Hallo Ries,

die Funktion zur Berechnung der Anzahl der breaks kannst Du Dir anzeigen lassen

Code: Alles auswählen

nclass.FD
oder auch

Code: Alles auswählen

print(nclass.FD)
Gruß, Jörg