Seite 1 von 1

Verteilung von Datensatz durch Histogram visualisieren

Verfasst: Do Sep 19, 2019 4:13 pm
von Freddy19911
Hallo,

für einen vorliegenden Datensatz (ca. 8000 Beobachtungen) möchte ich visuell prüfen ob dieser einer Normalverteilung folgt. Zusätzlich zu einem QQ-Plot und anderen Testmethoden würde ich mir die absolute Häufigkeit der Beobachtungen gerne in einem Histogramm anschauen. Das habe ich mit dem folgenden Befehl erledigt:

Code: Alles auswählen

qplot(data.NV$AR, geom="histogram")
Das Ergebnis ist auf dem Bild im Anhang zu sehen. Gibt es eine Möglichkeit ein Histogramm zu erstellen, für das gilt: Eine Beobachtung = 1 Balken? Nun erfordert ein Histogramm ja gerade die Einteilung der Daten in Klassen, weshalb ich vielleicht mit dieser Darstellungsform nicht weiterkomme. Hat jemand eine Idee wie ich mein Vorhaben am besten realisieren kann?

Vielen Dank und beste Grüße
Daten NV.PNG

Re: Verteilung von Datensatz durch Histogram visualisieren

Verfasst: Do Sep 19, 2019 4:23 pm
von student
Hast Du schon an einen simplen barplot() gedacht?

Re: Verteilung von Datensatz durch Histogram visualisieren

Verfasst: Do Sep 19, 2019 4:26 pm
von jogo
wie wäre es mit

Code: Alles auswählen

stem(data.NV$AR)
:?:

Gruß, Jörg

Re: Verteilung von Datensatz durch Histogram visualisieren

Verfasst: Do Sep 19, 2019 4:48 pm
von Freddy19911
Vielen Dank für die schnellen Antworten. Ich habe beides probiert und es sieht schon mal besser aus als mein Versuch mit dem Histogramm :?

Gibt es eine Möglichkeit bei dem barplot die Häufigkeiten auf der y-Achse darzustellen und die Beobachtungen auf der x-Achse? Ich habe sowohl positive als auch negative Beobachtungen, sodass natürlich standardmäßig die negativen unterhalb der x-Achse angezeigt werden und die positiven darüber. Am liebsten wäre mir eine Darstellung wie im Histogramm, wo auf der x-Achse die Werte abgetragen (-x_1...x_n) sind und auf der y-achse die Häufigkeiten. Ist das mit einem barplot möglich?

Nochmals vielen Dank für eure Hilfe
Barplot.PNG

Re: Verteilung von Datensatz durch Histogram visualisieren

Verfasst: Do Sep 19, 2019 9:29 pm
von bigben
Ich mag für solche Zwecke die Kombination von plot und table. Etwa so:

Code: Alles auswählen

beispiel <- round(rnorm(300),1)
plot(table(beispiel))
Gut an dieser Kombination ist, dass die schmalen Balken sowohl bei vielen als auch bei wenigen Punkten visuell gut aussieht.

Der naive Versuch mit barplot und table ist gefährlich:

Code: Alles auswählen

barplot(table(beispiel))
Hier fallen nämlich alle unbesetzen Werte auf der x-Achse einfach weg, während plot eine Lücke lässt.

LG,
Bernhard

Re: Verteilung von Datensatz durch Histogram visualisieren

Verfasst: Fr Sep 20, 2019 8:01 am
von jogo
Hallo Freddy,

vielleicht findest Du hier etwas Passendes:
https://www.r-graph-gallery.com/

Gruß, Jörg

Re: Verteilung von Datensatz durch Histogram visualisieren

Verfasst: Fr Sep 20, 2019 9:27 am
von Freddy19911
Hallo,

ich habe zusätzlich noch

Code: Alles auswählen

plot(density(x))
verwendet, also die"geglättete" Variante des Histogramms.

Vielen Dank für eure hilfreichen Antworten und ein schönes Wochenende 8-)