Verteilung von Datensatz durch Histogram visualisieren

Wie erstelle ich Grafiken, was ist zu beachten?

Moderatoren: EDi, jogo

Antworten
Freddy19911
Beiträge: 15
Registriert: Do Sep 05, 2019 5:07 pm

Verteilung von Datensatz durch Histogram visualisieren

Beitrag von Freddy19911 »

Hallo,

für einen vorliegenden Datensatz (ca. 8000 Beobachtungen) möchte ich visuell prüfen ob dieser einer Normalverteilung folgt. Zusätzlich zu einem QQ-Plot und anderen Testmethoden würde ich mir die absolute Häufigkeit der Beobachtungen gerne in einem Histogramm anschauen. Das habe ich mit dem folgenden Befehl erledigt:

Code: Alles auswählen

qplot(data.NV$AR, geom="histogram")
Das Ergebnis ist auf dem Bild im Anhang zu sehen. Gibt es eine Möglichkeit ein Histogramm zu erstellen, für das gilt: Eine Beobachtung = 1 Balken? Nun erfordert ein Histogramm ja gerade die Einteilung der Daten in Klassen, weshalb ich vielleicht mit dieser Darstellungsform nicht weiterkomme. Hat jemand eine Idee wie ich mein Vorhaben am besten realisieren kann?

Vielen Dank und beste Grüße
Daten NV.PNG
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Verteilung von Datensatz durch Histogram visualisieren

Beitrag von student »

Hast Du schon an einen simplen barplot() gedacht?
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Verteilung von Datensatz durch Histogram visualisieren

Beitrag von jogo »

wie wäre es mit

Code: Alles auswählen

stem(data.NV$AR)
:?:

Gruß, Jörg
Freddy19911
Beiträge: 15
Registriert: Do Sep 05, 2019 5:07 pm

Re: Verteilung von Datensatz durch Histogram visualisieren

Beitrag von Freddy19911 »

Vielen Dank für die schnellen Antworten. Ich habe beides probiert und es sieht schon mal besser aus als mein Versuch mit dem Histogramm :?

Gibt es eine Möglichkeit bei dem barplot die Häufigkeiten auf der y-Achse darzustellen und die Beobachtungen auf der x-Achse? Ich habe sowohl positive als auch negative Beobachtungen, sodass natürlich standardmäßig die negativen unterhalb der x-Achse angezeigt werden und die positiven darüber. Am liebsten wäre mir eine Darstellung wie im Histogramm, wo auf der x-Achse die Werte abgetragen (-x_1...x_n) sind und auf der y-achse die Häufigkeiten. Ist das mit einem barplot möglich?

Nochmals vielen Dank für eure Hilfe
Barplot.PNG
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Verteilung von Datensatz durch Histogram visualisieren

Beitrag von bigben »

Ich mag für solche Zwecke die Kombination von plot und table. Etwa so:

Code: Alles auswählen

beispiel <- round(rnorm(300),1)
plot(table(beispiel))
Gut an dieser Kombination ist, dass die schmalen Balken sowohl bei vielen als auch bei wenigen Punkten visuell gut aussieht.

Der naive Versuch mit barplot und table ist gefährlich:

Code: Alles auswählen

barplot(table(beispiel))
Hier fallen nämlich alle unbesetzen Werte auf der x-Achse einfach weg, während plot eine Lücke lässt.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: Verteilung von Datensatz durch Histogram visualisieren

Beitrag von jogo »

Hallo Freddy,

vielleicht findest Du hier etwas Passendes:
https://www.r-graph-gallery.com/

Gruß, Jörg
Freddy19911
Beiträge: 15
Registriert: Do Sep 05, 2019 5:07 pm

Re: Verteilung von Datensatz durch Histogram visualisieren

Beitrag von Freddy19911 »

Hallo,

ich habe zusätzlich noch

Code: Alles auswählen

plot(density(x))
verwendet, also die"geglättete" Variante des Histogramms.

Vielen Dank für eure hilfreichen Antworten und ein schönes Wochenende 8-)
Antworten