geom_count Skala

Wie erstelle ich Grafiken, was ist zu beachten?

Moderatoren: EDi, jogo

Antworten
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

geom_count Skala

Beitrag von bigben »

Hallo Forum,

folgende Beobachtung nervt mich bei ggplot2 schon lange und ich würde mich freuen, wenn mir jemand einen einprägsamen Weg zur Abhilfe zeigen oder Seelenfrieden durch Erklärung der dahinterstehenden Logik geben könnte.

Reproduzierbares Beispiel:

Code: Alles auswählen

library(ggplot2)
somedata <- data.frame(a = c(1, 2, 2, 2, 3, 4, 5, 5, 5, 6),
                       b = c(1, 2, 2, 3, 1, 5, 5, 5, 4, 1))
p <- ggplot(somedata) + geom_count(aes(x=a, y=b))
print(p)
Rplot.png
Rplot.png (4.35 KiB) 331 mal betrachtet
Was mich daran wirklich stört ist die Legende: Der Kreisdurchmesser codiert die Anzahl der Treffer. Warum zeigt mir ggplot2 an, wie groß es einen Punkt malen würde, wenn ein Punkt 1,25mal vorkäme? Ein Wertepaar kann nicht 1,25mal vorkommen, sondern immer nur ganzzahlig oft.
Das ist ein ganz klarer statistischer Fehler und wenn mir jemand die obige Grafik zum Review vorlegen würde, würde ich das anmeckern.

Warum macht ggplot2 das? Ich weiß, dass man auch andere Statistiken als die Summe darstellen kann und dann macht das Realzahlenniveau sicher Sinn, aber der Name der Funktion sagt, doch, wofür sie eigentlich da ist.

Und gibt es einen einfachen Weg, das abzuschalten, ohne dass ich jedes Mal wieder mit der Suchmaschine den richtigen scale-Befehl suchen muss?

Vielen Dank,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Athomas
Beiträge: 768
Registriert: Mo Feb 26, 2018 8:19 pm

Re: geom_count Skala

Beitrag von Athomas »

Ohne es zu wissen oder rechtfertigen zu wollen: ich könnte mir vorstellen, dass es damit zusammenhängt, dass in dieser Systematik nicht nur Zählungen, sondern auch "Anteile" visualisiert werden sollen...
Und gibt es einen einfachen Weg, das abzuschalten, ohne dass ich jedes Mal wieder mit der Suchmaschine den richtigen scale-Befehl suchen muss?
Sich den Befehl irgendwo aufschreiben :lol: ?!
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: geom_count Skala

Beitrag von bigben »

Ok, dann schreib ich hier mal hin, dass man scale_size_area(breaks=1:1e5) verwenden kann und wenn einem die Punkte dann zu groß sind mehr Feinsteuerung über scale_size(breaks=1:1e5, range=c(2,4) versuchen kann .
Sich den Befehl irgendwo aufschreiben :lol: ?!
Meinst Du, ich sollte ein PDF daraus machen und das als "ggplot2 Cheatsheet" zum kostenlosen Download anbieten?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
ruedi_br
Beiträge: 159
Registriert: Do Mär 01, 2018 3:53 pm

Re: geom_count Skala

Beitrag von ruedi_br »

Dann aber zusätzlich zu

Code: Alles auswählen

scale_size_area(breaks=1:1e5)
scale_size(breaks=1:1e5, range=c(2,4)
auch gleich mit der Variante

Code: Alles auswählen

ggplot(somedata) + geom_count(aes(x=a, y=b))+ scale_radius(breaks=1:1e3)
damit das cheatsheet nicht so leer wirkt. :lol:
Grüße
Ruedi
fortune(111)
Antworten