8ZRbP hat geschrieben: Mo Mär 04, 2019 10:57 pmmittlerweile bin ich so vorgegangen
"mittlerweile" nach einer "Weile" von 80 Minuten.
Um dieses Problem zu umgehen, habe ich halt meinen Datensatz umstrukturiert, von der breiten in die lange Form (d.h. vom wide format ins long format)
Das ist ggplot2 101. ggplot2 will Daten im langen Format.
(auch wenn ich nach wie vor für Lösungsvorschläge offen bin, die kein Umstrukturieren des Datensatz von der breiten in die lange Form erfordern)
Sag niemals nie. Aber ggplot2 will Daten im langen Format.
Der o.g. Code ist jedoch Gruppenvergleiche vorgesehen, ich will ja Messwiederholungen vergleichen. Um dieses Problem zu umgehen, habe ich halt meinen Datensatz umstrukturiert,
Ob Messwiederholungen oder Gruppen, das hat nichts mit der Entscheidung zwischen langem und weitem Format zu tun. Das sind zwei ganz unterschiedliche Kategorien.
Sowohl Boxplots als auch Punktwolken sind unterdessen überhaupt nicht gut für verbundene Beobachtungen geeignet, weil man ja eben gerade nicht sieht, welcher Punkt rechts zu welchem Punkt links gehört. Was man bei Punktwolken noch mit verbindenden Linien reparieren kann, lässt sich beim Boxplot nicht korrigieren. Du solltest nochmal überlegen, ob ein Boxplot für Deine Daten die richtige Darstellungsform ist.
Must-have:
- Die folgenden Datenpunkte im Boxplot sollen mit den entsprechenden Werten beschriftet sein: 1., 2., 3. und viertes Quartil.
Vor dem Must-have -wie gesagt- prüfen, ob Boxplots wirklich angemessen sind bei Deiner Messwiederholungsanalyse. Ansonsten ist das total unüblich, weil ein wissenschaftliches Publikum das i. d. R. weiß und Boxplots für ein nicht-wissenschaftliches Publikum eh nicht taugen. Natürlich kannst Du Dir da selbst was basteln. Da zu schau Dir
geom_text und ggf. auch
geom_label an.
Nice-to-have:
- Die Whisker sollen außen, wie üblich, mit einem kleinen "Querbalken" als "Endstrich" beendet werden und nicht einfach aufhören
- Die y-Achse soll im Koordinatenursprung ebenfalls einen Strich haben der eben mit "0" beschriftet ist.
Weites Format, Querbalken als Endstrich - hast Du mal überlegt, ob Du base graphics verwenden möchtest? Sonst halt
https://stackoverflow.com/questions/129 ... on-boxplot
Was mir an dem Diagramm überdies völlig unklar ist, das würde ich gerne noch aufklären:
Komische Gewichtung, die Du da an den Tag legst: Dass Du Deine eigene Grafik verstehst wäre m. E. "must have" und nicht "würde gerne noch"...
- Was bedeuten die schwarzen Datenpunkte? Ausreißer oder Extremwerte können es nicht sein, da es jeweils im gleichen Boxplot auch farbige Punkte gibt, die genauso weit oder noch weiter vom Median entfernt sind ie die schwarzen Datenpunkte.
Das können nicht nur Ausreißer sein, das sind Ausreißer. Das sind die Ausreißer, die mit dem Aufruf von geom_boxplot in schwarz gezeichnet wurden. Danach hast Du dieselben Puntke nochmal in bunt gemalt.
farbige Punkte gibt, die [...]noch weiter vom Median entfernt sind wie die schwarzen Datenpunkte
Noch weiter ? Oh Mann, da hast Du aber ein ganz dickes Problem an der Backe. Das heißt, dass Du Datenpunkte geplottet hast, die für den Boxplot gar nicht verwendet wurden. Wahrscheinlich ist Dein ggplot2 kaputt, oder R ist kaputt. Heftig, heftig. Oder doch ein Fehler bei Dir? Publizieren solltest Du so einen Plot besser nicht. Einmal kann es vorkommen, dass ein bunter Punkt zufällig genau auf dem schwarzen Punkt zu liegen kommt, aber mehrere Punkt in einem Plot? Vielleicht hast Du ja Jitter nicht nur in der width sondern auch in der height Richtung? Vielleicht hast Du auch das Diagramm nicht genau genug angeschaut? Wie geschrieben: Verstehen des eigenen Plots = "must have".
HTH,
Bernhard