Seite 1 von 1

Datenvisualisierung

Verfasst: Do Aug 06, 2020 4:24 pm
von retep
Hallo,
ich möchte die Community in folgender Angelegenheit um Hilfe bitten:
in der Anlage ist ein Testdatensatz mit dem dazugehörigen Code abgebildet. Ich wollte die dazu gehörige veröffentliche
Grafik nachbauen. Leider bekomme ich es nicht hin. Da auch das Buch hierfür nur die Grafik und nicht den Lösungsweg anbietet, möchte ich in
die Runde fragen, was den die fehlenden 2 Befehlszeilen sind, welche die Grafik so wie nach der Vorlage aussehen lassen.

Hier der Code:

Code: Alles auswählen

data("thyroid",package="mclust")
head(thyroid)
str(thyroid)
library("ggplot2")                     # Load ggplot2 package
library("GGally")                      # Load GGally package

ggpairs(thyroid[ , 2 : 6 ], 
        upper = list(continuous = "cor", combo = "box_no_facet", discrete = "count"),
        lower=list(continuous=wrap("points", pch = 2)),
        diag=list(continuous=wrap("barDiag", fill="dark green", color = "black", bins = 8)))+
  theme_bw()+
  theme(panel.grid.major = element_blank(), 
        panel.grid.minor = element_blank())
        

Ich vermute der Autor des Buches hat die Spalte "Diagnosis", als Factor und kann deswegen die Korrelationen farbig unterscheiden?
Wie kann ich den Code so verändern, dass es mit der veröffentlichten Version übereinstimmt (siehe Bildanhang).

Vielen Dank für Eure Hilfe!

Re: Datenvisualisierung

Verfasst: Do Aug 06, 2020 8:43 pm
von EDi
Ich wollte die dazu gehörige veröffentliche
Grafik nachbauen
Die Abbildung ist nicht mit ggplot erstellt, sondern mit base. Siehe ?pairs und examples(pairs) für Beispiele.

Re: Datenvisualisierung

Verfasst: Do Aug 06, 2020 11:22 pm
von retep
Hallo Edi,

ich weiß dass diese Grafik nicht mit ggplot erstellt wurde. In dem von mir zitierten Buchbeispiel stehen beide packages am Anfang des Codes. Aus diesem Grund habe ich mich für die Originalwiedergabe der Code Zeilen entschieden. Ich habe auch unter ?pairs nach geschlagen. In den Beispielen ist meiner Meinung keine Codezeile zu erkennnen, wie ich die scatterplots nach einer Facktor Variable gruppiert kann.

Die Codezeilen sind ein Versuch die Buchabbildung nachzubauen. Im Anhang ist das Resultat wenn ich versuche die Grafik nachzubauen, .

Vielen Dank für die Hilfe!