Grafische Darstellung Spearman-Korrelation
Grafische Darstellung Spearman-Korrelation
Hallo Community
ich bin R Beginner und tue mich leider mit dem Einstieg ein wenig schwer.
Es geht um den folgenden Sachverhalt..
Ich möchte den Zusammenhang zwischen zwei numerischen Variablen ermitteln und mit einer geeigneten Grafik darstellen.
Da der vorliegende Datensatz nicht normalverteilt ist, habe ich mich für die Spearman-Methode zur Ermittlung des Korrelationskoeffizienten entschieden und einen entsprechen rho erhalten.
Bei der grafischen Darstellung komme ich jedoch nicht weiter..
Normale Boxplots sind aufgrund der Datensatzgröße zu unübersichtlich.
Habt ihr eine gute Formel für mich auf Lager?
Ich habe etwas von spearman.plot gelesen, jedoch erscheint hierbei immer eine Fehlermeldung.
Vielen Dank im Voraus und lieben Gruß,
Tobi G.
ich bin R Beginner und tue mich leider mit dem Einstieg ein wenig schwer.
Es geht um den folgenden Sachverhalt..
Ich möchte den Zusammenhang zwischen zwei numerischen Variablen ermitteln und mit einer geeigneten Grafik darstellen.
Da der vorliegende Datensatz nicht normalverteilt ist, habe ich mich für die Spearman-Methode zur Ermittlung des Korrelationskoeffizienten entschieden und einen entsprechen rho erhalten.
Bei der grafischen Darstellung komme ich jedoch nicht weiter..
Normale Boxplots sind aufgrund der Datensatzgröße zu unübersichtlich.
Habt ihr eine gute Formel für mich auf Lager?
Ich habe etwas von spearman.plot gelesen, jedoch erscheint hierbei immer eine Fehlermeldung.
Vielen Dank im Voraus und lieben Gruß,
Tobi G.
Re: Grafische Darstellung Spearman-Korrelation
Boxplots eignen sich nur bedingt um Korrelationen darzustellen. Über wieviele Daten Punkte sprechen wir?Normale Boxplots sind aufgrund der Datensatzgröße zu unübersichtlich.
Scatterplot mit semi-transparenten Punkten, kontouren der 2D Dichte und hexbin fallen mir spontan für große Datenmengen ein. Geht alles mit ggplot2.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Grafische Darstellung Spearman-Korrelation
Die Antworten auf EDi und consuli beschreiben den Normalfall, dass man die Werte aufträgt und dann einen Blick für Korrelation gewinnt. Da ist dem visuellen Eindruck die Pearson-Korrelation aber näher als die Spearman-Korrelation. Für letztere könnte man sich vorstellen, Ränge statt Werten abzutragen, aber das ist eher ungewöhnlich.
Eine Grafik für unübersichtlich große Datenmengen zu empfehlen, ohne eine Ahnung zu haben, wie groß die Datenmengen sind und ob die Daten ordinal oder metrisch sind und wenn ordinal, in wievielen Kategorien, ist nicht sinnvoll.
LG,
Bernhard
Eine Grafik für unübersichtlich große Datenmengen zu empfehlen, ohne eine Ahnung zu haben, wie groß die Datenmengen sind und ob die Daten ordinal oder metrisch sind und wenn ordinal, in wievielen Kategorien, ist nicht sinnvoll.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Grafische Darstellung Spearman-Korrelation
Die Spearman Rangkorrelation ist genau eine Pearson Korrelation für Ränge.bigben hat geschrieben: ↑Mi Mai 30, 2018 1:17 pm Die Antworten auf EDi und consuli beschreiben den Normalfall, dass man die Werte aufträgt und dann einen Blick für Korrelation gewinnt. Da ist dem visuellen Eindruck die Pearson-Korrelation aber näher als die Spearman-Korrelation. Für letztere könnte man sich vorstellen, Ränge statt Werten abzutragen, aber das ist eher ungewöhnlich.
Consulihttps://de.wikipedia.org/wiki/Rangkorrelationskoeffizient#Spearmans_Rangkorrelationskoeffizient hat geschrieben: Im Prinzip ist ρ ein Spezialfall von Pearsons Produkt-Moment-Korrelationskoeffizient, bei dem die Daten in Ränge konvertiert werden, bevor der Korrelationskoeffizient berechnet wird.
Irmgard.
Re: Grafische Darstellung Spearman-Korrelation
Ich weiß, deshalb ja der Gedanke, dass man das auch in eine Visualisierung übertragen können müsste. Habe das aber im echten Leben noch nicht gesehen.
B
B
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Grafische Darstellung Spearman-Korrelation
Ja, da haben wir mal eine schöne mathematische Frage für unseren Forum-Mathematiker Athomas, ob die Pearsonsche Momenten-Produkt-Summe
rho= 1/n * Summe [ (x- E(x))/ s(x) * (y-E(y)) / s(y) ]
mit
E(x): Erwartungswert von x
s(x): Standardabweichung von x
den Wert 1 erreichen kann,
wenn x und y Ränge sind.
Consuli
Irmgard.
Re: Grafische Darstellung Spearman-Korrelation
Hä?
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Grafische Darstellung Spearman-Korrelation
Unsere Ausgangsfrage war doch, ob man als Repräsentation des Spearman-Rangkorrelationskoefizienten Ränge in einem x-y-Scatterplot auftragen kann und diesen Scatterplot von Rängen dann genauso interpretieren könnte, wie einen Scatterplott von intervallskalierten Merkmalen, richtig?
Aus dieser Frage ergeben sich m.E. zwei Unterfragen:
Unterfrage A)
Kann der Spearman-Rangkorrelationskoeffizient den Maximalwert 1 erreichen? (Z.B. das verallgemeinerte R^2 nach Cox/Snell kann das nicht)
Und da wir ja wissen, dass die Spearman Rangkorrelation eine verkappte Person Korrelation auf Rängen ist, bei der man wie folgt umformen kann,
rho= Cov(x, y) / (s(x)* s(y))
<=>
rho= 1/ n* Summe [(x-E(x)) * (y-(E(x))] / (s(x)* s(y))
<=>
rho= 1/n * Summe [ (x- E(x))/ s(x) * (y-E(y)) / s(y) ]
[<=> rho= Cov(x /s(x), y /(s(y)) ]
mit
E(x): Erwartungswert von x
s(x): Standardabweichung von x
Summe: Summationsoperator
kann man diese Frage zurückführen auf:
Kann
rho= 1/n * Summe [ (x- E(x))/ s(x) * (y-E(y)) / s(y) ]
den Wert 1 erreichen kann, wenn x und y Ränge sind?
Meine Vermutung wäre, dass die Spearman Korrelation nur dann den Wert 1 erreichen kann, wenn es keine doppelt besetzten Ränge gibt (keine gleichrangigen Beobachtungen). In Fällen wie diesem ist es aber immer besser, einen Mathematiker zu Rate zu ziehen.
Unterfrage B)
Wenn man nun Ränge in dem x-y-Scatterplot aufträgt (anstatt Intervalskala), darf man den Scatterplot dann noch mit dem einer bivariaten Normalverteilung vergleichen ? (was man ja implizit tut, wenn man Intervalskala aufträgt)
Und da hört es im Moment gerade bei mir auf. -> Mathematiker zu Rate ziehen.
Consuli
Aus dieser Frage ergeben sich m.E. zwei Unterfragen:
Unterfrage A)
Kann der Spearman-Rangkorrelationskoeffizient den Maximalwert 1 erreichen? (Z.B. das verallgemeinerte R^2 nach Cox/Snell kann das nicht)
Und da wir ja wissen, dass die Spearman Rangkorrelation eine verkappte Person Korrelation auf Rängen ist, bei der man wie folgt umformen kann,
rho= Cov(x, y) / (s(x)* s(y))
<=>
rho= 1/ n* Summe [(x-E(x)) * (y-(E(x))] / (s(x)* s(y))
<=>
rho= 1/n * Summe [ (x- E(x))/ s(x) * (y-E(y)) / s(y) ]
[<=> rho= Cov(x /s(x), y /(s(y)) ]
mit
E(x): Erwartungswert von x
s(x): Standardabweichung von x
Summe: Summationsoperator
kann man diese Frage zurückführen auf:
Kann
rho= 1/n * Summe [ (x- E(x))/ s(x) * (y-E(y)) / s(y) ]
den Wert 1 erreichen kann, wenn x und y Ränge sind?
Meine Vermutung wäre, dass die Spearman Korrelation nur dann den Wert 1 erreichen kann, wenn es keine doppelt besetzten Ränge gibt (keine gleichrangigen Beobachtungen). In Fällen wie diesem ist es aber immer besser, einen Mathematiker zu Rate zu ziehen.
Unterfrage B)
Wenn man nun Ränge in dem x-y-Scatterplot aufträgt (anstatt Intervalskala), darf man den Scatterplot dann noch mit dem einer bivariaten Normalverteilung vergleichen ? (was man ja implizit tut, wenn man Intervalskala aufträgt)
Und da hört es im Moment gerade bei mir auf. -> Mathematiker zu Rate ziehen.
Consuli
Irmgard.
Re: Grafische Darstellung Spearman-Korrelation
Code: Alles auswählen
> x <- 1:10
> y <- 2:11
> cor(x,y, method="spearman")
[1] 1
Code: Alles auswählen
> # alle Ränge dreifach besetzt
> cor(rep(x,3), rep(y,3), method="spearman")
[1] 1
Tut man das? Also ich würde Scatterplots auch von Daten zeichnen und betrachten, für die Normalität von vorneherein ausgeschlossen ist. Tobifragt schreibt ja schon in der Aufgabenstellung, dass seine Daten nicht normal verteilt sind. Und wenn er von Boxplots spricht, dann dürfte die eine Achse diskret verteilt sein und damit dann von vorneherein nicht normal.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte