HAllo zusammen,
ich würde gerne Stammdaten eines ERP System auf zusammenhänge untersuchen, jetzt ist es so das eine vielzahl von Spalten vorhanden sind. Daher ist es kaum möglich anhand eines Plotes dies zu untersuchen. Gibt es eine möglichkeit eine Top 10 liste (Korrelation) zu erzeugen?
Schöne Grüße
Korrelation von vielen Spalten
Re: Korrelation von vielen Spalten
Hallo User,
zumindest funktioniert
Gruß, Jörg
zumindest funktioniert
Code: Alles auswählen
str(iris)
cor(iris[, 1:4]) ## bzw. cor(iris[, -5])
Re: Korrelation von vielen Spalten
Hallo Jörg,
danke.
Habe mal einen Beispieldatensatz mit einem wesentlichen außreiser aufgebaut.
Wenn ich das rein rechnerisch ansehe (Pearson), würde ich mir den Datensatz nicht genauer ansehen. Überprüfe ich den Datensatz grafisch, sieht das ganz anders aus. Hat jemand eine idee, wie solche sachverhalte mit vielen spalten ausfindig machen kann?
Schöne Grüße
danke.
Habe mal einen Beispieldatensatz mit einem wesentlichen außreiser aufgebaut.
Wenn ich das rein rechnerisch ansehe (Pearson), würde ich mir den Datensatz nicht genauer ansehen. Überprüfe ich den Datensatz grafisch, sieht das ganz anders aus. Hat jemand eine idee, wie solche sachverhalte mit vielen spalten ausfindig machen kann?
Schöne Grüße
Re: Korrelation von vielen Spalten
Hallo User,
wenn ich ERP-System und QM-Meldungen lese, werde ich besonders aufmerksam (... und denke an SAP und insbesondere an das QM-Modul). Möchtest Du QM-Meldungen für ein bestimmtes Material oder Lieferanten über R auswerten? Hört sich interessant an...!
Oder darf ich Dich als neuen Interessenten für mein Calidris-Projekt gewinnen? Calidris ist eine R-Excel-Integration, allerdings noch in der PoC-Phase.
wenn ich ERP-System und QM-Meldungen lese, werde ich besonders aufmerksam (... und denke an SAP und insbesondere an das QM-Modul). Möchtest Du QM-Meldungen für ein bestimmtes Material oder Lieferanten über R auswerten? Hört sich interessant an...!
Oder darf ich Dich als neuen Interessenten für mein Calidris-Projekt gewinnen? Calidris ist eine R-Excel-Integration, allerdings noch in der PoC-Phase.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Re: Korrelation von vielen Spalten
Heißt im Klartext, dass Du Dir nur hoch korrelierende Paare anschauen willst?
Code: Alles auswählen
Überprüfe ich den Datensatz grafisch, sieht das ganz anders aus.
Code: Alles auswählen
Hat jemand eine idee, wie solche sachverhalte mit vielen spalten ausfindig machen kann?
Vielleicht würde Dir eine einfache Spearman-Korrelation anstelle der Pearson Korrelation schon helfen? Was sagt denn die Spearman-Korrelation in Deinem Beispiel?
Wenn das als Hinweis nicht reicht braucht es vielleicht eine scharfe Definition von "solche sachverhalte". Robuste Regression könnte das Problem vielleicht abmildern, oder man könnte die kleinste Korrelation, die nach Weglassen eines Punktes auftritt untersuchen oder so. Hängt aber von der genauen Problemdefinition ab.
Suchbegriffe zum Nachlesen wären leverage, influential observation oder auch robust regression.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Korrelation von vielen Spalten
Super danke für die Rückmeldung.
das mit dem Calidris Projekt hört sich gut an.
Kostet dies etwas?
Ich habe das gleich mal mit dem Spearman ausprobiert, sieht um einiges besser aus. Hat jemad beispiels in R für
das mit dem Calidris Projekt hört sich gut an.
Kostet dies etwas?
Ich habe das gleich mal mit dem Spearman ausprobiert, sieht um einiges besser aus. Hat jemad beispiels in R für
GrüßeRobuste Regression könnte das Problem vielleicht abmildern, oder man könnte die kleinste Korrelation, die nach Weglassen eines Punktes auftritt untersuchen oder so. Hängt aber von der genauen Problemdefinition ab.
Suchbegriffe zum Nachlesen wären leverage, influential observation oder auch robust regression.
Re: Korrelation von vielen Spalten
Hallo User,
kostet nichts! Wir sind noch in der Proof-of-Concept-Phase und in sehr kurzen Abständen ist mit neun Versionen zu rechnen. Ich denke (natürlich), dass sich ein Ausprobieren lohnt.
Wenn Du Dich dann als Newsletter-Empfänger registrieren lässt, wirst Du über jede neue Version informiert.
kostet nichts! Wir sind noch in der Proof-of-Concept-Phase und in sehr kurzen Abständen ist mit neun Versionen zu rechnen. Ich denke (natürlich), dass sich ein Ausprobieren lohnt.
Wenn Du Dich dann als Newsletter-Empfänger registrieren lässt, wirst Du über jede neue Version informiert.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube
Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)