Re: Datensätze mit R auswählen ?
Verfasst: Mi Mär 27, 2019 8:47 am
Hallo grafZahl,
das ist hier ein Statistikforum und ich schaue darauf mit den Augen eines Menschen, der sehr viel auf Statistik-forum.de unterwegs ist. Dort und auch in der Arbeit mit Studienrenden hier an der Uni, sehe ich immer wieder, dass Leute versuchen, statistische Probleme mit Excel anzugehen. Dabei treten sie in tausend Fallen, wo man vorher keine Fallen erwarten durfte. Da werden aus Zahlen Datumsangaben, da werden fehlende Werte beim Aufaddieren nicht berücksichtigt, da gibt es Verteilungsfunktionen, die komische Werte ausgeben, da hat die Boxplot-Funktion keine Erkennung für Ausreißer, die aber in einem Boxplot markiert gehören, da werden Leute verlockt, Balkengrafiken zu machen wo Histogramme hin gehören, da kann man lineare Regressionen machen, aber die Zahl der Prädiktoren ist stark begrenzt, da kann man tolle Eingabeforms für Tabellen machen, solange die Tabelle nicht mehr als soundsoviele Spalten hat etcpp.
Das ist jetzt auch nicht meine persönliche Marotte, da gibt es peer reviewed Veröffentlichungen drüber, beispielsweise hier: https://bmcbioinformatics.biomedcentral ... -2105-5-80 oder hier: http://citeseerx.ist.psu.edu/mwg-intern ... WskJ6M,&dl Einfach mal kurz überfliegen, dann verstehst Du meine Ablehnung.
Aus der Statistik-Perspektive ist Excel ultimatively not fit for real work!
Dein Problem ist kein Statistikproblem und ich kann nicht ausschließen, dass Excel für andere Rechenaufgaben besser geeignet ist. Da fehlen mir Kentnisse und Erfahrung. Hoffentlich ist Dir aufgefallen, dass ich Dich auf ein drittes Programm hingewiesen habe, nicht auf meinen Liebling R.
lp_solve bezeichnet sich selbst als "Mixed Integer Linear Programming (MILP) solver". Der Kernpunkt ist das "Integer". Mit ganzzahligen Integers lassen sich nämlich Kombinationsfragen, wie Du sie hast, abbilden.
Habe ich ein Ergebnis? Nein. Tut mir Leid, dass Du nicht gleich ein Ergebnis erhälst, wenn Du Dich mit einer Optimierungsfragestellung an ein Statistikforum wendest. Natürlich kann ich in einem Uhrmacherforum fragen, warum mein Motor nicht läuft. Beide benutzen schließlich Zahnräder. Ich darf dann nur keine eins-zu-eins-Anleitung aus dem Effeff erwarten. Ich kann halt selbst kein lp_solve, weil ich die sehr wenigen Optimierungsaufgaben, die ich bisher hatte, entweder mit R Bordmitteln oder brute force per vollständigem Ausprobieren lösen konnte. Beides passt nicht zu Deiner Aufgabe.
Ob Du bereit bist, lp_solve eine Chance zu geben, musst Du selbst sehen. Schau Dir die beiden Links in diesem Post an und dann Deine eigenen Erfahrungen und Excel und bilde Dir Deine eigene Meinung. Würde mich nicht wundern, wenn Du lp_solve aus Excel heraus benutzen könntest, aber das musst Du schon selbst schauen.
LG,
Bernhard
das ist hier ein Statistikforum und ich schaue darauf mit den Augen eines Menschen, der sehr viel auf Statistik-forum.de unterwegs ist. Dort und auch in der Arbeit mit Studienrenden hier an der Uni, sehe ich immer wieder, dass Leute versuchen, statistische Probleme mit Excel anzugehen. Dabei treten sie in tausend Fallen, wo man vorher keine Fallen erwarten durfte. Da werden aus Zahlen Datumsangaben, da werden fehlende Werte beim Aufaddieren nicht berücksichtigt, da gibt es Verteilungsfunktionen, die komische Werte ausgeben, da hat die Boxplot-Funktion keine Erkennung für Ausreißer, die aber in einem Boxplot markiert gehören, da werden Leute verlockt, Balkengrafiken zu machen wo Histogramme hin gehören, da kann man lineare Regressionen machen, aber die Zahl der Prädiktoren ist stark begrenzt, da kann man tolle Eingabeforms für Tabellen machen, solange die Tabelle nicht mehr als soundsoviele Spalten hat etcpp.
Das ist jetzt auch nicht meine persönliche Marotte, da gibt es peer reviewed Veröffentlichungen drüber, beispielsweise hier: https://bmcbioinformatics.biomedcentral ... -2105-5-80 oder hier: http://citeseerx.ist.psu.edu/mwg-intern ... WskJ6M,&dl Einfach mal kurz überfliegen, dann verstehst Du meine Ablehnung.
Aus der Statistik-Perspektive ist Excel ultimatively not fit for real work!
Dein Problem ist kein Statistikproblem und ich kann nicht ausschließen, dass Excel für andere Rechenaufgaben besser geeignet ist. Da fehlen mir Kentnisse und Erfahrung. Hoffentlich ist Dir aufgefallen, dass ich Dich auf ein drittes Programm hingewiesen habe, nicht auf meinen Liebling R.
lp_solve bezeichnet sich selbst als "Mixed Integer Linear Programming (MILP) solver". Der Kernpunkt ist das "Integer". Mit ganzzahligen Integers lassen sich nämlich Kombinationsfragen, wie Du sie hast, abbilden.
Habe ich ein Ergebnis? Nein. Tut mir Leid, dass Du nicht gleich ein Ergebnis erhälst, wenn Du Dich mit einer Optimierungsfragestellung an ein Statistikforum wendest. Natürlich kann ich in einem Uhrmacherforum fragen, warum mein Motor nicht läuft. Beide benutzen schließlich Zahnräder. Ich darf dann nur keine eins-zu-eins-Anleitung aus dem Effeff erwarten. Ich kann halt selbst kein lp_solve, weil ich die sehr wenigen Optimierungsaufgaben, die ich bisher hatte, entweder mit R Bordmitteln oder brute force per vollständigem Ausprobieren lösen konnte. Beides passt nicht zu Deiner Aufgabe.
Ob Du bereit bist, lp_solve eine Chance zu geben, musst Du selbst sehen. Schau Dir die beiden Links in diesem Post an und dann Deine eigenen Erfahrungen und Excel und bilde Dir Deine eigene Meinung. Würde mich nicht wundern, wenn Du lp_solve aus Excel heraus benutzen könntest, aber das musst Du schon selbst schauen.
LG,
Bernhard