wbart hat geschrieben: ↑Di Aug 07, 2018 4:43 pmist denn ein Modell ohne Einbeziehung der Substanzen denkbar?
Da ich keine Ahnung habe, welche Rolle die Substanzen in dem Spiel spielen, habe ich damit keine Probleme. Wenn das sachwissenschaftlich nicht denkbar ist, dann solltest Du das bei Gelegenheit erwähnen.
ich habe folgende Daten
Klingt nach nur einem Datensatz.
Das wäre ja im Prinzip nur ein Datensatz.
Klingt so, als wärest Du mit nur einem Datensatz nicht zufrieden. Um es mit Jörg zu sagen: "Meine Glaskugel ist gerade kaputt".
Wenn das geht könnte man evtl. für jede Substanz ein Modell erstellen und dann die unterschiedlichen Modelle vergleichen.
Dass Du unterschiedliche Modelle erstellen willst und diese nachher miteinander vergleichen willst, das war bisher nicht klar. Es gibt Modelle, die können gut mit kleinen Datenmengen umgehen und Modelle, die brauchen große Datenmengen, es gibt Modelle, die mit NA besser und solche, die mit NA schlechter umgehen können. Es gibt Modelle, die sich für Modellvergleiche mehr eignen und solche, die es weniger tun und es gibt Modelle, in die man Vorwissen über mögliche Zusammenhänge besser einfließen lassen kann und solche, bei denen man das weniger kann. Und dann gibt es Modelle, die für Signifikanztestungen besser geeignet sind als andere.
Dein Modell werd ich gleich mal kopieren und schauen was es macht. Danke dafür.
Was ich vorgeschlagen habe ist ein Regressionsbaum. Das ist ein Verfahren, dass wenig Kenntnisse über die Zusammenhänge erfordert, aber dennoch schon mit mittelkleinen Datenmengen auskommt. Es ist auch ein Verfahren, dass mit NA ganz gut umgehen kann. Es ist kein Verfahren, dass besonders stabil ist: Einige wenige Datensätze mehr oder weniger können den Baum ganz anders aussehen lassen und es ist auch kein Verfahren, dass sich besonders zum Vergleich verschiedener Modelle anbietet. Es ist aber ein Verfahren, bei dem man ganz gut auch die Substanz als Prädiktor mit einfließen lassen kann. Kurzum, ein guter Allrounder, wenn man noch keine weiteren Informationen hat.
Im Statistik-Forum habe ich mal folgenden Beitrag geschrieben: Ich schlage vor, dass Du Dir den durchliest und danach Dein Problem nochmal genauer spezifizierst:
http://www.statistik-forum.de/nutzung-d ... t6682.html
Es sei am Rande erwähnt, dass eine verantwortliche Modellauswahl nicht "mal eben so" aus dem Ärmel geschüttel werden kann. Wenn das also nur so eine Spielerei am Rande ist, dann ist alles ok. Wenn es bei diesem Modell um etwas wichtiges geht, dann zitiere ich mich mal selbst aus einem Thread in den FAQ:
Bedenke auch: Ein Forum hilft oft super, wenn es darum geht, die richtige Funktion, das richtige Funktionsargument oder einen Syntaxfehler zu finden. Die Planung einer Arbeit, die Gesamtheit der Auswertung und alle großen Projekte sind für dieses Format wenig geeignet. In manchen Fällen ist der richtige Weg der zur Statistikberatung, auch wenn das manchmal Geld kostet.
LG,
Bernhard