Seite 1 von 1

Variablenauswahl mit Caret

Verfasst: Do Apr 27, 2017 10:00 am
von diejulla
Hallo,
ich beschäftige mich gerade mit der Variablenauswahl mit dem Package "Caret". Ich kenne bisher die manuelle Vorwärtsselektion und Rückwärtseliminierung und habe da auch grundsätzlich das Prinzip verstanden. Zum Caret-Package finde ich nun ganz wenig Literatur und für die, die ich finde (auch die R Hilfe), habe ich zu wenig Grundwissen, um sie zu verstehen. Ich möchte aber nicht nur Skripte abarbeiten, sondern auch wissen, was der Unterschied ist und was dahinter steckt.

Was ich gefunden habe, ist ein Beispiel-Skript mit 2 Arbeitsweisen. Zum einen kann man die Variable mit der höchsten Korrelation finden (um sie dann, warum auch immer :? , auszuschließen). Dazu werden die Funktionen cor bzw. findcorrelation benutzt. Mit print wird mir dann im Beispiel-Datensatz [1] 8 ausgespuckt. Aber was heißt das für mich?


Dann kann man mit dem Befehl traincontrol ein Training Scheme vorbereiten.Was heißt das? Also was macht dieser Befehl mit meinen Daten?

Ich würde mich sehr freuen, wenn ihr mir hier ein bisschen Licht ins Dunkel bringen könntet, da ich definitiv zu den Ökologen zähle, die eher für die Datenerhebung leben und für die die statistische Auswertung ein (großes) notwendiges Übel ist :(

Viele Grüße!

Julla

Ps: Wenn ihr bzgl. der Variablenauswahl (verständliche!!!) Literaturtipps hättet, würde ich mich auch darüber sehr freuen!
diejulla

Re: Variablenauswahl mit Caret

Verfasst: Fr Apr 28, 2017 1:15 pm
von EDi
Bzgl. Literatur: Zum caret package gibt es eines ganzes Buch :?

Re: Variablenauswahl mit Caret

Verfasst: Fr Apr 28, 2017 8:52 pm
von EDi
Das paper hat mir auch sehr gefallen.