Seite 1 von 1

Frage zu model selection durchführung

Verfasst: Fr Apr 02, 2021 11:47 am
von Geierhorst103
Hallo Miteinander,

ich muss eine model selection mit R machen, um heraus zu finden, welche Faktoren die Gesamtabundanz (Abhängige Variable) bestimmen.
Meine Daten sehen folgendermaßen aus:

Code: Alles auswählen

data.frame':	19 obs. of  5 variables:
 $ Gesamtabundanz: num  691 81 1765 4172 2457 ...
 $ Substratdiv   : Factor w/ 5 levels "","Drei","Eins",..: 3 3 2 5 5 4 2 3 2 4 ...
 $ domSubstrat   : Factor w/ 6 levels "","Faustgroß",..: 2 2 5 4 6 6 5 3 2 4 ...
 $ FG            : num  0.383 1 1 0.202 0.351 ...
 $ Tiefe         : num  0.133 0.356 0.222 0.267 0.378 ...
>
Mein Problem ist, dass ich ja auch zwei Variablen als Faktoren habe, und nicht nur numerische Werte.
Wie kann ich damit eine model selection machen? Kann ich da lineare modelle mit machen (lm)? Oder muss ich die glm funktion benutzen?
Ist es egal, ob ich Faktoren benutze und nicht nur numerische Werte?

Könnt ihr mir irgendwie helfen?? Ich kenne mich so gut wie gar nicht mit Statistik aus und brauche das für meine Masterarbeit.. :?:

Viele Grüße
Geierhorst

Re: Frage zu model selection durchführung

Verfasst: Fr Apr 02, 2021 2:18 pm
von schubbiaschwilli
Gude!
Mein Problem ist, dass ich ja auch zwei Variablen als Faktoren habe, und nicht nur numerische Werte.
Wie kann ich damit eine model selection machen? Kann ich da lineare modelle mit machen (lm)? Oder muss ich die glm funktion benutzen?
Ist es egal, ob ich Faktoren benutze und nicht nur numerische Werte?
Prinzipiell sollte R mit den Daten klarkommen - Ich tippe, es werden keine Dummy-Variablen erzeugt. Und ob ein lineares Modell sinnvoll ist oder nicht - Tja, ohne Daten(analyse) bzw. ausprobieren wird dir das niemand sagen können. Gibt es denn sowas wie einen linearen Zusammenhang (oder zumindest Näherungsweise) der Prädiktoren mit der Gesamtabundanz?

Dank&Gruß
Schubbiaschwilli

Re: Frage zu model selection durchführung

Verfasst: Fr Apr 02, 2021 2:32 pm
von EDi
(1) Wie kann ich damit eine model selection machen? (2)Kann ich da lineare modelle mit machen (lm)? (3) Oder muss ich die glm funktion benutzen?
(4) Ist es egal, ob ich Faktoren benutze und nicht nur numerische Werte?
(1) Wieso nicht? Manuell oder automatisch oder meiner Meinung nach am Besten gar nicht (man kann ja auch die Modelparameter interpretieren. Weil die selektion hat ja auch eine Fehlerrate....).
(2) Wieso nicht?
(3) Falsche Frage. Wenn die Modellannahmen von lm nicht passen (Normalverteilt & gleiche Streuung) dann wäre ein glm eine Option (Abundanzen zeigen ja oft eine größere Varianz bei größeren Mittelwert, auch sind die diskret Verteilt. Man kann aber auch die Streuung separat modellieren, anstatt als gleich anzunehmen).
(4) Für mich macht das keinen praktischen Unterschied.