Seite 1 von 1

Auswahl der Referenzkategorie bei Dummyvariable

Verfasst: Fr Apr 09, 2021 1:31 pm
von Julia.95
Hallo liebes R-Netzwerk,

ich würde gerne mal eure Schwarm-Intelligenz zum Thema Statistik und Multiple Regressionsmodellen mit einer mehrfach kategorialen erklärenden Variable nutzen.
Mich würde da interessieren, wie ich begründet meine Referenzkategorie dieser Dummyvariable bestimme. Wie ich es in R ändere, weiß ich und dass man es inhaltlich begründen soll, ist mir auch bekannt. Aber was genau ist mit inhaltlich begründen gemeint und auf welche Punkte sollte man in der Entscheidung konkret achten? Fragen, wie z.B. nehme ich die Kategorie mit der meisten Häufigkeit oder die Kategorie, die am meisten Signifikanzen aufweist etc., schwirren mir durch den Kopf. Oder gibt es sogar eine Möglichkeit in R, sich die "beste" Referenzkategorie auf Basis von einem Datensatz z.B. ausrechnen zu lassen?

Vielen Dank schonmal für eure Hilfe & noch einen erfolgreichen Tag allen,
liebe Grüße
Julia

Re: Auswahl der Referenzkategorie bei Dummyvariable

Verfasst: Fr Apr 09, 2021 2:18 pm
von bigben
Julia.95 hat geschrieben: Fr Apr 09, 2021 1:31 pmWie ich es in R ändere, weiß ich und dass man es inhaltlich begründen soll, ist mir auch bekannt. Aber was genau ist mit inhaltlich begründen gemeint und auf welche Punkte sollte man in der Entscheidung konkret achten?
Hallo Julia,

es geht um die Frage, ob inhaltlich für Deine Studie eine Kategorie eine natürliche Referenzkategorie darstellt, zu der bei den anderen Kategorien etwas hinzugefügt oder weggenommen wird. Inhalte Deiner jeweiligen Studie sind entscheidend und gerade eben nicht technisch-statistische Der Art "häufigste" oder "beste". Dem Rechenalgorithmus ist das mal völlig egal, welche Kategorie baseline ist. Dich interessiert aber vielleicht die Signifikanz der Abgrenzung von irgendeiner Kategorie (z. B: der Kategorie "Kontrollgruppe") besonders.

LG,
Bernhard

Re: Auswahl der Referenzkategorie bei Dummyvariable

Verfasst: Fr Apr 09, 2021 10:59 pm
von EDi
Ich verstehe die Frage nicht...

Das Model ist doch das gleiche...


Man könnte die Referenz/Intercept auch ganz weglassen und die Ergebnisse wären gleich (bei nur categorischen Variablen). Das nutze ich häufig, weil man direkt die Gruppenmittel aus dem Model bekommt...