Seite 1 von 1

Kategorie von Variable wird durch intercept ersetzt?

Verfasst: Mo Aug 06, 2018 6:08 pm
von phil.sti
Hey zusammen, folgendes Thema hat mich zu euch hier auf das Forum geführt:

Und zwar geht es darum, dass ich eine lineare Regression durchgeführt habe. Im folgenden seht ihr die Ergebnisse der 1. linearen Regression für die unabhnägige Variable "gtrendsregion". Die Variable hat die Ausprägungen "America", "Asia", "Australia" etc.
r2.png

In der Summary werden alle im Datensatz vorhandene Kategorien ("America", "Asia", etc.) berücksichtigt, bis auf die Kategorie "Africa", welche zwar im Datensatz vorhanden ist, aber hier nicht mit angezeigt wird. Das wäre schon einmal meine erste Frage, warum wird "Africa" nicht mit in der Summary berücksichtigt? Das andere Thema ist, dass ich dann eine weitere lineare Regression durchgeführt habe (Summary auf 2. Bild) und bewusst die Konstante (Intercept) nicht berechnet habe. Dabei kam dann raus, dass "Africa" nun in der Summary berücksichtigt wird und interessanterweise genau den gleichen Wert wie die Konstante (Intercept) vom 1. Bild hat.

r1.png

Kann mir nun jemand sagen warum eine Kategorie einer Variable weggelassen wird und warum die Variable bei der Berechnung ohne Konstante (Intercept) genau den gleichen Wert hatte wie die Konstante (Intercept) in der 1. Berechnung?

Ich hoffe ich konnte das Problem einigermaßen beschreiben.

Danke schonmal für die Hilfe! :)

LG Phil

Re: Kategorie von Variable wird durch intercept ersetzt?

Verfasst: Mo Aug 06, 2018 6:58 pm
von Athomas
Ich hab kein Bock bei dem Wetter, daher ganz kurz: das ist o.k. so!
Um die Darstellung eindeutig zu machen, pickt sich lm für jeden Faktor eine Referenzkategorie heraus und setzt den zugehörigen Parameter auf 0.
In Deinem Fall ist das die erste Faktorstufe, und da Du nichts anderes festgelegt hast, der "kleinste" Wert in der lexikografischen Ordnung, halt "Africa"!

Re: Kategorie von Variable wird durch intercept ersetzt?

Verfasst: Mo Aug 06, 2018 11:41 pm
von EDi
B8e auch, dass sich bei der anderen Parametrisierung des Model andere koeffizienten ergeben. Trotzdem ist es das gleiche model nur halt anders dargestellt.

Re: Kategorie von Variable wird durch intercept ersetzt?

Verfasst: Di Aug 07, 2018 12:15 pm
von bigben
phil.sti hat geschrieben: Mo Aug 06, 2018 6:08 pmKann mir nun jemand sagen warum eine Kategorie einer Variable weggelassen wird und warum die Variable bei der Berechnung ohne Konstante (Intercept) genau den gleichen Wert hatte wie die Konstante (Intercept) in der 1. Berechnung?
In jedem Fall gilt: "Wenn es keine der anderen Regionen ist, dann ist es Afrika."
Im erstgenannten Modell gilt: Wenn alle anderen Terme 0 sind, dann bleibt der y-Achsenabschnitt (Intercept). Im zweiten Modell gibt es keinen Intercept, dann kann man den Wert auch "Afrika" nennen. Bleibt inhaltlich das Gleiche.

Siehe auch: https://de.wikipedia.org/wiki/Dummy-Var ... ykodierung

LG,
Bernhard