Kategorie von Variable wird durch intercept ersetzt?

Varianzanalyse, Diskriminanzanalyse, Kontingenzanalyse, Faktorenanalyse, Clusteranalyse, MDS, ....

Moderator: EDi

Antworten
phil.sti
Beiträge: 1
Registriert: Mo Aug 06, 2018 5:46 pm

Kategorie von Variable wird durch intercept ersetzt?

Beitrag von phil.sti »

Hey zusammen, folgendes Thema hat mich zu euch hier auf das Forum geführt:

Und zwar geht es darum, dass ich eine lineare Regression durchgeführt habe. Im folgenden seht ihr die Ergebnisse der 1. linearen Regression für die unabhnägige Variable "gtrendsregion". Die Variable hat die Ausprägungen "America", "Asia", "Australia" etc.
r2.png

In der Summary werden alle im Datensatz vorhandene Kategorien ("America", "Asia", etc.) berücksichtigt, bis auf die Kategorie "Africa", welche zwar im Datensatz vorhanden ist, aber hier nicht mit angezeigt wird. Das wäre schon einmal meine erste Frage, warum wird "Africa" nicht mit in der Summary berücksichtigt? Das andere Thema ist, dass ich dann eine weitere lineare Regression durchgeführt habe (Summary auf 2. Bild) und bewusst die Konstante (Intercept) nicht berechnet habe. Dabei kam dann raus, dass "Africa" nun in der Summary berücksichtigt wird und interessanterweise genau den gleichen Wert wie die Konstante (Intercept) vom 1. Bild hat.

r1.png

Kann mir nun jemand sagen warum eine Kategorie einer Variable weggelassen wird und warum die Variable bei der Berechnung ohne Konstante (Intercept) genau den gleichen Wert hatte wie die Konstante (Intercept) in der 1. Berechnung?

Ich hoffe ich konnte das Problem einigermaßen beschreiben.

Danke schonmal für die Hilfe! :)

LG Phil

Athomas
Beiträge: 388
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Kategorie von Variable wird durch intercept ersetzt?

Beitrag von Athomas »

Ich hab kein Bock bei dem Wetter, daher ganz kurz: das ist o.k. so!
Um die Darstellung eindeutig zu machen, pickt sich lm für jeden Faktor eine Referenzkategorie heraus und setzt den zugehörigen Parameter auf 0.
In Deinem Fall ist das die erste Faktorstufe, und da Du nichts anderes festgelegt hast, der "kleinste" Wert in der lexikografischen Ordnung, halt "Africa"!

Benutzeravatar
EDi
Beiträge: 1063
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Kategorie von Variable wird durch intercept ersetzt?

Beitrag von EDi »

B8e auch, dass sich bei der anderen Parametrisierung des Model andere koeffizienten ergeben. Trotzdem ist es das gleiche model nur halt anders dargestellt.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.

bigben
Beiträge: 1432
Registriert: Mi Okt 12, 2016 9:09 am

Re: Kategorie von Variable wird durch intercept ersetzt?

Beitrag von bigben »

phil.sti hat geschrieben:
Mo Aug 06, 2018 6:08 pm
Kann mir nun jemand sagen warum eine Kategorie einer Variable weggelassen wird und warum die Variable bei der Berechnung ohne Konstante (Intercept) genau den gleichen Wert hatte wie die Konstante (Intercept) in der 1. Berechnung?
In jedem Fall gilt: "Wenn es keine der anderen Regionen ist, dann ist es Afrika."
Im erstgenannten Modell gilt: Wenn alle anderen Terme 0 sind, dann bleibt der y-Achsenabschnitt (Intercept). Im zweiten Modell gibt es keinen Intercept, dann kann man den Wert auch "Afrika" nennen. Bleibt inhaltlich das Gleiche.

Siehe auch: https://de.wikipedia.org/wiki/Dummy-Var ... ykodierung

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte

Antworten