Hey zusammen, folgendes Thema hat mich zu euch hier auf das Forum geführt:
Und zwar geht es darum, dass ich eine lineare Regression durchgeführt habe. Im folgenden seht ihr die Ergebnisse der 1. linearen Regression für die unabhnägige Variable "gtrendsregion". Die Variable hat die Ausprägungen "America", "Asia", "Australia" etc.
In der Summary werden alle im Datensatz vorhandene Kategorien ("America", "Asia", etc.) berücksichtigt, bis auf die Kategorie "Africa", welche zwar im Datensatz vorhanden ist, aber hier nicht mit angezeigt wird. Das wäre schon einmal meine erste Frage, warum wird "Africa" nicht mit in der Summary berücksichtigt? Das andere Thema ist, dass ich dann eine weitere lineare Regression durchgeführt habe (Summary auf 2. Bild) und bewusst die Konstante (Intercept) nicht berechnet habe. Dabei kam dann raus, dass "Africa" nun in der Summary berücksichtigt wird und interessanterweise genau den gleichen Wert wie die Konstante (Intercept) vom 1. Bild hat.
Kann mir nun jemand sagen warum eine Kategorie einer Variable weggelassen wird und warum die Variable bei der Berechnung ohne Konstante (Intercept) genau den gleichen Wert hatte wie die Konstante (Intercept) in der 1. Berechnung?
Ich hoffe ich konnte das Problem einigermaßen beschreiben.
Danke schonmal für die Hilfe!
LG Phil
Kategorie von Variable wird durch intercept ersetzt?
Moderator: EDi
Re: Kategorie von Variable wird durch intercept ersetzt?
Ich hab kein Bock bei dem Wetter, daher ganz kurz: das ist o.k. so!
Um die Darstellung eindeutig zu machen, pickt sich lm für jeden Faktor eine Referenzkategorie heraus und setzt den zugehörigen Parameter auf 0.
In Deinem Fall ist das die erste Faktorstufe, und da Du nichts anderes festgelegt hast, der "kleinste" Wert in der lexikografischen Ordnung, halt "Africa"!
Um die Darstellung eindeutig zu machen, pickt sich lm für jeden Faktor eine Referenzkategorie heraus und setzt den zugehörigen Parameter auf 0.
In Deinem Fall ist das die erste Faktorstufe, und da Du nichts anderes festgelegt hast, der "kleinste" Wert in der lexikografischen Ordnung, halt "Africa"!
Re: Kategorie von Variable wird durch intercept ersetzt?
B8e auch, dass sich bei der anderen Parametrisierung des Model andere koeffizienten ergeben. Trotzdem ist es das gleiche model nur halt anders dargestellt.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Kategorie von Variable wird durch intercept ersetzt?
In jedem Fall gilt: "Wenn es keine der anderen Regionen ist, dann ist es Afrika."
Im erstgenannten Modell gilt: Wenn alle anderen Terme 0 sind, dann bleibt der y-Achsenabschnitt (Intercept). Im zweiten Modell gibt es keinen Intercept, dann kann man den Wert auch "Afrika" nennen. Bleibt inhaltlich das Gleiche.
Siehe auch: https://de.wikipedia.org/wiki/Dummy-Var ... ykodierung
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte