Multiple lineare Regression mit dummy Variable

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
Ninaxx
Beiträge: 5
Registriert: Do Sep 13, 2018 11:05 pm

Multiple lineare Regression mit dummy Variable

Beitrag von Ninaxx » Fr Okt 12, 2018 8:25 pm

Hallo zusammen,

ich analysiere einen Datensatz im Zuge einer Hausarbeit.

Kurz zu den Variablen:

AV=pro Kopf Konsum
UV=preis und warnhinweis (nominal)

Für die nominale Variable möchte ich eine dummy-Variable hinterlegen. Wenn ich allerdings statt (0/1) ja und nein für die Werte hinterlege, erhalte ich komplett unterschiedliche Werte.

Wenn ich die lineare Regression robust mit lms durchführe, weichen meine Werte bei ja und nein geringer zur Regression mit kqm ab. Ausreißer nach Hampel bestehen nicht.

Darf ich also auch ja und nein verwenden?

Danke und Grüße,
Nina

consuli
Beiträge: 354
Registriert: Mo Okt 10, 2016 8:18 pm

Re: Multiple lineare Regression mit dummy Variable

Beitrag von consuli » Sa Okt 13, 2018 2:35 pm

Du hast geschrieben:
Ninaxx hat geschrieben:
Fr Okt 12, 2018 8:25 pm
UV=preis und warnhinweis (nominal)
meinst in Wirklichkeit aber:

UVs:
  • preis (interval)
  • warnhinweis (nominal)
:?:

Consuli
Thanks to Steven for bringing up the best explanation for the existence and the origin of the universe, though. Especially for been a lighthouse of will-power still shining on, not only for disabled people, but any (beautiful minded) person.

Athomas
Beiträge: 78
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Multiple lineare Regression mit dummy Variable

Beitrag von Athomas » Sa Okt 13, 2018 2:57 pm

Ich habe gesehen, dass Du bereits seit einem Monat hier dabei bist - und damit unsere Wünsche in Bezug auf die Ausgestaltung einer Frage kennen solltest! Falls Du bisher noch keine Zeit hattest, schau Dir bitte mal den Beitrag des Kollegen EDi zu diesem Thema an : viewtopic.php?f=20&t=11

Du hast natürlich (eigentlich) Recht, dass die Darstellung der nominalen Variable keinem Einfluss auf die Ergebnisse haben darf!
"Eigentlich" deshalb, weil man R auch klarmachen muss, dass es sich um eine nominale Variable handelt - bei ja/nein nimmt es das automatisch an, bei 1/0 muss man das explizit zum Ausdruck bringen.

Sonst sieht R nur numerische Werte, benutzt dann seinen "gesunden Menschenverstand" :) und interpretiert das Ganze als eine numerische Variable! Wenn Du partout so codieren willst, musst Du die entstandene Variable zum "Faktor" machen.
Glaube nicht alles, was im Internet geschrieben wird - bloss weil da ein Name und ein Zitat stehen! (Immanuel Kant)

jogo
Beiträge: 933
Registriert: Fr Okt 07, 2016 8:25 am

Re: Multiple lineare Regression mit dummy Variable

Beitrag von jogo » Sa Okt 13, 2018 8:22 pm

Hallo Nina,

willkommen im Forum!
Eine Regression mit einer kategorialen Variablen (oder auch anders genannt nominal skalierten Variablen) ist eigentlich keine Regression. :shock:
Es ist bezüglich der kategorialen Variablen eine Varianzanalyse. :!:
Zum Glück sind beide statistische Verfahren lineare Modelle, weshalb die Funktion lm() mit diesen verschiedenen Typen von unabhängigen Variablen sehr gut zurecht kommt.
Trotzdem macht es einen Unterschied, ob eine Variable kategorial ist (in R genannt Faktor) oder ob sie intervall- oder ratioskaliert ist.
Die Gefahr der Verwechslung ist immer dann gegeben, wenn man händisch versucht, Faktoren in numeric umzukodieren oder eine numerische Kodierung unbedarft hernimmt, obwohl es sich um einen Faktor handelt.
Bitte zeige uns doch das Ergebnis von

Code: Alles auswählen

str(DeinDataframe)
und die Funktionsaufrufe von lm(), damit wir den Sachverhalt konkret besprechen können.

Gruß, Jörg

Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 0 Gäste