Seite 1 von 3
nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 2:53 pm
von Luisa93
Hallo zusammen,
ich habe leider noch nicht wirklich viel mit R gearbeitet und möchte eine multiple Regressionsanalyse durchführen. Für Excel ist der Umfang leider zu groß. Mein Problem ist nun, dass ich nominale Merkmalsausprägungen habe, die ich zunächst in Dummy-Variablen umwandeln möchte. Die Daten habe ich von Excel in R Studio reingezogen. Nun weiß ich allerdings nicht wie ich die nominalen Variablen in Dummy-Variablen umwandeln kann. Kann mir da jemand helfen?
Vielen Dank im Voraus!
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 2:59 pm
von jogo
Hallo Luisa,
willkommen im Forum!
Normalerweise ist die Umwandlung nicht nötig. Wenn Deine nominale Variable als factor in R gespeichert ist, werden bei den üblichen Modellierungen die entsprechenden Dummyvariablen intern erzeugt.
Was für ein statistisches Verfahren verwendest Du? Zeig uns bitte den Code.
Sollte man wirklich die Dummyvariablen benötigen, gibt es die Funktion model.matrix()
Gruß, Jörg
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 3:11 pm
von Luisa93
Danke für die schnelle Antwort.
Wie gesagt ich habe mit R noch überhaupt nicht gearbeitet. Ich habe im Moment nur die Excel-Tabelle in R reingezogen.
Meine erklärende Variable ist metrisch skaliert (Preis) und meine zu erklärenden Variablen sind nominal skaliert. Ich vermute auch, dass ich R auch irgendwie sagen muss, welches meine erklärenden und zu erklärenden Variablen sind, die er in die Regressionsanalyse packen soll. Aber ich habe dazu wirklich überhaupt keine Kenntnisse. Deswegen weiß ich schon gar nicht welche Code Sie meinen?
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 3:22 pm
von bigben
Hallo Luisa,
hier im Forum sagen wir "Du" zueinander.
Aber ich habe dazu wirklich überhaupt keine Kenntnisse.
Hier müssen wir unterscheiden: Meinst Du "keine Kenntnisse in R" oder "keine Statistikkenntnisse", wie man nominale Varialben mittels linearer Regression vorhersagt? Heißt nominal bei Dir dichotom, also "ja/nein", "wahr/falsch", ..., dann willst Du wahrscheinlich eine binär logistische Regression machen. Wenn Du mehrstufige nominale Variablen mit einer linearen Regression vorhersagen willst geht das auch, ist aber kein typischer Anfängerstoff mehr.
Wir werden also ein wenig mehr Input dazu brauchen, ob Du Hilfe mit R oder Hilfe in Statistik brauchst, was das für Variablen sind, wieviele Beobachtungen Du hast, wieviele Stufen die abhängige Variable annehmen darf und ob lineare Regression gesetzt ist, oder ob auch andere Regressionsverfahren infrage kommen.
LG,
Bernhard
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 3:23 pm
von jogo
Hallo Luisa,
Luisa93 hat geschrieben: Mo Jul 29, 2019 3:11 pm
Wie gesagt ich habe mit R noch überhaupt nicht gearbeitet.
in Deiner ersten Nachricht hieß es:
ich habe leider noch nicht wirklich viel mit R gearbeitet
Jetzt ist klar, dass Du ganz am Anfang stehst.
Ich habe im Moment nur die Excel-Tabelle in R reingezogen.
Das ist schon mal was. Kannst Du bitte den Output von
In die nächste Nachricht kopieren?
Gruß, Jörg
p.s.:
Deswegen weiß ich schon gar nicht welche Code Sie meinen?
Üblicherweise duzen wir uns hier im Forum. Wenn Sie auf dem
Sie bestehen, werde ich das berücksichtigen.
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 3:32 pm
von Luisa93
Auch meine statistischen Kenntnisse halten sich in Grenzen. Ich würde sagen ich habe wenige Grundkenntnisse.
Ich habe sowohl dichotome als auch mehrstufige nominale Ausprägungen.
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 3:47 pm
von jogo
Du wirst eventuell die character-Variablen in Faktoren umwandeln müssen.
Aber gelegentlich wird auch dies von den Funktionen für die statistischen Verfahren berücksichtigt.
Wichtig ist jetzt, was soll geprüft werden?
Eine (vielleicht zu einfache) Frage könnte sein:
Ist der Preis abhängig von der Region?
Code: Alles auswählen
boxplot(Preis ~ Region, data=Aufbereitete_Erhebungstabelle)
M <- aov(Preis ~ Region, data=Aufbereitete_Erhebungstabelle)
summary(M)
Gruß, Jörg
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 3:51 pm
von Luisa93
Genau, es soll geklärt werden, ob der Preis z.B. von Region oder Falschenfarbe usw. abhängig sein könnte.
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 4:07 pm
von bigben
Meine erklärende Variable ist metrisch skaliert (Preis) und meine zu erklärenden Variablen sind nominal skaliert.
Luisa93 hat geschrieben: Mo Jul 29, 2019 3:51 pm
Genau, es soll geklärt werden, ob der Preis z.B. von Region oder Falschenfarbe usw. abhängig sein könnte.
Das passt beides nicht wirklich zusammen, aber wenn man den Preis als abhängige betrachten darf, umso besser.
LG,
Bernhard
Re: nominale Variablen in Dummy-Variablen umwandeln
Verfasst: Mo Jul 29, 2019 4:09 pm
von Luisa93
Oh, ich habe mich da vertan. Der Preis ist natürlich die zu erklärende Variable.