nominale Variablen in Dummy-Variablen umwandeln
nominale Variablen in Dummy-Variablen umwandeln
Hallo zusammen,
ich habe leider noch nicht wirklich viel mit R gearbeitet und möchte eine multiple Regressionsanalyse durchführen. Für Excel ist der Umfang leider zu groß. Mein Problem ist nun, dass ich nominale Merkmalsausprägungen habe, die ich zunächst in Dummy-Variablen umwandeln möchte. Die Daten habe ich von Excel in R Studio reingezogen. Nun weiß ich allerdings nicht wie ich die nominalen Variablen in Dummy-Variablen umwandeln kann. Kann mir da jemand helfen?
Vielen Dank im Voraus!
ich habe leider noch nicht wirklich viel mit R gearbeitet und möchte eine multiple Regressionsanalyse durchführen. Für Excel ist der Umfang leider zu groß. Mein Problem ist nun, dass ich nominale Merkmalsausprägungen habe, die ich zunächst in Dummy-Variablen umwandeln möchte. Die Daten habe ich von Excel in R Studio reingezogen. Nun weiß ich allerdings nicht wie ich die nominalen Variablen in Dummy-Variablen umwandeln kann. Kann mir da jemand helfen?
Vielen Dank im Voraus!
Zuletzt geändert von Luisa93 am Mo Jul 29, 2019 5:24 pm, insgesamt 1-mal geändert.
Re: nominale Variablen in Dummy-Variablen umwandeln
Hallo Luisa,
willkommen im Forum!
Normalerweise ist die Umwandlung nicht nötig. Wenn Deine nominale Variable als factor in R gespeichert ist, werden bei den üblichen Modellierungen die entsprechenden Dummyvariablen intern erzeugt.
Was für ein statistisches Verfahren verwendest Du? Zeig uns bitte den Code.
Sollte man wirklich die Dummyvariablen benötigen, gibt es die Funktion model.matrix()
Gruß, Jörg
willkommen im Forum!
Normalerweise ist die Umwandlung nicht nötig. Wenn Deine nominale Variable als factor in R gespeichert ist, werden bei den üblichen Modellierungen die entsprechenden Dummyvariablen intern erzeugt.
Was für ein statistisches Verfahren verwendest Du? Zeig uns bitte den Code.
Sollte man wirklich die Dummyvariablen benötigen, gibt es die Funktion model.matrix()
Gruß, Jörg
Re: nominale Variablen in Dummy-Variablen umwandeln
Danke für die schnelle Antwort.
Wie gesagt ich habe mit R noch überhaupt nicht gearbeitet. Ich habe im Moment nur die Excel-Tabelle in R reingezogen.
Meine erklärende Variable ist metrisch skaliert (Preis) und meine zu erklärenden Variablen sind nominal skaliert. Ich vermute auch, dass ich R auch irgendwie sagen muss, welches meine erklärenden und zu erklärenden Variablen sind, die er in die Regressionsanalyse packen soll. Aber ich habe dazu wirklich überhaupt keine Kenntnisse. Deswegen weiß ich schon gar nicht welche Code Sie meinen?
Wie gesagt ich habe mit R noch überhaupt nicht gearbeitet. Ich habe im Moment nur die Excel-Tabelle in R reingezogen.
Meine erklärende Variable ist metrisch skaliert (Preis) und meine zu erklärenden Variablen sind nominal skaliert. Ich vermute auch, dass ich R auch irgendwie sagen muss, welches meine erklärenden und zu erklärenden Variablen sind, die er in die Regressionsanalyse packen soll. Aber ich habe dazu wirklich überhaupt keine Kenntnisse. Deswegen weiß ich schon gar nicht welche Code Sie meinen?
Re: nominale Variablen in Dummy-Variablen umwandeln
Hallo Luisa,
hier im Forum sagen wir "Du" zueinander.
Wir werden also ein wenig mehr Input dazu brauchen, ob Du Hilfe mit R oder Hilfe in Statistik brauchst, was das für Variablen sind, wieviele Beobachtungen Du hast, wieviele Stufen die abhängige Variable annehmen darf und ob lineare Regression gesetzt ist, oder ob auch andere Regressionsverfahren infrage kommen.
LG,
Bernhard
hier im Forum sagen wir "Du" zueinander.
Hier müssen wir unterscheiden: Meinst Du "keine Kenntnisse in R" oder "keine Statistikkenntnisse", wie man nominale Varialben mittels linearer Regression vorhersagt? Heißt nominal bei Dir dichotom, also "ja/nein", "wahr/falsch", ..., dann willst Du wahrscheinlich eine binär logistische Regression machen. Wenn Du mehrstufige nominale Variablen mit einer linearen Regression vorhersagen willst geht das auch, ist aber kein typischer Anfängerstoff mehr.Aber ich habe dazu wirklich überhaupt keine Kenntnisse.
Wir werden also ein wenig mehr Input dazu brauchen, ob Du Hilfe mit R oder Hilfe in Statistik brauchst, was das für Variablen sind, wieviele Beobachtungen Du hast, wieviele Stufen die abhängige Variable annehmen darf und ob lineare Regression gesetzt ist, oder ob auch andere Regressionsverfahren infrage kommen.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: nominale Variablen in Dummy-Variablen umwandeln
Hallo Luisa,
ich habe leider noch nicht wirklich viel mit R gearbeitet
Jetzt ist klar, dass Du ganz am Anfang stehst.
In die nächste Nachricht kopieren?
Gruß, Jörg
p.s.:
in Deiner ersten Nachricht hieß es:
ich habe leider noch nicht wirklich viel mit R gearbeitet
Jetzt ist klar, dass Du ganz am Anfang stehst.
Das ist schon mal was. Kannst Du bitte den Output vonIch habe im Moment nur die Excel-Tabelle in R reingezogen.
Code: Alles auswählen
str(DeinDataframe)
Gruß, Jörg
p.s.:
Üblicherweise duzen wir uns hier im Forum. Wenn Sie auf dem Sie bestehen, werde ich das berücksichtigen.Deswegen weiß ich schon gar nicht welche Code Sie meinen?
Re: nominale Variablen in Dummy-Variablen umwandeln
Auch meine statistischen Kenntnisse halten sich in Grenzen. Ich würde sagen ich habe wenige Grundkenntnisse.
Ich habe sowohl dichotome als auch mehrstufige nominale Ausprägungen.
Ich habe sowohl dichotome als auch mehrstufige nominale Ausprägungen.
Zuletzt geändert von Luisa93 am Mo Jul 29, 2019 5:23 pm, insgesamt 1-mal geändert.
Re: nominale Variablen in Dummy-Variablen umwandeln
Du wirst eventuell die character-Variablen in Faktoren umwandeln müssen.
Aber gelegentlich wird auch dies von den Funktionen für die statistischen Verfahren berücksichtigt.
Wichtig ist jetzt, was soll geprüft werden?
Eine (vielleicht zu einfache) Frage könnte sein:
Ist der Preis abhängig von der Region?
Gruß, Jörg
Aber gelegentlich wird auch dies von den Funktionen für die statistischen Verfahren berücksichtigt.
Wichtig ist jetzt, was soll geprüft werden?
Eine (vielleicht zu einfache) Frage könnte sein:
Ist der Preis abhängig von der Region?
Code: Alles auswählen
boxplot(Preis ~ Region, data=Aufbereitete_Erhebungstabelle)
M <- aov(Preis ~ Region, data=Aufbereitete_Erhebungstabelle)
summary(M)
Re: nominale Variablen in Dummy-Variablen umwandeln
Genau, es soll geklärt werden, ob der Preis z.B. von Region oder Falschenfarbe usw. abhängig sein könnte.
Re: nominale Variablen in Dummy-Variablen umwandeln
Meine erklärende Variable ist metrisch skaliert (Preis) und meine zu erklärenden Variablen sind nominal skaliert.
Das passt beides nicht wirklich zusammen, aber wenn man den Preis als abhängige betrachten darf, umso besser.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: nominale Variablen in Dummy-Variablen umwandeln
Oh, ich habe mich da vertan. Der Preis ist natürlich die zu erklärende Variable.