nominale Variablen in Dummy-Variablen umwandeln

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Hallo zusammen,

ich habe leider noch nicht wirklich viel mit R gearbeitet und möchte eine multiple Regressionsanalyse durchführen. Für Excel ist der Umfang leider zu groß. Mein Problem ist nun, dass ich nominale Merkmalsausprägungen habe, die ich zunächst in Dummy-Variablen umwandeln möchte. Die Daten habe ich von Excel in R Studio reingezogen. Nun weiß ich allerdings nicht wie ich die nominalen Variablen in Dummy-Variablen umwandeln kann. Kann mir da jemand helfen?

Vielen Dank im Voraus!
Zuletzt geändert von Luisa93 am Mo Jul 29, 2019 5:24 pm, insgesamt 1-mal geändert.
jogo
Beiträge: 2086
Registriert: Fr Okt 07, 2016 8:25 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von jogo »

Hallo Luisa,

willkommen im Forum!
Normalerweise ist die Umwandlung nicht nötig. Wenn Deine nominale Variable als factor in R gespeichert ist, werden bei den üblichen Modellierungen die entsprechenden Dummyvariablen intern erzeugt.
Was für ein statistisches Verfahren verwendest Du? Zeig uns bitte den Code.

Sollte man wirklich die Dummyvariablen benötigen, gibt es die Funktion model.matrix()

Gruß, Jörg
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Danke für die schnelle Antwort.

Wie gesagt ich habe mit R noch überhaupt nicht gearbeitet. Ich habe im Moment nur die Excel-Tabelle in R reingezogen.
Meine erklärende Variable ist metrisch skaliert (Preis) und meine zu erklärenden Variablen sind nominal skaliert. Ich vermute auch, dass ich R auch irgendwie sagen muss, welches meine erklärenden und zu erklärenden Variablen sind, die er in die Regressionsanalyse packen soll. Aber ich habe dazu wirklich überhaupt keine Kenntnisse. Deswegen weiß ich schon gar nicht welche Code Sie meinen?
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von bigben »

Hallo Luisa,

hier im Forum sagen wir "Du" zueinander.
Aber ich habe dazu wirklich überhaupt keine Kenntnisse.
Hier müssen wir unterscheiden: Meinst Du "keine Kenntnisse in R" oder "keine Statistikkenntnisse", wie man nominale Varialben mittels linearer Regression vorhersagt? Heißt nominal bei Dir dichotom, also "ja/nein", "wahr/falsch", ..., dann willst Du wahrscheinlich eine binär logistische Regression machen. Wenn Du mehrstufige nominale Variablen mit einer linearen Regression vorhersagen willst geht das auch, ist aber kein typischer Anfängerstoff mehr.

Wir werden also ein wenig mehr Input dazu brauchen, ob Du Hilfe mit R oder Hilfe in Statistik brauchst, was das für Variablen sind, wieviele Beobachtungen Du hast, wieviele Stufen die abhängige Variable annehmen darf und ob lineare Regression gesetzt ist, oder ob auch andere Regressionsverfahren infrage kommen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
jogo
Beiträge: 2086
Registriert: Fr Okt 07, 2016 8:25 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von jogo »

Hallo Luisa,
Luisa93 hat geschrieben: Mo Jul 29, 2019 3:11 pm Wie gesagt ich habe mit R noch überhaupt nicht gearbeitet.
in Deiner ersten Nachricht hieß es:
ich habe leider noch nicht wirklich viel mit R gearbeitet
Jetzt ist klar, dass Du ganz am Anfang stehst.
Ich habe im Moment nur die Excel-Tabelle in R reingezogen.
Das ist schon mal was. Kannst Du bitte den Output von

Code: Alles auswählen

str(DeinDataframe)
In die nächste Nachricht kopieren?

Gruß, Jörg
p.s.:
Deswegen weiß ich schon gar nicht welche Code Sie meinen?
Üblicherweise duzen wir uns hier im Forum. Wenn Sie auf dem Sie bestehen, werde ich das berücksichtigen.
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Auch meine statistischen Kenntnisse halten sich in Grenzen. Ich würde sagen ich habe wenige Grundkenntnisse.
Ich habe sowohl dichotome als auch mehrstufige nominale Ausprägungen.
Zuletzt geändert von Luisa93 am Mo Jul 29, 2019 5:23 pm, insgesamt 1-mal geändert.
jogo
Beiträge: 2086
Registriert: Fr Okt 07, 2016 8:25 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von jogo »

Du wirst eventuell die character-Variablen in Faktoren umwandeln müssen.
Aber gelegentlich wird auch dies von den Funktionen für die statistischen Verfahren berücksichtigt.

Wichtig ist jetzt, was soll geprüft werden?
Eine (vielleicht zu einfache) Frage könnte sein:
Ist der Preis abhängig von der Region?

Code: Alles auswählen

boxplot(Preis ~ Region, data=Aufbereitete_Erhebungstabelle)
M <- aov(Preis ~ Region, data=Aufbereitete_Erhebungstabelle)
summary(M)
Gruß, Jörg
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Genau, es soll geklärt werden, ob der Preis z.B. von Region oder Falschenfarbe usw. abhängig sein könnte.
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von bigben »

Meine erklärende Variable ist metrisch skaliert (Preis) und meine zu erklärenden Variablen sind nominal skaliert.
Luisa93 hat geschrieben: Mo Jul 29, 2019 3:51 pm Genau, es soll geklärt werden, ob der Preis z.B. von Region oder Falschenfarbe usw. abhängig sein könnte.
Das passt beides nicht wirklich zusammen, aber wenn man den Preis als abhängige betrachten darf, umso besser.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Oh, ich habe mich da vertan. Der Preis ist natürlich die zu erklärende Variable.
Antworten