nominale Variablen in Dummy-Variablen umwandeln

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Ich möchte gerne auch gerne die einzelnen Koeffizienten miteinander vergleichen.
Ich habe eine ähnliche Ausgabe die wurde mit dem Code >lm(formula = Y ~ X) erzeugt.
Bei mir kommt es allerdings nicht so raus, wie ich es gerne möchte. In meinem Fall werden nicht der t-Wert und p-Wert mit ausgegeben. Und außerdem möchte ich ja auch mehrere Variablen gleichzeitig verwenden. Also nicht nur Region.

Kann mir da jemand sagen, wie das funktioniert?
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

So. Nur mit mehreren Variablen. Müssen die Ausprägungen dafür wirklich nicht vorher in Dummy-Variablen kodiert werden?
Zuletzt geändert von Luisa93 am Di Jul 30, 2019 1:15 pm, insgesamt 1-mal geändert.
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von jogo »

Luisa93 hat geschrieben: Mo Jul 29, 2019 4:42 pm Reg.PNG

So. Nur mit mehreren Variablen. Müssen die Ausprägungen dafür wirklich nicht vorher in Dummy-Variablen kodiert werden?
Dann schau Dir doch die Modellmatrix an, z.B.:

Code: Alles auswählen

M <- aov(Petal.Length ~ as.character(Species), data=iris)
## summary(M)

model.matrix(Petal.Length ~ as.character(Species), data=iris)
Gruß, Jörg
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Hallo,

danke für die Hilfe schon einmal. Hab jetzt hinbekommen was ich wollte.

Habe allerdings nun nochmal zwei Fragen:

1. Was für ein Grund kann es haben, dass R bei Etikettenformrund/oval "NA" ausgibt?


------------------

2. Was für ein Grund kann es haben, dass Alkohol vorher (Preis ~ Alkohol) nicht signifikant war und nachher (Preis ~ Alkohol und andere Variablen) signifikant ist?

(vorher)
Zuletzt geändert von Luisa93 am Do Aug 01, 2019 3:11 pm, insgesamt 1-mal geändert.
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

(nachher)
Zuletzt geändert von Luisa93 am Do Aug 01, 2019 3:11 pm, insgesamt 2-mal geändert.
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von jogo »

Hallo Luisa,

ohne die Daten und ohne den Code kann ich nichts dazu sagen.
Als Daten kannst Du auch igendwelche konstuierten Pseudodaten nehmen
im Sinne von viewtopic.php?f=20&t=11 oder
https://stackoverflow.com/questions/596 ... le-example

Gruß, Jörg
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Hallo zusammen,

anbei der exemplarischer Datensatz:
Datensatz_Beispiel.xlsx
(19.12 KiB) 12-mal heruntergeladen
und die verwendeten Codes + Ausgabe:
Beispiel.txt
(5.99 KiB) 13-mal heruntergeladen

-> Bei Reg.Merkmal1.vs.Merkmal6: Merkmal_6 vorher kein 'NA'
-> Bei Reg.Gesamt: Merkmal_6e_3 plötzlich 'NA'
-> WARUM?

-> Bei Reg.Merkmal1.vs.Merkmal17: Merkmal_17 vorher nicht signifikant
-> Bei Reg.Gesamt: Merkmal_17 signifikant
-> WARUM?

Grüße
Luisa
jogo
Beiträge: 2085
Registriert: Fr Okt 07, 2016 8:25 am

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von jogo »

Hallo Luisa,

hier ein erster Zwischenbericht. Es hängt mit dem Mermal_3 zusammen:

Code: Alles auswählen

library("readxl")
Datensatz_Beispiel <- read_xlsx("Datensatz_Beispiel.xlsx")

Reg.Merkmal1.vs.Merkmal6 <- lm(Merkmal_1 ~ Merkmal_6, data=Datensatz_Beispiel)
summary(Reg.Merkmal1.vs.Merkmal6)

Reg.Merkmal1.vs.Merkmal17 <- lm(Merkmal_1 ~ Merkmal_17, data=Datensatz_Beispiel)
summary(Reg.Merkmal1.vs.Merkmal17)

Reg.Gesamt <- lm(Merkmal_1 ~ Merkmal_2+Merkmal_3+Merkmal_4+Merkmal_5+Merkmal_6+Merkmal_7+Merkmal_8+Merkmal_9+Merkmal_10+Merkmal_11+Merkmal_12+Merkmal_13+Merkmal_14+Merkmal_15+Merkmal_16+Merkmal_17+Merkmal_18+Merkmal_19, data=Datensatz_Beispiel)
summary(Reg.Gesamt)

lm(Merkmal_1 ~ Merkmal_3+Merkmal_6, data=Datensatz_Beispiel)
Zur genaueren Analyse muss man die Fälle zählen für die möglichen Kombinationen der Faktorlevels. Ich vermute, dass es bei einigen Ausprägungen von Merkmal_3 es keine Beobachtungen gibt, bei denen Merkmal_6 den Wert e_3 annimmt.

Bezüglich Merkmal_17:
beim Gesamtmodell ist die vorher durch Merkmal_17 erklärte Varianz auf andere Merkmale übergegangen.
Der Vergleich zwischen einem Modell mit wenigen erklärenden Variablen und einem mit mehr erklärenden Variablen ist nicht trivial.

Nachtrag (zu "NA bei Merkmal6..")

Code: Alles auswählen

tapply(rep(1,100), list(Datensatz_Beispiel$Merkmal_3, Datensatz_Beispiel$Merkmal_6), FUN=sum)
oder

Code: Alles auswählen

table(Datensatz_Beispiel$Merkmal_3, Datensatz_Beispiel$Merkmal_6)
Gruß, Jörg
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

table().PNG
table().PNG (3.95 KiB) 260 mal betrachtet
Luisa93
Beiträge: 16
Registriert: Mo Jul 29, 2019 2:32 pm

Re: nominale Variablen in Dummy-Variablen umwandeln

Beitrag von Luisa93 »

Der Vergleich zwischen einem Modell mit wenigen erklärenden Variablen und einem mit mehr erklärenden Variablen ist nicht trivial.
Kann es manchmal trotzdem sinnvoll sein, sich zunächst die einzelnen Variablen anzuschauen und dann im Gesamten?

Gibt es eine Möglichkeit die unabhängigen Variablen auf Multikollinarität zu überprüfen, wenn sich nicht nummerisch sind?
Antworten