Seite 2 von 3

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Mo Jul 29, 2019 4:36 pm
von Luisa93
Ich möchte gerne auch gerne die einzelnen Koeffizienten miteinander vergleichen.
Ich habe eine ähnliche Ausgabe die wurde mit dem Code >lm(formula = Y ~ X) erzeugt.
Bei mir kommt es allerdings nicht so raus, wie ich es gerne möchte. In meinem Fall werden nicht der t-Wert und p-Wert mit ausgegeben. Und außerdem möchte ich ja auch mehrere Variablen gleichzeitig verwenden. Also nicht nur Region.

Kann mir da jemand sagen, wie das funktioniert?

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Mo Jul 29, 2019 4:42 pm
von Luisa93
So. Nur mit mehreren Variablen. Müssen die Ausprägungen dafür wirklich nicht vorher in Dummy-Variablen kodiert werden?

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Di Jul 30, 2019 8:24 am
von jogo
Luisa93 hat geschrieben: Mo Jul 29, 2019 4:42 pm Reg.PNG

So. Nur mit mehreren Variablen. Müssen die Ausprägungen dafür wirklich nicht vorher in Dummy-Variablen kodiert werden?
Dann schau Dir doch die Modellmatrix an, z.B.:

Code: Alles auswählen

M <- aov(Petal.Length ~ as.character(Species), data=iris)
## summary(M)

model.matrix(Petal.Length ~ as.character(Species), data=iris)
Gruß, Jörg

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Mi Jul 31, 2019 4:44 pm
von Luisa93
Hallo,

danke für die Hilfe schon einmal. Hab jetzt hinbekommen was ich wollte.

Habe allerdings nun nochmal zwei Fragen:

1. Was für ein Grund kann es haben, dass R bei Etikettenformrund/oval "NA" ausgibt?


------------------

2. Was für ein Grund kann es haben, dass Alkohol vorher (Preis ~ Alkohol) nicht signifikant war und nachher (Preis ~ Alkohol und andere Variablen) signifikant ist?

(vorher)

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Mi Jul 31, 2019 4:45 pm
von Luisa93
(nachher)

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Mi Jul 31, 2019 8:19 pm
von jogo
Hallo Luisa,

ohne die Daten und ohne den Code kann ich nichts dazu sagen.
Als Daten kannst Du auch igendwelche konstuierten Pseudodaten nehmen
im Sinne von viewtopic.php?f=20&t=11 oder
https://stackoverflow.com/questions/596 ... le-example

Gruß, Jörg

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Do Aug 01, 2019 3:19 pm
von Luisa93
Hallo zusammen,

anbei der exemplarischer Datensatz:
Datensatz_Beispiel.xlsx
(19.12 KiB) 397-mal heruntergeladen
und die verwendeten Codes + Ausgabe:
Beispiel.txt
(5.99 KiB) 378-mal heruntergeladen

-> Bei Reg.Merkmal1.vs.Merkmal6: Merkmal_6 vorher kein 'NA'
-> Bei Reg.Gesamt: Merkmal_6e_3 plötzlich 'NA'
-> WARUM?

-> Bei Reg.Merkmal1.vs.Merkmal17: Merkmal_17 vorher nicht signifikant
-> Bei Reg.Gesamt: Merkmal_17 signifikant
-> WARUM?

Grüße
Luisa

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Fr Aug 02, 2019 9:06 am
von jogo
Hallo Luisa,

hier ein erster Zwischenbericht. Es hängt mit dem Mermal_3 zusammen:

Code: Alles auswählen

library("readxl")
Datensatz_Beispiel <- read_xlsx("Datensatz_Beispiel.xlsx")

Reg.Merkmal1.vs.Merkmal6 <- lm(Merkmal_1 ~ Merkmal_6, data=Datensatz_Beispiel)
summary(Reg.Merkmal1.vs.Merkmal6)

Reg.Merkmal1.vs.Merkmal17 <- lm(Merkmal_1 ~ Merkmal_17, data=Datensatz_Beispiel)
summary(Reg.Merkmal1.vs.Merkmal17)

Reg.Gesamt <- lm(Merkmal_1 ~ Merkmal_2+Merkmal_3+Merkmal_4+Merkmal_5+Merkmal_6+Merkmal_7+Merkmal_8+Merkmal_9+Merkmal_10+Merkmal_11+Merkmal_12+Merkmal_13+Merkmal_14+Merkmal_15+Merkmal_16+Merkmal_17+Merkmal_18+Merkmal_19, data=Datensatz_Beispiel)
summary(Reg.Gesamt)

lm(Merkmal_1 ~ Merkmal_3+Merkmal_6, data=Datensatz_Beispiel)
Zur genaueren Analyse muss man die Fälle zählen für die möglichen Kombinationen der Faktorlevels. Ich vermute, dass es bei einigen Ausprägungen von Merkmal_3 es keine Beobachtungen gibt, bei denen Merkmal_6 den Wert e_3 annimmt.

Bezüglich Merkmal_17:
beim Gesamtmodell ist die vorher durch Merkmal_17 erklärte Varianz auf andere Merkmale übergegangen.
Der Vergleich zwischen einem Modell mit wenigen erklärenden Variablen und einem mit mehr erklärenden Variablen ist nicht trivial.

Nachtrag (zu "NA bei Merkmal6..")

Code: Alles auswählen

tapply(rep(1,100), list(Datensatz_Beispiel$Merkmal_3, Datensatz_Beispiel$Merkmal_6), FUN=sum)
oder

Code: Alles auswählen

table(Datensatz_Beispiel$Merkmal_3, Datensatz_Beispiel$Merkmal_6)
Gruß, Jörg

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Mo Aug 05, 2019 10:21 pm
von Luisa93
table().PNG
table().PNG (3.95 KiB) 4133 mal betrachtet

Re: nominale Variablen in Dummy-Variablen umwandeln

Verfasst: Mo Aug 05, 2019 10:24 pm
von Luisa93
Der Vergleich zwischen einem Modell mit wenigen erklärenden Variablen und einem mit mehr erklärenden Variablen ist nicht trivial.
Kann es manchmal trotzdem sinnvoll sein, sich zunächst die einzelnen Variablen anzuschauen und dann im Gesamten?

Gibt es eine Möglichkeit die unabhängigen Variablen auf Multikollinarität zu überprüfen, wenn sich nicht nummerisch sind?