nominale Variablen in Dummy-Variablen umwandeln
Re: nominale Variablen in Dummy-Variablen umwandeln
Ich möchte gerne auch gerne die einzelnen Koeffizienten miteinander vergleichen.
Ich habe eine ähnliche Ausgabe die wurde mit dem Code >lm(formula = Y ~ X) erzeugt.
Bei mir kommt es allerdings nicht so raus, wie ich es gerne möchte. In meinem Fall werden nicht der t-Wert und p-Wert mit ausgegeben. Und außerdem möchte ich ja auch mehrere Variablen gleichzeitig verwenden. Also nicht nur Region.
Kann mir da jemand sagen, wie das funktioniert?
Ich habe eine ähnliche Ausgabe die wurde mit dem Code >lm(formula = Y ~ X) erzeugt.
Bei mir kommt es allerdings nicht so raus, wie ich es gerne möchte. In meinem Fall werden nicht der t-Wert und p-Wert mit ausgegeben. Und außerdem möchte ich ja auch mehrere Variablen gleichzeitig verwenden. Also nicht nur Region.
Kann mir da jemand sagen, wie das funktioniert?
Re: nominale Variablen in Dummy-Variablen umwandeln
So. Nur mit mehreren Variablen. Müssen die Ausprägungen dafür wirklich nicht vorher in Dummy-Variablen kodiert werden?
Zuletzt geändert von Luisa93 am Di Jul 30, 2019 1:15 pm, insgesamt 1-mal geändert.
Re: nominale Variablen in Dummy-Variablen umwandeln
Dann schau Dir doch die Modellmatrix an, z.B.:
Code: Alles auswählen
M <- aov(Petal.Length ~ as.character(Species), data=iris)
## summary(M)
model.matrix(Petal.Length ~ as.character(Species), data=iris)
Re: nominale Variablen in Dummy-Variablen umwandeln
Hallo,
danke für die Hilfe schon einmal. Hab jetzt hinbekommen was ich wollte.
Habe allerdings nun nochmal zwei Fragen:
1. Was für ein Grund kann es haben, dass R bei Etikettenformrund/oval "NA" ausgibt?
------------------
2. Was für ein Grund kann es haben, dass Alkohol vorher (Preis ~ Alkohol) nicht signifikant war und nachher (Preis ~ Alkohol und andere Variablen) signifikant ist?
(vorher)
danke für die Hilfe schon einmal. Hab jetzt hinbekommen was ich wollte.
Habe allerdings nun nochmal zwei Fragen:
1. Was für ein Grund kann es haben, dass R bei Etikettenformrund/oval "NA" ausgibt?
------------------
2. Was für ein Grund kann es haben, dass Alkohol vorher (Preis ~ Alkohol) nicht signifikant war und nachher (Preis ~ Alkohol und andere Variablen) signifikant ist?
(vorher)
Zuletzt geändert von Luisa93 am Do Aug 01, 2019 3:11 pm, insgesamt 1-mal geändert.
Re: nominale Variablen in Dummy-Variablen umwandeln
(nachher)
Zuletzt geändert von Luisa93 am Do Aug 01, 2019 3:11 pm, insgesamt 2-mal geändert.
Re: nominale Variablen in Dummy-Variablen umwandeln
Hallo Luisa,
ohne die Daten und ohne den Code kann ich nichts dazu sagen.
Als Daten kannst Du auch igendwelche konstuierten Pseudodaten nehmen
im Sinne von viewtopic.php?f=20&t=11 oder
https://stackoverflow.com/questions/596 ... le-example
Gruß, Jörg
ohne die Daten und ohne den Code kann ich nichts dazu sagen.
Als Daten kannst Du auch igendwelche konstuierten Pseudodaten nehmen
im Sinne von viewtopic.php?f=20&t=11 oder
https://stackoverflow.com/questions/596 ... le-example
Gruß, Jörg
Re: nominale Variablen in Dummy-Variablen umwandeln
Hallo zusammen,
anbei der exemplarischer Datensatz: und die verwendeten Codes + Ausgabe:
-> Bei Reg.Merkmal1.vs.Merkmal6: Merkmal_6 vorher kein 'NA'
-> Bei Reg.Gesamt: Merkmal_6e_3 plötzlich 'NA'
-> WARUM?
-> Bei Reg.Merkmal1.vs.Merkmal17: Merkmal_17 vorher nicht signifikant
-> Bei Reg.Gesamt: Merkmal_17 signifikant
-> WARUM?
Grüße
Luisa
anbei der exemplarischer Datensatz: und die verwendeten Codes + Ausgabe:
-> Bei Reg.Merkmal1.vs.Merkmal6: Merkmal_6 vorher kein 'NA'
-> Bei Reg.Gesamt: Merkmal_6e_3 plötzlich 'NA'
-> WARUM?
-> Bei Reg.Merkmal1.vs.Merkmal17: Merkmal_17 vorher nicht signifikant
-> Bei Reg.Gesamt: Merkmal_17 signifikant
-> WARUM?
Grüße
Luisa
Re: nominale Variablen in Dummy-Variablen umwandeln
Hallo Luisa,
hier ein erster Zwischenbericht. Es hängt mit dem Mermal_3 zusammen:Zur genaueren Analyse muss man die Fälle zählen für die möglichen Kombinationen der Faktorlevels. Ich vermute, dass es bei einigen Ausprägungen von Merkmal_3 es keine Beobachtungen gibt, bei denen Merkmal_6 den Wert e_3 annimmt.
Bezüglich Merkmal_17:
beim Gesamtmodell ist die vorher durch Merkmal_17 erklärte Varianz auf andere Merkmale übergegangen.
Der Vergleich zwischen einem Modell mit wenigen erklärenden Variablen und einem mit mehr erklärenden Variablen ist nicht trivial.
Nachtrag (zu "NA bei Merkmal6..")oder
Gruß, Jörg
hier ein erster Zwischenbericht. Es hängt mit dem Mermal_3 zusammen:
Code: Alles auswählen
library("readxl")
Datensatz_Beispiel <- read_xlsx("Datensatz_Beispiel.xlsx")
Reg.Merkmal1.vs.Merkmal6 <- lm(Merkmal_1 ~ Merkmal_6, data=Datensatz_Beispiel)
summary(Reg.Merkmal1.vs.Merkmal6)
Reg.Merkmal1.vs.Merkmal17 <- lm(Merkmal_1 ~ Merkmal_17, data=Datensatz_Beispiel)
summary(Reg.Merkmal1.vs.Merkmal17)
Reg.Gesamt <- lm(Merkmal_1 ~ Merkmal_2+Merkmal_3+Merkmal_4+Merkmal_5+Merkmal_6+Merkmal_7+Merkmal_8+Merkmal_9+Merkmal_10+Merkmal_11+Merkmal_12+Merkmal_13+Merkmal_14+Merkmal_15+Merkmal_16+Merkmal_17+Merkmal_18+Merkmal_19, data=Datensatz_Beispiel)
summary(Reg.Gesamt)
lm(Merkmal_1 ~ Merkmal_3+Merkmal_6, data=Datensatz_Beispiel)
Bezüglich Merkmal_17:
beim Gesamtmodell ist die vorher durch Merkmal_17 erklärte Varianz auf andere Merkmale übergegangen.
Der Vergleich zwischen einem Modell mit wenigen erklärenden Variablen und einem mit mehr erklärenden Variablen ist nicht trivial.
Nachtrag (zu "NA bei Merkmal6..")
Code: Alles auswählen
tapply(rep(1,100), list(Datensatz_Beispiel$Merkmal_3, Datensatz_Beispiel$Merkmal_6), FUN=sum)
Code: Alles auswählen
table(Datensatz_Beispiel$Merkmal_3, Datensatz_Beispiel$Merkmal_6)
Re: nominale Variablen in Dummy-Variablen umwandeln
Kann es manchmal trotzdem sinnvoll sein, sich zunächst die einzelnen Variablen anzuschauen und dann im Gesamten?Der Vergleich zwischen einem Modell mit wenigen erklärenden Variablen und einem mit mehr erklärenden Variablen ist nicht trivial.
Gibt es eine Möglichkeit die unabhängigen Variablen auf Multikollinarität zu überprüfen, wenn sich nicht nummerisch sind?