Seite 1 von 1
Frage zur Eingabe einer Regressionsanalye
Verfasst: Mi Jun 14, 2017 5:24 pm
von Jenny
Hallo,
ich bin Studentin und muss im Rahmen eines Projektes eine Regressionsanalyse mit R durchführen.
Leider kenn ich mich mit dem Programm nicht so gut aus und weiß daher nicht, wie ich die Formel als Befehl formulieren kann.
Es handelt sich bei der folgenden Formel im Anhang um eine Translog-Kostenfunktion. Die Werte an sich sind gegeben. Ich weiß nur nicht, wie ich diese als R-Befehl eingeben kann.
Vielleicht kann mir jemand helfen. Ich würde mich freuen.
Liebe Grüße, Jenny
Re: Frage zur Eingabe einer Regressionsanalye
Verfasst: Mi Jun 14, 2017 7:30 pm
von jogo
Hallo Jenny,
willkommen im Forum!
Hast Du denn die Daten schon eingelesen und kannst uns die Struktur des Datensatzes zeigen?
Kannst Du auch bitte noch beschreiben, welche Bedeutung die Variablen Q und W und die Indizes
i und
k in der Formel haben?
Gruß, Jörg
Re: Frage zur Eingabe einer Regressionsanalye
Verfasst: Do Jun 15, 2017 5:42 pm
von Jenny
Hallo Jörg,
vielen Dank für Deine Antwort.
Die Struktur hab ich im Anhang. Hoffe, es ist das was Du meinst.
C= Kosten
Q= Bilanzsumme
W1= Personalaufwendungen
W2= Zinsaufwendungen
W3= Verwaltungsaufwendungen
Der Index k steht für 1...3 beim jeweiligen W und i steht jeweils für ein Unternehmen.
Grüße, Jenny
Re: Frage zur Eingabe einer Regressionsanalye
Verfasst: Fr Jun 16, 2017 8:34 am
von jogo
Hallo Jenny,
Jenny hat geschrieben: Do Jun 15, 2017 5:42 pm
Die Struktur hab ich im Anhang. Hoffe, es ist das was Du meinst.
ja, das ist genau richtig, weil man daran sehen kann, dass wohl etwas beim Einlesen schief gelaufen ist, denn Q, W1, W2, W3 sind keine numerischen Werte sondern Zeichenketten (character).
Um herauszufinden, was für Texte in diesen Variablen die Interpretation als Zahlenwert verhindert haben:
Code: Alles auswählen
df <- DeinDatensatz
df$w1 <- as.numeric(df$W1) # bei jeder dieser drei Zeilen sollte es eine Warnmeldung geben
df$w2 <- as.numeric(df$W2)
df$w3 <- as.numeric(df$W3)
subset(df, is.na(w1) | is.na(w2) | is.na(w3)) # zeigt die Problemfälle an
Gerne kannst Du die Ausgabe auch in Deine nächste Nachricht kopieren.
Wenn es beim Einlesen nicht dieses Problem gegeben hätte, würde Dein Modell so ausschauen:
Code: Alles auswählen
lm(log(C) ~ year + (1 + log(Q) + log(W1) + log(W2) + log(w3))^2)
Grüße, Jörg
p.s.:
Ich sehe, dass Du einige Veränderungen an Deinem Datensatz vorgenommen hast seit dem Einlesen. Kannst Du bitte den Code in Deine nächste Nachricht kopieren?