Seite 1 von 1

Regression mit Kontrollvariablen

Verfasst: So Jul 11, 2021 2:59 pm
von Sandro
Paneldatensatz 1.csv
(130.18 KiB) 89-mal heruntergeladen
Hallo liebe Community,

ich würde mich über eure Hilfe freuen, denn ich bin neu in R und stehe momentan sehr auf den Schlauch...

Ich habe in einer Excel Tabelle 4 Variablen, Temperaturminimum, -maximum-, durchschnitt und die Coronafallzahlen. Die Daten beziehen sich auf jeweils 365 Tage und untersucht werden 30 Städte. Nun habe ich ebenfalls Kontrollvariablen. Diese sind die Bundesländer und die Monatsbezeichnungen, dargestellt als Dummy-Variablen. Einen kleinen Auszug der Tabelle habe ich im Anhang bereitgestellt, damit es verständlicher wird.

Für eine wissenschaftliche Arbeit muss ich eine Regression durchführen für die gilt: Corona Fallzahlen als abhänige Variable y und Temperatur als unabhänige Variable y.

Ohne Kontrollvariablen lautet der Befehl ja somit : lm( y~x, data=...)

Wie würde der Befehl den lauten mit den Kontrollvariablen?

Ich nehme stark an, dass:

lm ( y ~ x + Januar + Februar + März + April + Mai + Juni + Juli + August + September + Oktober + November + BW + BY + BE + BB + HB + HH + HE + MV + NI + NW + RP + SN + ST + SH + TH, data=...)

falsch ist oder?
Könnte mir jemand bitte einen Denkanstoß geben, bin ein bisschen überfordert mit R... :|

Re: Regression mit Kontrollvariablen

Verfasst: So Jul 11, 2021 6:46 pm
von student
Hallo Sandro,

schau mal hier, das 3. Modell bzw. 4. Modell könnte etwas für Dich sein.

Re: Regression mit Kontrollvariablen

Verfasst: So Jul 11, 2021 8:51 pm
von bigben
Also rechnen kann man das, wenn man x und y entsprechend ersetzt. Das hier läuft beispielsweise glatt durch R durch:

Code: Alles auswählen

d <- read.csv2("http://forum.r-statistik.de/download/file.php?id=1517")

mod <- lm ( NeueFälle ~ tavg + Januar + Februar + März + April + Mai + Juni + 
            Juli + August + September + Oktober + November + BW + BY + BE + BB +
            HB + HH + HE + MV + NI + NW + RP + SN + ST + SH + TH, data = d)
summary(mod)
Ob das statistisch sinnvoll ist ist aber eine andere Frage. Du hast beispielsweise die Städte erhoben weil Du wahrscheinlich denkst, dass die Messungen innerhalb einer Stadt nicht voneinander unabhängig sind. Wenn Du das berücksichtigen willst, dann geht das eher in Richtung hierarchisches Modell. Dafür wäre es meines Erachtens sinnvoll wenn Du sehr genau beschreiben würdest, was genau die Fragestellung ist, die Du beantworten möchtest und warum Du welche Variable erhoben hast.

LG,
Bernhard

Re: Regression mit Kontrollvariablen

Verfasst: So Jul 11, 2021 11:47 pm
von Sandro
Super, ich danke euch beiden für eure Zeit und Hilfe! :)

Zur Frage des Zwecks der Regression: Ich muss für eine wissenschaftliche Arbeit untersuchen, welchen Einfluss die Höchst-, Tiefst- und Durchschnittstemperaturen auf die täglichen COVID-19 Fallzahlen. Die Kontrollvariablen wurden mir hierbei vorgegeben. Also irgendein Sinn muss der Professor in der Regression sehen. :lol:

Liebe Grüße
Sandro