Regression mit Kontrollvariablen

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
Sandro
Beiträge: 2
Registriert: So Jul 11, 2021 2:47 pm

Regression mit Kontrollvariablen

Beitrag von Sandro »

Paneldatensatz 1.csv
(130.18 KiB) 89-mal heruntergeladen
Hallo liebe Community,

ich würde mich über eure Hilfe freuen, denn ich bin neu in R und stehe momentan sehr auf den Schlauch...

Ich habe in einer Excel Tabelle 4 Variablen, Temperaturminimum, -maximum-, durchschnitt und die Coronafallzahlen. Die Daten beziehen sich auf jeweils 365 Tage und untersucht werden 30 Städte. Nun habe ich ebenfalls Kontrollvariablen. Diese sind die Bundesländer und die Monatsbezeichnungen, dargestellt als Dummy-Variablen. Einen kleinen Auszug der Tabelle habe ich im Anhang bereitgestellt, damit es verständlicher wird.

Für eine wissenschaftliche Arbeit muss ich eine Regression durchführen für die gilt: Corona Fallzahlen als abhänige Variable y und Temperatur als unabhänige Variable y.

Ohne Kontrollvariablen lautet der Befehl ja somit : lm( y~x, data=...)

Wie würde der Befehl den lauten mit den Kontrollvariablen?

Ich nehme stark an, dass:

lm ( y ~ x + Januar + Februar + März + April + Mai + Juni + Juli + August + September + Oktober + November + BW + BY + BE + BB + HB + HH + HE + MV + NI + NW + RP + SN + ST + SH + TH, data=...)

falsch ist oder?
Könnte mir jemand bitte einen Denkanstoß geben, bin ein bisschen überfordert mit R... :|
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Regression mit Kontrollvariablen

Beitrag von student »

Hallo Sandro,

schau mal hier, das 3. Modell bzw. 4. Modell könnte etwas für Dich sein.
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Regression mit Kontrollvariablen

Beitrag von bigben »

Also rechnen kann man das, wenn man x und y entsprechend ersetzt. Das hier läuft beispielsweise glatt durch R durch:

Code: Alles auswählen

d <- read.csv2("http://forum.r-statistik.de/download/file.php?id=1517")

mod <- lm ( NeueFälle ~ tavg + Januar + Februar + März + April + Mai + Juni + 
            Juli + August + September + Oktober + November + BW + BY + BE + BB +
            HB + HH + HE + MV + NI + NW + RP + SN + ST + SH + TH, data = d)
summary(mod)
Ob das statistisch sinnvoll ist ist aber eine andere Frage. Du hast beispielsweise die Städte erhoben weil Du wahrscheinlich denkst, dass die Messungen innerhalb einer Stadt nicht voneinander unabhängig sind. Wenn Du das berücksichtigen willst, dann geht das eher in Richtung hierarchisches Modell. Dafür wäre es meines Erachtens sinnvoll wenn Du sehr genau beschreiben würdest, was genau die Fragestellung ist, die Du beantworten möchtest und warum Du welche Variable erhoben hast.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Sandro
Beiträge: 2
Registriert: So Jul 11, 2021 2:47 pm

Re: Regression mit Kontrollvariablen

Beitrag von Sandro »

Super, ich danke euch beiden für eure Zeit und Hilfe! :)

Zur Frage des Zwecks der Regression: Ich muss für eine wissenschaftliche Arbeit untersuchen, welchen Einfluss die Höchst-, Tiefst- und Durchschnittstemperaturen auf die täglichen COVID-19 Fallzahlen. Die Kontrollvariablen wurden mir hierbei vorgegeben. Also irgendein Sinn muss der Professor in der Regression sehen. :lol:

Liebe Grüße
Sandro
Antworten