Problem mit R Studio Lineare Regression

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

EinS-ZwO
Beiträge: 4
Registriert: Mo Okt 28, 2019 8:55 am

Problem mit R Studio Lineare Regression

Beitrag von EinS-ZwO »

Hallo zusammen,
ich bin noch relativ neu im Umgang mit R Studio und habe ein kleines Problem:
Ich zwar hab ich im Studium eine Übungsaufgabe bekommen.
Aufgabenstellung habe ich mal Angehängt, dazu habe ich eine Datensatz in Excel bekommen.
Diesen Datensatz einzulesen ist kein Problem.
Wo ich nicht weiterkomme ist: das erstellen des 95% Progressionsintervall.
Davor muss ich ja eine Lineare Regression machen. Pizza <-lm( #abhängige Variable ~ #unabhängige Variable, #Datensatz. Nur was ist aus dem vorhandenen Datensatz die abhängige und was die unabhängige. Als abhängige Variable hätte ich jetzt die "Bewertung" genommen??
Das 95% Prognoseintervall ist ja : predict(Pizza,?????????) und dann weiß ich nicht mehr wie es weiter geht.
Kann mir hier jemand Tipps geben bzw. helfen???
Dateianhänge
Datensatz
Datensatz
Aufgabenstellung
Aufgabenstellung
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Problem mit R Studio Lineare Regression

Beitrag von bigben »

Hallo EinsZwo,

die Daten, die Du da als Excel bekommen hast können wir als Screenshot schlecht zum Ausprobieren nutzen, daher wäre es hilfreich, wenn Du beim nächsten Post computerlesbare, für R aufbereitete Beispieldaten posten könntest. Wege dahin findest Du hier: viewtopic.php?f=20&t=11

Ansonsten sehe ich das wie Du, dass

Code: Alles auswählen

lm(bewertung ~ mehl + salz + backpulver, data=???)
die richtige Anordnung der Spalten in einer linearen Regression wären. Die sollten dann aber als factor eingelesen werden, damit R automatisch eine Dummycodierung vornehmen kann. Ob man für diese Aufgabe unbedingt eine lineare Regression rechnen muss, weiß ich nicht, aber wenn Ihr die gerade durchnehmt, dann wird das so schon gemeint sein. (Man könnte ja auch einfach mit which.max die höchsten bewertung-Werte heraussuchen, aber Hausaufgqaben erledigt man so, wie Lehrer die Hausaufgaben erledigt haben wollen.)

Bevor Du predict verwendest musst Du erst entscheiden, welches die bestschmeckende Kombination ist.

Eine Prognose danach aus zwei Beobachtungen zu rechnen erscheint mir persönlich unverhältnismäßig, aber es ist ja nur eine Übungsaufgabe.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Problem mit R Studio Lineare Regression

Beitrag von EDi »

Ich weiß zwar nicht was ein Progressions Interval ist, aber vermutlich brauchst du 'interval="predict"' (fängt zumindest mit den gleichen 2 Buchstaben an).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Problem mit R Studio Lineare Regression

Beitrag von bigben »

In der Aufgabenstellung steht Prognoseintervall.
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
EinS-ZwO
Beiträge: 4
Registriert: Mo Okt 28, 2019 8:55 am

Re: Problem mit R Studio Lineare Regression

Beitrag von EinS-ZwO »

Stimmt hab es im Text falsch geschrieben. Soll das 95% Prognoseintervall sein.

Ja leider müssen wir es so kompliziert machen. Da wir dann beantworten sollen: Daten einlesen, dann wie man Daten Modelliert und dann die optimale Einstellung für Mehl, Salz, Backpulver. Und dann noch die Prognose ( 95% Prognoseintervall )

Ich probiere es Daheim dann gleich mal aus, und schau ob ich auch die Prognose hinbekomme.

Wenn ich für die Lineare Regression dies so eingebe:

Pizza1 <- lm(bewertung ~ mehl + salz + backpulver, data=Pizza)

plotModel (Pizza1) --> zum Darstellen?

dann sollte mein 95% Prognoseintervall ( falls ich es richtig verstanden habe ) so aussehen:

predict(Pizza1, newdata = data.frame( Bewertung = 10), interval = "prediction") ??
Dateianhänge
Pizza.csv
(967 Bytes) 54-mal heruntergeladen
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Problem mit R Studio Lineare Regression

Beitrag von bigben »

EinS-ZwO hat geschrieben: Mo Nov 04, 2019 1:53 pmJa leider müssen wir es so kompliziert machen.
Das sollte kein Problem sein.

Code: Alles auswählen

Pizza1 <- lm(bewertung ~ mehl + salz + backpulver, data=Pizza)

plotModel (Pizza1) --> zum Darstellen?
Wenn die Variablen im Datensatz alle klein geschrieben werden, solltest Du dabei bleiben und pizza1 auch klein schreiben. plotModel ist keine Standard-R-Funktion. Wir können vermuten, dass Du das Paket mosaic verwendest, aber es ist nicht gut, wenn wir über Code Vermutungen anstellen müssen. Es kommt schon auch mal vor, dass identische Funktionsnamen in verschiedenen Paketen verschieden definiert werden. Deshalb bitte immer den library oder require-Aufruf dazu posten, wenn nötig.
dann sollte mein 95% Prognoseintervall ( falls ich es richtig verstanden habe ) so aussehen:

Code: Alles auswählen

predict(Pizza1, newdata = data.frame( Bewertung = 10), interval = "prediction") ??
Nö. Erstens kommen gar keine Bewertungen bis 10 vor (gehen nur bis 5,9...) und zweitens will predict die unabhängigen Variablen sehen, nicht die abhängigen. Außerdem hast Du Bewertung hier großgeschrieben, im Datensatz aber kleingeschrieben. Da musst Du gut aufpassen, da ist R kleinlich:

Code: Alles auswählen

> a <- 1
> A <- a+1
> cat(a)
1
A propos kleinlich: Kannst Du bitte code-Tags verwenden?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
EinS-ZwO
Beiträge: 4
Registriert: Mo Okt 28, 2019 8:55 am

Re: Problem mit R Studio Lineare Regression

Beitrag von EinS-ZwO »

Ah ok .Ich verwende "mosaic" Ja das mit dem kleinschreiben ist als Konstrukteur der nicht viel mit R Studio zutun hat so eine Sachen ;-) Hab schon öfters Fehler gesucht in R und dann war es an der Groß und Kleinschreibung gehangen.

Ich hab mich jetzt mal daheim hingesetzt und das so Versucht.
Ich habe die Daten eingelesen und dann einen Plot gemacht.
Irgendwie schaut der Plot komisch aus ( keine lineare Linie ). Auf der Y-Achse habe ich die bewertung, auf der X-Achse steht aber nur mehl. Oder ist das normal??
Wenn ich über summary das dann auslese steht wieder mehl , salz, backpulver drin.
Im Unterricht haben wir das ganze immer nur mit einem Wert auf der Y und einem Wert auf der X-Achse gemacht.

Beim Predict bringt er mir immer einen Fehler.
Im Skript steht der Befehl so drin:
Punktprognose inkl. 95%-Prognoseintervall

Code: Alles auswählen

predict(erglm1, # Modell
 # Neue Beobachtung mit x=10: newdata = data.frame(RotorL = 10), 
# Prognoseintervall: interval = "prediction")
Wo liegt beim Plot mein Fehler? Ich bin mein Skript auch nochmal durchgegangen, aber da steht nicht wirklich was Hilfreiches drin.

LG,
Michael
Dateianhänge
Übungsaufgabe_2.jpg
Übungsaufgabe_1.jpg
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Problem mit R Studio Lineare Regression

Beitrag von bigben »

EinS-ZwO hat geschrieben: Mo Nov 04, 2019 6:11 pm Hab schon öfters Fehler gesucht in R und dann war es an der Groß und Kleinschreibung gehangen.
Konsequent immer alles klein und dann kann das nicht mehr vorkommen.
Irgendwie schaut der Plot komisch aus ( keine lineare Linie ). Auf der Y-Achse habe ich die bewertung, auf der X-Achse steht aber nur mehl. Oder ist das normal??
Schwer zu sagen. Ich kenne diese Funktion nicht und so ganz toll dokumentiert ist das in der Anleitung nicht. Es ist halt auch schwer, drei Prädiktoren auf der x-Achse gleichzeitig abzubilden.
.
Im Skript steht der Befehl so drin:
Punktprognose inkl. 95%-Prognoseintervall

Code: Alles auswählen

predict(erglm1, # Modell
 # Neue Beobachtung mit x=10: newdata = data.frame(RotorL = 10), 
Eben, da steht ein x-Wert, kein y-Wert.


Ich als Mensch verstehe Dein predict-Kommando auch nicht, also das in dem Screenshot. In Deiner Aufgabe steht doch die Frage, welche Kombination aus Salz, Wasser und Backpulver die besten Ergebnisse bringt. Das ist der nächste Schritt.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
EinS-ZwO
Beiträge: 4
Registriert: Mo Okt 28, 2019 8:55 am

Re: Problem mit R Studio Lineare Regression

Beitrag von EinS-ZwO »

In unserem Skript haben wir auch nur das Beispiel anhand der Flügellänge eines Papierhelikopters. Längere Flügellänge = längere Flugzeit. Und das Fach Grundlagen Statistik haben wir auch nur 9 x je 3 Stunden und davon sind vll, 4x mit R Studio. Die Prüfung ist auch nicht über R Studio sondern über Statistik allgemein.
Da ist diese Übungsaufgabe schon kompliziert, bzw. ich denke falsch ^^

Wie würdet ihr den diese Aufgabe lösen bzw. rangehen? Damit ich vll. verstehe wo mein Denkfehler ist.

LG
Michael
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Problem mit R Studio Lineare Regression

Beitrag von Athomas »

Problem mit R Studio Lineare Regression
Sag bitte nicht immer "RStudio" - die Programmiersprache, mit der Du die lineare Regression rechnen möchtest, nennt sich "R"!

Wikipedia sagt: "RStudio ist eine vom Unternehmen RStudio, Inc. angebotene, integrierte Entwicklungsumgebung und grafische Benutzeroberfläche für die statistische Programmiersprache R".

Zu "R" sagt Wikipedia: "R ist eine freie Programmiersprache für statistische Berechnungen und Grafiken."
Antworten