Problem mit R Studio Lineare Regression
Moderator: EDi
Problem mit R Studio Lineare Regression
Hallo zusammen,
ich bin noch relativ neu im Umgang mit R Studio und habe ein kleines Problem:
Ich zwar hab ich im Studium eine Übungsaufgabe bekommen.
Aufgabenstellung habe ich mal Angehängt, dazu habe ich eine Datensatz in Excel bekommen.
Diesen Datensatz einzulesen ist kein Problem.
Wo ich nicht weiterkomme ist: das erstellen des 95% Progressionsintervall.
Davor muss ich ja eine Lineare Regression machen. Pizza <-lm( #abhängige Variable ~ #unabhängige Variable, #Datensatz. Nur was ist aus dem vorhandenen Datensatz die abhängige und was die unabhängige. Als abhängige Variable hätte ich jetzt die "Bewertung" genommen??
Das 95% Prognoseintervall ist ja : predict(Pizza,?????????) und dann weiß ich nicht mehr wie es weiter geht.
Kann mir hier jemand Tipps geben bzw. helfen???
ich bin noch relativ neu im Umgang mit R Studio und habe ein kleines Problem:
Ich zwar hab ich im Studium eine Übungsaufgabe bekommen.
Aufgabenstellung habe ich mal Angehängt, dazu habe ich eine Datensatz in Excel bekommen.
Diesen Datensatz einzulesen ist kein Problem.
Wo ich nicht weiterkomme ist: das erstellen des 95% Progressionsintervall.
Davor muss ich ja eine Lineare Regression machen. Pizza <-lm( #abhängige Variable ~ #unabhängige Variable, #Datensatz. Nur was ist aus dem vorhandenen Datensatz die abhängige und was die unabhängige. Als abhängige Variable hätte ich jetzt die "Bewertung" genommen??
Das 95% Prognoseintervall ist ja : predict(Pizza,?????????) und dann weiß ich nicht mehr wie es weiter geht.
Kann mir hier jemand Tipps geben bzw. helfen???
Re: Problem mit R Studio Lineare Regression
Hallo EinsZwo,
die Daten, die Du da als Excel bekommen hast können wir als Screenshot schlecht zum Ausprobieren nutzen, daher wäre es hilfreich, wenn Du beim nächsten Post computerlesbare, für R aufbereitete Beispieldaten posten könntest. Wege dahin findest Du hier: viewtopic.php?f=20&t=11
Ansonsten sehe ich das wie Du, dass
die richtige Anordnung der Spalten in einer linearen Regression wären. Die sollten dann aber als factor eingelesen werden, damit R automatisch eine Dummycodierung vornehmen kann. Ob man für diese Aufgabe unbedingt eine lineare Regression rechnen muss, weiß ich nicht, aber wenn Ihr die gerade durchnehmt, dann wird das so schon gemeint sein. (Man könnte ja auch einfach mit which.max die höchsten bewertung-Werte heraussuchen, aber Hausaufgqaben erledigt man so, wie Lehrer die Hausaufgaben erledigt haben wollen.)
Bevor Du predict verwendest musst Du erst entscheiden, welches die bestschmeckende Kombination ist.
Eine Prognose danach aus zwei Beobachtungen zu rechnen erscheint mir persönlich unverhältnismäßig, aber es ist ja nur eine Übungsaufgabe.
LG,
Bernhard
die Daten, die Du da als Excel bekommen hast können wir als Screenshot schlecht zum Ausprobieren nutzen, daher wäre es hilfreich, wenn Du beim nächsten Post computerlesbare, für R aufbereitete Beispieldaten posten könntest. Wege dahin findest Du hier: viewtopic.php?f=20&t=11
Ansonsten sehe ich das wie Du, dass
Code: Alles auswählen
lm(bewertung ~ mehl + salz + backpulver, data=???)
Bevor Du predict verwendest musst Du erst entscheiden, welches die bestschmeckende Kombination ist.
Eine Prognose danach aus zwei Beobachtungen zu rechnen erscheint mir persönlich unverhältnismäßig, aber es ist ja nur eine Übungsaufgabe.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Problem mit R Studio Lineare Regression
Ich weiß zwar nicht was ein Progressions Interval ist, aber vermutlich brauchst du 'interval="predict"' (fängt zumindest mit den gleichen 2 Buchstaben an).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
.
Re: Problem mit R Studio Lineare Regression
In der Aufgabenstellung steht Prognoseintervall.
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Problem mit R Studio Lineare Regression
Stimmt hab es im Text falsch geschrieben. Soll das 95% Prognoseintervall sein.
Ja leider müssen wir es so kompliziert machen. Da wir dann beantworten sollen: Daten einlesen, dann wie man Daten Modelliert und dann die optimale Einstellung für Mehl, Salz, Backpulver. Und dann noch die Prognose ( 95% Prognoseintervall )
Ich probiere es Daheim dann gleich mal aus, und schau ob ich auch die Prognose hinbekomme.
Wenn ich für die Lineare Regression dies so eingebe:
Pizza1 <- lm(bewertung ~ mehl + salz + backpulver, data=Pizza)
plotModel (Pizza1) --> zum Darstellen?
dann sollte mein 95% Prognoseintervall ( falls ich es richtig verstanden habe ) so aussehen:
predict(Pizza1, newdata = data.frame( Bewertung = 10), interval = "prediction") ??
Ja leider müssen wir es so kompliziert machen. Da wir dann beantworten sollen: Daten einlesen, dann wie man Daten Modelliert und dann die optimale Einstellung für Mehl, Salz, Backpulver. Und dann noch die Prognose ( 95% Prognoseintervall )
Ich probiere es Daheim dann gleich mal aus, und schau ob ich auch die Prognose hinbekomme.
Wenn ich für die Lineare Regression dies so eingebe:
Pizza1 <- lm(bewertung ~ mehl + salz + backpulver, data=Pizza)
plotModel (Pizza1) --> zum Darstellen?
dann sollte mein 95% Prognoseintervall ( falls ich es richtig verstanden habe ) so aussehen:
predict(Pizza1, newdata = data.frame( Bewertung = 10), interval = "prediction") ??
- Dateianhänge
-
- Pizza.csv
- (967 Bytes) 54-mal heruntergeladen
Re: Problem mit R Studio Lineare Regression
Das sollte kein Problem sein.
Wenn die Variablen im Datensatz alle klein geschrieben werden, solltest Du dabei bleiben und pizza1 auch klein schreiben. plotModel ist keine Standard-R-Funktion. Wir können vermuten, dass Du das Paket mosaic verwendest, aber es ist nicht gut, wenn wir über Code Vermutungen anstellen müssen. Es kommt schon auch mal vor, dass identische Funktionsnamen in verschiedenen Paketen verschieden definiert werden. Deshalb bitte immer den library oder require-Aufruf dazu posten, wenn nötig.Code: Alles auswählen
Pizza1 <- lm(bewertung ~ mehl + salz + backpulver, data=Pizza) plotModel (Pizza1) --> zum Darstellen?
Nö. Erstens kommen gar keine Bewertungen bis 10 vor (gehen nur bis 5,9...) und zweitens will predict die unabhängigen Variablen sehen, nicht die abhängigen. Außerdem hast Du Bewertung hier großgeschrieben, im Datensatz aber kleingeschrieben. Da musst Du gut aufpassen, da ist R kleinlich:dann sollte mein 95% Prognoseintervall ( falls ich es richtig verstanden habe ) so aussehen:
Code: Alles auswählen
predict(Pizza1, newdata = data.frame( Bewertung = 10), interval = "prediction") ??
Code: Alles auswählen
> a <- 1
> A <- a+1
> cat(a)
1
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Problem mit R Studio Lineare Regression
Ah ok .Ich verwende "mosaic" Ja das mit dem kleinschreiben ist als Konstrukteur der nicht viel mit R Studio zutun hat so eine Sachen Hab schon öfters Fehler gesucht in R und dann war es an der Groß und Kleinschreibung gehangen.
Ich hab mich jetzt mal daheim hingesetzt und das so Versucht.
Ich habe die Daten eingelesen und dann einen Plot gemacht.
Irgendwie schaut der Plot komisch aus ( keine lineare Linie ). Auf der Y-Achse habe ich die bewertung, auf der X-Achse steht aber nur mehl. Oder ist das normal??
Wenn ich über summary das dann auslese steht wieder mehl , salz, backpulver drin.
Im Unterricht haben wir das ganze immer nur mit einem Wert auf der Y und einem Wert auf der X-Achse gemacht.
Beim Predict bringt er mir immer einen Fehler.
Im Skript steht der Befehl so drin:
Punktprognose inkl. 95%-Prognoseintervall
Wo liegt beim Plot mein Fehler? Ich bin mein Skript auch nochmal durchgegangen, aber da steht nicht wirklich was Hilfreiches drin.
LG,
Michael
Ich hab mich jetzt mal daheim hingesetzt und das so Versucht.
Ich habe die Daten eingelesen und dann einen Plot gemacht.
Irgendwie schaut der Plot komisch aus ( keine lineare Linie ). Auf der Y-Achse habe ich die bewertung, auf der X-Achse steht aber nur mehl. Oder ist das normal??
Wenn ich über summary das dann auslese steht wieder mehl , salz, backpulver drin.
Im Unterricht haben wir das ganze immer nur mit einem Wert auf der Y und einem Wert auf der X-Achse gemacht.
Beim Predict bringt er mir immer einen Fehler.
Im Skript steht der Befehl so drin:
Punktprognose inkl. 95%-Prognoseintervall
Code: Alles auswählen
predict(erglm1, # Modell
# Neue Beobachtung mit x=10: newdata = data.frame(RotorL = 10),
# Prognoseintervall: interval = "prediction")
LG,
Michael
Re: Problem mit R Studio Lineare Regression
Konsequent immer alles klein und dann kann das nicht mehr vorkommen.
Schwer zu sagen. Ich kenne diese Funktion nicht und so ganz toll dokumentiert ist das in der Anleitung nicht. Es ist halt auch schwer, drei Prädiktoren auf der x-Achse gleichzeitig abzubilden.Irgendwie schaut der Plot komisch aus ( keine lineare Linie ). Auf der Y-Achse habe ich die bewertung, auf der X-Achse steht aber nur mehl. Oder ist das normal??
Eben, da steht ein x-Wert, kein y-Wert..
Im Skript steht der Befehl so drin:
Punktprognose inkl. 95%-Prognoseintervall
Code: Alles auswählen
predict(erglm1, # Modell # Neue Beobachtung mit x=10: newdata = data.frame(RotorL = 10),
Ich als Mensch verstehe Dein predict-Kommando auch nicht, also das in dem Screenshot. In Deiner Aufgabe steht doch die Frage, welche Kombination aus Salz, Wasser und Backpulver die besten Ergebnisse bringt. Das ist der nächste Schritt.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Problem mit R Studio Lineare Regression
In unserem Skript haben wir auch nur das Beispiel anhand der Flügellänge eines Papierhelikopters. Längere Flügellänge = längere Flugzeit. Und das Fach Grundlagen Statistik haben wir auch nur 9 x je 3 Stunden und davon sind vll, 4x mit R Studio. Die Prüfung ist auch nicht über R Studio sondern über Statistik allgemein.
Da ist diese Übungsaufgabe schon kompliziert, bzw. ich denke falsch ^^
Wie würdet ihr den diese Aufgabe lösen bzw. rangehen? Damit ich vll. verstehe wo mein Denkfehler ist.
LG
Michael
Da ist diese Übungsaufgabe schon kompliziert, bzw. ich denke falsch ^^
Wie würdet ihr den diese Aufgabe lösen bzw. rangehen? Damit ich vll. verstehe wo mein Denkfehler ist.
LG
Michael
Re: Problem mit R Studio Lineare Regression
Sag bitte nicht immer "RStudio" - die Programmiersprache, mit der Du die lineare Regression rechnen möchtest, nennt sich "R"!Problem mit R Studio Lineare Regression
Wikipedia sagt: "RStudio ist eine vom Unternehmen RStudio, Inc. angebotene, integrierte Entwicklungsumgebung und grafische Benutzeroberfläche für die statistische Programmiersprache R".
Zu "R" sagt Wikipedia: "R ist eine freie Programmiersprache für statistische Berechnungen und Grafiken."