Aufgabe zu linearer Regression

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

sharewood

Aufgabe zu linearer Regression

Beitrag von sharewood »

Hallo zusammen,

im Rahmen meiner Hausarbeit bin ich auf euer Forum gestoßen.
Ich muss einen Katalog von 6 Aufgaben lösen. Die ersten 5 Aufgaben sind gelöst, bei der letzten folgenden Aufgabe benötige ich bitte mal eure Hilfe für einen Lösungsansatz:

Untersuchen Sie mit Hilfe zweier getrennter linearer Regressionen, wer das Gewicht besser einschätzen kann, Männer oder Frauen?

Der Datensatz umfasst die relevanten Variablen: Geschlecht (sex), Gewicht (weight), selbst eingeschätztes Gewicht (repwt)

Welcher Test kann hier angewandt werden?

Vielen Dank vorab für Eure Hilfe.

Sharewood
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Aufgabe zu linearer Regression

Beitrag von EDi »

Welcher Test kann hier angewandt werden?
Verstehe nicht wie du von der Aufgabenstellung zu einem "Test" kommst...

Ich würde einfach die zwei Regressionen fitten und mir den Standardfehler der Residuen anschauen (als Maß für die Präzision der Schätzung, je größer die Streuung, desto schlechter die Genauigkeit der Einschätzung.).
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
sharewood

Re: Aufgabe zu linearer Regression

Beitrag von sharewood »

Sorry, "Test" ist in der Tat mißverständlich gewesen. Auswertung hätte es vielleicht besser getroffen.

Danke für die Rückmeldung.
Habe nun zuerst die Teilmengen bestimmt und je Teilmenge (Geschlecht) die lineare Regression durchgeführt.

Folgende Ausgabe für die Frauen ist das Ergebnis:

> RegModel.11 <- lm(weight~repwt, data=Frauen)
> summary(RegModel.11)
Call:
lm(formula = weight ~ repwt, data = Frauen)
Residuals:
Min 1Q Median 3Q Max
-5.5197 -0.7523 -0.3722 0.6221 6.3895
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1.76785 1.75321 1.008 0.316
repwt 0.97731 0.03068 31.857 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

Residual standard error: 2.067 on 98 degrees of freedom
(11 observations deleted due to missingness)
Multiple R-squared: 0.9119, Adjusted R-squared: 0.911
F-statistic: 1015 on 1 and 98 DF, p-value: < 2.2e-16


Kann ich hier bereits den Standardfehler des Residuums erkennen und mit der anderen Ausgabedatei der Männer vergleichen?

Danke dir vorab :D
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Aufgabe zu linearer Regression

Beitrag von bigben »

> Kann ich hier bereits den Standardfehler des Residuums erkennen

Ja, dort wo Residual standard error in der Ausgabe steht.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
sharewood

Re: Aufgabe zu linearer Regression

Beitrag von sharewood »

Klasse, danke für deine Rückmeldung!
MrSerious

Re: Aufgabe zu linearer Regression

Beitrag von MrSerious »

Müsste man nicht das Intercept der beiden Datensätze (Frauen & Männer) miteinander vergleichen bzw. dieses Standardisieren um einen Vergleich möglich zu machen? Um anschließend über Beta1 den Erklärungsgrad der unabhängigen Variable auf die abhängige interpretieren zu können ?!?
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Aufgabe zu linearer Regression

Beitrag von bigben »

Hi,

das mit dem Intercept habe ich ohne Begründung nicht verstanden. Sicher könnte man in der einen oder der anderen Weise noch Anpassungen machen. Dazu müsste sharewood aber erst definieren, was er unter `besser` versteht. Ob absolute oder relative Fehler zählen, ist ja zunächst einmal offen geblieben und so hat EDi sich das Bequemste heraus gesucht.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
MrSerious

Re: Aufgabe zu linearer Regression

Beitrag von MrSerious »

Hi,
vielen Dank für deine schnelle Antwort.
Wir sitzen (zufällig) an der Lösung des gleichen Problems.

Ziel ist es sowohl die Regression für die Daten der Männer, als auch die der Frauen den Mittelwert gleich 0 und die Varianz gleich 1 zu setzen, um den Einfluss der erklärenden Variablen (geschätztes Gewicht) auf die abhängige Variable (tatsächliches Gewicht) zu bestimmen.
Um anschließend als Antwort formulieren zu können, ob Männer oder Frauen Ihr Gewicht besser einschätzen können.

Wir wissen jedoch leider nicht wir das korrekt in R umsetzen können.


Vielen Dank
bigben
Beiträge: 2781
Registriert: Mi Okt 12, 2016 9:09 am

Re: Aufgabe zu linearer Regression

Beitrag von bigben »

Hi!
MrSerious hat geschrieben: Mo Jun 12, 2017 8:08 pmWir sitzen (zufällig) an der Lösung des gleichen Problems.
So, so.
Ziel ist es sowohl die Regression für die Daten der Männer, als auch die der Frauen den Mittelwert gleich 0 und die Varianz gleich 1 zu setzen,
Das ist wohl eher kein Ziel, vielleicht ein Rechenweg. Dieser Satz hat zwei Subjekte, was etwas verwirrend ist, weil man eine Regression gar nicht gleich Null setzen kann. Bitte gebt doch die Fragestellung vollständig so ein, wie sie da steht, damit wir nicht nochmal eine Aufgabe lösen, die so gar nicht gestellt worden ist.
Wir wissen jedoch leider nicht wir das korrekt in R umsetzen können.
Ihr wisst, dass Ihr von den Werten der Männer die Durchschnittswerte der Männer abziehen und dann durch die Varianz teilen sollt. Wo steckt ihr nun fest? Wie weit kommt Ihr selbst, wo genau braucht Ihr Hilfe?

Kleiner Tipp vorneweg:

Code: Alles auswählen

help(scale)
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
MrSerious

Re: Aufgabe zu linearer Regression

Beitrag von MrSerious »

Guten Morgen Bernhard,

vielen Dank schon einmal für den Tipp.
Die Aufgabenstellung lautet: Untersuchen Sie mit Hilfe zweier getrennter linearer Regressionen, wer das Gewicht besser einschätzen kann, Männer oder Frauen. Hierzu haben wir die abhängige Variable (tatsächliches Gewicht) und die unabhängige Variable (geschätztes Gewicht) für den jeweiligen Datensatz Männer bzw. Frauen.
Unsere Idee (die auch durch einen kleinen Hinweis des Profs gesteuert wurde) Regressionskoeffizienten standardisieren, um den Einfluss der unabhängigen Variablen (geschätztes Gewicht) auf die abhängige Variable (tatsächliches Gewicht) jeweils für den Datensatz der Männer bzw. Frauen messen zu können, um dann im Anschluss die Frage beantworten zu können, welche Gruppe das Gewicht besser einschätzen kann.

Unseren Recherchen nach (und auch dem folgenden Wikipedia-Artikel zu dem Thema: https://de.wikipedia.org/wiki/Regressionskoeffizient) müsste dies durch Standardisierung erfolgen, so dass im Anschluss der Mittelwert 0 und die Varianz 1 ist.

Leider bekommen wir diese Standardisierung auch nach mehrfachen Versuchen nicht in R umgesetzt.

Daher die Bitte um Unterstützung. Vielen Dank im Voraus!

Freundliche Grüße
Antworten