Plot-Diagramm bei Funktion

Alles zum Thema der beschreibenden Statistik

Moderator: jogo

Antworten
statistikanfaenger
Beiträge: 4
Registriert: Mo Apr 20, 2020 5:17 pm

Plot-Diagramm bei Funktion

Beitrag von statistikanfaenger »

Hallo liebes Forum,

ich übe gerade für eine Statistik-Prüfung und stehe mächtig auf dem Schlauch.

Mein Problem ist, dass ich folgende Variablen habe:
-Gehalt
-Ausbildung (ja/nein) => Dummy-Variable
-Führerschein (ja/nein) => Dummy-Variable

Ich habe jetzt folgende Funktion:
lm(Gehalt ~ Ausbildung + Führerschein)

Ich möchte also prüfen, ob das Gehalt davon abhängt, ob ich eine Ausbildung und einen Führerschein habe. Im Zuge der Regression müssen ja verschiedene Bedingungen geprüft werden und eine davon ist, ob Linearität vorliegt. Habe auch schon im Internet recherchiert, aber finde nur wenig dazu, wenn zwei Dummyvariablen genutzt werden und nichts metrisches.

Wenn ich für die Funktion jetzt grafisch prüfen möchte, ob Linearität vorliegt, komm ich aber nicht weiter.

Ich würde da die plot-Funktion nehmen, aber weiß nicht ob das stimmt.
Wenn ich plot(Gehalt ~ Ausbildung + Führerschein, data=xyz) eingebe, steht unten nur "Hit <Return> to see next plot: "

Mache ich irgendwas falsch?
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Plot-Diagramm bei Funktion

Beitrag von bigben »

Was heißt Linearität bei dichotomen Prädiktoren? Es könnte sein, dass der Effekt von Führerschein und Ausbildung zusammen größer ist als die Summe beider Teileffekte. Das würde ein Interaktionsterm aufklären können.

LG, Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
statistikanfaenger
Beiträge: 4
Registriert: Mo Apr 20, 2020 5:17 pm

Re: Plot-Diagramm bei Funktion

Beitrag von statistikanfaenger »

Hmm, das macht mich jetzt noch ratloser o_0.

Wie gehe ich dann jetzt vor, wenn ich das grafisch überprüfen möchte?
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Plot-Diagramm bei Funktion

Beitrag von ruppy »

Du hast zwei Dummy-Variablen, d.h. es gibt kein "Mehr" an Führerschein haben, entweder "ja" oder "nein".
Linear könnte z.B. sein: mit steigender Anzahl an Ausbildungsjahren steigt das Gehalt linear an.

Plotte das ganze doch stattdessen einfach mal als Säulen- oder Balkendiagramm (1 Balken für Führerschein "ja" und 1 Balken für Führerschein "nein" und dann jeweils Mittelwerte für das Einkommen).

Oder google doch mal die Begriffe t-test bzw. ANOVA.

BG ruppy
statistikanfaenger
Beiträge: 4
Registriert: Mo Apr 20, 2020 5:17 pm

Re: Plot-Diagramm bei Funktion

Beitrag von statistikanfaenger »

Was meinte bigben denn mit seinem Interaktionsterm?

Könnte ich, wenn ich es trotzdem grafisch mit einem Plot-Diagramm darstellen wollen würde so machen:
ggplot(xyz, aes(x = führerschein + Ausbildung , y = Gehalt)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, size = 0.5)
ruppy
Beiträge: 41
Registriert: Mo Nov 04, 2019 10:05 pm

Re: Plot-Diagramm bei Funktion

Beitrag von ruppy »

Interaktionsterm z.B. wenn der Effekt von Führerschein vorhanden davon bedingt wird, dass Ausbildung abgeschlossen wurde.
Plot-Diagramm ist redundant. Mit Plot ist Diagramm gemeint.

Schau doch mal was dabei rauskommt wenn du den Plot so erstellst und ob du das als sinnvoll empfindest.

Wie gesagt google doch mal die Begriffe, die ich dir genannt habe ;)

Vllt. auch mal ANOVA & Interaktionsterm
statistikanfaenger
Beiträge: 4
Registriert: Mo Apr 20, 2020 5:17 pm

Re: Plot-Diagramm bei Funktion

Beitrag von statistikanfaenger »

ruppy hat geschrieben: Mo Apr 20, 2020 7:13 pm Interaktionsterm z.B. wenn der Effekt von Führerschein vorhanden davon bedingt wird, dass Ausbildung abgeschlossen wurde.
Plot-Diagramm ist redundant. Mit Plot ist Diagramm gemeint.

Schau doch mal was dabei rauskommt wenn du den Plot so erstellst und ob du das als sinnvoll empfindest.

Wie gesagt google doch mal die Begriffe, die ich dir genannt habe ;)

Vllt. auch mal ANOVA & Interaktionsterm
Die Begriffe abgesehen von Interaktionsterm sagen mir schon was :D.
Es geht mir ja nur darum, ob das Vorgehen richtig ist. Ob das Diagramm dann sinnvoll interpretierbar ist, ist mir erst mal egal. Zu sagen, es ist nicht sinnvoll interpretierbar aber das Vorgehen ist richtig, wäre ja auch ein Ergebnis. Nur wenn das Vorgehen falsch ist, kann ich das so ja nicht begründen.

Angenommen, wir hätten nicht zwei Dummy-Variablen, sondern:
Gehalt
Alter
Studienzeit.

Wie würde ich denn das auf Linearität prüfen? Im Internet nehmen die halt immer nur eine Variable und nicht zwei...
ggplot(xyz, aes(x = Studienzeit + Alter , y = Gehalt)) +
geom_point() +
geom_smooth(method = "lm", se = FALSE, size = 0.5)

Wäre das dann richtig (also mit dem "+" bei aes())
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Plot-Diagramm bei Funktion

Beitrag von bigben »

Der nächste wichtige Schritt für Dich sollte die Analyse der Residuen der Regression sein. Das funktioniert auch bei mehreren Prädiktoren. Schau zum Beispiel mal hier:

http://www.sthda.com/english/articles/3 ... ssentials/

https://www.qualtrics.com/support/stats ... egression/

Im weiteren Verlauf danach sind Interaktionsterme dann auch wichtig, aber Versuch erst das mit der Residuen Analyse zu verstehen.

LG, Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten