Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
clara92

Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R

Beitrag von clara92 »

Hallo :)

Ich habe ein Thema für meine Thesis gefunden und möchte nun den Einfluss verschiedener Faktoren auf die Aktienrendite von amerikanischen Unternehmen prüfen. Bevor ich eine Regressionsanalyse durchführen kann, müsste ich zunächst die Normalverteilung der Aktienrendite in R prüfen.. Wie kann ich das denn machen? Kann ich in R auch ein Normalverteilungsdiagramm ausgeben lassen?

Habt ihr allgemeine Tipps, was ich bei meinem Thema beachten muss oder welche Methoden gut geignet sind?

Lieben Dank im Voraus :)
Clara
jogo
Beiträge: 2086
Registriert: Fr Okt 07, 2016 8:25 am

Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R

Beitrag von jogo »

Hallo Clara,

willkommen im Forum!
clara92 hat geschrieben: Di Mai 23, 2017 5:09 pmIch habe ein Thema für meine Thesis gefunden und möchte nun den Einfluss verschiedener Faktoren auf die Aktienrendite von amerikanischen Unternehmen prüfen.
prima. Du hast die Daten schon?
Und Du hast die Daten auch schon in R eingelesen?
Bevor ich eine Regressionsanalyse durchführen kann, müsste ich zunächst die Normalverteilung der Aktienrendite in R prüfen.. Wie kann ich das denn machen?
Hiermit hast Du ganz treffsicher eines der klassischen Streitthemen gefunden.
Oft ist die Forderung nach normalverteilten Variablen zu scharf. Manchmal entspringt der Wunsch nach Prüfung auf Normalverteilung der irrigen Annahme, alles müsse normalverteilt sein, weil in einigen Beweisen zu einigen Verfahren für bestimmte statistische Variablen die Normalverteilung vorausgesetzt wird. Wenn man genau hinschaut, bezieht sich diese Voraussetzung jedoch nur auf die Residuen.
Als Tests auf Normalverteilung steht in R alles bereit, was die Statistik hergibt. Zu dem Nutzen der Test gibt es auch kritische Aussagen, z.B. bei wenig Daten kann H0 nicht abgelehnt werden und bei einer großen Anzahl wird H0 oft abgelehnt.
Wer es grafisch mag, kann einen Q-Q-Plot verwenden. https://de.wikipedia.org/wiki/Quantil-Quantil-Diagramm
Kann ich in R auch ein Normalverteilungsdiagramm ausgeben lassen?
Wie soll so ein Diagramm aussehen?
R sollte das können.
Habt ihr allgemeine Tipps, was ich bei meinem Thema beachten muss oder welche Methoden gut geignet sind?
Der erste Schritt, der oft unterschätzt wird, ist das Einlesen der Daten.

Viele Grüße, Jörg
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R

Beitrag von bigben »

clara92 hat geschrieben: Di Mai 23, 2017 5:09 pmHabt ihr allgemeine Tipps, was ich bei meinem Thema beachten muss
Hallo clara92,

mein Tipp setzt einen anderen Schwerpunkt als Jörgs: Überstürze nicht das Besorgen von Daten und das Einlesen in R, sondern mach Dir sehr genaue Gedanken darum, welche Fragen Du mit welchen Daten und welchen Verfahren beantworten möchtest. Ich weiß nicht, ob Du Dich in eine Zeitreihenanalyse oder in eine Paneldatenanalyse stürzen, oder einfach nur Korrelationen rechnen möchtest. Das eine wäre durchaus leicht, das andere kann schnell kompliziert werden. Kläre rechtzeitig, welche Anforderungen an Deine Arbeit, insbesondere an den Statistikteil, gestellt werden und fange die Arbeit erst an, wenn Du einen klaren Blick auf diese Dinge hast und Dich selbst kritisch geprüft hast.
Die Frage, ob R dieses oder jenes kann ist bis auf weiteres nicht relevant. Faustregel: Wenn Du es in drei Monaten lernen kannst, kann R das schon lang.

Bei der praktischen Umsetzung mit R hat jogo dann schon Recht: Beim Einlesen der Daten werden oft Fehler gemacht und übersehen, die später Verwirrung stiften. Da helfen wir Dir dann aber auch. Erwarte aber im Forum keinen wirtschaftswissenschaftlichen Sachverstand: Was in diesem Bereich übliches und unübliches Vorgehen ist, ob dieses oder jenes akzeptiert wird und wie man das traditionell berichtet, darüber weiß hier jemand was oder auch nicht. sachwissenschaftliche Kenntnisse müssen von Dir kommen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
clara92

Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R

Beitrag von clara92 »

Hallo ihr beiden :)

Danke schon mal für eure hilfreichen Antworten.
Ich habe bereits alle Daten in einer Excel Datei gesammelt, aber noch nichts in r eingelesen. Es hängt schon an Problemen wie die Daten überhaupt geordnet sein müssen. Da bin ich noch dabei mir r Handbücher durchzulesen und Videos auf youtube dazu anzuschauen.

Der allgemeine Teil der Arbeit ist so gut wie fertig, also Begriffserklärungen, Benennen der Variablen und das Aufstellen von Hypothesen.
Mein weiteres Vorgehen wäre eigentlich eine lineare Regression durchzuführen um die Hypothesen verwerfen/ beibehalten zu können. Hier hatte ich in einem meiner Vorlesungsskripts gelesen, dass die Normalverteilung Voraussetzung für valide Ergebnisse ist.
Ist das hier doch nicht erforderlich?? Bringt die Regression auch ohne Prüfung gute Ergebnisse?
Ich hatte mir eigentlich vorgestellt über r einen Graphen über die Normalverteilung zu erstellen, evtl ein Punktdiagramm, welches auf der x-achse die Aktienrendite abbildet und auf der y-achse die Häufigkeiten.

Über die weiteren Methoden würde ich mir eigentlich erst Gedanken machen, sobald ich weiß was die Regression für Ergebnisse liefert.

Liebe Grüße
Clara
bigben
Beiträge: 2778
Registriert: Mi Okt 12, 2016 9:09 am

Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R

Beitrag von bigben »

clara92 hat geschrieben: Mi Mai 24, 2017 10:02 am Es hängt schon an Problemen wie die Daten überhaupt geordnet sein müssen.
Das hängt allerdings auch schon davon ab, was Du danach mit den Daten tun möchtest. Es liegt in der Natur der Sache, dass wir hier die Daten so schnell wie möglich aus Excel herausbekommen und lieber in R weiter verarbeiten wollen. Excel ist einfach viel zu gefährlich.
Mein weiteres Vorgehen wäre eigentlich eine lineare Regression durchzuführen um die Hypothesen verwerfen/ beibehalten zu können.
Vorsicht bei einfachen Regressionen und Zeitreihen. Wenn das für Deinen Prof. in Ordnung ist, dann ist gut. Das entscheidende Problem ist hier nicht die Normalverteilung, sondern die fehlende Unabhängigkeit der Beobachtungen.
Hier hatte ich in einem meiner Vorlesungsskripts gelesen, dass die Normalverteilung Voraussetzung für valide Ergebnisse ist.
Normalverteilung der Residuen ist eine sehr schöne Sache. Wenn die Residuen nicht normalverteilt sind, stimmen die Modellannahmen der linearen Regression nicht. Das bedeutet aber nicht, dass die unabhängigen oder abhängigen Variablen normalverteilt sein müssten. Ob die Residuen normalverteilt sind kannst Du erst untersuchen, wenn die Regression bereits durchgeführt wurde.
Bringt die Regression auch ohne Prüfung gute Ergebnisse?
Möglich, aber unsicher. Überprüfungen solltest Du nach der Regressionsrechnung unbedingt durchführen. Nur eben nicht auf Normalverteilung der UVs und AVs.
Ich hatte mir eigentlich vorgestellt über r einen Graphen über die Normalverteilung zu erstellen, evtl ein Punktdiagramm, welches auf der x-achse die Aktienrendite abbildet und auf der y-achse die Häufigkeiten.
Kannst Du machen, solltest Du wahrscheinlich auch machen, ist aber zum Überprüfen der Normalverteilung längst nicht so gut geeignet, wie der von Jörg angesprochene Quantile-Quantile-Plot. (in R mit qqnorm()).

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten