Hallo
Ich habe ein Thema für meine Thesis gefunden und möchte nun den Einfluss verschiedener Faktoren auf die Aktienrendite von amerikanischen Unternehmen prüfen. Bevor ich eine Regressionsanalyse durchführen kann, müsste ich zunächst die Normalverteilung der Aktienrendite in R prüfen.. Wie kann ich das denn machen? Kann ich in R auch ein Normalverteilungsdiagramm ausgeben lassen?
Habt ihr allgemeine Tipps, was ich bei meinem Thema beachten muss oder welche Methoden gut geignet sind?
Lieben Dank im Voraus
Clara
Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R
Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R
Hallo Clara,
willkommen im Forum!
Und Du hast die Daten auch schon in R eingelesen?
Oft ist die Forderung nach normalverteilten Variablen zu scharf. Manchmal entspringt der Wunsch nach Prüfung auf Normalverteilung der irrigen Annahme, alles müsse normalverteilt sein, weil in einigen Beweisen zu einigen Verfahren für bestimmte statistische Variablen die Normalverteilung vorausgesetzt wird. Wenn man genau hinschaut, bezieht sich diese Voraussetzung jedoch nur auf die Residuen.
Als Tests auf Normalverteilung steht in R alles bereit, was die Statistik hergibt. Zu dem Nutzen der Test gibt es auch kritische Aussagen, z.B. bei wenig Daten kann H0 nicht abgelehnt werden und bei einer großen Anzahl wird H0 oft abgelehnt.
Wer es grafisch mag, kann einen Q-Q-Plot verwenden. https://de.wikipedia.org/wiki/Quantil-Quantil-Diagramm
R sollte das können.
Viele Grüße, Jörg
willkommen im Forum!
prima. Du hast die Daten schon?
Und Du hast die Daten auch schon in R eingelesen?
Hiermit hast Du ganz treffsicher eines der klassischen Streitthemen gefunden.Bevor ich eine Regressionsanalyse durchführen kann, müsste ich zunächst die Normalverteilung der Aktienrendite in R prüfen.. Wie kann ich das denn machen?
Oft ist die Forderung nach normalverteilten Variablen zu scharf. Manchmal entspringt der Wunsch nach Prüfung auf Normalverteilung der irrigen Annahme, alles müsse normalverteilt sein, weil in einigen Beweisen zu einigen Verfahren für bestimmte statistische Variablen die Normalverteilung vorausgesetzt wird. Wenn man genau hinschaut, bezieht sich diese Voraussetzung jedoch nur auf die Residuen.
Als Tests auf Normalverteilung steht in R alles bereit, was die Statistik hergibt. Zu dem Nutzen der Test gibt es auch kritische Aussagen, z.B. bei wenig Daten kann H0 nicht abgelehnt werden und bei einer großen Anzahl wird H0 oft abgelehnt.
Wer es grafisch mag, kann einen Q-Q-Plot verwenden. https://de.wikipedia.org/wiki/Quantil-Quantil-Diagramm
Wie soll so ein Diagramm aussehen?Kann ich in R auch ein Normalverteilungsdiagramm ausgeben lassen?
R sollte das können.
Der erste Schritt, der oft unterschätzt wird, ist das Einlesen der Daten.Habt ihr allgemeine Tipps, was ich bei meinem Thema beachten muss oder welche Methoden gut geignet sind?
Viele Grüße, Jörg
Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R
Hallo clara92,
mein Tipp setzt einen anderen Schwerpunkt als Jörgs: Überstürze nicht das Besorgen von Daten und das Einlesen in R, sondern mach Dir sehr genaue Gedanken darum, welche Fragen Du mit welchen Daten und welchen Verfahren beantworten möchtest. Ich weiß nicht, ob Du Dich in eine Zeitreihenanalyse oder in eine Paneldatenanalyse stürzen, oder einfach nur Korrelationen rechnen möchtest. Das eine wäre durchaus leicht, das andere kann schnell kompliziert werden. Kläre rechtzeitig, welche Anforderungen an Deine Arbeit, insbesondere an den Statistikteil, gestellt werden und fange die Arbeit erst an, wenn Du einen klaren Blick auf diese Dinge hast und Dich selbst kritisch geprüft hast.
Die Frage, ob R dieses oder jenes kann ist bis auf weiteres nicht relevant. Faustregel: Wenn Du es in drei Monaten lernen kannst, kann R das schon lang.
Bei der praktischen Umsetzung mit R hat jogo dann schon Recht: Beim Einlesen der Daten werden oft Fehler gemacht und übersehen, die später Verwirrung stiften. Da helfen wir Dir dann aber auch. Erwarte aber im Forum keinen wirtschaftswissenschaftlichen Sachverstand: Was in diesem Bereich übliches und unübliches Vorgehen ist, ob dieses oder jenes akzeptiert wird und wie man das traditionell berichtet, darüber weiß hier jemand was oder auch nicht. sachwissenschaftliche Kenntnisse müssen von Dir kommen.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R
Hallo ihr beiden
Danke schon mal für eure hilfreichen Antworten.
Ich habe bereits alle Daten in einer Excel Datei gesammelt, aber noch nichts in r eingelesen. Es hängt schon an Problemen wie die Daten überhaupt geordnet sein müssen. Da bin ich noch dabei mir r Handbücher durchzulesen und Videos auf youtube dazu anzuschauen.
Der allgemeine Teil der Arbeit ist so gut wie fertig, also Begriffserklärungen, Benennen der Variablen und das Aufstellen von Hypothesen.
Mein weiteres Vorgehen wäre eigentlich eine lineare Regression durchzuführen um die Hypothesen verwerfen/ beibehalten zu können. Hier hatte ich in einem meiner Vorlesungsskripts gelesen, dass die Normalverteilung Voraussetzung für valide Ergebnisse ist.
Ist das hier doch nicht erforderlich?? Bringt die Regression auch ohne Prüfung gute Ergebnisse?
Ich hatte mir eigentlich vorgestellt über r einen Graphen über die Normalverteilung zu erstellen, evtl ein Punktdiagramm, welches auf der x-achse die Aktienrendite abbildet und auf der y-achse die Häufigkeiten.
Über die weiteren Methoden würde ich mir eigentlich erst Gedanken machen, sobald ich weiß was die Regression für Ergebnisse liefert.
Liebe Grüße
Clara
Danke schon mal für eure hilfreichen Antworten.
Ich habe bereits alle Daten in einer Excel Datei gesammelt, aber noch nichts in r eingelesen. Es hängt schon an Problemen wie die Daten überhaupt geordnet sein müssen. Da bin ich noch dabei mir r Handbücher durchzulesen und Videos auf youtube dazu anzuschauen.
Der allgemeine Teil der Arbeit ist so gut wie fertig, also Begriffserklärungen, Benennen der Variablen und das Aufstellen von Hypothesen.
Mein weiteres Vorgehen wäre eigentlich eine lineare Regression durchzuführen um die Hypothesen verwerfen/ beibehalten zu können. Hier hatte ich in einem meiner Vorlesungsskripts gelesen, dass die Normalverteilung Voraussetzung für valide Ergebnisse ist.
Ist das hier doch nicht erforderlich?? Bringt die Regression auch ohne Prüfung gute Ergebnisse?
Ich hatte mir eigentlich vorgestellt über r einen Graphen über die Normalverteilung zu erstellen, evtl ein Punktdiagramm, welches auf der x-achse die Aktienrendite abbildet und auf der y-achse die Häufigkeiten.
Über die weiteren Methoden würde ich mir eigentlich erst Gedanken machen, sobald ich weiß was die Regression für Ergebnisse liefert.
Liebe Grüße
Clara
Re: Thema gefunden aber keine Ahnung zur Anwendung von Statistikmethoden in R
Das hängt allerdings auch schon davon ab, was Du danach mit den Daten tun möchtest. Es liegt in der Natur der Sache, dass wir hier die Daten so schnell wie möglich aus Excel herausbekommen und lieber in R weiter verarbeiten wollen. Excel ist einfach viel zu gefährlich.
Vorsicht bei einfachen Regressionen und Zeitreihen. Wenn das für Deinen Prof. in Ordnung ist, dann ist gut. Das entscheidende Problem ist hier nicht die Normalverteilung, sondern die fehlende Unabhängigkeit der Beobachtungen.Mein weiteres Vorgehen wäre eigentlich eine lineare Regression durchzuführen um die Hypothesen verwerfen/ beibehalten zu können.
Normalverteilung der Residuen ist eine sehr schöne Sache. Wenn die Residuen nicht normalverteilt sind, stimmen die Modellannahmen der linearen Regression nicht. Das bedeutet aber nicht, dass die unabhängigen oder abhängigen Variablen normalverteilt sein müssten. Ob die Residuen normalverteilt sind kannst Du erst untersuchen, wenn die Regression bereits durchgeführt wurde.Hier hatte ich in einem meiner Vorlesungsskripts gelesen, dass die Normalverteilung Voraussetzung für valide Ergebnisse ist.
Möglich, aber unsicher. Überprüfungen solltest Du nach der Regressionsrechnung unbedingt durchführen. Nur eben nicht auf Normalverteilung der UVs und AVs.Bringt die Regression auch ohne Prüfung gute Ergebnisse?
Kannst Du machen, solltest Du wahrscheinlich auch machen, ist aber zum Überprüfen der Normalverteilung längst nicht so gut geeignet, wie der von Jörg angesprochene Quantile-Quantile-Plot. (in R mit qqnorm()).Ich hatte mir eigentlich vorgestellt über r einen Graphen über die Normalverteilung zu erstellen, evtl ein Punktdiagramm, welches auf der x-achse die Aktienrendite abbildet und auf der y-achse die Häufigkeiten.
LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte