Allgemeine Frage

Wie rufe ich R-Funktionen auf, wie selektiere ich Daten, ich weiß nicht genau ....

Moderatoren: EDi, jogo

Antworten
franzpeter

Allgemeine Frage

Beitrag von franzpeter »

Hallo,
ich hätte eine allgemeine Frage (bin Statistik-Anfänger).

Mal angenommen ich habe einen Datensatz der kontinuierlich eingehende Messwerte entlang einer Zeitachse beschreibt und ich lege zwei gleitende
Durchschnitte rein, z.B. 100er gleitender Durchschnitt und 13er gleitender Durchschnitt, die mit den eingehenden Daten mitlaufen. Ich möchte bei Eingang neuer Daten nun eine Aussage darüber machen können, mit welcher Wahrscheinlichkeit sich diese neuen Daten nun in eine bestimmte
Richtung entwickeln werden. Die Messwerte sind unabhängig voneinander.

Nun stelle ich an vergangenen Daten fest, dass meine Daten mit einer 30%igen Wahrscheinlichkeit für eine Dauer x oberhalb des 100er bleiben, sonst unterhalb des 100er liegen.

Weitern stelle ich fest, dass meine bisherigen Daten mit einer 60%igen Wahrscheinlichkeit für eine Dauer y oberhalb des 13er bleiben, sonst unterhalb
des 13er liegen (separat vom 100er gemessen).

Kann ich durch Kombination beider gleitender Durchschnitte nun irgendeine Verbesserung meiner Voraussage bewirken, d.h. würden sich hier Wahrscheinlichkeiten addieren oder müsste man diese multiplizieren ?

Wäre toll wenn Ihr dazu etwas sagen könntet. Danke im Voraus.
Curnen
Beiträge: 27
Registriert: Fr Nov 18, 2016 3:45 pm

Re: Allgemeine Frage

Beitrag von Curnen »

Also leider habe ich noch große Probleme damit, überhaupt die Ausgangssituation zu verstehen. Deshalb mal anhand des gleitenden 100er Durchschnitts:

Du hast also 100 aufeinanderfolgende Punkte über die du den Durchschnitt gebildet hast. Mit 30% Wahrscheinlichkeit liegt jetzt nur der 101. Punkt darüber oder der gleitende Durchschnitt der Punkte 2-101 ?

Ganz allgemein gesagt werden Wahrscheinlichkeiten zweier Ereignisse addiert, wenn man entweder das eine oder das andere Ereignis als "Erfolg" wertet und multipliziert, wenn sie zusammen eintreten müssen. Beispiel: Die Wahrscheinlichkeit mit einem Würfelwurf entweder eine 1 oder eine 2 zu Würfeln ist 1/3, nämlich 1/6 für eine 1 + 1/6 für eine 2. Die Wahrscheinlichkeit zuerst genaut eine 1 und dann genau eine 2 zu würfeln ist 1/36, nämlich erst 1/6 und dann erneut 1/6.
franzpeter

Re: Allgemeine Frage

Beitrag von franzpeter »

Hallo & danke erstmal. Der Kernthema ist folgendes: Ich habe Messwerte in einer Datenbank und jede Minute kommen weitere hinzu. Ich suche eine Methodik um eine Aussage machen zu können in welche Richtung sich die neuen Messwerte wohl aktuell entwickeln basierend auf den vorhandenen Daten. Je höher die wahrscheinlichkeit dass meine Aussage zutrifft, desto besser. Nun dachte ich ich kann die Zuverlässigkeit meiner Aussage irgendwie verbessern, indem ich statt einen gld mehrere nehme. Es muss aber kein gld sein, vielleicht gibt es ja bessere Instrumente für soetwas. Leider fehlt mir da die Erfahrung und ich bin fùr jeden Tipp dankbar. Generell verstehe ich den gld als Prognosemittel auch nicht so ganz, denn weshalb sollte es möglich sein anhand von Ereignissen in der Vergangenheit etwas ùber die Zukunft auszusagen .... andererseits macht die Wettervorhersage ja nichts anderes.
Curnen
Beiträge: 27
Registriert: Fr Nov 18, 2016 3:45 pm

Re: Allgemeine Frage

Beitrag von Curnen »

Wie einfach oder schwer das ist und welche Werkzeuge du brauchst hängt sehr davon ab, um was für Daten es sich handelt und wie viele Einflussfaktoren du erwartest.

Einen radioaktiven Zerfall beispielsweise kannst du in Kenntnis historischer Daten ziemlich gut in die Zukunft fortschreiben und das auch - relativ simpel - mit einer gefitteten Exponentialfunktion tun.

Den Börsenkurs einer Aktie als anderes Extrem dagegen wirst du basierend auf historischen Daten nur sehr unzureichend abbilden können, weil es Einflussfaktoren gibt die sich über die Zeit ändern (Wirtschaftszyklen und Umsatzzahlen oder Börsenhypes, die jeden Aktienkurs verdreifachen, sobald die Pressemeldung nur das Wort Blockchain enthält) und damit für eine historische Entwicklung wichtig, aber im zukünftigen Kontext unwichtig oder anders sein können.

Komplexere Zusammenhänge würde man dann vielleicht mit Modellen aus dem Caret Paket angehen.

Viel Erfolg!
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Allgemeine Frage

Beitrag von bigben »

franzpeter hat geschrieben: Mi Jan 10, 2018 9:49 pmKann ich durch Kombination beider gleitender Durchschnitte nun irgendeine Verbesserung meiner Voraussage bewirken, d.h. würden sich hier Wahrscheinlichkeiten addieren oder müsste man diese multiplizieren ?
Weder noch. Wahrscheinlichkeiten sind Werte zwischen 0 und 1 und wenn man sie miteinander multipliziert, ist das Ergebnis kleiner, nicht größer, als die Ausgangswerte. Wahrscheinlichkeiten kann man in der Regel nicht addieren - sonst käme man ganz schnell auf Werte größer 1,0 und die sind nicht sinnvoll.

Oder machen wir es an einem praktischen Beispiel: Ich vergesse, welcher Wochentag heute ist. Die Wahrscheinlichkeit, dass gestern Dienstag war ist 1/7. Die Wahrscheinlichkeit, dass vorgestern Montag war ist auch 1/7. Die Wahrscheinlichkeit, dass gestern Dienstag und vorgestern Montag war, ist weder 2/7 noch 1/49.
DAss man Wahrscheinlichkeiten addieren oder multiplizieren kann, kommt vor, erfordert dann aber in aller Regel, dass die Wahrscheinlichkeiten voneinander unabhängig sind. Und das sind sie in Deinem Beispiel ganz sicher nicht.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Allgemeine Frage

Beitrag von EDi »

Zunächst mal hast du eine zeitliche Abhängigkeit in deine Daten, die ich im Modell berücksichtigen würde und dir Infos geben kann, wie viele Information in den vorhergegangen Daten liegt.


Eine einfache Methode wäre auch die Steigung (+CI) deines smoother am Ende als vorhersage zu nehmen.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
Antworten