Verteilungstest auf Überprüfung anderer Formeln erweitern

Allgemeine Statistik mit R, die Test-Methode ist noch nicht bekannt, ich habe noch keinen Plan!

Moderatoren: EDi, jogo

Antworten
consuli
Beiträge: 479
Registriert: Mo Okt 10, 2016 8:18 pm

Verteilungstest auf Überprüfung anderer Formeln erweitern

Beitrag von consuli »

Hallo!

Ich stehe gerade vor einer ungeliebten Aufgabe, dass ich (bestimmte) Funktionsformeln einer Variablen (+Parameter) beweisen muss, die ich mit R ausgeminert habe.

Wegen meiner beschränkten Equivalenzumformungsfähigkeiten bin ich nun auf folgende "hervorragende" Ideenkette gekommen:
  1. Eine Dichtefunktion einer theoretischen Verteilung ist eigentlich auch nur eine Funktion. Das einzige an ihr spezielle ist, dass ihr Integral (von -inf bis +inf) 1 ist.
  2. Eine statistischer Verteilungstest testet, ob eine theoretische Verteilung, namnetlich ihre Dichtefunktion, zu emprischen Beobachtungen passt. Wenn sie gut zu den Beobachtungen passt, wird die Hypothese "die Beobachtungen sind XYZ-verteilt" angenommen.
  3. Wenn ich nun die zu beweisende Formel nehme, und zu ihr mit integrate() dass numerische Integral berechne und dadurch dividiere, bekomme ich eine Art genormte Pseudod-Dichtefunktion.
  4. In diese Pseudod-Dichtefunktion setze ich nun iterativ unterschiedliche Parameter ein, teile jeweils durch das numerische Integral und berechne Pseudobeobachtungswerte, z.B. 1000 Stück
  5. Für die 1000 Pseudobeobachtungswerte mache einen Verteilungstest
  6. Fällt dieser signifikant aus, ist die Formel nach statistischen Maßstäben bewiesen
Ich würde mir dadurch die ungeliebte Beweisarbeit durch mathematische Äquivalenzumformungen sparen und ein Mathematiker bekäme eine interessante mathematische Aufgabe.

Was haltet Ihr davon?

Gruß
Consuli
Irmgard.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Verteilungstest auf Überprüfung anderer Formeln erweitern

Beitrag von bigben »

Hallo consuli,

ich würde gerne ein paar Fragen los werden, ob ich die die Aufgabe verstehe.
consuli hat geschrieben: Fr Apr 20, 2018 1:02 pmIch stehe gerade vor einer ungeliebten Aufgabe, dass ich (bestimmte) Funktionsformeln einer Variablen (+Parameter) beweisen muss, die ich mit R ausgeminert habe.
Verstehe ich richtig: Du eine Variable beobachtet und hast zu der empirischen Verteilungsfunktion -mit nicht näher benannten Methoden- eine Hypothese aufgestellt, dass die Variable in Wirklichkeit einer Verteilungsfunktion folgt, die Du als Formel ausformuliert hast. Ist das die "Funktionsformel"?

Was genau willst Du nun beweisen? Anscheinend, dass die in dieser Formel gewählten Parameter gut gewählt sind?
[*] Eine Dichtefunktion einer theoretischen Verteilung ist eigentlich auch nur eine Funktion. Das einzige an ihr spezielle ist, dass ihr Integral (von -inf bis +inf) 1 ist.
Ja.

Code: Alles auswählen

[*] Eine statistischer Verteilungstest testet, ob eine theoretische Verteilung, namnetlich ihre Dichtefunktion, zu emprischen Beobachtungen passt. Wenn sie gut zu den Beobachtungen passt, wird die Hypothese "die Beobachtungen sind XYZ-verteilt" angenommen. 
Cum grano salis: Das Nicht-Ablehnen der Nullhypothese ist nicht das Annehmen der Gegenhypothese, aber wenn man das übliche Auge zudrückt: Ja.

Code: Alles auswählen

[*] Wenn ich nun die zu beweisende Formel nehme, und zu ihr mit integrate() dass numerische Integral berechne und dadurch dividiere, bekomme ich eine Art genormte Pseudod-Dichtefunktion.
Wenn ich richtig verstehe. Hier soll nur korrigiert werden, dass Deine ausgeminerte Verteilungsfunktion zu einer richtigen Verteilungsfunktion wird, indem das Integral auf 1 fixiert wird. Also war die ausgeminerte Funktion doch noch keine Verteilungsfunktion, kann aber leicht zu einer gemacht werden. Stimmt das soweit?

Code: Alles auswählen

[*] In diese Pseudod-Dichtefunktion setze ich nun iterativ unterschiedliche Parameter ein, teile jeweils durch das numerische Integral und berechne Pseudobeobachtungswerte, z.B. 1000 Stück
[*] Für die 1000 Pseudobeobachtungswerte mache einen Verteilungstest
[*] Fällt dieser signifikant aus, ist die Formel nach statistischen Maßstäben bewiesen
Warum jetzt plötzlich unterschiedliche Parameter und warum iterativ? Geht es um die Frage, ob die ganz oben bestimmten Parameter richtig sind und dass nicht andere, willkürlich gewählte Parameter besser passen? Willst Du zeigen, dass der Verteilungstest mit den ausgeminerten Parametern nicht signifikant wird, mit den anderen Parametern aber doch signifikant wird?
Was haltet Ihr davon?
Nun, offensichtlich habe ich es noch nicht verstanden und jede Haltung steht unter dem Vorbehalt, dass mir nicht ein sehr wesentliches Verständnis fehlt. Du versteckst unter dem Neologismus "ausgeminert" ein Verfahren zur Parameterbestimmung, an dessen Ergebnissen Du Zweifel ausräumen musst/willst (ob "beweisen" dafür eine glückliche Wortwahl ist, ist hier nicht das Thema). Davor würde ich anstelle Deiner Beweiskette suchen, ob es nicht ein Verfahren gibt, dessen Ergebnisse auch so anerkannt werden. Wenn das nicht geht: Den Ansatz, mit der von Dir bestimmten Funktion neue Daten zu simulieren und mit den beobachteten zu vergleichen, finde ich richtig gut. Eine Beweisführung durch multiples Durchführen von Signifikanztesten stellt mir initial erstmal die Nackenhaare auf. Einmal, weil multiples Testen viele Probleme aufwirft, zum anderen, weil dadurch eine Dichotomie geschaffen wird (Parameter passen zu den Beobachtungen oder aber nicht), wo es in Wirklichkeit keine Dichotomie gibt (Verteilungsparameter passen graduell besser oder schlechter zu Beobachtungen). Die Bayes-Jünger simulieren mittels MCMC Wahrscheinlichkeitsdichten von Parametern, die weder die künstliche Dichotomisierung in richtige und falsche Parameter noch die Probleme multiplen Testens mit sich bringen. Falls ich das Problem richtig verstanden habe, würde ich in die Richtung gehen.


Fazit: Wenn die anderen nichts schlaueres schreiben, würde ich Dich um eine Präzisierung des Problems bitten.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
consuli
Beiträge: 479
Registriert: Mo Okt 10, 2016 8:18 pm

Re: Verteilungstest auf Überprüfung anderer Formeln erweitern

Beitrag von consuli »

Ich glaube, es ist einfacher, wenn da mal einen "Köder" (schweizer-deutsch für Code :D ) aufsetze, und den dann poste. Dann versteht man es sicher besser. Dafür brauch ich aber nen bisschen Zeit.

Consuli
Irmgard.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Verteilungstest auf Überprüfung anderer Formeln erweitern

Beitrag von bigben »

Du hast natürlich Recht, dass Code meistens besser ist. Im Moment habe ich aber weniger Probleme mit Deiner Vorgehensweise, als beim Verstehen des zu lösenden Problems. Aber auch dabei würde ein konkretes Beispiel bestimmt helfen.

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten