Dichte fitten - Welche bzw. wie die richtige finden?

Modelle zur Korrelations- und Regressionsanalyse

Moderator: EDi

Antworten
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von schubbiaschwilli »

Gude!

Mir geht es wie jedem Statistiker (ok, ich bin keiner): Ich suche die richtige - Dichtefunktion. Ich habe eine Funktion, die (einige, aber nicht alle) Eigenschaften einer Dichte hat (aber keine ist - Was ich aber beheben kann), und suche nun eine Dichtefunktion, an die ich meine Funktion fitten kann. Jetzt habe ich angefangen, und einige Dichtefunktionen ausprobiert (also ganz klassisch die Abstandsquadrate minimiert usw.) und auch sonst mal gesucht (und fitdistrplus mit den Cullen-Frey-Plots gefunden - Nettes Zeug) - Aber nichts, was mir das ausprobieren jeder einzelnen Dichte erspart - Kennt jemand da vielleicht was?

Dank&Gruß
Schubbiaschwilli
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von Athomas »

Hmm, "fitdistrplus" fittet offenbar (korrigiere mich, wenn ich irre) Verteilungen - und keine Dichten. Der Unterschied ist bekannt?
Ansonsten wäre es natürlich schön, wenn Du ein paar Details über die Natur Deines Problems verraten könntest...
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von schubbiaschwilli »

Gude!

Nachtrag: Mit Funktion meine ich einzelne Punkte - Sieht man aber gleich.

Ich hab' mit Monte-Carlo-Simulation Dinge simuliert (je K ein paar Durchläufe), und schaue mir nun die Fehler an; dazu habe ich einen Plot mit den Standardabweichung der Fehler in Abhängigkeit von K erzeugt. Da ich weiß, dass die Kurve für K->0 gegen 0 läuft, und für steigendes K dem Anschein nach auch gegen 0, und halt den Plot sehe, möchte ich halt mal ausprobieren, ob eine Dichte das Ding trifft - Lognormal, Chi^2, Weibull, Gamma, Beta... - Deswegen die Frage, ob es vielleicht ein Paket gibt, das genau das kann.

Hier die Daten mit einer (modifizierten) Chi^2-Dichte:
Rplot.png
Rplot.png (3.63 KiB) 897 mal betrachtet
Dank&Gruß
schubbiaschwilli
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von Athomas »

Ich glaube nicht, dass es ist eine gute Idee ist, aufgrund einer optischen Ähnlichkeit den Suchraum für die Approximation so stark einzuschränken - zumal ich nicht erkennen kann, dass dadurch irgendetwas einfacher wird!
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von schubbiaschwilli »

Gude!

Naja, die Funktionswerte, die ich habe, haben nun mal (sicher) ein paar Eigenschaften, die einige Verteilungen bzw. deren Dichten haben (speziell stetige Verteilungen mit halboffenem Intervall) - Das ist zum einen schon ziemlich viel an Information, und zum anderen denke ich, dass mir eine orientierungslose Suche nach ein paar Polynomen da auch nicht weiterhilft.

Dank&Gruß
schubbiaschwilli
Athomas
Beiträge: 769
Registriert: Mo Feb 26, 2018 8:19 pm

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von Athomas »

Da möchte ich mit Deinem Landsmann Goethe sagen: "Erlaubt ist, was gefällt!" :lol:
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von schubbiaschwilli »

Gude!

Und Antonio Montecatino so zu Torquato Tasso: "Was gelten soll, muss wirken und muss dienen."

Gumbel (jaja, mal was anderes) funktioniert auch ganz gut (siehe Plot) bzw. sogar etwas besser als Chi^2, aber es ist ein elendiges Gefrickel - Also kennt jemand vielleicht da was? Ich werde doch nicht der erste User sein, der die richtige Dichtefunktion sucht.

Dank&Gruß
Schubbiaschwilli
Plot.png
Plot.png (3.53 KiB) 857 mal betrachtet
bigben
Beiträge: 2780
Registriert: Mi Okt 12, 2016 9:09 am

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von bigben »

Hallo schubbiaschwilli,

vielleicht habe ich das Problem noch nicht richtig verstanden. Es gibt eine endliche und überschaubare Menge an Verteilungen in fitdistr oder fitdistrplus oder so und Du musst die alle durchprobieren, RSME berechnen und die mit dem kleinsten RMSE identifizieren. Das klingt erstmal so, als sollte sich die passende Funktion dazu leicht selbst schreiben lassen. Ich könnte mir vorstellen, dass sie im wesentlichen aus einer for-Schleife mit der jeweiligen Verteilung als Laufvariable besteht.
Worin besteht denn das eigentliche Problem?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
schubbiaschwilli
Beiträge: 253
Registriert: Di Jun 27, 2017 12:09 pm

Re: Dichte fitten - Welche bzw. wie die richtige finden?

Beitrag von schubbiaschwilli »

Gude!

Natürlich hast du recht, das würde wahrscheinlich gehen (man müsste halt von cdf auf df umbauen), aber das Problem ist für mich, dass fitdistr oder fitdistrplus halt nur eine 'überschaubare' Anzahl Verteilungen unterstützen - Im Prinzip habe ich ja genau damit angefangen , dies zu tun (nur halt mit verschiedenen Paketen), aber (wie üblich bei diesen Dingen) steckt der Teufel im Detail - Ich sag' mal 'Startwerte'. Aber es ging ja auch nur um eine der Dichte ähnlichen Funktion bzw. ob sowas machbar ist (was es ja ist).

Dank&Gruß
schubbiaschwilli
Antworten