Asymmetrischer kernel für Kerndichteschätzer?

Methoden der Zeitreihenanalyse

Moderator: schubbiaschwilli

Antworten
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Asymmetrischer kernel für Kerndichteschätzer?

Beitrag von bigben »

Hallo Leute,

gegeben sei ein (nicht ganz hypothetischer) Fall eines Menschen mit einer chronischen Krankheit, die über Jahre mal aktiver und mal weniger aktiv ist und wenn das irgendwann aus dem Ruder läuft, wird man das Therapieregime ändern müssen. Ich entnehme meinem Krankenhausinformationssystem alle die Termine, an denen sie im Krankenhaus war und deute das als Hinweis auf Krankheitsaktivität. Mit fast realen Daten sieht das vielleicht so aus: (ggplot2, geom_rug und geom_density)
Rplot31.png
Rplot31.png (5.58 KiB) 1524 mal betrachtet
Das linke (alte) Ende der Kurve ist mir egal. Die beginnt 2005 weil da ein neues Computersystem eingeführt wurde und ältere Informationen aufwändiger zu beschaffen wären. Wenn man die Ereignisse auf der x-Achse in neuester Zeit betrachtet, dann hat die Aktivität eher zugenommen, die Dichteschätzung durch geom_density() fällt aber ab. Bestimmt fällt die Dichte ab, weil die Daten zensiert sind bzw. es in der Zukunft (noch) keine Ereignisse gibt. Um eine Kurve zu zeichnen, die bei konstanter Vorstellungsfrequenz am rechten Ende nicht abnimmt müsste man wahrscheinlich eine Art unsymmetrischen kernel haben, der nur in die Vergangenheit, nicht aber in die Zukunft schaut. Diese hier sind aber alle symmetrisch.

Muss ich mir da selbst was programmieren oder kennt jemand eine benutzerfreundliche Implementation, die schon fertig auf CRAN rumliegt? Es erscheint mir so naheliegend, sowas für Zeitreihen zu haben, dass ich mir nicht vorstellen kann, der erste mit der Idee zu sein. Oder ist die Idee einfach schlecht?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Asymmetrischer kernel für Kerndichteschätzer?

Beitrag von EDi »

Wir wäre es einfach den Abstand (vielleicht einfach nur diff(Vorstellungstermin)) gegen den Vorstellungstermin aufzutragen und dann ein glm/gam drüber ziehen?

Dürftr doch die gleiche Frage (kommt der Patient in kürzeren Abständen) beantworten?
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Asymmetrischer kernel für Kerndichteschätzer?

Beitrag von bigben »

Gute Idee! Das lässt sich mit einfachen Mitteln machen und beantwortet die gleiche Frage. Hier mal einfach mit geom_smooth(method = "gam"):
Rplot32.png
Rplot32.png (6.27 KiB) 1509 mal betrachtet
Ist aber grundsätzlich schon wieder ein ganzes Stück astrakter / weniger Intuitiv. Also, auf einem eher banalen Niveau von: Die Kurve geht 'runter wenn das Problem durch die Decke geht. Kein Problem, wenn man ein Paper schreibt, gangbar aber doch etwas unglücklich, wenn man drei Minuten Redezeit hat, sein Poster vorzustellen.

Danke dafür,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Asymmetrischer kernel für Kerndichteschätzer?

Beitrag von EDi »

Hmm, die Zensur machst nicht einfacher. Weil du siehts ja nur, wenn der patient was hat...

Erinnert mich an zero-inflated Modelle. Wenn du z.B. einen Tierbestand zählen willst und du zählts 0, dann kann das sein, dass kein Tier da ist oder du es gerae nicht gesehen hast. Das 2 Prozesse die sich überlagern und man auch so modellieren kann (heißen dann z.b. hurdle modelle).

Gleiches bei chemischen Messungen. Wenn du einen Stoff nicht misst, kann dass sein dass er nicht da ist, oder er aber unter der Bestimmungsgrenze (LOD) liegt. Ein Hurdle Modell könnte dann modellieren: 1. Die Wahrscheinlichkeit dass man über der LOD liegt (logistische Regression) und 2. Wenn man darüber ist wie hoch ist die Konzentration.

Wenn du also zu dem Termin noch ein Maß für die Schwere der Krankheit hättest, könntest du eventuell solch ein Modelö drauf loslassen...
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Asymmetrischer kernel für Kerndichteschätzer?

Beitrag von bigben »

Hallo EDi,

im Moment ging es mir eher um eine möglichst schlichte Visualisierung, nicht um ein komplexes Modell. Ich werde das wahrscheinlich in den nächsten Tagen mal coden, wie ich mir das vorgestellt hatte, aber wenn das niemand kennt gibt es bestimmt Gründe, warum es keiner kennt.

GLG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten