Epidemiemodelle mit R?

Methoden der Zeitreihenanalyse

Moderator: schubbiaschwilli

consuli
Beiträge: 479
Registriert: Mo Okt 10, 2016 8:18 pm

Re: Epidemiemodelle mit R?

Beitrag von consuli »

Eigentlich suche ich so ein Modell, wie es das MRC Centre for Global Infectious Disease Analysis at Imperial College London letztes Wochenende für die Modellierung des Wuhan-Coronavirus-Ausbruchs genutzt hat.

China hat gesagt nur 60 Infizirete.

Aber das MRC konnte anhand ihres Modells von den 3 Infizierten in anderen Ländern darauf zurück schließen, dass die wahre anzahl an Infizierten ca. 1700 beträgt.
Irmgard.
Benutzeravatar
EDi
Beiträge: 1599
Registriert: Sa Okt 08, 2016 3:39 pm

Re: Epidemiemodelle mit R?

Beitrag von EDi »

Trau keinem Model dass du nicht selbst validiert hast... So oder so ähnlich.
Bitte immer ein reproduzierbares Minimalbeispiel angeben. Meinungen gehören mir und geben nicht die meines Brötchengebers wieder.

Dieser Beitrag ist lizensiert unter einer CC BY 4.0 Lizenz
Bild.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Epidemiemodelle mit R?

Beitrag von bigben »

Aber wenn man dem Link in consulis Link folgt, dann geht es da gar nicht um Simulation sondern um klassische Wahrscheinlichkeitsrechnung.
The results in Table 1 are maximum likelihood estimates obtained using this negative binomial likelihood function
http://www.imperial.ac.uk/media/imperia ... 1-2020.pdf

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
consuli
Beiträge: 479
Registriert: Mo Okt 10, 2016 8:18 pm

Re: Epidemiemodelle mit R?

Beitrag von consuli »

bigben hat geschrieben: Mi Jan 22, 2020 8:09 am Aber wenn man dem Link in consulis Link folgt, dann geht es da gar nicht um Simulation sondern um klassische Wahrscheinlichkeitsrechnung.
The results in Table 1 are maximum likelihood estimates obtained using this negative binomial likelihood function
http://www.imperial.ac.uk/media/imperia ... 1-2020.pdf

LG,
Bernhard
Ja, da habe ich mich falsch ausgedrückt. Das Imperial-College-Coronavirus-Modell scheint nur ein partielles Modell, um die Anzahl der Infizierten in der Region eines Flughafens zu schätzen.

Müsste ich denn nicht auch ein Simulationsmodell der ganzen Welt mit historischen Virusepidemien füttern, damit ich nicht irgendwas praxisfernes modelliere?

Zwischenzeitlich habe ich mir auch überlegt, dass man die Nahübertragung "auf der grünen Wiese" durch Geldscheine und -münzen auch mitmodellieren muss, so wie es ruedi eingangs mit dem verlinkten SIR Modell vorschlug.

Da kommt ganz schön viel Kram zusammen. Ich glaube, in R kriegt man das nicht mehr hin. Damit muss man schon einen funken-sprühenden Apachen beschäftigen.
Irmgard.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Epidemiemodelle mit R?

Beitrag von bigben »

@consuli: Bitte nicht falsch verstehen, aber ich glaube nicht, dass die Leistungsfähigkeit von R hier der Flaschenhals für das Projekt ist.

Liebe Grüße,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
consuli
Beiträge: 479
Registriert: Mo Okt 10, 2016 8:18 pm

Re: Epidemiemodelle mit R?

Beitrag von consuli »

Ich glaube, ich habe nun einen verinfachten Ansatz gefunden, wie man Epidemiemodell auf jedem Fall mit R rechnen kann.

Man unterteilt die Welt einfach in GPS-Planquadrate (oder auch UTM-Planquadrate der Wehrmacht ;-) ). Für jedes Planquadrat (das um genau zu sein in Wahrheit eine Mantelfläche der Erdkugell ist; aber kleine Planquadrate sind fast quadratisch) bestimmt man :
  • Bevölkerungsanzahl und
  • Bevölkerungsdichte.


Die Bevölkerungsanzahl der Planquadrate unterteilt man in die Bevölkerungsgruppen:
  • Neutrale (Nicht-Infizierte)
  • Infizierte (ohne Symptome)
  • Kranke (mit Symptomen)
  • Resistente (die entweder die Krankheit bereits durchgemacht haben oder Geimpfte)
  • (Tote; nur zu Infomrationszwecken, denn sie fallen ja aus dem Modell raus und stecken keinen mehr an)
Dann formliert man eine Migrations- bzw. Übergangsmatrix, die die Ansteckung innerhalb des Planquadrats beschreibt. Planquadrate mit höherer Bevölkerungsdichte haben durch vermehrte Nutzung von öffentlichen Verkehrsmitteln und großen Gebäuden (insbesondere derer Schalter, Wasserhahnarmaturen, Türgriffe, Haltegriffe, .usw.) eine höhere Ansteckungsrate und entsprechend eine andere Migrationsmatrix.

Zusätzlich reisen die Leute zwischen den Planquadraten. Hier muss man nun die Verkehrsströme aus Flugzeug, Eisenbahn, S-Bahn und Auto berücksichten. Auch dafür stellt man eine Migrationsmatrix auf, und zwar
  • eine die den Morgenverkehr beschreibt
  • und eine die den Abendverkehr beschreibt
Eine Modelltag besteht dann aus
  1. Morgenverkehr
  2. Ansteckung tagsüber
  3. Abendverkehr
  4. Ansteckung abends und nachts
also 4 Matritzenmultiplikationen.

Die Reisemigrationsmatrizen leitet man aus Verkehrsdaten ab.

Die Ansteckungsmatritzen errechnet man mit einem statistischen Modell aus den gemeldeten meldepflichtigen Krankheiten der Kreisgesundheitsämter, wobei man die Krankheiten nach Inkubationszeit, Ansteckungsrate und Lethalität sortiert.

Vermutlich muss man für die
  • Infizierte (ohne Symptome)
  • Kranke (mit Symptomen)
noch Untergruppen bilden
  • Infizierte_in_Tag1
  • Infizierte_in_Tag2
  • Infizierte_in_Tag3
  • Infizierte ...
  • Kranke_in_Tag1
  • Kranke_in_Tag2
  • Kranke_in_Tag3
  • Kranke ...
um das zeitliche Durchaltern der Bestandsgruppen Infizierte und Kranke zu modellieren.

Die Matritzen werden ziemlich groß, aber R kann mit sehr großen Matritzen rechnen.

Landkreise sind auch keine quadratischen Planquadrate, aber das macht nichts, solange man jeweils deren Entfernung vom Flächenschwerpunkt zu einander und deren Bevölkerungsdichte kennt, kann man die Reisebewegungen aus den Verkehrsdaten modellieren.

Das einzig blöde ist, dass unterschiedlich lange Krankheiten und unterschiedliche Inkubationszeiten unterschiedliche Anzahlen der Unterbestandsgruppen Infizierte und Kranke haben. Aber ich denke, man modelliert dann einfach jeweils die Maximalzahl der Tage und regelt es über die Migrationsmatritzen, dass bei Krankheit ABC niemand in die Untergruppe Infizierte_in_Tag25 kommt.

Bin ich nicht gerade wieder somewhat genial ? 8-) 8-)

Ihr braucht mir jetzt nur noch sagen, wie ich aus den historischen Ansteckungsfällen der Gesundheitsämter über ein statistisches Modell eine bzw. zwei Ansteckungsmatritzen errechnen kann. :D :D
Irmgard.
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Epidemiemodelle mit R?

Beitrag von bigben »

consuli hat geschrieben: Fr Jan 24, 2020 1:41 pmFür jedes Planquadrat (das um genau zu sein in Wahrheit eine Mantelfläche der Erdkugell ist; aber kleine Planquadrate sind fast quadratisch)
China erstreckt sich von 18° bis 54° nördlicher Breite. Wenn ich das richtig überschlagen habe, ist der 18. Breitengrad ca 38 Tkm lang, der 52. nur 24 Tkm. Mit geografischen Modellen, die die Erdkrümmung vernachlässigen indem sie China in gleichgroße Quadrate Parkettieren sollte man sehr vorsichtig sein!
  • Bevölkerungsanzahl und
  • Bevölkerungsdichte.
Ich habe ehrlich keine Ahnung vom Meldewesen in China, habe aber meine Zweifel, wie genau man das außerhalb städtischer Ballungszentren angeben kann.
consuli hat geschrieben:Zusätzlich reisen die Leute zwischen den Planquadraten. Hier muss man nun die Verkehrsströme aus Flugzeug, Eisenbahn, S-Bahn und Auto berücksichten.

consuli hat geschrieben:(Auto ist irrelevant, weil kaum ansteckend.)

:shock:
stellt man eine Migrationsmatrix auf, und zwar
  • eine die den Morgenverkehr beschreibt
  • und eine die den Abendverkehr beschreibt
Ich würde schon annehmen, dass es auch Monate gibt, die durch mehr und Monate, die durch weniger Flugverkehr gekennzeichnet sind. Du musst also nur für jedes Planquadrat vierundzwanzig Matrizen aufstellen, die den morgendlichen und abendlichen Verkehr pro Monat (die Leute haben da weniger Urlaub als hier. Besser Halbmonate?) aufstellen und bist rasch bei viel mehr Freiheitsgraden, als Du mit allen Daten dieser Welt füttern könntest. Da brauchst Du starke prior-Annahmen!

Die Reisemigrationsmatrizen leitet man aus Verkehrsdaten ab.
Verkehrsdaten? Dir ist schon klar, dass China in den Ballungszentren ein Hochtechnologieland, in den ländlichen Räumen aber ein Entwicklungsland ist. Ob sich da jemand hingestellt und Ochsenkarren pro Tag über diesen Hügel gezählt hat?
Die Ansteckungsmatritzen errechnet man mit einem statistischen Modell aus den gemeldeten meldepflichtigen Krankheiten der Kreisgesundheitsämter, wobei man die Krankheiten nach Inkubationszeit, Ansteckungsrate und Lethalität sortiert.
Du selbst hast doch weiter oben auf einen Beleg verwiesen, dass die chinesischen Angaben dazu gelogen sind. Willst Du mit erlogenen Zahlen modellieren?
Infizierte (ohne Symptome)
Infizierte ohne Symptome aus Kreisgesundheitsämtern?
Die Matritzen werden ziemlich groß, aber R kann mit sehr großen Matritzen rechnen.
Jaja, der Flaschenhals ist sicher nicht Rs Kompetenz in Matrizenmultiplikation.
Bin ich nicht gerade wieder somewhat genial ? 8-) 8-)
All models are wrong. Some models are useful. Letztlich ist jedes Modell darauf angewiesen, dass es mit ausreichend Daten gefüttert wird. Klingt für mich so, als hättest Du genügend Freiheitsgrade gelassen, dass man rückwirkend alles und prospektiv nichts erklären kann. Aber Du hast schon Recht: Wenn ich alle Daten die ich haben wollte in beliebiger Aktualität und beliebiger Präzision haben könnte, wüsste ich auch mehr.
Ihr braucht mir jetzt nur noch sagen, wie ich aus den historischen Ansteckungsfällen der Gesundheitsämter über ein statistisches Modell eine bzw. zwei Ansteckungsmatritzen errechnen kann. :D :D
Historische Ansteckungsfälle mit afrikanischer Schweingepest in China???
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
consuli
Beiträge: 479
Registriert: Mo Okt 10, 2016 8:18 pm

Re: Epidemiemodelle mit R?

Beitrag von consuli »

  • In Deutschland werden die meldepflichtigen Krankheiten an die Gesundheitsämter der Landkreise und kreisfreien Städte gemeldet. Die sind im Schnitt ca. 700 qkm groß. Also würde man dann auch die Planquadrate der Welt in etwa so groß machen und die Ansteckungsquoten von DE auf die Welt hochrechen. (Kantenlänge also ungefähr 25 km).
  • Für ein Ansteckungsmodell ist es nicht wichtig die tatsächlichen örtlichen Gegebenheiten zu modellieren, sondern nur, wie viele Personen vom einen Ansteckungskreis (=Planquadrat) in den anderen pendeln. Und die größte Pendelei ist Arbeits-, Schul, Kindergarten und Einkaufen bedingt und spielt sich im Nahbereich ab. Für Kristallisationskeime in fernen Planquadraten spielen die Flugreisen eine große Rolle.
  • Das Modell modelliert dann keine expliziten Ansteckungen in Verkehrsmitteln (inkl. Autos) und Gebäuden, sondern für jedes Planquadrat indirekte pauschale Ansteckungsraten innerhalb des Planquadrats. Höhere Bevölkerungsdichte -> vermutlich höhere Ansteckung (weil stärkere Nutzung von öfentlichen Verkehrsmitteln und großen Gebäuden).
  • Nein. Saisonale und Sonntags-Reisematrizen gibt es nicht. Zu viel Arbeit.
Irmgard.
Benutzeravatar
student
Beiträge: 674
Registriert: Fr Okt 07, 2016 9:52 am

Re: Epidemiemodelle mit R?

Beitrag von student »

Ich verfolge die Diskussion mit Interesse, weil ich auch davon ausgehe, dass noch etwas auf uns zukommt. Wenn China sagt, zurzeit sind es 80 Toten und x infizierten , würde ich ganz ohne Statistik sagen, dass es durchaus 100-mal so viele sein könnten. Auch wenn gesagt wird, der Virus ist "leicht ansteckender" geworden, gehe ich davon aus, dass er deutlich aggressiver geworden ist. Ich gehe nicht davon aus, dass China offen und ehrlich ist.

Ich habe aber auch noch einen Beitrag: An AI Epidemiologist Sent the First Warnings of the Wuhan Virus
Viele Grüße,
Student
-----------------------------------------------------------------------------------------------------------------------
faes.de, Datenanalyse mit R & das Ad-Oculos-Projekt
Das Ad-Oculos-Projekt auf YouTube

Habe Mut, dich deines eigenen Verstandes zu bedienen! (Kant)
bigben
Beiträge: 2771
Registriert: Mi Okt 12, 2016 9:09 am

Re: Epidemiemodelle mit R?

Beitrag von bigben »

Zufällig gerade in der personalisierten Werbung gesehen: Bild
[...] This book is focused on the application of modern statistical methods and models to estimate infectious disease parameters. We want to provide the readers with software guidance, such as R packages, and with data, as far as they can be made publicly available.
ISBN 978-1-4614-4072-7

Eine Autorin heißt übrigens C. Faes
@Student: Hast Du uns da was verheimlicht?

LG,
Bernhard
---
Programmiere stets so, dass die Maxime Deines Programmierstils Grundlage allgemeiner Gesetzgebung sein könnte
Antworten