ich bin noch relativ neu auf dem Gebiet des maschinellen Lernens und stehe vor einem Problem:
- Ich habe ein Netz aus Messstationen, verteilt über mehrere Km².
- Für alle Messstationen liegen in stündlichen Intervallen Messwerte vor.
- Ich will eine Interpolation zwischen den Messstationen, basierend auf ML berechnen
Zeitstempel, X-Koordinate, Y-Koordinate, Höhe über NN, Messwert [Label], Abstände und Messwerte zu den N nächsten Stationen
Zur Interpolation:
- Ich habe einen neuen Satz Messwerte für alle Stationen, die dem Modell unbekannt sind.
- Für Datenpunkte aus einem digitalen Höhenmodell (Koordinaten in regelmäßigem Raster und deren Höhe über NN) berechne ich mir jeweils die N nächsten Stationen und deren Messwerte aus dem Messdatensatz.
- Anschließend soll für jeden Punkt des Höhenmodells ein Wert interpoliert werden.
Ich habe jedoch noch keinen Ansatz gefunden, wie ich meine Daten gebündelt in ein Regressionsmodell einspeisen kann.
Ursprünglich wollte ich die Daten mittels Random Forest trainieren und anschließend für Koordinaten aus einem digitalen Höhenmodell die zwischenliegenden Werte interpolieren - Random Forest sieht jedoch keine Gruppierungen oder dergleichen vor.
Versucht hatte ich auch eine One-Hot-Kodierung, was aber aufgrund des großen Beobachtungszeitraumes zu einer enormen Explosion der Feature-Anzahl führte.
Habt ihr irgendwelche Ideen hierzu? Sollte ich meine Daten völlig anders aufbereiten? Gibt es geeignetere ML-Modelle für Multi-Temporale, räumliche Problemstellungen?