Vorhersagemodellierung
Verfasst: Sa Nov 16, 2019 11:54 am
Hallo Zusammen,
in der Uni beschäftigen wir uns ein wenig mit der Vorhersagemodellierung mit R.
Nun habe ich durch Recherche herausgefunden, dass es wohl verschiedene Ansätze/Methoden hierzu gibt.
Leider ist mir nun nicht genau klar, mit welchem Ansatz/Methode ich am besten an mein Ziel komme.
Die Fragestellung ist folgende:
- Konstruieren Sie ein Modell auf Basis der Trainingsdaten und sagen Sie für die Anwendungsdaten x0 die Zielvariable ˆy0 vorraus.
Zur Bewertung der Vorhersagegüte wird der mittlere absolute Fehler MAE (mean absolute error) auf die Anwendungsdaten herangezogen.
Gefunden zur Vorhersage hatte ich nun folgende Methoden:
- lineare Regression
- Baumverfahren
- Neuronale Netze
Folgende Tipps haben wir noch bekommen:
- Vermeiden Sie Über-Anpassung
- Evtl. kann eine Datenvorverarbeitung (Variablentransformation, z.B. log() oder die Elimination von Ausreißern) helfen.
Könnt Ihr mir aufgrund der genannten Informationen Tipps geben welchen Ansatz/Methode ich wählen muss?
Gibt es noch weitere bisher nicht berücksichtigte Variablen?
Ich hoffe Ihr könnt mir helfen.
Vielen Dank im voraus.
LG
Chris
in der Uni beschäftigen wir uns ein wenig mit der Vorhersagemodellierung mit R.
Nun habe ich durch Recherche herausgefunden, dass es wohl verschiedene Ansätze/Methoden hierzu gibt.
Leider ist mir nun nicht genau klar, mit welchem Ansatz/Methode ich am besten an mein Ziel komme.
Die Fragestellung ist folgende:
- Konstruieren Sie ein Modell auf Basis der Trainingsdaten und sagen Sie für die Anwendungsdaten x0 die Zielvariable ˆy0 vorraus.
Zur Bewertung der Vorhersagegüte wird der mittlere absolute Fehler MAE (mean absolute error) auf die Anwendungsdaten herangezogen.
Gefunden zur Vorhersage hatte ich nun folgende Methoden:
- lineare Regression
- Baumverfahren
- Neuronale Netze
Folgende Tipps haben wir noch bekommen:
- Vermeiden Sie Über-Anpassung
- Evtl. kann eine Datenvorverarbeitung (Variablentransformation, z.B. log() oder die Elimination von Ausreißern) helfen.
Könnt Ihr mir aufgrund der genannten Informationen Tipps geben welchen Ansatz/Methode ich wählen muss?
Gibt es noch weitere bisher nicht berücksichtigte Variablen?
Ich hoffe Ihr könnt mir helfen.
Vielen Dank im voraus.
LG
Chris