Seite 1 von 1

Reinforcment Learning Praxisanwendung

Verfasst: Mi Apr 10, 2019 10:01 pm
von lulu123
Hallo liebe Mitglieder,

aus der Praxis habe ich eine Anwendung bei der ich mir gut vorstellen könnte, dass sie mit RL gelöst werden kann.

Wie könnte so neuronales Netz als Agentenpolicy aussehen?
Freue mich auf eure Ideen!

Re: Reinforcment Learning Praxisanwendung

Verfasst: Do Apr 11, 2019 8:20 am
von Athomas
Ich würde keine Belohnung vorsehen, sondern nur Bestrafungen.
Richtig so, nur so wird er später mal ein anständiger Agent!

Was hat das mit R zu tun?

Re: Reinforcment Learning Praxisanwendung

Verfasst: Do Apr 11, 2019 8:55 am
von bigben
Hallo lulu123,

neuronale Netzwerke gehören zum überwachten Maschinenlernen. Du brauchst dafür einen haufen Daten, wie oder wie oft geschossen wurde und welche Veränderungen das an der Eigenfrequenz verursacht hat. Mir ist unklar, welche Einflussfaktoren variiert werden können (unabhängige Variablen: Zahl der Schüsse, Leistung beim Schuss, Dauer des Schusses, Ort des Schießens, bisherige Frequenz, Abstand bisherige Frequenz zur Sollfrequenz,... ?)). Vor allem ist mir aber unklar, wie diese Daten generiert werden sollen. Kannst Du das in einem Computermodell simulieren, oder bist Du bereit, hunderte oder tausende Werkstücke mit verschiedenen Lasereinstellungen zu beschießen, um Daten für so ein Netz zu generieren?

LG,
Bernhard

Re: Reinforcment Learning Praxisanwendung

Verfasst: Do Apr 11, 2019 5:05 pm
von lulu123
Hi Bernhard,

danke für die schnelle Antwort. Zunächst würde ich das Netz in der Simulation lernen lassen und dann könnte man es tatsächlich mit realen Werkstücken weiterlernen lassen.
Für die Ausgänge konnte man die Anzahl und Leistung der Schüsse nehmen. Wie du sagst wäre auch eine Variation der Position oder Abstand zwischen 2 Schüssen möglich. Als Eingänge würde die Istfrequenz dienen, die bei der Aktion Messen ermittelt wird.
Wie könnte ein möglicher Algorithmus aussehen? Passt für so eine Anwendung das Deep Q-Learning überhaupt? Wenn ja was wie sehen Input und Hidden Layer aus?

Re: Reinforcment Learning Praxisanwendung

Verfasst: Do Apr 11, 2019 6:50 pm
von EDi

Re: Reinforcment Learning Praxisanwendung

Verfasst: Do Apr 11, 2019 9:32 pm
von lulu123
Probiert habe ich noch nichts. Wie gesagt momentan versuche ich erst zu verstehen, welchen Algorithmus man anwenden könnte um die Aufgabe zu lösen. Das Ziel ist es, dass der Agent über die Zeit das Optimum lernt und so die Produktionsdauer reduziert.

Re: Reinforcment Learning Praxisanwendung

Verfasst: Do Apr 11, 2019 10:06 pm
von EDi
Probiert habe ich noch nichts. Wie gesagt momentan versuche ich erst zu verstehen, welchen Algorithmus man anwenden könnte um die Aufgabe zu lösen. Das Ziel ist es, dass der Agent über die Zeit das Optimum lernt und so die Produktionsdauer reduziert.
Was hat das dann mit R zu tun?

Re: Reinforcment Learning Praxisanwendung

Verfasst: Fr Apr 12, 2019 8:46 am
von jogo
Hallo Lulu,

willkommen im Forum!
Wie Du jetzt selbst bestätigt hast, hat Deine Frage (eventuell noch) recht wenig mit R zu tun.
- Aber dies ist nun mal ein R-Forum.
Da bleibt uns nur übrig, auf allgemeine Informationen zu verweisen wie z.B. die TaskViews im CRAN:
https://cran.r-project.org/web/views/
und dort speziell auf dieses:
https://cran.r-project.org/web/views/Ma ... rning.html

Gruß, Jörg