Reinforcment Learning Praxisanwendung

lulu123 · Beitrag von **lulu123** » Mi Apr 10, 2019 10:01 pm

Hallo liebe Mitglieder,

aus der Praxis habe ich eine Anwendung bei der ich mir gut vorstellen könnte, dass sie mit RL gelöst werden kann.

Wie könnte so neuronales Netz als Agentenpolicy aussehen?
Freue mich auf eure Ideen!

Athomas · Beitrag von **Athomas** » Do Apr 11, 2019 8:20 am

Ich würde keine Belohnung vorsehen, sondern nur Bestrafungen.

Richtig so, nur so wird er später mal ein anständiger Agent!

Was hat das mit R zu tun?

Beitrag von **bigben** » Do Apr 11, 2019 8:55 am

Hallo lulu123,

neuronale Netzwerke gehören zum überwachten Maschinenlernen. Du brauchst dafür einen haufen Daten, wie oder wie oft geschossen wurde und welche Veränderungen das an der Eigenfrequenz verursacht hat. Mir ist unklar, welche Einflussfaktoren variiert werden können (unabhängige Variablen: Zahl der Schüsse, Leistung beim Schuss, Dauer des Schusses, Ort des Schießens, bisherige Frequenz, Abstand bisherige Frequenz zur Sollfrequenz,... ?)). Vor allem ist mir aber unklar, wie diese Daten generiert werden sollen. Kannst Du das in einem Computermodell simulieren, oder bist Du bereit, hunderte oder tausende Werkstücke mit verschiedenen Lasereinstellungen zu beschießen, um Daten für so ein Netz zu generieren?

LG,
Bernhard

lulu123 · Beitrag von **lulu123** » Do Apr 11, 2019 5:05 pm

Hi Bernhard,

danke für die schnelle Antwort. Zunächst würde ich das Netz in der Simulation lernen lassen und dann könnte man es tatsächlich mit realen Werkstücken weiterlernen lassen.
Für die Ausgänge konnte man die Anzahl und Leistung der Schüsse nehmen. Wie du sagst wäre auch eine Variation der Position oder Abstand zwischen 2 Schüssen möglich. Als Eingänge würde die Istfrequenz dienen, die bei der Aktion Messen ermittelt wird.
Wie könnte ein möglicher Algorithmus aussehen? Passt für so eine Anwendung das Deep Q-Learning überhaupt? Wenn ja was wie sehen Input und Hidden Layer aus?

Beitrag von **EDi** » Do Apr 11, 2019 6:50 pm

https://keras-rl.readthedocs.io/en/latest/

https://arxiv.org/abs/1312.5602

https://www.mitpressjournals.org/doi/ab ... lCode=neco

http://incompleteideas.net/book/the-book-2nd.html

Was hat du denn schon ausprobiert in R?

lulu123 · Beitrag von **lulu123** » Do Apr 11, 2019 9:32 pm

Probiert habe ich noch nichts. Wie gesagt momentan versuche ich erst zu verstehen, welchen Algorithmus man anwenden könnte um die Aufgabe zu lösen. Das Ziel ist es, dass der Agent über die Zeit das Optimum lernt und so die Produktionsdauer reduziert.

Beitrag von **EDi** » Do Apr 11, 2019 10:06 pm

Probiert habe ich noch nichts. Wie gesagt momentan versuche ich erst zu verstehen, welchen Algorithmus man anwenden könnte um die Aufgabe zu lösen. Das Ziel ist es, dass der Agent über die Zeit das Optimum lernt und so die Produktionsdauer reduziert.

Was hat das dann mit R zu tun?

Beitrag von **jogo** » Fr Apr 12, 2019 8:46 am

Hallo Lulu,

willkommen im Forum!
Wie Du jetzt selbst bestätigt hast, hat Deine Frage (eventuell noch) recht wenig mit R zu tun.
- Aber dies ist nun mal ein R-Forum.
Da bleibt uns nur übrig, auf allgemeine Informationen zu verweisen wie z.B. die TaskViews im CRAN:
https://cran.r-project.org/web/views/
und dort speziell auf dieses:
https://cran.r-project.org/web/views/Ma ... rning.html

Gruß, Jörg

Deutsches R-Forum

Reinforcment Learning Praxisanwendung

Reinforcment Learning Praxisanwendung

Re: Reinforcment Learning Praxisanwendung

Re: Reinforcment Learning Praxisanwendung

Re: Reinforcment Learning Praxisanwendung

Re: Reinforcment Learning Praxisanwendung

Re: Reinforcment Learning Praxisanwendung

Re: Reinforcment Learning Praxisanwendung

Re: Reinforcment Learning Praxisanwendung