Algorithmus des Reinforcement Learning am lebenden Objekt:
Der Hund Lasse gibt sein Pfötchen. Um diese Aktion zu bestärken, bekommt er eine Belohnung (reinforcement).
In Zukunft wird er diese Aktion in Erwartung einer erneuten Belohnung häufiger ausführen. Wir belohnen diese Aktion jedes Mal,
bis der Zusammenhang zwischen Aktion und Belohnung verinnerlicht ist.
Dieses angeleitete Lernprojekt bietet eine Einführung in die Grundlagen des Reinforcement Learning am Beispiel des Q-Learning-Algorithmus.
Dieser bildet die Grundlage für viele komplexe Machine Learning Algorithmen, die heutzutage in unterschiedlichen Bereichen Anwendung finden.
Das Lernziel dieses Projektes besteht darin, die Grundlagen des Q-Learning zu verstehen, indem die/der Bearbeitende diesen Algorithmus
auf verschiedene Probleme anwenden soll. Die Aufgaben, die in dieser Projektarbeit zu bearbeiten sind, sollen die Grundlagen des Reinforcement
Learning festigen und bieten gleichzeitig einen Einstieg in objektorientiertes Programmieren in Python 3.
Die Einbettung in den Kontext eines eindimensionalen Random Walk soll außerdem physikalische Intuition für die
Erforschung von diffusiven Prozessen in der weichen Materie liefern.
Ressource: Anleitung FP-Versuch reinforcement learning
|