Reinforcement learning Algorithmus am lebenden Objekt: Der Hund Lasse gibt sein
Pfötchen. Dafür bekommt er eine Belohnung um diese Aktion zu bestärken
(reinforcement). In Zukunft wird er diese Aktion, in Erwartung einer erneuten Belohnung, häufiger ausführen. Wir belohnen diese
Aktion jedes mal, bis der Zusammenhang zwischen Aktion und Belohnung verinnerlicht ist.
Dieses angeleitete Lernprojekt bietet eine Einführung in die Grundlagen des reinforcement learning am Beispiel
des Q-learning Algorithmus. Dieser bildet die Grundlage für viele komplexe machine learning Algorithmen, die heutzutage
in verschiedenen Bereichen Anwendung finden. Das Lernziel dieses
Projektes besteht darin die Grundlagen des Q-learning zu verstehen, die/der Bearbeitende diesen Algorithmus auf verschiedene Probleme anwenden
lernen soll. Die Aufgaben, die in dieser Projektarbeit
zu bearbeiten sind, sollen die Grundlagen des reinforcement learning festigen und bieten gleichzeitig einen Einstieg in objektorientiertes
Programmieren in python3. Die Einbettung in den Kontext eines
eindimensionalen random-walks soll außerdem physikalische Intuition für die Erforschung von diffusiven Prozessen in der weichen Materie liefern.
Ressource: Anleitung FP-Versuch reinforcement learning
|