print 
 wechseln zu deutsch 

Fortgeschrittenen-Praktikum: Weiche Materie

Angeleitetes Lernprojekt: Reinforcement learning für intelligente Brownsche Dynamik. 

Rods

Algorithmus des Reinforcement Learning am lebenden Objekt:
Der Hund Lasse gibt sein Pfötchen. Um diese Aktion zu bestärken, bekommt er eine Belohnung (reinforcement). In Zukunft wird er diese Aktion in Erwartung einer erneuten Belohnung häufiger ausführen. Wir belohnen diese Aktion jedes Mal, bis der Zusammenhang zwischen Aktion und Belohnung verinnerlicht ist.


Dieses angeleitete Lernprojekt bietet eine Einführung in die Grundlagen des Reinforcement Learning am Beispiel des Q-Learning-Algorithmus. Dieser bildet die Grundlage für viele komplexe Machine Learning Algorithmen, die heutzutage in unterschiedlichen Bereichen Anwendung finden. Das Lernziel dieses Projektes besteht darin, die Grundlagen des Q-Learning zu verstehen, indem die/der Bearbeitende diesen Algorithmus auf verschiedene Probleme anwenden soll. Die Aufgaben, die in dieser Projektarbeit zu bearbeiten sind, sollen die Grundlagen des Reinforcement Learning festigen und bieten gleichzeitig einen Einstieg in objektorientiertes Programmieren in Python 3.
Die Einbettung in den Kontext eines eindimensionalen Random Walk soll außerdem physikalische Intuition für die Erforschung von diffusiven Prozessen in der weichen Materie liefern.

Ressource: Anleitung FP-Versuch reinforcement learning

Bild: P.A. Monderkamp / TP2

Betreuung
Kontakt über Email mit Prof. Löwen (hlowen <at> thphy.uni-duesseldorf.de), oder G.H. Philipp Nguyen (nguyen <at> thphy.uni-duesseldorf.de).


Last updated: Thu, May 15 2025 12:26:52
 
tp2admin <at> thphy.uni-duesseldorf.de · Last modified: Thu, May 15 2025 12:26:52 · ©2025-ThPhyII