print 
 wechseln zu deutsch 

Fortgeschrittenen-Praktikum: Weiche Materie

Angeleitetes Lernprojekt: Reinforcement learning für intelligente Brownsche Dynamik. 

Rods

Reinforcement learning Algorithmus am lebenden Objekt:
Der Hund Lasse gibt sein Pfötchen. Dafür bekommt er eine Belohnung um diese Aktion zu bestärken (reinforcement). In Zukunft wird er diese Aktion, in Erwartung einer erneuten Belohnung, häufiger ausführen. Wir belohnen diese Aktion jedes mal, bis der Zusammenhang zwischen Aktion und Belohnung verinnerlicht ist.


Dieses angeleitete Lernprojekt bietet eine Einführung in die Grundlagen des reinforcement learning am Beispiel des Q-learning Algorithmus. Dieser bildet die Grundlage für viele komplexe machine learning Algorithmen, die heutzutage in verschiedenen Bereichen Anwendung finden. Das Lernziel dieses Projektes besteht darin die Grundlagen des Q-learning zu verstehen, die/der Bearbeitende diesen Algorithmus auf verschiedene Probleme anwenden lernen soll. Die Aufgaben, die in dieser Projektarbeit zu bearbeiten sind, sollen die Grundlagen des reinforcement learning festigen und bieten gleichzeitig einen Einstieg in objektorientiertes Programmieren in python3.
Die Einbettung in den Kontext eines eindimensionalen random-walks soll außerdem physikalische Intuition für die Erforschung von diffusiven Prozessen in der weichen Materie liefern.

Ressource: Anleitung FP-Versuch reinforcement learning

Bild: P.A. Monderkamp / TP2

Betreuung
Kontakt über Email mit Prof. Löwen (hlowen <at> thphy.uni-duesseldorf.de), oder G.H. Philipp Nguyen (nguyen <at> thphy.uni-duesseldorf.de).


Last updated: Fri, August 18 2023 15:14:07
 
tp2admin <at> thphy.uni-duesseldorf.de · Last modified: Fri, August 18 2023 15:14:07 · ©2024-ThPhyII