2017
informatika
Fine grained spatial control of robots using artificial neural networks and reinforcement learning
Témavezető:
Dr. Cserey György, Dr. Koller Miklós
Dr. Cserey György, Dr. Koller Miklós
Összefoglaló
Nem tudni, hogy a legújabb, megerősítéses tanuláson és neurális hálókon alapuló ágensek hogyan teljesítenek a valóságban, azokban az esetekben amikor folytonos cselekvésterek szükségesek a vezérléshez. A dolgozatban bemutatom a DDPG algoritmus egy módosított változatát, ami képes kevés epizódból online módon tanulni. Az algoritmus része egy új módszer az eseménybufferben tárolt átmenetek számának csökkentésére. Ezen túl implementálok egy nyílt forrású környezeti szimulációt aminek a fő tervezési szempontja a fizikai megvalósítás könnyedsége.
Dr. Cserey György
Dr. Koller Miklós