Megerősítéses tanulás alkalmazása egy vagy kétszemélyes játékokra

Tanszéki konzulens: 
A munkatárs fényképe
tudományos segédmunkatárs
Szoba: IE 426

A kiírás adatai

A téma státusza: 
Törölt (nem látszik a listákban)
Kiírás éve: 
2016
A kiírás jellege: 
önálló labor, szakdolgozat/diplomaterv
A feladat célja egy megerősítéses tanulás alapú ágens implementálása és tanítása valamilyen egyszerű, egy vagy kétszemélyes számítógépes játékra.
 
A megerősítéses tanulás a gépi tanulás egy olyan formája, ahol egy adott környezetben optimális cselekvések végzését tanulja a tanuló ágens. A környezet állapotát részben vagy teljesen képes megfigyelni, mely az ágens cselekvéseinek hatására megváltozik. Az ágens a cselekvéseit követően egy jutalom jelet is megfigyel a környezetből. Az ágens célja ennek az összjutalomnak a hosszútávú maximalizálása.
 
A teljesség igénye nélkül néhány lehetséges játék: passziánsz, tetris, amőba, léghoki.
 
A feladatot alapvetően Matlab, Python vagy Java programozási nyelven kell megoldani. A feladat megoldásához jó programozási készség és lineáris algebra ismeretek szükségesek.
© 2010-2024 BME MIT | Hibajelentés | Használati útmutató