Megerősítéses tanulás – keretrendszer implementálása és illesztése

Tanszéki konzulens: 
A munkatárs fényképe
tudományos segédmunkatárs
Szoba: IE 426

A kiírás adatai

A téma státusza: 
Törölt (nem látszik a listákban)
Kiírás éve: 
2016
A kiírás jellege: 
önálló labor
A feladat célja egy általános megerősítéses tanulás keretrendszer fejlesztése, mely egyaránt kezel diszkrét és folytonos állapottereket.
 
A megerősítéses tanulás a gépi tanulás egy olyan formája, ahol egy adott környezetben optimális cselekvések végzését tanulja a tanuló ágens. A környezet állapotát részben vagy teljesen képes megfigyelni, mely az ágens cselekvéseinek hatására megváltozik. Az ágens a cselekvéseit követően egy jutalom jelet is megfigyel a környezetből. Az ágens célja ennek az összjutalomnak a hosszútávú maximalizálása.
 
 A keretrendszert GPU támogatással kell elkészíteni. Erre egy ideális megoldás az egész keretrendszernek valamilyen erre alkalmas (deep learning) rendszerben történő implementálása. Potenciálisan szóba jövő rendszerek: TensorFlow, Theano, H2O, Deeplearning4j, Caffe, Torch, CNTK.
 
A feladatot alapvetően Python, C++, vagy Java programozási nyelven kell megoldani. A feladat megoldásához jó programozási készség, lineáris algebra és valószínűségszámítás ismeretek szükségesek. Előny a Linux legalább felhasználói szintű ismerete.
 
 
© 2010-2024 BME MIT | Hibajelentés | Használati útmutató