Megerősítéses tanulás – keretrendszer implementálása és illesztése
Tanszéki konzulens:
tudományos segédmunkatárs
Szoba: IE 426 |
A kiírás adatai
A téma státusza:
Törölt (nem látszik a listákban)
Kiírás éve:
2016
A kiírás jellege:
önálló labor
A feladat célja egy általános megerősítéses tanulás keretrendszer fejlesztése, mely egyaránt kezel diszkrét és folytonos állapottereket.
A megerősítéses tanulás a gépi tanulás egy olyan formája, ahol egy adott környezetben optimális cselekvések végzését tanulja a tanuló ágens. A környezet állapotát részben vagy teljesen képes megfigyelni, mely az ágens cselekvéseinek hatására megváltozik. Az ágens a cselekvéseit követően egy jutalom jelet is megfigyel a környezetből. Az ágens célja ennek az összjutalomnak a hosszútávú maximalizálása.
A keretrendszert GPU támogatással kell elkészíteni. Erre egy ideális megoldás az egész keretrendszernek valamilyen erre alkalmas (deep learning) rendszerben történő implementálása. Potenciálisan szóba jövő rendszerek: TensorFlow, Theano, H2O, Deeplearning4j, Caffe, Torch, CNTK.
A feladatot alapvetően Python, C++, vagy Java programozási nyelven kell megoldani. A feladat megoldásához jó programozási készség, lineáris algebra és valószínűségszámítás ismeretek szükségesek. Előny a Linux legalább felhasználói szintű ismerete.
Engedy István Tamás, 2016. február 15. 13:49 | Legutóbb frissítve: 2017. január 25. 15:57