Megerősítéses tanulás – keretrendszer implementálása és illesztése

Tanszéki konzulens:

Engedy István

tudományos segédmunkatárs

Szoba: IE 426

A kiírás adatai

A téma státusza:

Törölt (nem látszik a listákban)

Kiírás éve:

2016

A kiírás jellege:

önálló labor

Kutatócsoport:

Mesterséges intelligencia›Mesterséges Intelligencia Kutatócsoport

A feladat célja egy általános megerősítéses tanulás keretrendszer fejlesztése, mely egyaránt kezel diszkrét és folytonos állapottereket.

A megerősítéses tanulás a gépi tanulás egy olyan formája, ahol egy adott környezetben optimális cselekvések végzését tanulja a tanuló ágens. A környezet állapotát részben vagy teljesen képes megfigyelni, mely az ágens cselekvéseinek hatására megváltozik. Az ágens a cselekvéseit követően egy jutalom jelet is megfigyel a környezetből. Az ágens célja ennek az összjutalomnak a hosszútávú maximalizálása.

A keretrendszert GPU támogatással kell elkészíteni. Erre egy ideális megoldás az egész keretrendszernek valamilyen erre alkalmas (deep learning) rendszerben történő implementálása. Potenciálisan szóba jövő rendszerek: TensorFlow, Theano, H2O, Deeplearning4j, Caffe, Torch, CNTK.

A feladatot alapvetően Python, C++, vagy Java programozási nyelven kell megoldani. A feladat megoldásához jó programozási készség, lineáris algebra és valószínűségszámítás ismeretek szükségesek. Előny a Linux legalább felhasználói szintű ismerete.

Engedy István Tamás, 2016. február 15. 13:49 | Legutóbb frissítve: 2017. január 25. 15:57

Méréstechnika és Információs Rendszerek Tanszék

Megerősítéses tanulás – keretrendszer implementálása és illesztése

A kiírás adatai

Oktatási lapjaink