Neurális hálók és mély tanulás alkalmazása

Napjainkban a neurális hálók alkalmazási köre dinamikusan bővül. Számos, pár évvel ezelőtt még megoldhatatlannak tűnő feladat leküzdésében jutott oroszlán szerep e számítás paradigma által nyújtott apparátusnak. Még szélesebb körű alkalmazhatóságuk azonban olyan korlátok meghaladását igényli, melyek ma még élesen jelentkeznek. Ahhoz, hogy ez lehetségessé váljon nem elegendő az eljárások fekete doboz jellegű, eszköz szintű alkalmazása. Elengedhetetlen az egyes módszerek alapos, elméleti szempontból is kielégítő ismerete. A témalabor fő célkitűzése éppen ezért a neurális paradigma apparátusának részét képező finomabb módszerek, eljárások alapos feltérképezése, olyan elméleti és demonstrációs célra is alkalmas gyakorlati vizsgálatok elvégzése, mellyel átláthatóak, pontosabban megismerhetőek és ezen ismeretek birtokában komplex feladatok esetén hatásosabban alkalmazhatóak a mély tanulás finomabb módszerei is (pl. batch normalizáció, dropout, transfer learning, különböző veszteségfüggvények hatása az optimalizációra, háló struktúrák hatása, tudástranszfer stb.)

Hosszabb távon (önálló labor, szakdolgozat, diplomaterv, phd téma) természetesen éles szakmai kihívást jelentő, komplexebb alkalmazási feladatok is végezhetőek. Ilyen feladatok a képi információ alapú döntéshozatal körébe tartozó problémák, mely mind orvosi, mind műszaki alkalmazás esetén széles feladatkört lefed. Legújabb elméleti eredmények alapján a neurális hálók képek generálására, több módusú, összetett eloszlások megtanulására, valamint ehhez kapcsolódóan számos, nem szorosan a műszaki életben felmerülő alkalmazási probléma megoldására is alkalmasak. Nyitott kérdése viszont a tudományterületnek, hogy hogyan lehetséges a klasszikus jel- és képfeldolgozás kurrens eredményeinek, módszereinek a neurális paradigmában történő alkalmazása. Az alábbiakban a teljesség igénye nélkül részletezzük ezen problémákat, pár gyakorlati feladatot is megemlítve. Fontos, hogy a tématerületbe jól illeszkedő, de itt nem taglalt feladatok konzultálására is nyitottak vagyunk (kivéve a reinforcement learning-et).

Képi információ alapú döntéshozatal

Az orvosi képalkotó diagnosztikai eljárások a műszaki és orvosi diagnosztika legjobban fejlődő területét jelentik. A különböző, más módszerrel nem diagnosztizálható megbetegedések (pl. daganatok, krónikus gyulladások stb.) előfordulása tendenciaszerű növekedése miatt ezen eszközök alkalmazása egyre nagyobb hangsúlyt kap a modern medicinában. Az orvosi diagnosztizálás pontosságát jelentősen javíthatják mind a jobb minőségű (de nagyobb sugárterheléssel nem járó) felvételek, mind az orvosi döntéstámogató rendszerek (CAD-ek) alkalmazása. Előbbi problémák (pl. rekonstrukció) esetén a mai napig az algoritmikus kép és jelfeldolgozáson alapuló módszerek tekinthetőek egyeduralkodónak, viszont a tudományos kutató műhelyekben már olyan eljárások vizsgálata és tervezése történik, melyek lehetővé teszik majd a közeljövőben a neurális paradigma itteni sikeres alkalmazását is. A döntéstámogató, képi diagnosztikai rendszerek (CAD) már a mély tanulás előtti időszakban is neurális eszközökre épültek, itt viszont kiemelten érdekes kérdés a tudástranszfer gyakorlati alkalmazhatósága, annak lehetőségei, illetve korlátjai.

A problémakör másik fontos alkalmazását jelentik az autonóm járművek, melyek esetén leginkább képi információ alapján kell egy neurális eszköznek felelős döntést hoznia valós időben. Itt a legrelevánsabb alkalmazási korlát a mély hálók sok tekintetben black box jellege, mely meghaladásához azok interpretációja, működésük robosztusságának növelése elengedhetetlen. Szűk keresztmetszet továbbá a hálók nagy számítási igénye, mely csökkentése az elérhető pontosság megtartása mellett szintén kritikus lehet.

Eloszlások tanulása, minták generálása

Sokáig nyitott kérdés volt, hogyan lehet több módusú, általános, nevezetes eloszlások kombinációjával nem jól közelíthető, komplex domén felett (pl. képek) definiált eloszlásokat, annak statisztikai mintái alapján modellezni. A mély neurális hálók ezen problémára is hatékony eszközöket biztosítanak (VAE, GAN, pixel CNN), melyekkel sok esetben embereket is megtévesztő képeket lehet generálni. Általános problémája viszont a mai módszereknek, hogy nem használják fel a klasszikus kép- és jelfeldolgozás eredményeit, ezek használatával viszont várhatóan javítani lehetne a minőségen és hatékonyságon. Fontos alkalmazási területe ezen eszközöknek a mintagenerálás (data augmentation), mely mögött a tapasztalati kockázatminimalizáláson alapuló tanulási eljárásokkal konstruált eszközök valódi mérésekkel sosem kielégíthető mintaigénye áll.

Számos alkalmazási terület is kapcsolódik e témához, például a fekete-fehér képek színezése, festmények generálása valódi képekből, képek felbontásának növelése, képeken kitakart részletek generálása, sematikus képekből (pl. utca térképekből) valódi felvételek (pl. szatellitképek) generálása, video, illetve hangfelvételek hihető manipulálása.

A témakör különböző nehézségi fokon művelhető, kezdve az egyszerű feladatoktól, egészen az összetett rendszerek tervezéséig, illetve analíziséig. Így a témacsokorba illeszkedő feladatok a témalabortól kezdve akár az MSc diplomatervig végigvihetőek, sőt, mint azt számos létező példa is bizonyítja, akár PhD témaként is művelhetőek.

Szívesen látunk olyan, az alkalmazott matematika iránt érdeklődő hallgatókat, akik nem idegenkednek a fenti feladatokhoz kapcsolódó elméletibb jellegű problémáktól és markánsan meg kívánják haladni a terület main-stream „csinálok egy hálót, elindítom a tanítását, majd megváltódik a világ” megközelítését.

Témavezetők

Dr. Bolgár Bence
tudományos segédmunkatárs
Tel.:+36 1 463-2010
Email: bolgar(*) mit.bme.hu

Dr. Hullám Gábor
adjunktus
Tel.:+36 1 463-2010
Email: hullam.gabor(*) mit.bme.hu

Hadházi Dániel
tudományos segédmunkatárs
Tel.:+36 1 463-2458
Email: hadhazi(*) mit.bme.hu

 

 
© 2010-2024 BME MIT