Valószínűségi gráfos modellek felhasználása a mesterséges intelligenciában
Konzulensek: Antal Péter, Hullám Gábor, Millinghoffer András
A valószínűségi gráfos modellek a mesterséges intelligencia, a gépi tanulás és a döntéselmélet általános, alapvető eszközeivé váltak, mint például a Bayes-hálózatok vagy a Markov-hálózatok (lásd például a munkacsoportunk által fejlesztett BayesCube eszközt, http://bioinfo.mit.bme.hu/ ).
Valószínűségi gráfos modellek továbbfejlesztése
A valószínűségi gráfos modellek kiterjesztésének jelenlegi irányai például az oksági relációk részletes jellemzése, a környezetfüggő függetlenségek reprezentálása, a jövőbeli információ hasznának hatékony megbecslése, magyarázatgenerálás, illetve bayesi megközelítésben modellek sokaságának hatékony kezelése.
A témalabor folyamán lehetőséget biztosítunk a valószínűségi gráfos modellek általános megismerésére és a fentebbi kutatásokhoz tartozó módszerek megvalósítására, nevezetesen például a következő feladatok esetében:
- oksági relációk részletes jellemzése, “kényszerített” élek és “zavarásmentes” élek azonosítása,
- magyarázatgenerálás,
- a jövőbeli információ hasznának hatékony megbecslése,
- modellek, környezetfüggő függetlenségek és átfogó modelltulajdonságok hatékony reprezentálása bayesi megközelítésben.
Megismerhető eszközök és területek:
- Nyelvek: C, R, Python
- Területek: Genetikai méréstechnikák, bioinformatika, kemoinformatika, gyógyszerkutatás, biostatisztika, orvosi szakértői rendszerek, orvosi döntéstámogatás.
Kutatási projektjeink:
- Bayesian, systems-based methods for analyzing large health data sets,
- Decision Support and Intelligent Automation of Next-Generation Sequencing Workflows,
- Depression, diet and co-morbid disorders (UK Biobank, 1602),
- Ageing with elegans: discovering molecular pathways underlying healthy ageing for prevention, diagnosis, and treatment (EU/H2020).
Általunk fejlesztett eszközök:
- BayesCube, BayesEye, (http://bioinformatics.mit.bme.hu/
Nagyteljesítményű számítási módszerek a mesterséges intelligenciában
A témalabor során a cél, hogy több hallgató közösen együttműködve valósítson meg egy a fenti kihívásoknak megfelelő munkafolyamat-rendszert, a következő részfeladatok megvalósításával:
- Nagy mennyiségű és számítási igényű adathalmazok feldolgozása elosztott számítási környezetben, azaz a teljes számításhalmaz részfeladatokra (job-ok) bontása, a job-ok futtatásának koordinálása, valamint az eredmények összegyűjtése és összefésülése (aggregálása).
- Egy-egy futó számításhalmaz előrehaladásának monitorozása és az ezzel kapcsolatos adminisztrátori feladatok megvalósítása.
- A lefutott számítások eredményeinek megjelenítse.
A fenti témákhoz az alkalmazási környezetet genotipizálási mérések és az ezekre támaszkodó betegség-gén asszociációs számítások jelentik (ezekkel a hallgatóknak csak érintőlegesen érdemes megismerkedniük); a témalaborok során az alábbi technológiákkal kapcsolatos ismeretek szerezhetők:
- Nagy teljesítményű, elosztott számítási rendszerek használata (htcondor: https://research.cs.wisc.edu/htcondor/).
- Felhő (cloud) technológia (mta cloud: https://cloud.mta.hu/mta-cloud).