Biológiailag informált neurális hálózatok
A neurális hálózatok egyre szélesebb körű alkalmazása a biológiai és orvosi adatfeldolgozásban új kihívásokat vet fel az értelmezhetőség, az általánosíthatóság és a biológiai plauzibilitás szempontjából. A klasszikus, tisztán adatvezérelt mélytanulási modellek gyakran nehezen illeszthetők a meglévő biológiai tudáshoz, és eredményeik magyarázata sok esetben korlátozott.
A biológiailag informált neurális hálózatok (Biologically Informed Neural Networks, BINN) célja, hogy a tanulási folyamatba explicit módon beépítsék a biológiai előismereteket, például gén–gén kölcsönhatásokat, jelátviteli útvonalakat, fehérje–fehérje interakciókat vagy hierarchikus ontológiákat. Ezáltal olyan modellek hozhatók létre, amelyek strukturáltabbak, jobban értelmezhetők, és potenciálisan robusztusabbak korlátozott mintaszám esetén is.
A témakiírás célja egy biológiailag informált neurális hálózati modell megtervezése, implementálása és alkalmazása valós, publikus biológiai adatkészleteken. A hallgató feladata olyan modellarchitektúra kialakítása, amelyben a hálózat szerkezete vagy regularizációja biológiai tudáson alapul (pl. génútvonalak, hálózatok, ontológiák). A modellt tanítani, tesztelni és kiértékelni kell egy releváns predikciós feladaton (pl. betegségkimenetel, fenotípus, gyógyszerhatás).
A munka fontos része magyarázhatósági módszerek alkalmazása (pl. feature-attribution, pathway-szintű aggregáció, gradiens-alapú vagy perturbációs technikák), valamint az eredmények összevetése hagyományos, nem biológiailag informált neurális hálózatokkal. A cél annak vizsgálata, hogy a biológiai priorok hogyan befolyásolják a teljesítményt, a stabilitást és az értelmezhetőséget.
Feladatok jellege:
-
Publikus biológiai adatkészletek feldolgozása
-
Biológiai előismeretek formális reprezentálása (hálózat, hierarchia, maszkok, regularizáció)
-
Biológiailag informált neurális hálózati modell tervezése és implementálása
-
Modell tanítása, tesztelése és kvantitatív kiértékelése
-
Magyarázhatósági algoritmusok alkalmazása és összehasonlító elemzése
-
Eredmények kritikus értelmezése biológiai szempontból
Keretrendszer:
-
PyTorch
-
(opcionálisan) PyTorch Geometric, NumPy, pandas
BME-MIT



