„Lassan két évtizede foglalkozunk a mesterséges intelligencia, gépi tanulás, bioinformatika és biostatisztika területeihez tartozó módszerekkel"

Magyarországon hozták létre a 250 leggyakoribb betegség egymásra hatásának első térképét, amelyhez a BME VIK kutatói csaknem százhúszezer ember adatát vizsgálták meg.

„Lassan két évtizede foglalkozunk a mesterséges intelligencia, gépi tanulás, bioinformatika és biostatisztika területeihez tartozó módszerekkel, amelyekből a Bayes-i, rendszerszemléletű megközelítések váltak kulcsfontosságúvá a betegségek közötti kapcsolatrendszer feltérképezéséről szóló publikációnkban” – mondta el Antal Péter, a Méréstechnika és Információs Rendszerek Tanszék docense, aki egyik szerzője volt a közelmúltban a PLOS Computational Biology folyóiratban megjelent cikknek, amely bemutatta a Műegyetem, a Semmelweis Egyetem, valamint a Manchesteri Egyetem kutatóinak közös munkáját.

Ennek eredményeképpen olyan elektronikusan elérhető és kereshető ún. multimorbiditási, vagyis különböző betegségek egymásra hatását mutató térkép készült el, amely a 250 leggyakoribb kór közötti rendszerszintű kapcsolatokat mutatja be. A felület orvosok, gyógyszerkutatók vagy a laikus érdeklődők számára egyaránt hasznos lehet.

A kutatások nagy számú résztvevő részletes egészségügyi információit tartalmazó adathalmazokon alapultak, amelyek a UK Biobankból származtak. A UK Biobank a világ jelenlegi legnagyobb, félmillió résztvevővel rendelkező olyan adatbázisa, amely a résztvevők teljes genetikai profilját is tartalmazza, illetve információkat a korábbi vagy fennálló betegségeiről, gyógyszerfogyasztási és életviteli szokásairól, valamint egyes részcsoportok esetében még betegségspecifikus adatokat is. A kutatócsoport egy korábbi pályázatukkal ezen információbázis használatához nyert jogosultságot.

Az adatbázisba önkéntes résztvevők adatai kerülnek, akiknek a rendszer az adatait több szempontból is védi. „Sok más kutatócsoport is részt vesz az adatok elemzésében, de a UK Biobank nagyon vigyáz arra, hogy a tudósok csak a pályázati szakterületükre vonatkozó információkat kapják meg, és csak a korábban megjelölt kérdéseket vizsgálhatják” – mesélte Antal Péter.

A jelen elemzésben a csaknem 120 000 depressziós résztvevőre vonatkozó adatokat használták. „A feladatunk az volt, hogy a depressziónak az összes többi betegséghez való kapcsolódását próbáljuk feltérképezni. Olyan rendszermodellt építettünk, amelyben világosabbá vált, hogyan hatnak közvetlenül egymásra az egyes betegségek, például a depresszió, az elhízás, a stressz vagy a migrén” – fogalmazott Antal Péter.

Az ismert több ezer betegségből többszörös szűrés eredményeképpen kapták meg az adatbázisban leggyakoribb 250 betegséget, amelyek ilyen rendszerszintű elemzésre felhasználhatóak voltak.

A munkában kulcsszerepe volt Marx Péter doktorandusznak, a publikáció másik BME-s társszerzőjének, az Antal Péter vezette kutatócsoport tagjának. „A betegségek megszűrése valódi kihívás volt, mert minden adat kódolva érkezett hozzánk. A testtömeg-index információkból kellett például a rendszerbe építeni az elhízást, mint betegséget, mert ez az adatokban nem különálló kórként szerepelt.”

Az információk letisztítása után indultak meg a több szálon futó elemzések. Marx Péter egyik sajátos feladata volt, hogy a Nagy-Britanniában használt betegség-kódrendszert a nemzetközi kódrendszerbe építse be. Az ehhez szükséges orvostudományi hátteret a Semmelweis Egyetem szakértői, a publikáció társszerzői, Bagdy György és Juhász Gabriella biztosították.

„A tanszéki fejlesztésű, ún. valószínűségi gráfos modelleken alapuló módszer segítségével tudtuk kiszűrni a betegségek páronkénti relációinál a közvetett hatásokat” – emlékezett Marx Péter. „Ez volt a legnagyobb munka: több napig tartó számításokat kellett gépen futtatni és az eredményeket összevetni, értelmezni. Végül a 18 csoportba osztott 250 betegség csomópontjai között 320 olyan statisztikailag is megerősített kapcsolat jelentkezett, ami a betegségeket egymáshoz köti. A módszerünkből származó eredmények nem pusztán betegségpárokra, hanem betegségcsoportokra is alkalmazhatóak, akár négy-öt betegséget is vizsgálhatunk együtt.”

A publikáció tartalmazza annak az ingyenes keresőrendszernek az elérhetőségét, amely elkészítésében oroszlánrészt vállalt Marx Péter. A honlapnak a BME Méréstechnika és Információs Rendszerek Tanszék szerverei biztosítanak helyet. Az interaktív felületen a betegséghálózatokat mutató térkép keresőjében különféle változókat – például betegségpárokat vagy csoportokat – adhatunk meg. A változók kombinálásával, szűrésével választ kaphatunk arra, hogy többféle betegség között valószínű-e közvetlen betegség-betegség szintű egymásra hatás.

A kiemelten kezelt depresszió térképe például jól igazolja, hogy ez a betegség elsősorban a többi pszichiátriai betegséggel van szoros kapcsolatban, de az elhízással és egyes testi betegségekkel is összefügg. A cukorbetegséggel való kapcsolata viszont nem közvetlen, hanem inkább az elhízás miatt gyakoribb a depressziósoknál.

Az egyes betegségek közötti kapcsolat statisztikai megerősítését a neveket összekötő vonal vastagsága jelzi. „Jelenlegi korlát, hogy e vonalak nem mutatják meg, például színezéssel, hogy a kapcsolat pozitív vagy negatív hatású” – hívta fel a figyelmet Antal Péter. „Az utóbbi évek meglepő tudományos felfedezése volt az inverz komorbiditás, nevezetesen, hogy egyes betegségek megléte más betegségek előfordulásának valószínűségét csökkenti. Ez a jövőbeli kutatásainknak is egyik iránya, de a jelenlegi legfontosabb feladatot a projekt májustól elérhető teljes körű genetikai adatai jelentik. Ekkortól lehetett ugyanis letölteni a UK Biobank félmillió résztvevőjének a 10 terabájtnyi genetikai adatát, amelynek rendszerszintű vizsgálata a betegségekre, gyógyszerfogyasztásra, környezeti hatásokra és életmódra vonatkozó adatokkal együtt jelenti a következő nagy bioinformatikai kihívást.

HA - GI

Fotó: Philip János

Illusztrációk: Antal Péter

© 2010-2017 BME MIT