Orvosbiológiai adatelemzés és döntéstámogatás

Vezető kutató: Antal Péter

Az orvosbiológiai kutatásokat alapjaiban formálják át az új molekuláris biológiai méréstechnikai eljárások és az általuk generált nagy mennyiségű, átfogó adat. A témalabor e terület jellegzetességeit és a jelentkező kihívások kezeléséhez szükséges technikák megismerését teszi lehetővé két feladatcsoport keretében: (1) genetikai adatok mérése és elemzése, (2) szemantikus technológiák a kemo- és bioinformatikában.  

Genetikai adatok mérése és elemzése

Konzulensek: Sárközy Péter, Gézsi András, Millinghoffer András

Az új molekuláris biológiai méréstechnikai eljárások mindennapjainkat is elérő példái a modern genetikai szekvenálási méréstechnikák. Ezek közül bemutatunk egy egyetlen molekulás, valós idejű elektronikus genetikai szekvenálási eljárást, amely a mintaelőkészítést és így az általános használatot is drasztikusan leegyszerűsíti. Az eljárás során egy nanoméretű póruson vezetünk át egy DNS szálat, és az áthaladása során változó áramerősségből következtetünk a nukleotidok sorrendjére. A molekuláris szintű, kutatási adatok mellett egyre nagyobb szerepet töltenek be az olyan adatok is, amelyek a népesség egy átfogó részét fedik le és teljes körű egészségügyi, klinikai és gyógyszerfogyasztási adatokat gyűjtenek, valós életből származó adatokkal kiegészítve. Az ilyen jellegű adatgyűjtést a viselhető elektronikai eszközök és a támogatott életvitel technológiáinak az elterjedése is segíti. Ez az új, sokrétű, a népességnek akár milliós részét lefedő, esetenként akár megfigyelések millióit tartalmazó egészségügyi adathalmaznak az elemzése új lehetőségek sorát nyitja meg. Különösen fontos lehetőség a rendszerszintű, összetett összefüggések felderítése, mint például a genetikai adottságok, környezeti tényezők és a személyes döntések együtteseinek a vizsgálata, illetve ezek egészségmegőrzésre, betegségek megelőzésére vonatkozó hatásának a megértése. Lehetőséget biztosítunk a hálózati-rendszerszintű adatelemzés megismerésére és az orvosi szakértői rendszerek alkalmazására valós adatokon.

Megvalósítandó feladatok típusai:

  • Új generációs szekvenálás elutasításos opcióval.
  • Teljes-genomszélességű genetikai adatok statisztikai elemzése
  • Adatvédelmet biztosító statisztikai módszerek

Megismerhető eszközök és területek:

  • Nyelvek: C, R, Python
  • Keretrendszerek: Eclipse, Cytoscape, Protégé,
  • Területek: Genetikai méréstechnikák, bioinformatika, kemoinformatika, gyógyszerkutatás, biostatisztika, orvosi szakértői rendszerek, orvosi döntéstámogatás.

 

Szemantikus technológiák a kemo- és bioinformatikában

Konzulensek: Bruncsics Bence, Gézsi András

Az ún. Resource Description Framework (RDF) W3C ajánlás megjelenése óta az RDF formátumú, publikusan elérhető adatok mennyisége rendkívül gyorsan növekszik. Az adatok nagy mennyisége és az adatbázis sémájának hiánya azonban számos kihívást támaszt az adatokat lekérdezni kívánó felhasználókkal szemben. Az adatbázisok „rejtett struktúrájának” feltérképezése, az egymással összekapcsolódó entitások megismerése, a lehetséges következtetések típusainak meghatározása és a lekérdezések optimalizálása önmagában is nehéz feladat. A felhasználónak emellett ismernie kell egy lekérdező nyelvet is ahhoz, hogy információt tudjon kinyerni az adatbázisból.

A témalabor során támogatást és lehetőséget biztosítunk az alábbi ismeretek megszerzésére:

  • A szemantikus web technológiák és a SPARQL lekérdező nyelv megismerése
  • Hatékony SPARQL lekérdezések létrehozásának szabályai
  • Élettudományi (kemo- és bioinformatikai célokra felhasználható) kapcsolt adatbázisok megismerése
  • Virtuoso adatbázis rendszer használata

Megismerhető eszközök és területek:

  • Nyelvek: SPARQL lekérdező nyelv, R, BioConductor
  • Keretrendszerek: OpenLink Virtuoso, Cytoscape, Protégé,
  • Területek: Bioinformatika, kemoinformatika, gyógyszerkutatás, orvosi szakértői rendszerek

Nemzetközi kutatási projektjeink:

  • K.U. Leuven, BME Crysys Lab, BME Combine Lab: HIDUCTION, személyes adatok védelmét megőrző adat és tudásfúziója a személyre szabott medicinában
     
  • University of Manchester, MTA-SE Neuropszichofarmakológiai és Neurokémiai kutatócsoport, BME Combine Lab: UK Biobank (1602), Depression, diet and co-morbid disorders
     
  • Ageing with elegans: discovering molecular pathways underlying healthy ageing for prevention, diagnosis, and treatment (EU/H2020).

Általunk fejlesztett eszközök:

Kiemelt publikációk:

  • Sarkozy, P., Jobbágy, Á., Antal, P: Calling Homopolymer Stretches from Raw Nanopore Reads by Analyzing k-mer Dwell Times, IFMBE 2017
  • P Marx, B Bolgár, A Gezsi, A Gulyás-Kovács, P Antal: MicroRNA Prioritization based on Target Profile Similarities. BIOINFORMATICS, 278-285
  • M Bence, P Marx, E Szantai, E Kubinyi, Z Ronai, Z Banlaki: Lessons from the canine Oxtr gene: populations, variants and functional aspects. Genes, Brain and Behavior 16 (4), 427-438
  • AH Freedman, I Gronau, RM Schweizer, D Ortega-Del Vecchyo, E Han, P Marx, et. al.: Genome sequencing highlights the dynamic early history of dogs. PLoS genetics 10 (1), e1004016
  • Szalai Csaba - Antal Péter: Hálózatok vizsgálata betegségekben, Természet világa, 2015
  • Marx, P., Antal, P., Bolgar, B., Bagdy, G., Deakin, B., & Juhasz, G. (2017). Comorbidities in the diseasome are more apparent than real: What Bayesian filtering reveals about the comorbidities of depression. PLoS computational biology, 13(6), e1005487.
  • P. Antal et al.: Using Literature and Data to Learn Bayesian Networks as Clinical Models of Ovarian Tumors, Artificial Intelligence in Medicine, 2004
  • P. Antal et al.: Bayesian Applications of Belief Networks and Multilayer Perceptrons for Ovarian Tumor Classification with Rejection, Artificial Intelligence in Medicine, 2003

 

© 2010-2021 BME MIT | Hibajelentés | Használati útmutató