Tudásbevitel és -lekérdezés kontrollált természetes nyelven

Tanszéki konzulens: 
A munkatárs fényképe
associate professor
Szoba: IE437
Tel.:
+36 1 463-2899
Email: meszaros (*) mit * bme * hu

A kiírás adatai

A téma státusza: 
Aktív (aktuális, lehet rá jelentkezni)
Kiírás éve: 
2013
A kiírás jellege: 
szorgalmi feladat, önálló labor, szakdolgozat/diplomaterv

Ez a feladat a Természetes nyelvű felhasználói felületek c. témám egy változata. Az ott leírtakat is érdemes átnézni.

A feladat általánosabban

A feladat lényege annak a kérdésnek a vizsgálata, hogy egy kellően korlátozott természetes nyelv hogyan teheti könnyebbé egy adott területre vonatkozó megállapítások (tudáselemek) rögzítését és elérését számítógépes rendszerekben.

A feladat kutatási és fejlesztési célokat is magába foglal - a jelentkező érdeklődésétől függően kombinálva azokat.
Ha szoftverfejlesztés felől közelítünk... Egyszerű nyelvtani elemző és szövegbeviteli rendszert szeretnénk építeni, amellyel egy tudásbázis állításait adhatjuk meg, azon lekérdezéseket futtathatunk. Az elemző komplexitása néhány képernyőnyi, a beviteli rendszer pedig lehet egy Javascript-alapú prediktív szövegmező.
Tudásmérnökség szempontjából... Azt vizsgáljuk, hogy ezzel a kontrollált beviteli módszerrel hogyan írhatunk le állításokat, hogyan kapcsolhatjuk azokat már meglevő tudáselemekhez, külső adat- és tudásbázisokhoz, hogyan kell a kontrollált természetes nyelvet megtervezni, hogyan változik futásidőben a szókincse, stb.

Előzmények, alkalmazási terület

A tanszéken az "információ és tudás tárház" projektben az információhoz jutás folyamatát modelleztük, illetve javaslatokat tettünk ilyen rendszerek felépítésére és működésére. Egy ilyen rendszer egyik központi eleme a tudástár. A feladat ennek a készítését, bővítését vizsgálja.

A jelenleg alkalmazott klasszikus szövegbányászati módszerek ezen a téren messze elmaradnak az elvárt szinttől, és alkalmazásukkal további lényeges áttörés nem várható. Ezért előtérbe kerülnek a szemantikus publikálás eszközei, amelyek a bevitel során igyekeznek a.tudást - legalább részben - formalizálni, számítógéppel feldolgozhatóvá tenni. Ezen rendszerek azonban - speciális beviteli formáik miatt - nehezen terjednek el, igen lassan válnak megszokottá az alkalmazók számára. Ezen a problémán szeretnénk segíteni a kontrollált természetes nyelvek alkalmazásával.

Egyik lehetséges alkalmazási terület az orvosi- és bioinformatika, a megcélzott alkalmazás pedig a tudományos közleményekben megfogalmazott tudás formálisabb leírásának támogatása. Ezek a területek nagyon kiterjedt irodalmi adatbázisokkal rendelkeznek, amelyeknél egyre fontosabb kérdéssé válik a felhalmozott tudás használatának hatékony számítógépes támogatása.

Másik alkalmazási területünk az irodalmi művekhez és történeti szövegekhez kapcsolódó kutatói (ún. kritikai) megjegyzések olyan beviteli módjának kialakítása, amelyik lehetővé teszi egy formális tudásbázis felépítését. A klasszikus kritikai kiadásokhoz képest így lehetővé válik a tudás formális lekérdezése, esetleg következtetések megvalósítása is. Ez a terület a Történeti szövegek számítógépes elemzése c. kiíráshoz kapcsolódik.

Részfeladatok

A kiírt feladat sokféleképpen részletezhető, programozási és elméleti jellegű feladatok is elképzelhetők: 

  • kontrollált természetes nyelvek felépítése, létrehozása, érdekességképpen egy lazán kapcsolódó oldal: Language Creation Society
  • (kontrollált) természetes nyelvek gépi feldolgozása
  • tárgyterületi háttértudás (ontológia, tudásbázis) bekapcsolása a nyelvbe
  • nyelvtan és szókincs generálás tárgyterületi háttértudásból
  • számítógépes interfész (szövegbeviteli felület) megvalósítása
  • ...

Lásd még a Természetes nyelvű felhasználói felületek c. kiírást.

Szükséges kompetenciák - megszerezhető képességek

A feladat sikeres megoldásához alapvető programozói tudás szükséges, de speciális (pl. NLP) nyelvek és algoritmusok előismerete nem. Előzetesen csak alapszintű jártasság szükséges az MI egyes területein (lásd MI könyv kommunikációról szóló fejezetei).

A feladat megoldása során gyakorlati ismeretek szerezhetők egyszerűbb természetes nyelv feldolgozási és fordítási feladatokban, újszerű felhasználói interfészek létrehozásában, tudásbázisok építésében.

A jelentkezés menete, mi várható a konzulenstől...

Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.

© 2010-2024 BME MIT