Természetes nyelvű felhasználói felületek

Tanszéki konzulens: 
A munkatárs fényképe
docens
Szoba: IE437
Tel.:
+36 1 463-2899
Email: meszaros (*) mit * bme * hu

A kiírás adatai

A téma státusza: 
Aktív (aktuális, lehet rá jelentkezni)
Kiírás éve: 
2008
A kiírás jellege: 
szorgalmi feladat, önálló labor, szakdolgozat/diplomaterv

Bevezetésképpen egy demo videót [lásd irodalmak a lap végén] szeretnék bemutatni, amely egy magyar nyelvű kérdés SQL fordítását készíti el, és azt illusztrálja, hogy a gépi nyelvekhez nem értő felhasználó hogyan használhatja a saját természetes nyelvét egy feladat megfogalmazása során. 

A feladat általánosabban

Az önálló laboratórium feladat lényege annak a kérdésnek a vizsgálata, hogy egy kellően korlátozott természetes nyelv mennyiben egyszerűsíti (teszi lehetővé) ember-gép kommunikációs rendszerek felépítését.

Ha intelligens ágensek felől közelítjük a feladatok... A vizsgált rendszer a szokásos mesterséges (pl. ágens kommunikációs) nyelveket szintaktikailag és szemantikailag jól meghatározott természetes nyelvekkel (angol, magyar) cseréli fel annak érdekében, hogy megkönnyítse emberek részvételét a kommunikációban. A feladatról szól néhány fólia is (Dobrowiecki Tadeusz készítésében).

Ha szoftverfejlesztés felől közelítünk... Olyan rendszereket szeretnénk építeni, amelyekkel egy - természetes nyelvek feldolgozásában nem jártas - programozó is (viszonylag) egyszerűen készíthet természetes nyelvű felületet (pl. weblapot).

Ha a nyelvi elemzés felől közelítünk... Olyan nyelvi elemzési és generálási módszereket szeretnénk kidolgozni (alkalmazi), amelyek adott alkalmazási terület kellően korlátos nyelvtanára és szókincsére építve működő és egyszerű nyelvi felületek létrehozásához szükségesek.

Előzmények, alkalmazási területek

A tanszéken a kilencvenes évek óta foglalkozunk ágensrendszerek vizsgálatával, illetve alkalmazásukkal különféle területeken. Az intelligens ágensek szabványos kommunikációja (ACL) lehetővé teszi a fejlesztők számára különböző tartalom nyelvek alkalmazását. Érdekes lehet annak vizsgálata, hogy ezek a tartalom nyelvek mennyiben helyettesíthetők természetes nyelvekkel oly módon, hogy ne rontsuk az ágens nyelvek hatékonyságát (feldolgozhatóságát), ugyanakkor a gépi kommunikációt közelebb hozzuk az ágens közösségekben (pl. intelligens terekben) megjelenő emberekhez. (A feladat akár a tanszéki mitmót moduláris robothoz kapcsolódóan tovább is alakulhat.)

A tanszéken az "információ és tudás tárház" projektben az információhoz jutás folyamatát modelleztük, illetve javaslatokat tettünk ilyen rendszerek felépítésére és működésére. Egy információkereső rendszer egyik sarkallatos eleme a felhasználói kérések megfogalmazásának mikéntje: hogyan lehet megfogalmazni a felhasználó információs igényét létező tárgyterületi leírásokra (ontológiákra, adat- és tudásbázisokra) támaszkodva, az egyszerű kulcsszavas keresésnél lényegesen hatékonyabban. Ebben is segíthet egy jól szabályozott természetes nyelv, amely bár közel áll a felhasználó anyanyelvéhez, de nyelvtani szabályai, illetve szókincse a tárgyterületi tudásból származnak (ezáltal lehetővé téve az egyértemű gépi feldolgozást).

Részfeladatok

A kiírt feladat sokféleképpen részletezhető, programozási és elméleti jellegű feladatok is elképzelhetők. Saját ötlettel is megkereshetnek. Néhány feladattípus:

  • kontrollált természetes nyelvek, ágens kommunikációs nyelvek
  • (kontrollált) természetes nyelvek gépi feldolgozása
  • tárgyterületi háttértudás leírása (ontológia, tudásbázis)
  • nyelvtan és szókincs generálás tárgyterületi háttértudásból
  • ágens kommunikációs (tartalom) nyelvek
  • interfész ágensek megvalósítása
  • természetesen nyelvű felületek webrendszerekben
  • természetes nyelvű kommunikáció beágyazott (mobil) rendszerekben

Szükséges kompetenciák - megszerezhető képességek

A feladat sikeres megoldásához programozói tudás szükséges, de speciális (pl. NLP) nyelvek és algoritmusok előismerete nem. Előzetesen csak alapszintű jártasság szükséges az MI egyes területein (lásd MI könyv ágensekről és kommunikációról szóló fejezetei). 

A feladat megoldása során gyakorlati ismeretek szerezhetők egyszerűbb természetes nyelv feldolgozási és fordítási feladatokban, valamint mélyebb ismeretek ágensrendszerek megvalósításában (ágensek működése, kommunikációja, kooperációja, stb.). Alkalmazási területtől függően további gyakorlati ismeretek szerezhetőek pl. az információbeszerzés, beágyazott intelligencia, intelligens otthon, stb. témakörökben. 

Kapcsolódó kutatás

Az előzményekben felsorolt (lezárult) projektek mellett saját doktori témám és új projektek is kapcsolódnak a témához.

Felhasznált eszközök

A fejlesztés Eclipse / Java környezetben zajlik (nem kötelezően). Kisebb webes (HTML, PHP) feladatok is elképzelhetők. Megfelelő érdeklődés esetén egyedi (beágyazott) hardver és szoftver eszközök alkalmazására is lehetőség van. A feladat hosszabb távú célkitűzése az, hogy az intelligens terek különféle eszközeit is bevonjuk a mintaalkalmazásokba, illetve olyan érdekes és jövőbemutató alkalmazási környezetek eszközeit is megvizsgáljuk, mint például az otthoni betegellátás, illetve az idősek egészségügyi (táv)felügyelete. 

Egy korábbi hallgatói munka Androidos környezetben valósított meg hangalapú bevitelt. Ilyen eszközök is a rendelkezésünkre állnak.

Irodalmak

  1. A bevezetésben említett demonstráció részletesebb ismertetője:
    Mészáros Tamás, Dobrowiecki Tadeusz, Kiss Margit: "Kontrollált természetes nyelvű lekérdezés webes adatbázisokhoz" In: Networkshop 2007, Eger, Magyarország 2007.04.11.-2007.04.13, 2007.

A jelentkezés menete, mi várható a konzulenstől...

Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.

 

© 2010-2024 BME MIT | Hibajelentés | Használati útmutató