Szövegelemző és -annotáló rendszer fejlesztése

Tanszéki konzulens: 
A munkatárs fényképe
docens
Szoba: IE437
Tel.:
+36 1 463-2899
Email: meszaros (*) mit * bme * hu

A kiírás adatai

A téma státusza: 
Aktív (aktuális, lehet rá jelentkezni)
Kiírás éve: 
2016
A kiírás jellege: 
önálló labor, szakdolgozat/diplomaterv

Célkitűzés

A feladat természetes nyelvű dokumentumok gépi elemzésére koncentrál, jellemzően tudáskinyerési és klasszifikációs céllal.

A feladat részletei

Az elképzelt megoldás az intelligens ágens megközelítésre épít, célja a minél szélesebb körű autonóm működés megvalósítása. Olyan gépi módszereket és eszközöket alkalmaz, amelyek képesek emberi szakértők feladait átvállalva, önállóan végrehajtani különféle szövegelemzési, annotálási, adatkinyerési és osztályozási tevékenységeket.

Az alkalmazható módszerek és algoritmusok köre igen széles a nyelvi elemzéstől kezdve, a különféle tudásalapú és tanuló rendszereken keresztül a szótár-, vagy ontológia-alapú megoldásokig. A feladat testre szabása során a jelentkező kiválaszthatja azokat az eszközöket és módszereket, amelyekkel szívesen megismerkedne, illetve dolgozna, és közösen határozzuk meg az elkészítendő alkalmazás célját, funkcióit.

A potenciális alkalmazási területek tárháza is széles az üzleti intelligencia rendszerektől kezdve a történeti és irodalmi szövegek elemzésén keresztül az információbeszerző rendszerekig.

Lehetséges részfeladatok

A feladatkiírás sokféleképpen szabható személyre, például:

  • információkinyerés webes adatforrásokból (weblapok, Facebook stb.),
  • szöveggyűjtemény tudáselemeinek felismerése, annotálása, kinyerése és felhasználása (pl. útleírások térképre rendezése)
  • szöveg összekapcsolása és bővítése tudásbázisokkal (pl. háttérinformációk megjelenítése a Wikidata segítségével)
  • hangulatelemzés szövegekből (pl. termékértékelések osztályozása)
  • szerzőség azonosítása
  • és további remek hallgatói ötletek

 

Szükséges kompetenciák - megszerezhető képességek

A feladat sikeres megoldásához alapvető programozói tudás (jellemzően Python) szükséges, speciális (pl. NLP) nyelvek és algoritmusok előzetes előismerete nem.

A feladat megoldása során gyakorlati ismeretek szerezhetők természetes nyelvű elemzők működéséről, autonóm ágensrendszerek megvalósításáról, megismerhetők fogalomtárak, ontológiák és különféle tudásreprezentációs eszközök (pl. RDF), valamint a kiválasztott MI eszközök és módszerek (pl. gépi tanulás, szabályalapú rendszerek stb.).

A jelentkezés menete, mi várható a konzulenstől...

Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.

 
Kapcsolódó tantárgyak: 
Komplex MI alkalmazások
Kapcsolódó tantárgyak: 
Tudásalapú szolgáltatások
© 2010-2021 BME MIT | Hibajelentés | Használati útmutató