ChatGPT és információkeresés

Tanszéki konzulens: 
A munkatárs fényképe
docens
Szoba: IE437
Tel.:
+36 1 463-2899
Email: meszaros (*) mit * bme * hu

A kiírás adatai

A téma státusza: 
Aktív (aktuális, lehet rá jelentkezni)
Kiírás éve: 
2023
A kiírás jellege: 
önálló labor, szakdolgozat/diplomaterv

Célkitűzés

A feladat egy olyan rendszer megvalósítása, amely természetes nyelvű szövegekből (pl. weblap-rendszer, céges dokumentumtár, TVSz, tantárgyi adatlapok stb.) felépített korpuszon képes információkeresési és -kinyerési feladatok megoldására nagy nyelvi modellek alkalmazásával.

A feladat részletei

A ChatGPT lázba hozta a világot: jelesre megír egy ZH-t, fogalmazásokat készít önállóan egy megadott témakörből és alapvetően jól válaszol a felhasználó kérdéseire. Nyelvi képességei látványosan jobbak, mint a korábbi nyelvi modelleké, még magyar nyelven is társalgási szinten beszél. A rendszerhez elérhető egy programozói felületet is, amin keresztül programozottan is felhasználhatók az OpenAI által készített GPT nyelvi modellek.

Bár ezen modellek generatív jellegük miatt elsőként az ember-gép interfészek terén váltak népszerűvé, de más alkalmazási területeken is egyre szélesebb körben használják őket. Ezen területek egyike az információkereső rendszerek (pl. az internetes keresőmotorok).

A feladat egy olyan rendszer megvalósítása, amely természetes nyelvű szövegekből felépített korpuszon képes információkeresési és -kinyerési feladatok megoldására nagy nyelvi modellek alkalmazásával. A rendszernek alkalmasnak kell lennie egy szövegbázis betöltésére és tárolására, majd azon különféle információkereséshez kapcsolódó feladatok megoldására, pl. relevancialapú dokumentum-részletek keresése, információkinyerés, kérdés-megválaszolás
stb.

A hallgató munkájának a következőkre kell kiterjednie:

  • ismerkedés a nagy nyelvi modellek működésével és alkalmazási területeivel,
  • a feladatkiíráshoz hasonló célú megoldások felkutatása és megismerése,
  • egy választott témakörre vonatkozó dokumentumgyűjtemény létrehozása,
  • a fentebb megfogalmazott feladatokat megoldó alkalmazás tervezése és megvalósítása,
  • teljesítménymértékek meghatározása az alkalmazás működésének kiértékelésére,
  • információkeresési kísérletek futtatása, az alkalmazás működésének értékelése.

Szükséges kompetenciák - megszerezhető képességek

A feladat sikeres megoldásához elemi programozói tudás (Python, esetleg NodeJS) szükséges, speciális (pl. NLP) algoritmusok és eszközök előzetes előismerete nem.

A feladat megoldása során gyakorlati ismeretek szerezhetők a természetes nyelvű szövegek gépi elemzésének különböző lépéseiről (NLP pipeline), valamint a mélytanuló (deep learning) rendszerek és a nagy nyelvi modellek (LLM) alkalmazásáról.

Lehetőség van generatív (és más, mélytanuláson alapuló) nyelvi modellek továbbtanítására és finomhangolására is, így a jelentkező a modellépítés alapvető lépéseivel is megismerkedhet.

A jelentkezés menete, mi várható a konzulenstől...

Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.

© 2010-2024 BME MIT | Hibajelentés | Használati útmutató