ChatGPT és információkeresés
associate professor
Szoba: IE437
Tel.:
+36 1 463-2899 Email: meszaros (*) mit * bme * hu |
A kiírás adatai
Célkitűzés
A feladat egy olyan rendszer megvalósítása, amely természetes nyelvű szövegekből (pl. weblap-rendszer, céges dokumentumtár, TVSz, tantárgyi adatlapok stb.) felépített korpuszon képes információkeresési és -kinyerési feladatok megoldására nagy nyelvi modellek alkalmazásával.
A feladat részletei
A ChatGPT lázba hozta a világot: jelesre megír egy ZH-t, fogalmazásokat készít önállóan egy megadott témakörből és alapvetően jól válaszol a felhasználó kérdéseire. Nyelvi képességei látványosan jobbak, mint a korábbi nyelvi modelleké, még magyar nyelven is társalgási szinten beszél. A rendszerhez elérhető egy programozói felületet is, amin keresztül programozottan is felhasználhatók az OpenAI által készített GPT nyelvi modellek.
Bár ezen modellek generatív jellegük miatt elsőként az ember-gép interfészek terén váltak népszerűvé, de más alkalmazási területeken is egyre szélesebb körben használják őket. Ezen területek egyike az információkereső rendszerek (pl. az internetes keresőmotorok).
A feladat egy olyan rendszer megvalósítása, amely természetes nyelvű szövegekből felépített korpuszon képes információkeresési és -kinyerési feladatok megoldására nagy nyelvi modellek alkalmazásával. A rendszernek alkalmasnak kell lennie egy szövegbázis betöltésére és tárolására, majd azon különféle információkereséshez kapcsolódó feladatok megoldására, pl. relevancialapú dokumentum-részletek keresése, információkinyerés, kérdés-megválaszolás
stb.
A hallgató munkájának a következőkre kell kiterjednie:
- ismerkedés a nagy nyelvi modellek működésével és alkalmazási területeivel,
- a feladatkiíráshoz hasonló célú megoldások felkutatása és megismerése,
- egy választott témakörre vonatkozó dokumentumgyűjtemény létrehozása,
- a fentebb megfogalmazott feladatokat megoldó alkalmazás tervezése és megvalósítása,
- teljesítménymértékek meghatározása az alkalmazás működésének kiértékelésére,
- információkeresési kísérletek futtatása, az alkalmazás működésének értékelése.
Szükséges kompetenciák - megszerezhető képességek
A feladat sikeres megoldásához elemi programozói tudás (Python, esetleg NodeJS) szükséges, speciális (pl. NLP) algoritmusok és eszközök előzetes előismerete nem.
A feladat megoldása során gyakorlati ismeretek szerezhetők a természetes nyelvű szövegek gépi elemzésének különböző lépéseiről (NLP pipeline), valamint a mélytanuló (deep learning) rendszerek és a nagy nyelvi modellek (LLM) alkalmazásáról.
Lehetőség van generatív (és más, mélytanuláson alapuló) nyelvi modellek továbbtanítására és finomhangolására is, így a jelentkező a modellépítés alapvető lépéseivel is megismerkedhet.
A jelentkezés menete, mi várható a konzulenstől...
Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.