LLM-alapú természetes nyelvű magyarázat generálás microservice distributed tracing adatokhoz

Tanszéki konzulens: 
A doktorandusz fényképe
doktorandusz
Szoba: IB414
Tel.:
+36 1 463-3579
Email: bpeter (*) mit * bme * hu

A kiírás adatai

A téma státusza: 
Aktív (aktuális, lehet rá jelentkezni)
Kiírás éve: 
2025
A kiírás jellege: 
önálló labor, szakdolgozat/diplomaterv

A microservice architektúrájú rendszerekben elterjedt megfigyelhetőségi technika az elosztott tranzakciókövetés (distributed tracing), melynek segítségével végigkövethetők az esetenként több száz mikroszolgáltatáson áthaladó kérések és az ezek végrehajtása során megfigyelt metrikák és naplóbejegyzések (logok). Az így nyert adatok azonban általában bonyolult struktúrákban vannak leírva, a vizualizációs megoldások pedig csak részlegesen segítik megértésüket.

Distributed trace adatok elemzéséből hasznos diagnosztikai szabályokat is kaphatunk (pl. gépi tanulás útján), azonban ezek szintén komplexek lehetnek – bár tartalmazzák a megmagyarázhatóságot segítő információt, az nem olvasható ki könnyen reprezentációjukból.

Ez egy kísérletezős, „felderítő” jellegű téma, melyben arra keressük a választ, hogy mennyire tudnak a nagy nyelvi modellek (large language model, LLM) segíteni minket ilyen adatok, illetve kifejezetten diagnosztikai szabálykészletek értelmezésében.

A munka részét képezi benchmarkok kidolgozása, a megfelelő „kontextus” promptok (pl. ChatGPT esetében custom instruction) és konverzációs minták kikísérletezése. A kezdeti lépések után a téma következő megcélzott eleme az LLM-ek „interaktív diagnosztikai ágensként” való alkalmazása, ahol az LLM a nyers adatok fölötti lekérdezéseket is javasolhat, melyek eredményét programozottan visszatápláljuk.

© 2010-2025 BME MIT | Hibajelentés | Használati útmutató