LLM-alapú Verifiable Credential séma és kódgenerálás

Kirás éve: 2026 | Státusz: nyitott

Az önrendelkezésű identitás (Self-Sovereign Identity, SSI) egy olyan-magának az elmúlt években egyre nagyobb teret hódító-identitás- és adatkezelési paradigma, amelyben a felhasználók maguk kezelik digitális azonosítóikat és az azokhoz kapcsolódó minden potenciálisan személyes adatot. E megközelítés elméleti és technológiai alapját az ellenőrizhető tanúsítványok (Verifiable Credentials, VC) és a decentralizált azonosítók (Decentralized Identifiers, DID) adják: a VC-k digitálisan aláírt állításokat tartalmaznak egy alanyról, amelyeket az alany maga tárol és oszt meg a számára szükséges mértékben. A téma aktualitását az EU eIDAS 2.0 rendelete adja, amely 2026 végére kötelezi a tagállamokat VC-khez hasonló adaststrukturák tárolására képes, "digitális identitás tárcák" biztosítására az állampolgárok számára, ezzel kontinentális léptékben megnyitva az utat az SSI paradigmáját megvalósító szoftveralkalmazások előtt.

A tanszéken jelenleg is folyó kutatásokban foglalkozunk a VC-alapú identitás- és adatkezelő alkalmazások tervezésével.[Design Space Exploration of Verifiable Credential Schemas using Partial Graph Modeling] Egy ilyen rendszer tervezésének és fejlesztésének részét képezi az adatmodell – a VC sémák – kialakítása, valamint a kibocsátó és ellenőrző komponensek implementálása. Ezek a feladatok jelenleg manuálisak, és jelentős szakértelmet igényelnek a JSON-LD, a kriptográfiai aláírások és a kapcsolódó szabványok terén.

A nagy nyelvi modellek (LLM) programkód-generálásban mutatott képességei nyomán felmerül a kérdés, hogy mennyire alkalmazhatók ezek az eszközök a VC fejlesztés területén. Konkrétan vizsgálható, hogy természetes nyelvű use case leírásokból generálhatók-e érvényes VC sémák (JSON-LD/JSON Schema formátumban), illetve hogy a séma alapján előállíthatók-e működőképes kódrészletek a kibocsátási és ellenőrzési logikához (pl. TypeScript, Python).

Ezen komponensek generálásában érdemes lehet az LLM-ek alkalmazása mellet formális modellező eszközök használata a hallucináció és az LLM-ek egyéb hibáinak elkerülése mellett, mint például a gráfadatbázisok, ontológiáknak való megfelelés ellenőrzése, vagy akár a parciális gráfmodellezés (Refinery)

A téma felderítő, kísérletező jellegű, és több irányba is továbbvihető. Megvizsgálható a promptok és a kontextus (pl. szabványdokumentációk, példasémák) hatása a generált kimenetek minőségére, a különböző LLM-ek összehasonlítása, illetve a generált kódok automatizált tesztelésének lehetősége.

Az Önálló laboratórium pontos célját a hallgatóval közösen, az ő érdeklődése mentén alakítjuk ki. A félév elején a hallgató megismerkedik a VC szabványokkal és a meglévő fejlesztői eszközökkel, e közben körvonalazódik, hogy melyik részproblémára fókuszál a félév hátralévő részében.

Farkas Martin

doktorandusz
farkas