Adatminőség biztosítása adatterekben [EDGE-Skills EU Projekt]

Kirás éve: 2026   |   Státusz: nyitott

Az adatterek olyan elosztott ökoszisztémák, ahol különböző szervezetek szabványos módon tudnak adatokat cserélni, miközben nem kell elengedniük a saját adataik feletti kontrollt.

Egy adattérben különböző komplex sokszereplős együttműködések építhetők ki; pl. egy szervezet tanulmányi adatokat szolgáltat, egy másik szervezet egyedi szolgáltatása anonimizálja ezeket, egy harmadik szervezet az anonimizált adatokat kapja csak meg és AI modelleket épít azok alapján, és így tovább.

Az ilyen együttműködések csak akkor tudnak jól működni, ha az adatátadások során a felek biztosítani tudják egymást, hogy az átadott adat minősége megfelelő – legalább olyan , mint amiben szerződésesen megegyeztek. Pl. hiányos, vagy túl egyhangú adatokból nem lehet jó modellt építeni.

Egy tanszéki projekt során egy épülő EU adattérhez (Prometheus-X) fejlesztünk egy olyan komponenst, melynek célja az adatminőség biztosítása az adattérben történő tranzakciók során. Az adatokkal kapcsolatban különböző követelmények fogalmazhatók meg, melyeket a Data Veracity Assurance (DVA) eszköz ki tud értékelni és a kiértékelés eredményéről nyugtákat tud adni.

A téma során a Data Veracity Assurance adattér építőelem fejlesztésébe lehet becsatlakozni. A feladat elsősorban gyakorlati, fejlesztés jellegű.

Péter Bertalan Zoltán
Péter Bertalan Zoltán

doktorandusz
bpeter
  ORCID Google Scholar ResearchGate