Szerzőazonosítás kézírás alapján (képfeldolgozás, gépi tanulás)

Tanszéki konzulens: 
A munkatárs fényképe
associate professor
Szoba: IE437
Tel.:
+36 1 463-2899
Email: meszaros (*) mit * bme * hu

A kiírás adatai

A téma státusza: 
Aktív (aktuális, lehet rá jelentkezni)
Kiírás éve: 
2022
A kiírás jellege: 
önálló labor, szakdolgozat/diplomaterv

A feladat célja kézzel írt szövegek szerzőségének megállapítása. A kb. 1000 oldalas adathalmaz 6-7 szerzőtől származik. A dokumentumok nagy részének a szerzősége egyértelmű, de egyeseké vitatott, kérdéses. Ezek megállapítására kell egy megoldást elkészíteni. Az adathalmaz és a feladat külső, akadémiai környezetből érkezik, az elkészült megoldás konkrét kutatásokat támogat.

A feladat részletei

A kézírás-felismerés hosszú múltra tekint vissza, elemi megoldásai már évtizedek óta részét képezik ipari rendszereknek (pl. postai irányítószámok felismerése), de a kézzel írt dokumentumok gépi szöveggé alakítása is egyre több helyen jelenik meg elvárásként. A kiírás ehhez a területhez kapcsolódik, bár annál egyszerűbb feladatot takar: nem feltétlenül szükséges a karakterek felismerése, a szerzőség megállapítása nemcsak a szöveg tartalma, hanem a kézírás képi jellemzői alapján is megtörténhet.

Az adathalmaz szkennelt dokumentumokat tartalmaz, így néhány elemi képfeldolgozási lépést is végre kell hajtani rajta (megfelelő kivágás, kontrasztállítás, szegmentálás sorokra, szavakra vagy betűkre). Ehhez felhasználhatók a kézírás-felismerésnél (illetve más területeken) már bevált módszerek és eszközök.

Ezután valamilyen tanuló hálózattal célszerű egy szerzőségi modellt kialakítani, majd a vitatott szerzőségű dokumentumok klasszifikációját elvégezni. Az eredmények ellenőrzéséhez hipotézisek is rendelkezésre állnak a vitatott szerzőségű dokumentumokkal kapcsolatban.

A feladat igény szerint (MSc) bonyolítható kézírás-felismeréssel és stilometriai módszerek alkalmazásával is, amelyek a szövegek tartalmi jellemzői alapján építenek nyelvi modellt a szerzőkről. Ez utóbbi területtel már számos korábbi hallgatói munkában foglalkoztunk, több, gyakorlatban is alkalmazott szoftverkomponenst is készítettünk, amelyek felhasználhatók a feladat megoldására.

Szükséges kompetenciák - megszerezhető képességek

A feladat sikeres megoldásához alapvető programozói tudás (jellemzően Python, esetleg R) szükséges, speciális (pl. NLP, képfeldolgozási) algoritmusok és eszközök előzetes előismerete nem elvárt.

A megoldás kialakítása során gyakorlati ismeretek szerezhetők mélytanuló (deep learning) rendszerek alkalmazásáról, opcionálisan megismerhetők természetes nyelvi modellek, stilometriai módszerek is.

A jelentkezés menete, mi várható a konzulenstől...

Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.

© 2010-2022 BME MIT