Villanyspenót bővítések (szövegbányászat, web)

Tanszéki konzulens: 
A munkatárs fényképe
associate professor
Szoba: IE437
Tel.:
+36 1 463-2899
Email: meszaros (*) mit * bme * hu
Külső konzulens: 
Maróthy Szilvia, OSZK

A kiírás adatai

A téma státusza: 
Korábbi (jelenleg nem aktív, de látszik)
Kiírás éve: 
2015
A kiírás jellege: 
önálló labor, szakdolgozat/diplomaterv

A Országos Széchényi Könyvtárban nagyszabású digitalizálási projekt indult meg. Az új tartalomszolgáltatási rendszert a Digitális Filológia Osztályának vezetésével dolgozza ki a könyvtár. A rendszer alapötlete az, hogy a könyvtár a négy fő gyűjtőkörének megfelelő szakértői rendszereket hozzon létre: irodalomtudományi, nyelvtudományi, történettudományi és könyvtörténeti, könyvtártudományi szakértői rendszert.

Jelenleg az irodalomtudományi szakértői rendszer kidolgozása zajlik, ehhez keres a Digitális Filológia Osztály bölcsészettudományok iránt is érdeklődő hallgatókat.

A feladat

A feladat kiindulási pontja egy online irodalomtörténet szövege, melyet a készülő irodalomtudományi szakértői rendszer középpontjába állítva kapcsolunk össze más szépirodalmi és szakirodalmi szövegekkel, adatbázisokkal.

A feladat során a hallgató egyrészt adatbázisokkal (pl.  RPHA ) kapcsolja össze az irodalomtörténet szövegét, szövegbányászati eszközökkel feltárva a kapcsolódási pontokat. Másrészt a szövegbányászat során kigyűjtött egyéb információk (pl. évszámok, korszakra utaló kifejezések, műfajnevek) segítségével vizualizációk készíthetőek el (pl. folyamatábra a műfajok népszerűségének alakulásáról a századok során).

További vizualizációra ad lehetőséget a szövegek közötti kapcsolódási pontok hálózatszerű viszonyainak ábrázolása.

Mind az irodalomtörténet és az adatbázisok összekapcsolásához, mind a vizualizációk készítéséhez szükséges az online irodalomtörténet (jelenleg HTML-alapú) szövegének tisztítása, XML tagekkel (s ezen belül egyes esetekben azonosítókkal, pl. VIAF ID) való ellátása.

A könyvtári katalógusokkal való összekapcsolás érdekében szükség van az irodalomtörténetben szereplő lábjegyzetekből a bibliográfiai információk kigyűjtésére (elsősorban névre, dátumra és címre), melyet reguláris kifejezések felhasználásával kell elvégezni, majd az adatokat adatbázisba rendezni ill. XML tagekkel ellátni.

Az így nyert adatok megjelenítéséhez az online irodalomtörténet oldalán szükség lesz olyan felületre, ami egy kifejezéshez akár több linket is meg tud jeleníteni egyszerre, jól olvasható formában.

Szükséges kompetenciák - megszerezhető képességek

 A Villanyspenót nevű online irodalomtörténet node.js-ben készült, az ehhez kapcsolódó fejlesztői és üzemeltetési ismeretek (MongoDB, Angular, Javascript, NoSQL) előnyt jelenteken. Az RPHA Java alapon épül fel, ennek alapszintű ismerete szükséges.

További általános információk

Ezen a lapon összefoglaltam, mire számítok a jelentkezőktől, illetve mi várható tőlem.

 
© 2010-2024 BME MIT