Kedvcsináló

A szövegek számítógépes kezelése, feldolgozása a számítógépek első alkalmazásai között említhető, gyökerei még a múlt században a könyvtártudományban és a nyelvészetben erednek. Módszereit széles körben alkalmazzák például keresőrendszerek, szövegbányászati eszközök, gépi fordítók, webes és üzleti intelligencia megoldások, valamint megjelentek az oktatásunkban is (alapvetően MSc specializációkon). Az emberi nyelv gépi megértése azonban nehéz feladat, a szövegekben rejlő információk megfelelő kiaknázására és felhasználására a klasszikus módszerek önmagukban korlátozottan alkalmasak.

Eredményesebb információkereső, szövegkivonatoló rendszerek vagy akár ügyesebb chatbotok fejlesztése egyre több emberi (nyelvi, szakértői és alkalmazói) tudás beépítését, azaz a megoldások "intelligenssé" tételét kívánják meg. Ilyen módszerekkel foglalkozik a mesterséges intelligencia (MI), amely az elmúlt években újra az érdeklődés középpontjába került. Ez nem kis részben annak köszönhető, hogy számos - korábban sok fejlesztő számára bonyolultnak tűnő - eljárását könnyen felhasználható fejlesztőeszközökké "szelidítették" a Google, az IBM vagy a Microsoft megoldásai.

A tantárgyban a hangsúlyt éppen az ilyen, egyszerűen alkalmazható intelligens szövegelemzési módszerek gyakorlati bemutatására helyezzük. Néhány példaalkalmazáson keresztül megmutatjuk, hogy egy Android chatbot, egy beszélő robot, vagy egy tudásalapú szövegelemző és -keresőrendszer fejlesztése alapvetően nem igényli bonyolult elméletek ismeretét, egyszerű eszközökre és programozói felületekre támaszkodva is meglepően ügyes megoldások alakíthatók ki.

A tantárgy gyakorlatorientált. A teljesítéséhez alapvetően egy saját NLP projekt végigvitele szükséges, aminek a témája szabadon választható (lásd kedvcsinálok lentebb). A félév során bemutatunk számos ipari projekteket, ahonnan ötletek meríthetők, és a tantárgyi laborokon megismerkedhetnek a projektek megvalósításához szükséges eszközökkel.

Kipróbálásra, kedvcsinálóként ajánljuk

Nagy nyelvi modellek és alkalmazásuk (ChatGPT).

Google Cloud NL API vagy a hasonló MeaningCloud.

Természetesnyelv-feldolgozás tudáskinyerési céllal: Inception, entitásfelismerés, szemantikus annotálás (+mélytanulás)

Amazon (Alexa) Lex, Echo és az Alexa app.

IBM Bluemix Watson NLU és Conversations (+HOWTO).

Microsoft Azure Bot Framework, Cognitive Services (és alkalmazásuk demói).

A programozás kedvelőinek: Jupyter (lásd még: HyperTalk), Java Groovy és DSL, ACE.

Hardverépítőknek Peeqo.

Adatelemzés iránt érdeklődőknek: adatvirtualizáció és DBPedia lekérdezés demók.

© 2010-2024 BME MIT | Hibajelentés | Használati útmutató