Mesterséges intelligencia módszerek és alkalmazásai a képfeldolgozás terén

A tanfolyam célja, hogy a résztvevők átfogó betekintést kapjanak a gépi tanulás és a képfeldolgozás alapelveibe, miközben konkrét, valós példákon keresztül ismerkednek meg ezek legnépszerűbb gyakorlati alkalmazásaival. A képzés során nemcsak az elméleti hátteret sajátítják el, hanem gyakorlati készségeket is szereznek: megtanulják, hogyan használhatják a modern eszközöket és módszereket egyszerűbb képfeldolgozó modellek létrehozására saját projektjeikben. A workshop célja, hogy a résztvevők magabiztosan alkalmazzák a megszerzett tudást, és képesek legyenek önállóan is kísérletezni a képfeldolgozás területén.

Előzetesen elvárt ismeretek

A tanfolyam középhaladó szintű az MI területén, alapvető programozási ismereteket feltételez.
(Python programozási nyelv ismerete előnyt jelent.)

A képzés tematikája

Ez a tanfolyam 8 blokkból áll, amelyek során a résztvevők lépésről lépésre megismerkednek a gépi tanulás és a képfeldolgozás alapelveivel, a modellek építésével, kiértékelésével és magyarázatával. A program célja, hogy a résztvevők elméleti tudást és gyakorlati készségeket egyaránt szerezzenek, amelyek segítségével önállóan is képfeldolgozó modelleket tudnak létrehozni.

1. Blokk: Gépi tanulás áttekintése
A résztvevők megismerik a gépi tanulás fő ágazatait: felügyelt, felügyelet nélküli és megerősítéses tanulás. Bemutatásra kerülnek a legfontosabb modelltípusok és módszerek, valamint áttekintjük az underfitting és overfitting jelenségét, továbbá a regularizáció szerepét a modellek megbízhatóságának növelésében.

2. Blokk: Adathalmazok és problémáik
Foglalkozunk a tipikus problémákkal, amelyek ML adathalmazokkal előfordulnak, beleértve a címkézést és az adatminőséget. Megbeszéljük a bias-mentesség és a fairness biztosításának jelentőségét, a keresztvalidációs technikákat és a modellek robusztusságát. A képfeldolgozásban használt adataugmentáció is bemutatásra kerül.

3. Blokk: Konvolúciós neurális hálók áttekintése
A résztvevők megismerik a konvolúciók működését, a stride és padding fogalmát, valamint a pooling és dropout rétegek szerepét. Bemutatásra kerülnek klasszikus architektúrák, mint a LeNet, AlexNet, VGG és ResNet, valamint a feature map-ek értelmezése a gyakorlati alkalmazásokban.

4. Blokk: Transzfertanulás
Részletesen tárgyaljuk, miért működik jól a transfer learning, hogyan történik a head csere, a fagyasztás és a részleges finomhangolás, valamint ezek gyakorlati alkalmazásai.

5. Blokk: Képfeldolgozó modellek kiértékelése
A résztvevők megismerik az osztályozási, objektumdetekciós és szegmentációs feladatok jellemzőit. Bemutatjuk a jósági metrikákat osztályozásnál (ROC, PR-görbék, konfúziós mátrix) és a szegmentációs metrikákat (IOU, Dice-score).

6. Blokk: Objektumdetekció és lokalizáció alapjai
A blokk során a bounding box fogalmát, az egy- és két-stage detektorok működését tárgyaljuk. Bemutatásra kerül a népszerű YOLO család, valamint gyakorlati alkalmazási példák.

7. Blokk: Szegmentálás
A résztvevők megismerkednek a semantic és instance segmentation különbségeivel. Bemutatjuk az U-Net és Mask R-CNN modelleket, valamint tipikus orvosi és ipari alkalmazási példákat.

8. Blokk: Modellek magyarázata
A kurzus záró blokkja az Explainable AI (XAI) technikáira fókuszál, bemutatva azok célját és alkalmazásait. Részletesen tárgyaljuk az integrált gradiens alapú módszereket, amelyek segítségével a modellek döntései átláthatóvá válnak.

Óraszám

Csoportlétszám

10-20

Helyszín

Számítógépes terem

A tanfolyam meghirdetéséről és a tanfolyam feltételeiről a kapcsolattartó ad bővebb felvilágosítást.

Hullám Gábor

tanszékvezető helyettes, docens, kapcsolattartó

Hullám Gábor

tanszékvezető helyettes, docens, kapcsolattartó