Mesterséges intelligencia módszerek és alkalmazásai a képfeldolgozás terén
A tanfolyam célja, hogy a résztvevők átfogó betekintést kapjanak a gépi tanulás és a képfeldolgozás alapelveibe, miközben konkrét, valós példákon keresztül ismerkednek meg ezek legnépszerűbb gyakorlati alkalmazásaival. A képzés során nemcsak az elméleti hátteret sajátítják el, hanem gyakorlati készségeket is szereznek: megtanulják, hogyan használhatják a modern eszközöket és módszereket egyszerűbb képfeldolgozó modellek létrehozására saját projektjeikben. A workshop célja, hogy a résztvevők magabiztosan alkalmazzák a megszerzett tudást, és képesek legyenek önállóan is kísérletezni a képfeldolgozás területén.
Előzetesen elvárt ismeretek
A tanfolyam középhaladó szintű az MI területén, alapvető programozási ismereteket feltételez.(Python programozási nyelv ismerete előnyt jelent.)
A képzés tematikája
Ez a tanfolyam 8 blokkból áll, amelyek során a résztvevők lépésről lépésre megismerkednek a gépi tanulás és a képfeldolgozás alapelveivel, a modellek építésével, kiértékelésével és magyarázatával. A program célja, hogy a résztvevők elméleti tudást és gyakorlati készségeket egyaránt szerezzenek, amelyek segítségével önállóan is képfeldolgozó modelleket tudnak létrehozni.1. Blokk: Gépi tanulás áttekintése
A résztvevők megismerik a gépi tanulás fő ágazatait: felügyelt, felügyelet nélküli és megerősítéses tanulás. Bemutatásra kerülnek a legfontosabb modelltípusok és módszerek, valamint áttekintjük az underfitting és overfitting jelenségét, továbbá a regularizáció szerepét a modellek megbízhatóságának növelésében.
2. Blokk: Adathalmazok és problémáik
Foglalkozunk a tipikus problémákkal, amelyek ML adathalmazokkal előfordulnak, beleértve a címkézést és az adatminőséget. Megbeszéljük a bias-mentesség és a fairness biztosításának jelentőségét, a keresztvalidációs technikákat és a modellek robusztusságát. A képfeldolgozásban használt adataugmentáció is bemutatásra kerül.
3. Blokk: Konvolúciós neurális hálók áttekintése
A résztvevők megismerik a konvolúciók működését, a stride és padding fogalmát, valamint a pooling és dropout rétegek szerepét. Bemutatásra kerülnek klasszikus architektúrák, mint a LeNet, AlexNet, VGG és ResNet, valamint a feature map-ek értelmezése a gyakorlati alkalmazásokban.
4. Blokk: Transzfertanulás
Részletesen tárgyaljuk, miért működik jól a transfer learning, hogyan történik a head csere, a fagyasztás és a részleges finomhangolás, valamint ezek gyakorlati alkalmazásai.
5. Blokk: Képfeldolgozó modellek kiértékelése
A résztvevők megismerik az osztályozási, objektumdetekciós és szegmentációs feladatok jellemzőit. Bemutatjuk a jósági metrikákat osztályozásnál (ROC, PR-görbék, konfúziós mátrix) és a szegmentációs metrikákat (IOU, Dice-score).
6. Blokk: Objektumdetekció és lokalizáció alapjai
A blokk során a bounding box fogalmát, az egy- és két-stage detektorok működését tárgyaljuk. Bemutatásra kerül a népszerű YOLO család, valamint gyakorlati alkalmazási példák.
7. Blokk: Szegmentálás
A résztvevők megismerkednek a semantic és instance segmentation különbségeivel. Bemutatjuk az U-Net és Mask R-CNN modelleket, valamint tipikus orvosi és ipari alkalmazási példákat.
8. Blokk: Modellek magyarázata
A kurzus záró blokkja az Explainable AI (XAI) technikáira fókuszál, bemutatva azok célját és alkalmazásait. Részletesen tárgyaljuk az integrált gradiens alapú módszereket, amelyek segítségével a modellek döntései átláthatóvá válnak.
Óraszám
8Csoportlétszám
10-20Helyszín
Számítógépes terem
A tanfolyam meghirdetéséről és a tanfolyam feltételeiről a kapcsolattartó ad bővebb felvilágosítást.
Hullám Gábor
tanszékvezető helyettes, docens, kapcsolattartó
Hullám Gábor
tanszékvezető helyettes, docens, kapcsolattartó
BME-MIT