'Big Data' elemzési módszerek

Tárgyfelelős

A munkatárs fényképe
egyetemi tanár
Szoba: IB420
Tel.:
+36 1 463-3595
Email: pataric (*) mit * bme * hu

Oktatók

A munkatárs fényképe
címzetes egyetemi tanár
Szoba: IE435
Tel.:
+36 1 463-2677
Email: horvath (*) mit * bme * hu
A munkatárs fényképe
tanársegéd
Szoba: IB418
Tel.:
+36 1 463-2006
Email: ikocsis (*) mit * bme * hu

Hirdetmények

Tartalomátvétel

Bevezetés

A nagymennyiségű adat elemzésénél, az ún. Big Data problémakörben az adatok óriási mennyi­sége (tera-, peta-, ill. hexabyte méretű adatbázisok) mellett nehézség a legkülönfélébb formában rendelkezésre álló adatok fúziója és homogenizálása is. Az egyre nagyobb feldolgozási kapa­citású számítási eszközök mellett célalgoritmusok és -architektúrák biztosítják az óriási adat­mennyiség elérhető árú és idő alatti hatékony elemzését. Az új lehetőségek olyan új kérdéseket vetnek fel, mint a megfelelő adatok megszerzését biztosító kísérlettervezés, a mérés megtervezése, valamint a megszerzett adat elemzése. A Big Data körében kritikus szempont az adatelemzési módszerek megfelelő skálázhatósága, a számítási komplexitás növekedésének kézbentartása, továbbá a sokdimenziós adatok hatékony ábrázo­lása, vizualizációja. A tárgy célja, a Big Data problémakör megoldását biztosító eszközök és módszerek áttekintése, a nagy adatmennyiségből adódó speciális problémák kezelése. A tárgyaláshoz több szempontból előnyös, közös nevező a komplex modellek használata, valamint az adatok hatékony ábrázolása, vizualizációja, ide értve a vizuális adatelemzés lehetőségeinek áttekintését is. A tantárgy követelményeit eredményesen teljesítő hallgatók: 1. Ismerik az elemzésre szolgáló alkalmas legfontosabb dedikált hardver/szoftver eszközö­ket, valamint a kinyert tudás integrációját a tipikus informatikai kulcsterületeken. Ezen belül jártasak az elterjedten használt, nyílt forráskódú R nyelvű eszközök és azok Big Data irányú kiterjesztéseinek használatában. 2. Képesek az informatika széles területén az ismeretszerzési folyamatok tervezésére, végrehajtására és eredményük szabatos reprezentációjára. Ismerik a kísérlettervezés, adatminőség-biztosítás, adattisztí­tás, adatelemzés, értelmezés, döntéstámogatás és modellalkotás fázisait. 3. Ismerik a klasszikus statisztikai döntéselméleti alapokat, különös tekintettel az optimali­zálási és mintavételi technikákra. Megismernek néhány, a ’Big Data’ informatika területén kulcsszerepet játszó területet (pl. ritka adat analízis).