Külső témák

Ipari partnerek által kiírt témák, külső szakmai témavezetéssel, belső (szakdolgozattal / diplomamunkával kapcsolatos) konzultációs lehetőséggel.

1. Outlier detection algoritmusok vizsgálata

Napjainkban a különböző informatikai ill. telekommunikációs rendszerek számos diagnosztikai paraméter szolgáltatnak a működésükről. Ezek segítségével folyamatosan diagnosztizálható a rendszer működése és a szokásostól eltérő viselkedés utalhat a rendszer közelgő meghibásodására. Az eltérések automatikus feltárására szolgálnak a különböző outlier detection algoritmusok. A téma kidolgozása során a hallgatók megismerkednek néhány elterjedtebb outlier detection algoritmussal és ezek megvalósításával és alkalmazásával valós környezetben.

Szükséges feltételek:

Max létszám: 1 fő


2. Application fingerprinting

Összetett rendszerek teljesítménymérése és modellezése számos kihívást rejt magában. Számos esetben (pl.: erőforrás foglalási stratégiák, méretezés,…) nem szükséges az eredeti alkalmazásokat használni, hiszen csak bizonyos tulajdonságait vizsgáljuk az alkalmazásoknak (pl: CPU használat, memória igény, I/O igény, ...). Egy alkalmazás ill. virtuális gép várható erőforrásigényének időbeli alakulását meghatározó paramétereket nevezzük az alkalmazás fingerprintjének. A téma kidolgozása során egyrészt megoldást kellene adni egy alkalmazás/virtuális gép erőforrásigényeinek a monitorozása, másrészt a begyűjtött adatok alapján a fingerprint előállítását követően, statisztikailag hasonló, terhelést kellene előállítani.

Szükséges feltételek:

Max létszám: 2 fő


3. Analitikai algoritmusok fejlesztése big data környezetben

A klasszikus adattárház és relációs adatbázisokra épülő megoldások nehezen skálázhatók és nagy adatmennyiségekkel már nehezen birkóznak meg. Ezen problémák kezelésére szolgálnak a különböző big data megoldások, viszont az analitikai és adatbányászati megoldások portolása big data környezetbe számos kihívást tartogat (elosztott feldolgozás, adat lokalitás, stb). Adatbányászati ill. analitikai algoritmusok rejtett, nem triviális összefüggések feltárására szolgálnak. Számos különböző típusú problémára adnak megoldásokat: gyakori minták, szekvenciák keresése, klaszterezés, osztályozás, eltérés elemzés stb. Ezen problémákra általában léteznek szekvenciális algoritmusok, viszont ezek hatékony átalakítása big data környezetbe nem triviális feladat. A feladat kidolgozása során egy-egy algoritmuscsalád részletesebb vizsgálata a cél.

Szükséges feltételek:

Max létszám: 1 fő


4. On-line/ stream analytics algoritmusok fejlesztése

Big data környezetben külön tématerület az adatfolyamok feldolgozása és kezelése. Tekintettel arra, hogy folyamatosan nagy sebességgel érkeznek az adatok, ezért különleges megoldásokat igényelnek a különböző analitikai algoritmusok és módszerek futtatása. Adatbányászati ill. analitikai algoritmusok rejtett, nem triviális összefüggések feltárására szolgálnak. Számos különböző típusú problémára adnak megoldásokat: gyakori minták, szekvenciák keresése, klaszterezés, osztályozás, eltérés elemzés stb. Ezen problémákra általában léteznek szekvenciális algoritmusok, viszont ezek hatékony átalakítása stream processing környezetbe nem triviális feladat. A feladat kidolgozása során egy-egy algoritmuscsalád részletesebb vizsgálata a cél.

Szükséges feltételek:

Max létszám: 1 fő


5. Weboldalak tartalom szerinti automatikus kategorizálása

A téma célja, hogy weboldalak elemzésével olyan módszerek kerüljenek kifejlesztésre, amelyek segítségével a ma használatban lévő modern weboldalak hatékonyan tematikusan kategorizálhatóak legyenek. A kategóriák beazonosítása történhet egyrészt automatikusan (pl. hír, sport, blog, stb.), másrészt már előre definiált kategóriákba való besorolás is elképzelhető. A megoldás demonstrálásához használt programozási nyelv rugalmasan választható.

A feladat továbbfejleszthető egy nyelv-független megoldás keresésének irányába, ahol mindemellett célnak kitűzhető olyan módszerek keresése, amelyek lehetővé teszik különböző nyelven hasonló weboldalak összevonását.

Alapvetően kutatási jellegű témáról van szó, amely mind a nagy mennyiségű szöveganalízis, mind a gépi tanulás (automatikus kategorizálás) irányába is kitekintést tesz.

Szükséges feltételek:

Max létszám: 1 fő


6. Web-böngészési szokások kategorizálása felhasználói HTTP forgalom elemzésével

A téma a felhasználói forgalom csomagszintű elemzésével kinyerhető információk felderítésével foglalkozik. A megoldáshoz irodalomkutatás mellett saját megoldások kidolgozását is szívesen látjuk, amely segítségével különböző szempontok szerint kategóriákba sorolhatjuk az internetböngészők felhasználói halmazát. Gondolhatunk itt mind idő-alapú (milyen napszakban milyen jellegű) aktivitás, mind tematikai preferencia (böngészés, chat, audio/video streaming) alapján történő csoportosításra. A megoldás demonstrálásához használt programozási nyelv rugalmasan választható.

Ezt a kutatói témát azoknak ajánljuk, akik érdeklődnek az alacsony-szintű felhasználói forgalomelemezés rejtelmei, és a gépi tanulásba is szívesen belekóstolnának.

Szükséges feltételek:

Max létszám: 1 fő


7. Alkalmazások megkülönböztetése HTTP forgalom elemzésével

A téma célja, hogy a felhasználói forgalom csomagszintű elemzésével automatikusan beazonosíthassunk különböző mobil háttéralkalmazásoknak szerver felé történő kommunikációit a hálózaton. A feladat főként kutatói jellegű: a forgalom elemzésével különböző módszereket szükséges kifejleszteni, amelyek segítségével az egyes háttéralkalmazások kiszűrhetőek a felhasználói forgalmak közül, és egymástól bizonyos minőségekben megkülönböztethetőek. A megoldás demonstrálásához használt programozási nyelv rugalmasan választható.

Ezt témát annak ajánljuk, akik érdeklődnek az alacsony-szintű forgalomelemezés rejtelmei iránt és a gépi tanulás egy gyakorlati alkalmazásába szeretnének elmélyedni.

Szükséges feltételek:

Max létszám: 1 fő


8. Adaptív terheléselosztási algoritmus tervezése feldolgozói kontextus-megőrzéssel

Tekintsünk egy feldolgozói rendszert, amelyben különböző adatfolyamokon különböző feldolgozóegységek dolgoznak. A feldolgozóegységek száma dinamikusan csökkenhet vagy nőhet, és szintúgy az adatfolyamok száma, illetve az adatfolyamokon belül az adat érkezési intenzitása (sávszélesség). Fontos továbbá, hogy a feldolgozóegység egy kontextust tart fenn minden általa kezelt adatfolyam számára, és egyszerre egy adatfolyamon csak egy feldolgozóegység dolgozhat.

A feladat olyan algoritmus keresése, amely arra törekszik, hogy optimálisan alkalmazkodjon a növekvő/csökkenő adatfolyamok számához, és azok váltakozó intenzitásához. Az alkalmazkodás során újabb feldolgozóegységek indítása és leállítása mellett, szükség esetén az adatfolyamok átcsoportosítását és ezáltal a kontextus mozgatását a feldolgozóegységek közt is hatékonyan elvégzi.

A feladat elvárt kimenete egy program, amely az algoritmus működését demonstrálja. Az elkészítési programozási nyelv lehet C/C++, Java, C#, de szóba jöhet más is, megegyezés szerint.

A feladat eredményét tovább emelheti, ám nem követelmény, ha az algoritmus teljesítménye matematikai levezetéssel is megtámogatható.

Szükséges feltételek:

Max létszám: 1 fő


9. Elosztott rendszerek erőforrás monitorozása nyílt forráskódú szoftverekkel

A hallgató feladata a különböző a különböző nyílt forráskódú monitorozó es riasztásgeneráló (monitoring/alerting) szoftverek feltérképezése, részletes kielemzése és összehasonlítása. Az összehasonlításnál különös figyelni kell a rendszer skálázhatóságára és adatközpontokban való alkalmazhatóságára és automatikus telepítésére.

Elosztott rendszereknél különösen fontos a rendszer erőforráshasználatának pontos ismerete és tervezhetősége, ezért a helyesen kiválasztott monitorozó szoftver létfontosságú.

A téma BSc szakdolgozatként, MSc diplomamunkaként és TDK munkaként is folytatható.

Szükséges feltételek:

Max létszám: 2 fő


10. Szerverek energia fogyasztásának közelítő becslése szoftverrel

Részben a felhő rendszerek terjedésével (pl. felhő alapú GPS navigáló rendszerek), részben pedig a rohamosan növekvő adatmennyiség (pl. okostelefonok által készített fényképek) következtében egyre nagyobb szerverfarmok létrehozása válik szükségessé. Nem ritka, hogy egy szekrény villamos energiafogyasztása akár eléri az óránkénti 10 kWh-t is, melynek egy teljes adatközpontra vetített fogyasztása komoly gazdasági és környezeti terheket jelent. Mindezek indokolttá teszik az energiatudatos üzemeltetést, beleértve az alkalmazások telepítésének és vezérlésének fogyasztást minimalizáló megvalósítását.

A hallgató feladata megvizsgálni egy választott számítógép hardverének fogyasztási jellemzőit, majd ez alapján szoftveres úton (fogyasztás mérő használata nélkül) becslést adni annak villamos energiafogyasztására különböző alkalmazástípusok futtatása esetén.

A téma BSc szakdolgozatként, MSc diplomamunkaként és TDK munkaként is folytatható.

Szükséges feltételek:

Max létszám: 2 fő