Önálló labor : Big Data analitika virtualizált rendszereken

BME - Távközlési és Médiainformatikai Tanszék - TMIT

| Témakiírások | | | | | IW

Témakiírások

Önálló labor

Aktuális témakiírások

Kiírt témák

>>Témakiírások >>

Ez egy előző félévben kiírt, archivált téma.

Big Data analitika virtualizált rendszereken (Big Data analytics on virtualized systems)
A hagyományos informatikai rendszerekben az adatokat előszűrés után strukturált formában tárolják, de ezáltal sok olyan részletet elvesztünk, amelyek újszerű elemzésével hasznos összefüggéseket lehet felderíteni. Erre a felismerésre épít a BigData megközelítés, amely során a korábbiaknál nagyságrendekkel nagyobb méretű adathalmazon próbáljuk meg a közös mintákat beazonosítani, a minták közti korrelációkat feltárni és erre építve gyakorlatban használható következtetéseket levonni - még akkor is, ha az okokat nem tudjuk kideríteni. Annak érdekében, hogy ezeket a folyamatokat megvalósítsuk, szükség van a nagy feldolgozás-igényt támogató infrastruktúra tervezésére, kiépítésére és működtetésére. A BigData világában a feladatok méretéből adódóan fontossá váltak a virtualizációs megvalósítások, ma ezek divatos képviselője a felhő alapú rendszerek. Az önlab téma során a hallgatóknak egy gyakorlati igényből kiindulva kell egy BigData feladatot megoldó elosztott rendszert megvalósítaniuk. Miközben a használt virtualizációs rendszerek (legyen az Open Stack, AWS vagy Docker) megismerése elkerülhetetlen, a fókusz a BigData technológiák kezelésén, és nem a virtualizációs infrastruktúrán van. A jellemző technológiák: Apache Hadoop környezet és OpenStack. A témát ipari partnerekkel egyeztetve műveljük, az kiválóan alkalmas TDK dolgozat, diplomamunka elkészítéséhez, lehetőség van a témában folyó tanszéki projektbe való bekapcsolódásra is. A témáról, a tanszéken folyó munkáról szívesen mesélünk további részleteket, keress meg minket a egy kötetlen beszélgetés erejéig.
The legacy information processing systems the data is stored in a structured way, losing important details that may be useful if processed with novel analytical methods. This disadvantage is eliminated by the Big Data approach, where several orders of magnitude larger data sets are handled in order to identify usedul patterns, detect correlations among patterns and draw conclusions that have practical usefulness. In order to implement these processes there is a need for an infrustructure being able to support large volume transactions, and in current IT environment that is heavily relying on virtualization techniques. During their work the student should start from analyzing a practical request, then implement a system supporting the Big Data processes to be executed on these data. Whereas a background knowledge on virtualization techniques (Open Stack, AWS or Docker) is necessary, but the current work will focus on Big Data technologies and not the virtualization ones. This topic can be further developed into a Diploma Thesis. For further details please contact us.
Kulcsszavak: Spark, Hadoop, Big Data, Virtualizáció
Témavezető: Simon Csaba
Oktatók: Maliosz Markosz, Simon Csaba.
A következő tantárgyakhoz javasolt:
	vitma345	(Vill., BSc. Önálló laboratórium)
	vitma414	(Szakdolgozat)
	vitmm807	(Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
	vitmm857	(Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
	vitmm907	(Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
	vitmml02	(Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
	vitmml03	(Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
	vieum821	(Önálló munka 1)
	vitmm376	(Projekt labor 1)
	vitmm377	(Diplomatervezés 1 [analytics])
	vitmm388	(Projekt labor 2)

QR: (mi is az?)
	katt. a nagyításhoz

Big Data analitika virtualizált rendszereken (Big Data analytics on virtualized systems)