Ez egy előző félévben kiírt, archivált téma.
Tranzakciós adatok számos iparágban előfordulnak: ilyen adatok a bankkártya szokásainkat leíró logok, a telefontársaságok által tárolt hívás logok, stb. Ezen tranzakciók címkézésével azonosítható lesz, hogy egy bankkártya költés milyen céllal történt meg, vagy milyen jellegű kapcsolatban vagyunk az adott telefonálóval. Miközben ezek a címkék a legtöbbször a végfelhasználók számára triviálisan megadhatók, egyre nagyobb igény van arra, hogy ezeket automatikusan, a tranzakció paramétereiből tudja meghatározni egy gépi tanulási algoritmus. A hallgató a téma keretén belül megismerkednek az alapproblémával, egy kiválasztott adathalmazhoz létrehoz egy jól skálázódó, akár tömeges feldolgozásra is képes implementációt, majd teszteli annak pontosságát, sebességét. A téma kiválóan alkalmas szakdolgozat, diplomamunka vagy TDK készítésére is, és megfelelő teljesítmény esetén akár tanszéki projektbe is be lehet kapcsolódni. A témáról, a tanszéken folyó adatbányászati munkáról szívesen mesélünk további részleteket, de akár nézz körül a csapatunk blogján (dmlab.hu/blog), vagy üljünk le egy (akár virtuális) kávézásra (keress a gaspar@tmit.bme.hu címen)