Önálló labor : NEXTSEQ: videó következő képkocka becslés (nyelvultrahang képek)

BME - Távközlési és Médiainformatikai Tanszék - TMIT

| Témakiírások | | | | | IW

Témakiírások

Önálló labor

Aktuális témakiírások

Kiírt témák

>>Témakiírások >>

Ez egy előző félévben kiírt, archivált téma.

NEXTSEQ: videó következő képkocka becslés (nyelvultrahang képek) (NEXTSEQ: Predicting the next sequence in a video (ultrasound tongue imaging))			Ipari partner: MTA-ELTE Lendület Lingvális Artikuláció Kutatócsoport
A közelmúltban a neurális hálózatok alkalmassá váltak magas szintű reprezentációk kiépítésére, így arra is, hogy a múltbeli események alapján megjósolhassák a jövőt - pl. videó képkockákban. Ehhez tipikusan deep learning módszerek (például CNN és GAN) használhatóak. A nyelv ultrahangos elemzését már évek óta használják a beszédkutatásában. A hallgató feladata, hogy a következő ultrahang-kép-előrejelzési feladathoz alkalmazza a legújabb gépi tanulási módszereket. A kutatás az MTA-ELTE Lingvális Artikuláció Kutatócsoporttal együttműködésben történik. Javasolt programozási nyelv: Python.
Recently, building high-level representations by training neural networks to predict future configurations from past behavior in video data has been proposed using deep learning methods (e.g. CNNs and GANs). Ultrasound imaging of the tongue has been used for many years in research on speech production. The task of the student is to apply recent machine learning methods for the next ultrasound frame prediction task. Suggested programming languages: Python. The research will be conducted in collaboration with the MTA-ELTE Lingual Articulation Research Group (Momemtum grant, http://lingart.elte.hu).
Kulcsszavak: deep learning, CNN, GAN, ultrasound
Témavezető: Csapó Tamás Gábor
Oktatók: Csapó Tamás Gábor.
A következő tantárgyakhoz javasolt:
	vitma367	(Info, BSc, Önálló laboratórium, Infokommunikációs hálózatok és alkalmazások ágazat)
	vitma380	(Info, BSc, Önálló laboratórium, Médiainformatika ágazat)
	vitma387	(Önlab, IVIR szakirány)
	vitma415	(Szakdolgozat)
	vitma416	(Szakdolgozat)
	vitma417	(Szakdolgozat, IVIR szakirány)
	vitmal01	(Info, BSc, Önálló laboratórium)
	vitmm805	(Info, MSc, Önálló laboratórium 1, Hálózatok és szolgáltatások)
	vitmm811	(Info, MSc, Önálló laboratórium 1, Médiainformatika)
	vitmm855	(Info, MSc, Önálló laboratórium 2, Hálózatok és szolgáltatások)
	vitmm861	(Info, MSc, Önálló laboratórium 2, Médiainformatika)
	vitmm905	(Diplomatervezés 1. (Info, Hálózatok és szolgáltatások szakirány))
	vitmm911	(Diplomatervezés 1. (Info, Médiainformatika szakirány))
	vitmml00	(Info,MSc,Önlab.1, Internet arch. és szolg.,Adat- és médiainformatika,Mobil hálózatok és szolg. integrációja (VITMML00))
	vitmml01	(Info,MSc,Önlab.2, Internet arch. és szolg.,Adat- és médiainformatika,Mobil hálózatok és szolg. integrációja (VITMML01))
	vitma345	(Vill., BSc. Önálló laboratórium)
	vitma414	(Szakdolgozat)
	vitmm807	(Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
	vitmm857	(Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
	vitmm907	(Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
	vitmml02	(Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
	vitmml03	(Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
	vieum821	(Önálló munka 1)
	vieum871	(Önálló munka 2)
	vieum921	(Diplomatervezés 1 (Egészségügyi mérnök))

QR: (mi is az?)
	katt. a nagyításhoz

NEXTSEQ: videó következő képkocka becslés (nyelvultrahang képek) (NEXTSEQ: Predicting the next sequence in a video (ultrasound tongue imaging))