Önálló labor : End-to-end beszédfelismerés

BME - Távközlési és Médiainformatikai Tanszék - TMIT

| Témakiírások | | | | | IW

Témakiírások

Önálló labor

Aktuális témakiírások

Kiírt témák

>>Témakiírások >>

Ez egy előző félévben kiírt, archivált téma.

End-to-end beszédfelismerés ()
A hagyományos beszédfelismerésben megszokott felépítés szerint a front-end végzi a jelfeldolgzást (akárcsak az emberi fül), a back-enden pedig a dekóder a felépített köztes modelleket használva elvégzi a beszédfelismerést. Mind a front-end, mind a back-end meglehetősen komplex rendszerek: elsőre bonyolult jelfeldolgozási műveletek a front-enden, kiejtésmodellezés, nyelvi modellek, és nagyon nagy méretű véges automatákból konstruált, a valós idejű működés kereteit feszegető felismerési hálózatok a back-enden. Az end-to-end architektúra egy az egyben egy egyszerű neuronhálóval váltja ki a feldolgozási láncot. Elsősorban kétirányú, LSTM cellás rekurrens hálókat használunk. Amit a feladat kínál: megismerkedés egy újszerű, dinamikusan fejlődő, egyre széleskörűbben alkalmazott csúcstechnológiával; mérnöki készségek - elsősorban programozás, szkriptelés, jelfeldolgozás, modellezés - elsajátítása; jártasság megszerzése deep learningben és neuronálók hazsnálatában; kreatív mérnöki és tudományos munka, akár TDK és PhD továbbviteli lehetőséggel is; Egy profi csapatba elkötelezett, érdeklődő hallgatókat várunk.
Kulcsszavak: end-to-end, beszédfelismerés, neurális háló, deep learning
Témavezető: Szaszák György
Oktatók: Mihajlik Péter, Szaszák György.
A következő tantárgyakhoz javasolt:
	vitma367	(Info, BSc, Önálló laboratórium, Infokommunikációs hálózatok és alkalmazások ágazat)
	vitma380	(Info, BSc, Önálló laboratórium, Médiainformatika ágazat)
	vitma387	(Önlab, IVIR szakirány)
	vitma415	(Szakdolgozat)
	vitma416	(Szakdolgozat)
	vitma417	(Szakdolgozat, IVIR szakirány)
	vitmal01	(Info, BSc, Önálló laboratórium)
	vitmm805	(Info, MSc, Önálló laboratórium 1, Hálózatok és szolgáltatások)
	vitmm811	(Info, MSc, Önálló laboratórium 1, Médiainformatika)
	vitmm855	(Info, MSc, Önálló laboratórium 2, Hálózatok és szolgáltatások)
	vitmm861	(Info, MSc, Önálló laboratórium 2, Médiainformatika)
	vitmm905	(Diplomatervezés 1. (Info, Hálózatok és szolgáltatások szakirány))
	vitmm911	(Diplomatervezés 1. (Info, Médiainformatika szakirány))
	vitmml00	(Info,MSc,Önlab.1, Internet arch. és szolg.,Adat- és médiainformatika,Mobil hálózatok és szolg. integrációja (VITMML00))
	vitmml01	(Info,MSc,Önlab.2, Internet arch. és szolg.,Adat- és médiainformatika,Mobil hálózatok és szolg. integrációja (VITMML01))
	vitma345	(Vill., BSc. Önálló laboratórium)
	vitma414	(Szakdolgozat)
	vitmm807	(Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
	vitmm857	(Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
	vitmm907	(Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
	vitmml02	(Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
	vitmml03	(Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
	vieum821	(Önálló munka 1)
	vieum871	(Önálló munka 2)
	vieum921	(Diplomatervezés 1 (Egészségügyi mérnök))
	vitmm376	(Projekt labor 1)
	vitmm377	(Diplomatervezés 1 [analytics])
	vitmm388	(Projekt labor 2)

QR: (mi is az?)
	katt. a nagyításhoz

End-to-end beszédfelismerés ()