Budapesti Műszaki és Gazdaságtudományi Egyetem - BME -- Távközlési és Médiainformatikai Tanszék - TMIT BME - Távközlési és Médiainformatikai Tanszék - TMIT
 
 
| Témakiírások | | | | | IW  
 
 
Önálló labor
Kiírt témák

Ez egy előző félévben kiírt, archivált téma.

SPEECH2UTI: akusztikum-artikuláció inverzió deep learning alapon (SPEECH2UTI: acoustic-to-articulatory inversion using deep learning)

A beszédhangok (=akusztikum) a beszélőszervek (=artikuláció) koordinált mozgásának eredményéből állnak elő. A szakirodalomban különböző módszerek állnak rendelkezésre az artikulációs mozgások és a keletkező beszéd kapcsolatának modellezésére. A fordított problémát akusztikum-artikuláció inverziónak is nevezik, azaz a beszédjel bemenetből szeretnénk artikulációs mozgásra vonatkozó információt előállítani. A hallgató feladata a meglévő algoritmusok vizsgálata és 2D ultrahang segítségével új, mély neurális háló alapú módszerek kidolgozása. Korábbi kutatásunk a témában: https://arxiv.org/abs/1904.06083 Javasolt programozási nyelvek: Python.

Speech sounds (=acoustics) are produced as the coordinated movement of the speaking organs (=articulation). There are several available methods to model the relation of articulatory movements and the resulting speech. The reverse problem is often called as acoustic-articulatory inversion. The task of the student is to investigate available algorithms and develop new methods based on 2D ultrasound using modern machine learning methods (e.g. deep neural networks). Our previous research: https://arxiv.org/abs/1904.06083 Suggested programming languages: Python.

Kulcsszavak: python, inverzió, beszéd, ultrahang
Témavezető: Csapó Tamás Gábor
Oktatók: Csapó Tamás Gábor.
A következő tantárgyakhoz javasolt:
 vitma367 (Info, BSc, Önálló laboratórium, Infokommunikációs hálózatok és alkalmazások ágazat)
 vitma380 (Info, BSc, Önálló laboratórium, Médiainformatika ágazat)
 vitma387 (Önlab, IVIR szakirány)
 vitma415 (Szakdolgozat)
 vitma416 (Szakdolgozat)
 vitma417 (Szakdolgozat, IVIR szakirány)
 vitmal01 (Info, BSc, Önálló laboratórium)
  ()
 vitmm805 (Info, MSc, Önálló laboratórium 1, Hálózatok és szolgáltatások)
 vitmm811 (Info, MSc, Önálló laboratórium 1, Médiainformatika)
 vitmm855 (Info, MSc, Önálló laboratórium 2, Hálózatok és szolgáltatások)
 vitmm861 (Info, MSc, Önálló laboratórium 2, Médiainformatika)
 vitmm905 (Diplomatervezés 1. (Info, Hálózatok és szolgáltatások szakirány))
 vitmm911 (Diplomatervezés 1. (Info, Médiainformatika szakirány))
 vitmml00 (Info,MSc,Önlab.1, Internet arch. és szolg.,Adat- és médiainformatika,Mobil hálózatok és szolg. integrációja (VITMML00))
 vitmml01 (Info,MSc,Önlab.2, Internet arch. és szolg.,Adat- és médiainformatika,Mobil hálózatok és szolg. integrációja (VITMML01))
 vitma345 (Vill., BSc. Önálló laboratórium)
 vitma414 (Szakdolgozat)
 vitmal03 (Vill.mérn. BSc Önálló laboratórium)
 vitmm807 (Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
 vitmm857 (Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
 vitmm907 (Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
 vitmml02 (Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
 vitmml03 (Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
 vieum821 (Önálló munka 1)
 vieum871 (Önálló munka 2)
 vieum921 (Diplomatervezés 1 (Egészségügyi mérnök))
QR:    (mi is az?)
 
 katt. a nagyításhoz