Ez egy előző félévben kiírt, archivált téma.
A közelmúltban a neurális hálózatok alkalmassá váltak magas szintű reprezentációk kiépítésére, így arra is, hogy a múltbeli események alapján megjósolhassák a jövőt - pl. videó képkockákban. Ehhez tipikusan deep learning módszerek (például CNN és GAN) használhatóak. A nyelv ultrahangos elemzését már évek óta használják a beszédkutatásában. A hallgató feladata, hogy a következő ultrahang-kép-előrejelzési feladathoz alkalmazza a legújabb gépi tanulási módszereket. A kutatás az MTA-ELTE Lingvális Artikuláció Kutatócsoporttal együttműködésben történik. Javasolt programozási nyelv: Python.
Recently, building high-level representations by training neural networks to predict future configurations from past behavior in video data has been proposed using deep learning methods (e.g. CNNs and GANs). Ultrasound imaging of the tongue has been used for many years in research on speech production. The task of the student is to apply recent machine learning methods for the next ultrasound frame prediction task. Suggested programming languages: Python. The research will be conducted in collaboration with the MTA-ELTE Lingual Articulation Research Group (Momemtum grant, http://lingart.elte.hu).