Ez egy előző félévben kiírt, archivált téma.
A hagyományos beszédfelismerésben megszokott felépítés szerint a front-end végzi a jelfeldolgzást (akárcsak az emberi fül), a back-enden pedig a dekóder a felépített köztes modelleket használva elvégzi a beszédfelismerést. Mind a front-end, mind a back-end meglehetősen komplex rendszerek: elsőre bonyolult jelfeldolgozási műveletek a front-enden, kiejtésmodellezés, nyelvi modellek, és nagyon nagy méretű véges automatákból konstruált, a valós idejű működés kereteit feszegető felismerési hálózatok a back-enden. Az end-to-end architektúra egy az egyben egy egyszerű neuronhálóval váltja ki a feldolgozási láncot. Elsősorban kétirányú, LSTM cellás rekurrens hálókat használunk. Amit a feladat kínál: megismerkedés egy újszerű, dinamikusan fejlődő, egyre széleskörűbben alkalmazott csúcstechnológiával; mérnöki készségek - elsősorban programozás, szkriptelés, jelfeldolgozás, modellezés - elsajátítása; jártasság megszerzése deep learningben és neuronálók hazsnálatában; kreatív mérnöki és tudományos munka, akár TDK és PhD továbbviteli lehetőséggel is; Egy profi csapatba elkötelezett, érdeklődő hallgatókat várunk.