Budapesti Műszaki és Gazdaságtudományi Egyetem - BME -- Távközlési és Médiainformatikai Tanszék - TMIT Dept. of Telecommunications and Media Informatics - TMIT
| IW  
Student topics

Érzelmek hangalapú mesterséges intelligenciával támogatott detektálása (Emotion recognition by artificial intelligence using speech)

Human speech can be used to express much more than semantic content (meaning). The tone of voice, intonation (pronunciation), rhythm changes are all capable of expressing the speaker's intentional or spontaneous emotional intentions, mood or state of health, in addition to the message to be conveyed. These are called non-verbal information, which can also be identified by the human voice and speech formation mechanism (change of vocal cord tension, change of rhythm, change of volume, closed articulation, etc.). Several machine learning methods have already been tried for automatic emotion recognition based on voice, but the emergence of new deep learning techniques is constantly allowing the introduction of new methods. In this topic, the task of the students is to test machine learning procedures (including deep learning) that implement emotion recognition using speech signal input. The procedure can also be used in human-machine interface and customer service automation. For more information, please contact us in the Informatics building, room B 156, at or Microsoft Teams (Sztahó Dávid,

Human speech can be used to express much more than semantic content (meaning). The tone of voice, intonation (pronunciation), rhythm changes are all capable of expressing the speaker's intentional or spontaneous emotional intentions, mood or state of health, in addition to the message to be conveyed. These are called non-verbal information, which can also be identified by the human voice and speech formation mechanism (change of vocal cord tension, change of rhythm, change of volume, closed articulation, etc.). Several machine learning methods have already been tried for automatic emotion recognition based on voice, but the emergence of new deep learning techniques is constantly allowing the introduction of new methods. In this topic, the task of the students is to test machine learning procedures (including deep learning) that implement emotion recognition using speech signal input. The procedure can also be used in human-machine interface and customer service automation. For more information, please contact us in the Informatics building, room B 156, at or Microsoft Teams (Sztahó Dávid,

Kulcsszavak: érzelemfelismerés, beszédfelismerés, audio-vizuális érzelem adatbázis, percepció, gépi tanulás, mélytanulás, deep learning
Témavezető: Sztahó Dávid
Oktatók: Sztahó Dávid.
A következő tantárgyakhoz javasolt:
 vitma387 (Önlab, IVIR szakirány)
 vitma415 (Szakdolgozat)
 vitma416 (Szakdolgozat)
 vitma417 (Szakdolgozat, IVIR szakirány)
 vitmal01 (Info, BSc, Önálló laboratórium)
 vitmm855 (Info, MSc, Önálló laboratórium 2, Hálózatok és szolgáltatások)
 vitmm861 (Info, MSc, Önálló laboratórium 2, Médiainformatika)
 vitmm905 (Diplomatervezés 1. (Info, Hálózatok és szolgáltatások szakirány))
 vitmm911 (Diplomatervezés 1. (Info, Médiainformatika szakirány))
 vitmml10 (Info, MSc, Önálló laboratórium 1)
 vitmml11 (Info, MSc, Önálló laboratórium 2)
 vitma345 (Vill., BSc. Önálló laboratórium)
 vitma414 (Szakdolgozat)
 vitmal03 (Vill.mérn. BSc Önálló laboratórium)
 vitmm807 (Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
 vitmm857 (Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
 vitmm907 (Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
 vitmml02 (Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
 vitmml03 (Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
 vieum821 (Önálló munka 1)
 vieum871 (Önálló munka 2)
 vieum921 (Diplomatervezés 1 (Egészségügyi mérnök))
QR:    (mi is az?)
 katt. a nagyításhoz
Kedvencekbe felvesz   Jelentkezés