Budapesti Műszaki és Gazdaságtudományi Egyetem - BME -- Távközlési és Médiainformatikai Tanszék - TMIT BME - Távközlési és Médiainformatikai Tanszék - TMIT
 
 
| Témakiírások | | | | | IW  
 
 
Önálló labor
Kiírt témák

Ez egy előző félévben kiírt, archivált téma.

Neurális hálózatok a nyelvi modellezésben (Neural networks in language modelling)

Ipari partner: SpeechTex Kft.

A statisztikai nyelvi modellek a szósorozatok valószínűségét modellezik, melynek minél pontosabb ismerete elengedhetetlen a korszerű beszédfelismerő rendszerekben. A jelenlegi rendszerek döntő többsége ún. n-gram nyelvi modellt használ, mely n-1 korábbi szó alapján becsüli a következő szótári elem valószínűségét. Gyakorlatban a 3-gram modellek használata az elterjedt. Könnyű belátni azonban, hogy ilyen rövid előtörténet (tipikusan két korábbi szó) nem minden esetben elegendő. A magyar nyelvben nagyon gyakran fordul elő, hogy egy mondat egymással összefüggő elemei jóval távolabb kerülnek egymástól. Egy érdekes új kutatási irány képviselői az ún. visszacsatolt (rekurzív) neurális hálózatokat (Recurrent Neural Network - RNN) használják nyelvi modellezési célokra. Az RNN alkalmazásának óriási előnye, hogy szakít az n-gram-okkal és felépítésének köszönhetően végtelen hosszú függőségeket tud modellezni a szövegben, így minden korábbinál pontosabb beszédfelismerő tanítását teszi lehetővé. A hallgató a félév elején segítségünkkel megismerheti az RNN-ek alapjait, a tanításukhoz rendelkezésre álló eszközöket és a vonatkozó szakirodalmat. A félév második felében megépítheti és tesztelheti saját RNN-alapú nyelvi modelljeit, melyhez tanítószöveget és beszédfelismerő keretrendszert is biztosítunk. Amennyiben a hallgató részéről érdeklődés mutatkozik, úgy a téma mélyebb, elméleti jellegű problémák megoldására is kínál lehetőséget, így TDK-ra is ideális valamint PhD témaként is továbbvihető.

Kulcsszavak: RNN, nyelvi modellezés, beszédfelismerés
Témavezető: Tarján Balázs
Oktatók: Tarján Balázs.
A következő tantárgyakhoz javasolt:
 vitma345 (Vill., BSc. Önálló laboratórium)
 vitma414 (Szakdolgozat)
 vitmm807 (Vill., MSc, Önálló laboratórium 1, Infokommunikációs rendszerek)
 vitmm857 (Vill., MSc, Önálló laboratórium 2, Infokommunikációs rendszerek)
 vitmm907 (Diplomatervezés 1. (Vill. Infokommunikációs rendszerek szakirány))
 vitmml02 (Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
 vitmml03 (Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
 vieum821 (Önálló munka 1)
QR:    (mi is az?)
 
 katt. a nagyításhoz