Budapesti Műszaki és Gazdaságtudományi Egyetem - BME -- Távközlési és Médiainformatikai Tanszék - TMIT BME - Távközlési és Mesterséges Intelligencia Tanszék - TMIT
 
 
| Témakiírások | | | | | IW  
 
 
Önálló labor
Kiírt témák

Valósidejű feliratozás a GStreamer multimédia keretrendszerben ()

Ipari partner: Ericsson Magyarország

A GStreamer segítségével egyszerű komponensekből lehet összetett média-feldolgozási rendszert építeni egy irányított gráf definiálásával. A gst-wishper komponens például a bemeneti beszéd szöveggé alakítására képes az OpenAI Whisper programkönyvtárát felhasználva. Más komponensekkel pedig felirat-fájlokat lehet a lejátszandó videón megjeleníteni. A feladat egy olyan GStreamer pipeline összeállítása és kiértékelése, szükség esetén új segédkomponensek létrehozásával, amely valós időben feliratozza a bemeneti videót.

Kulcsszavak: GStreamer,OpenAI,Whisper,speech to text
Témavezető: Németh Felicián
Oktatók: Lévai Tamás, Németh Felicián, Pelle István.
A következő tantárgyakhoz javasolt:
 vitmal01 (Info, BSc, Önálló laboratórium)
 vitmml10 (Info, MSc, Önálló laboratórium 1)
 vitmml11 (Info, MSc, Önálló laboratórium 2)
 vitmal03 (Vill.mérn. BSc Önálló laboratórium)
 vitmml02 (Vill,MSc,Önlab.1, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML02))
 vitmml03 (Vill,MSc,Önlab.2, Okos város,Vez.nélküli rendsz. és alk.ok,Multimédia rendsz. és szolg.,Optikai távközlés (VITMML03))
QR:    (mi is az?)
 
 katt. a nagyításhoz
 
Kedvencekbe felvesz   Jelentkezés