Félstruktúrált adatok (XML, JSON vagy más leírási és adatcsere-formátumok) tartalmában történő hatékony keresésre az adatbáziskezelők SQL eszközein túlmenő lehetőségek kézenfekvőbb, sokszor kényelmesebb megoldást adnak. Ilyen eszköz például az Apache Lucene, az Oracle Text, vagy a MySQL full-text search megoldása. Hatékonyságon egyszerre értjük a programozói, futási és felhasználói hatékonyságot.
A félstrukturált adatok sokszor heterogén környezetből származnak, és akár egymezős keresőn keresztül, online vagy rövid késleltetésű keresési lehetőséget kell biztosítani. A téma jellegéből adódóan teret ad a kreativitásnak, komplex rendszer tervezésére és kidolgozására ad lehetőséget. A kiválasztott részterülettől függően van lehetőség ipari kapcsolat bevonására, szakmai gyakorlat végzésére.
A téma keretében különböző méretű feladatok kidolgozására van lehetőség, több féléven át művelhető, BSc szakdolgozatig vagy MSc diplomatervig vihető.
Kulcsszavak: féltruktúrált adatok, dokuentum-adatbázisok, szabad szöveges keresés
Budapesti Műszaki és Gazdaságtudományi Egyetem (BME) Távközlési és Mesterséges Intelligencia Tanszék (TMIT) 1117, Budapest, Magyar tudósok körútja 2. tel: (1) 463-2448; fax: (1) 463-3107 email: titkarsag@tmit.bme.hu