Publications of Csendes, Dóra

Számítógépes összehasonlító szövegelemzés ügyfélszolgálati tájékoztatók legfontosabb prozódiai elemeinek a meghatározására

A szövegelemzéssel történő hangsúlykijelölés bonyolult feladat. Jelenleg nincs olyan elemző algoritmus, amelyik gépi úton képes a magyar mondatokban a hangsúlyok kijelölésére. Alapvető célunk, hogy az eddig elért és hozzáférhető elméleti nyelvészeti eredményeket, valamint kész mondatelemző algoritmusokat egyetlen, jól körülhatárolható struktúrált számítógépes rendszerré fejlesszük tovább automatikus hangsúlykijelölési kísérletek végzése céljából. Ebben a tanulmányban munkánk végeredményét, egy futtatható programrendszert (elemző) mutatjuk be. Az elemző bemenetére a mondat szöveges formája kerül, majd a feldolgozás során a mondat minden szavát egy hangsúlycímkével látja el. A feldolgozást két szinten végezzük: (i) tagmondatokra bontás, (ii) a hangsúly kijelölése tagmondatonként. Öt hangsúlykategóriát definiáltunk az elemzéshez: (F)=erős hangsúly, (E)=kiemelt, (W)=normál, (N)=hangsúlytalan és (-)= erősen hangsúlytalan (redukált) címkék. Az elemző 12 modulból épül fel, melyben mindegyik modul azonos koncepcióra épül. Az elemzőt egy szűk témakört leíró szöveges állományra fejlesztettük. A hangsúlykijelölés hatásfoka összességében 85%.