Türkçe haber yayını verileri için bürünsel bilginin çıkarılması ve cümle bölütlemede kullanılması
Dosyalar
Tarih
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Bu çalışmada, Türkçe haber yayını verilerine ilişkin bürünsel özelliklerin açık kaynak kodlu yazılımlar ile çıkarılması ve bürünsel özellik gruplarının Otomatik Konuşma Tanıma (Automatic Speech Recognition) Sistemi çıkışından elde edilen metin üzerinde cümle bölütlemedeki başarımlarının karşılaştırılması gerçekleştirilmiştir.Özellikle cümle bölütleme işlevi için oldukça yüksek başarım oranına sahip bir bürünsel özellik seti elde edilmiştir.
In this study, extracting the prosodic information for Turkish Broadcast News Data using the open source tools and comparing the sentence segmentation performances of these grouped prosodic information on the raw data obtained as an output from the Automatic Speech Recognition System are established. Especially for the sentence segmentation task, a very promising prosodic feature set is obtained.