Automatic speech recognition system for Turkish spoken language
Yükleniyor...
Dosyalar
Tarih
2012-06-21
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Işık Üniversitesi
Erişim Hakkı
info:eu-repo/semantics/openAccess
Attribution-NonCommercial-NoDerivs 3.0 United States
Attribution-NonCommercial-NoDerivs 3.0 United States
Özet
The transmission and storage of speech sounds is possible for decades. In addition by using signal processing techniques, it is also possible tp process speech signals. By using time abd frequency analysis od speech signal and several machine learning algorithms, it is possible to build a system which is used to recognize spoken words. Such systems are called Automatic Speech Recognition systems. In our work, We have used the Automatic Speech Recognition system for Turkish spoken language which has built by BUSIM speech group. However, the output of the recognizer is the list of spoken words. Even for humans it is avery hard to understand a text without punctuation symbols. Hence to build more complex recognizer whose goal to perform topic segmentation and topic summarization, the output of ASR should be divided into sentences at first. Our goal is to build a system which performs the sentence segmentation. In our work We have used ASR system to obtain word level and phoneme level time marks and by using that time marks with the audio files, We have extracted prosodic features, where the prosodic properties of speech contains information about the punctuation in the text, which is not available at the output of ASR system.
Uzun yıllardan beri ses ve konuşmaların saklanması ve iletilmesi mümkündür. Ayrık zamanlı ve sürekli zamanlı işaret işleme yöntemleri sayesinde ses ve konuşma işaretleri de işaretleri de işlenebilmektedir. Bununla beraber, eğitilebilen algoritmalar kullanılarak Otomatik Konuşma Tanıma ve Otomatik Konuşmacı tanıma sistemleri de geliştirilebilmektedir. Bu çalışamada Boğaziçi Üniversitesi'nde bulunan ''BUSİM spech group'' tarafından geliştirilmiştir, Türkçe dili için otomatik konuşma tanıma sistemi kullanılmıştır. Bu sistem; konuşmacıların söylediği kelimeleri bir liste halinde dökebilmektedir. Ancak; bir insan için bile noktalama işaretlerinden yoksun bir metinden bilgi alabilmek oldukça zordur. Bu sebebten dolayı konu bölütleme veya konu özetleme gibi daha ileri uygulamaları yapabilmek için, öncelikle cümle bölütleme işlemenin yapılması gerekmektedir. Dil bilgisine uygun bir yazılı metindeki noktalama işaretleri, diksiyonda vurgu ile belirtilmektedir. Başka bir deyişle bu özellikler konuşma işaretinin bürünsel özellikleridir. Amacımız, Otomatik Konuşma Sisteminin çıktıları ile ses işaretinin bürünsel özelliklerini kullanarak cümle bölütlenmesini otamatik yapabilenbir sistem geliştirmektedir.
Uzun yıllardan beri ses ve konuşmaların saklanması ve iletilmesi mümkündür. Ayrık zamanlı ve sürekli zamanlı işaret işleme yöntemleri sayesinde ses ve konuşma işaretleri de işaretleri de işlenebilmektedir. Bununla beraber, eğitilebilen algoritmalar kullanılarak Otomatik Konuşma Tanıma ve Otomatik Konuşmacı tanıma sistemleri de geliştirilebilmektedir. Bu çalışamada Boğaziçi Üniversitesi'nde bulunan ''BUSİM spech group'' tarafından geliştirilmiştir, Türkçe dili için otomatik konuşma tanıma sistemi kullanılmıştır. Bu sistem; konuşmacıların söylediği kelimeleri bir liste halinde dökebilmektedir. Ancak; bir insan için bile noktalama işaretlerinden yoksun bir metinden bilgi alabilmek oldukça zordur. Bu sebebten dolayı konu bölütleme veya konu özetleme gibi daha ileri uygulamaları yapabilmek için, öncelikle cümle bölütleme işlemenin yapılması gerekmektedir. Dil bilgisine uygun bir yazılı metindeki noktalama işaretleri, diksiyonda vurgu ile belirtilmektedir. Başka bir deyişle bu özellikler konuşma işaretinin bürünsel özellikleridir. Amacımız, Otomatik Konuşma Sisteminin çıktıları ile ses işaretinin bürünsel özelliklerini kullanarak cümle bölütlenmesini otamatik yapabilenbir sistem geliştirmektedir.
Açıklama
Text in English ; Abstract: English and Turkish
Includes bibliographical references (leaves 207-211)
xvii, 212 leaves
Includes bibliographical references (leaves 207-211)
xvii, 212 leaves
Anahtar Kelimeler
Prosody, Speech recognition, Konuşma tanıma, Prozodi
Kaynak
WoS Q Değeri
Scopus Q Değeri
Cilt
Sayı
Künye
Dalva, D. (2012). Automatic speech regognition system for Turkish spoken language. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü