Co-training using prosodic, lexical and morphological information for automatic sentence segmentation of Turkish spoken language
dc.authorid | 0000-0002-7035-8724 | |
dc.contributor.advisor | Güz, Ümit | en_US |
dc.contributor.author | Dalva, Doğan | en_US |
dc.contributor.other | Işık Üniversitesi, Fen Bilimleri Enstitüsü, Elektronik Mühendisliği Doktora Programı | en_US |
dc.date.accessioned | 2018-08-16T13:28:55Z | |
dc.date.available | 2018-08-16T13:28:55Z | |
dc.date.issued | 2018-01-15 | |
dc.department | Işık Üniversitesi, Fen Bilimleri Enstitüsü, Elektronik Mühendisliği Doktora Programı | en_US |
dc.description | Text in English ; Abstract: English and Turkish | en_US |
dc.description | Includes bibliographical references (leaves 124-132) | en_US |
dc.description | xiv, 132 leaves | en_US |
dc.description.abstract | Sentence segmentation of speech aims detecting sentence boundaries in a stream of words output by the speech recognizer. Sentence segmentation is a preliminary step toward speech understanding. It is of particular importance for speech related applications, as most of the further processing steps; such as parsing, machine translation and information extraction, assume the presence of sentence boundaries. Typically, statistical methods require a huge amount of manually labeled data, which is time and labor consuming process to prepare. In this work, novel multiview semi-supervised learning strategies for the solution of sentence segmentation problem are proposed. The aim of this work is to and effective semi-supervised machine learning strategies when only a small set of sentence boundary labeled data is available. This work proposes three-view co-training and committee-based strategies incorporating with agreement, disagreement and self-combined strategies using lexical, morphological and prosodic information, and investigates performance of the proposed learning strategies against baseline, self-training and co-training. The experimental results show that the proposed learning strategies highly improve the sentence segmentation problem, since data sets can be represented by three redundantly suffcient and disjoint feature sets. | en_US |
dc.description.abstract | Cümle bölütleme işlevi, standart Otomatik Konuşma Tanıma (OKT) sistemlerinin çıkışından elde edilen işlenmemiş kelime dizisi biçimindeki veriyi cümlelere ayırarak zenginleştirmeyi amaçlayan bir işlemdir. Cümle bölütleme; çözümleme, makine çevrimi, bilgi çıkarımı gibi cümle bölütlemenin yapıldığının varsayıldığı konuşma işlemenin daha ileri uygulamaları için bir ön adım olarak gerçekleştirilmektedir. Cümle bölütlemede kullanılan standart yöntemler, model eğitimi aşamasıında oldukça fazla etiketlenmiş veriye ihtiyaç duyar. El ile yapılan veri etiketleme işlemi; emek, dikkat ve zaman isteyen bir işlemdir. Bu çalışmada çok bakışlı yarı öğreticili yöntemler geliştirerek, daha az el ile etiketlenmiş veri ile standart yöntemlere göre daha yüksek başarımın sağlanması hede flenmektedir. Bu çalışmada çok bakışlı yarı öğreticili yöntemler geliştirerek, daha az el ile etiketlenmiş veri ile standart yöntemlere göre daha yüksek başarımın sağlanması hedeflenmektedir. Bu çalışmada sözcüksel, biçimbilgisel ve prozodik özellikleri kullanan, uzlaşma (agreement), uzlaşamama (disagreement) ve self-combined yöntemleri ile beraber çalısan yeni üç bakışlı eş eğitim (co-training) ve kurul tabanlı (committee-based) yöntemler geliştirildi. Yeni yöntemlerin performansları, iki bakışlı eş eğitim yöntemleri, kendi kendini eğitme (self-training) yöntemi ve standart yöntemler ile kıyaslandı. Deneysel sonuçlar, veri kümeleri yeterli ve ayrık özellik grupları kullanılarak ifade edilebildiği için, önerilen yöntemlerin cümle bölütleme başarımı oldukça arttırdığı göstermektedir. | en_US |
dc.description.sponsorship | This material is based upon work supported by the Scientific and Technological Research Council of Turkey (TUBITAK) (Project Number: 107E182 and Project Number: 111E228). | en_US |
dc.description.sponsorship | Isik University Scientific Research Project Fund (Project Number: 09A301 and Project Number: 14A201). | en_US |
dc.description.tableofcontents | Sentence Segmentation | en_US |
dc.description.tableofcontents | Semi-Supervised Learning | en_US |
dc.description.tableofcontents | Self-Training | en_US |
dc.description.tableofcontents | Co-Training | en_US |
dc.description.tableofcontents | Data Collection and Annotation | en_US |
dc.description.tableofcontents | Pre-processing Data | en_US |
dc.description.tableofcontents | Data Profile | en_US |
dc.description.tableofcontents | Extraction of Prosodic, Morphological and Lexical Features for Sentence Segmentation Problem | en_US |
dc.description.tableofcontents | Prosodic Features | en_US |
dc.description.tableofcontents | SRI-International Algemy Prosodic Feature Extraction Tool | en_US |
dc.description.tableofcontents | Purdue Prosodic Feature Extraction Tool | en_US |
dc.description.tableofcontents | Comparison of SRI Algemy and Purdue Prosodic Feature Extraction Tools | en_US |
dc.description.tableofcontents | Morphological Features | en_US |
dc.description.tableofcontents | Lexical Features | en_US |
dc.description.tableofcontents | Proposed Method | en_US |
dc.description.tableofcontents | Calibrated Confidence Scores | en_US |
dc.description.tableofcontents | Semi-Supervised Learning | en_US |
dc.description.tableofcontents | Co-Training Agreement Strategy | en_US |
dc.description.tableofcontents | Co-Training Disagreement Strategy | en_US |
dc.description.tableofcontents | Self-Combined Strategy | en_US |
dc.description.tableofcontents | Proposed Three-view Co-Training and Committee-Based Learning Strategies | en_US |
dc.description.tableofcontents | Three-View Co-Training Strategy 1 | en_US |
dc.description.tableofcontents | Three-View Co-Training Strategy 2 | en_US |
dc.description.tableofcontents | Three-View Co-Training Strategy 3 | en_US |
dc.description.tableofcontents | Three-View Co-Training Strategy 4 | en_US |
dc.description.tableofcontents | Three-View Co-Training Strategy 5 | en_US |
dc.description.tableofcontents | Three-View Co-Training Strategy 6 | en_US |
dc.description.tableofcontents | Three-View Co-Training Strategy 7 | en_US |
dc.description.tableofcontents | Committee-Based Learning Strategy 8 | en_US |
dc.description.tableofcontents | Committee-Based Learning Strategy 9 | en_US |
dc.description.tableofcontents | Experimental Setup of the Self-Training and Co-Training Methods | en_US |
dc.description.tableofcontents | Experimental Results of the Self-Training and Co-Training Methods Based on Different Feature Sets | en_US |
dc.description.tableofcontents | Experimental Results Based on the Lexical Features | en_US |
dc.description.tableofcontents | Experiment Results Based on the Morphological Features | en_US |
dc.description.tableofcontents | Experimental Results Based on the Prosodic Features | en_US |
dc.description.tableofcontents | Experimental Results Based on the Combination of Lexical and Morphological Features | en_US |
dc.description.tableofcontents | Experimental Results Based on the Combination of Lexical and Prosodic Features | en_US |
dc.description.tableofcontents | Experimental Results Based on the Combination of Prosodic and Morphological Features | en_US |
dc.description.tableofcontents | Average Results Based on Different Strategies | en_US |
dc.description.tableofcontents | Statistical Analysis of the Experimental Results | en_US |
dc.description.tableofcontents | Scenario of Concatenating Trained Models to Online ASR Systems | en_US |
dc.identifier.citation | Dalva, D. (2018). Co-Training using Prosodic, Lexical and Morphological Information for Automatic Sentence Segmentation of Turkish Spoken Language. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü | en_US |
dc.identifier.uri | https://hdl.handle.net/11729/1317 | |
dc.institutionauthor | Dalva, Doğan | en_US |
dc.institutionauthorid | 0000-0002-7035-8724 | |
dc.language.iso | en | en_US |
dc.publisher | Işık Üniversitesi | en_US |
dc.relation.publicationcategory | Tez | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Boosting | en_US |
dc.subject | Co-training | en_US |
dc.subject | Forced alignment | en_US |
dc.subject | Lexical feature extraction | en_US |
dc.subject | Machine learning | en_US |
dc.subject | Morphology | en_US |
dc.subject | Multi-view semi-supervised learning | en_US |
dc.subject | Prosody | en_US |
dc.subject | Prosodic feature extraction | en_US |
dc.subject | Sentence segmentation | en_US |
dc.subject | Self- training | en_US |
dc.subject | Biçimbilgisel bilgi (Morfoloji) | en_US |
dc.subject | Cümle bölütleme | en_US |
dc.subject | Çok bakışlı yarı öğreticili öğrenme | en_US |
dc.subject | Eş eğitim (Co-Training) | en_US |
dc.subject | Makine öğrenmesi | en_US |
dc.subject | Prozodi | en_US |
dc.subject | Prozodik özellik çıkarımı | en_US |
dc.subject | Sözlüksel (Lexical) özellik çıkarımı | en_US |
dc.subject | Zorlanmış hizalama | en_US |
dc.subject.lcc | Q325.5 .D35 2018 | |
dc.subject.lcsh | Machine learning -- Statistical methods | en_US |
dc.subject.lcsh | Signal processing -- Digital techniques | en_US |
dc.subject.lcsh | Prosodic analysis (Linguistics) | en_US |
dc.subject.lcsh | Machine learning | en_US |
dc.subject.lcsh | Boosting (Algorithms) | en_US |
dc.subject.lcsh | Autosegmental theory (Linguistics) | en_US |
dc.subject.lcsh | Automatic speech recognition | en_US |
dc.subject.lcsh | Speech processing systems | en_US |
dc.subject.lcsh | Grammar, Comparative and general -- Morphology | en_US |
dc.title | Co-training using prosodic, lexical and morphological information for automatic sentence segmentation of Turkish spoken language | en_US |
dc.title.alternative | Bürüsel, sözcüksel ve biçimsel bilgiyi kullanan eş-eğitim ile Türkçe konuşma dilinin otomatik cümle bölütlemesi | en_US |
dc.type | Doctoral Thesis | en_US |
dspace.entity.type | Publication |