Word sense disambiguation, named entity recognition, and shallow parsing tasks for Turkish
dc.contributor.advisor | Yıldız, Olcay Taner | en_US |
dc.contributor.author | Topsakal, Ozan | en_US |
dc.contributor.other | Işık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programı | en_US |
dc.date.accessioned | 2019-04-09T02:04:23Z | |
dc.date.available | 2019-04-09T02:04:23Z | |
dc.date.issued | 2019-04-02 | |
dc.department | Işık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programı | en_US |
dc.description | Text in English ; Abstract: English and Turkish | en_US |
dc.description | Includes bibliographical references (leaves 45-48) | en_US |
dc.description | x, 48 leaves | en_US |
dc.description.abstract | People interactions are based on sentences. The process of understanding sentences is thru converging, parsing the words and making sense of words. The ultimate goal of Natural Language Processing is to understand the meaning of sentences. There are three main areas that are the topics of this thesis, namely, Named Entity Recognition, Shallow Parsing, and Word Sense Disambiguation. The Natural Language Processing algorithms that learn entities, like person, location, time etc. are called Named Entity Recognition algorithms. Parsing sentences is one of the biggest challenges in Natural Language Processing. Since time efficiency and accuracy are inversely proportional with each other, one of the best ideas is to use shallow parsing algorithms to deal with this challenge. Many of words have more than one meaning. Recognizing the correct meaning that is used in a sentence is a difficult problem. In Word Sense Disambiguation literature there are lots of algorithms that can help to solve this problem. This thesis tries to find solutions to these three challenges by applying machine learning trained algorithms. Experiments are done on a dataset, containing 9,557 sentences. | en_US |
dc.description.abstract | İnsanların birbiriyle diyalogları cümlelerle olmaktadır. Cümlenin anlaşılması, kelimelere yakınsayarak, onları ayrıştırarak ve cümle içerisinde kullanılan ideal anlamlarını bularak olur. Doğal Dil İşleme’nin nihai amacı cümleyi anlamaktır. Bu tezin konusu üç alandan oluşmaktadır: Adlandırılmış Varlık Tanıma, Sığ ayrıştırma ve Kelime Anlamlandırma’dır. “İnsan“, “yer“, “zaman“ gibi varlıkları öğrenebilen Doğal Dil Geliştirme algoritmalarına Adlandırılmış Varlık Algoritmaları denir. Cümleleri ayrıştırma Doğal Dil İşleme’nin en büyük meydan okumalarından birisidir. Zaman ve doğruluğu arttırma ters orantılı olduğundan dolayı Sığ Ayrıştırma algoritmaları bu konudaki en iyi çözümlerden biridir. Bir çok kelimenin birden çok anlamı vardır. Cümle içinde kullanılan kelimenin doğru anlamını algılamak zorlu bir problemdir. Kelime Anlamlandırma literatüründe bu problemi çözümlemek için bir çok algoritma mevcuttur. Bu tezde bu üç alan için makine öğrenimi algoritmalarıyla çözümler üretilmeye çalışılmıştır. Deneyler 9,557 cümlelik bir veri kümesi üzerinde yapılmıştır. | en_US |
dc.description.tableofcontents | Named Entity Recognition | en_US |
dc.description.tableofcontents | Shallow Parse | en_US |
dc.description.tableofcontents | Word Sense Disambiguation | en_US |
dc.description.tableofcontents | Previous / Related Works | en_US |
dc.description.tableofcontents | Named Entity Recognition | en_US |
dc.description.tableofcontents | Linguistic Background | en_US |
dc.description.tableofcontents | Computational Background | en_US |
dc.description.tableofcontents | Shallow Parse | en_US |
dc.description.tableofcontents | Linguistic Background | en_US |
dc.description.tableofcontents | Computational Background | en_US |
dc.description.tableofcontents | Word Sense Disambiguation | en_US |
dc.description.tableofcontents | Linguistic Background | en_US |
dc.description.tableofcontents | Computational Background | en_US |
dc.description.tableofcontents | Data | en_US |
dc.description.tableofcontents | Prework | en_US |
dc.description.tableofcontents | Data | en_US |
dc.description.tableofcontents | Preparing Educational Videos | en_US |
dc.description.tableofcontents | Controlling Other Students | en_US |
dc.description.tableofcontents | Tagging | en_US |
dc.description.tableofcontents | Morphological Disambiguation | en_US |
dc.description.tableofcontents | NER Tagging | en_US |
dc.description.tableofcontents | Shallow Parse Tagging | en_US |
dc.description.tableofcontents | Word Sense Disambiguation Tagging | en_US |
dc.description.tableofcontents | Algorithms | en_US |
dc.description.tableofcontents | Features | en_US |
dc.description.tableofcontents | Experiments | en_US |
dc.description.tableofcontents | Experiment Setup | en_US |
dc.description.tableofcontents | Inter-annotator Agreement | en_US |
dc.description.tableofcontents | NER | en_US |
dc.description.tableofcontents | Shallow Parse | en_US |
dc.description.tableofcontents | Word Sense Disambiguation | en_US |
dc.identifier.citation | Topsakal, O. (2019). Word sense disambiguation, named entity recognition, and shallow parsing tasks for Turkish. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü. | en_US |
dc.identifier.uri | https://hdl.handle.net/11729/1547 | |
dc.institutionauthor | Topsakal, Ozan | en_US |
dc.language.iso | en | en_US |
dc.publisher | Işık Üniversitesi | en_US |
dc.relation.publicationcategory | Tez | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.rights | Attribution-NonCommercial-NoDerivs 3.0 United States | * |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/3.0/us/ | * |
dc.subject | Machine learning | en_US |
dc.subject | Named entity recognition | en_US |
dc.subject | Natural language processing | en_US |
dc.subject | NER | en_US |
dc.subject | NLP | en_US |
dc.subject | Shallow parsing | en_US |
dc.subject | Word sense disambiguation | en_US |
dc.subject | Adlandırılmış varlık tanıma | en_US |
dc.subject | Doğal dil işleme | en_US |
dc.subject | Kelime anlamlandırma | en_US |
dc.subject | Makine öğrenmesi | en_US |
dc.subject | Sığ ayrıştırma | en_US |
dc.subject.lcc | QA76.9.N38 T67 2019 | |
dc.subject.lcsh | Natural language processing (Computer science) | en_US |
dc.subject.lcsh | Natural language processing. | en_US |
dc.title | Word sense disambiguation, named entity recognition, and shallow parsing tasks for Turkish | en_US |
dc.title.alternative | Türkçe için kelime anlamlandırma, adlandırılmış varlık tanıma ve sığ ayrıştırma | en_US |
dc.type | Master Thesis | en_US |