Word sense disambiguation, named entity recognition, and shallow parsing tasks for Turkish

dc.contributor.advisorYıldız, Olcay Taneren_US
dc.contributor.authorTopsakal, Ozanen_US
dc.contributor.otherIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.date.accessioned2019-04-09T02:04:23Z
dc.date.available2019-04-09T02:04:23Z
dc.date.issued2019-04-02
dc.departmentIşık Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Yüksek Lisans Programıen_US
dc.descriptionText in English ; Abstract: English and Turkishen_US
dc.descriptionIncludes bibliographical references (leaves 45-48)en_US
dc.descriptionx, 48 leavesen_US
dc.description.abstractPeople interactions are based on sentences. The process of understanding sentences is thru converging, parsing the words and making sense of words. The ultimate goal of Natural Language Processing is to understand the meaning of sentences. There are three main areas that are the topics of this thesis, namely, Named Entity Recognition, Shallow Parsing, and Word Sense Disambiguation. The Natural Language Processing algorithms that learn entities, like person, location, time etc. are called Named Entity Recognition algorithms. Parsing sentences is one of the biggest challenges in Natural Language Processing. Since time efficiency and accuracy are inversely proportional with each other, one of the best ideas is to use shallow parsing algorithms to deal with this challenge. Many of words have more than one meaning. Recognizing the correct meaning that is used in a sentence is a difficult problem. In Word Sense Disambiguation literature there are lots of algorithms that can help to solve this problem. This thesis tries to find solutions to these three challenges by applying machine learning trained algorithms. Experiments are done on a dataset, containing 9,557 sentences.en_US
dc.description.abstractİnsanların birbiriyle diyalogları cümlelerle olmaktadır. Cümlenin anlaşılması, kelimelere yakınsayarak, onları ayrıştırarak ve cümle içerisinde kullanılan ideal anlamlarını bularak olur. Doğal Dil İşleme’nin nihai amacı cümleyi anlamaktır. Bu tezin konusu üç alandan oluşmaktadır: Adlandırılmış Varlık Tanıma, Sığ ayrıştırma ve Kelime Anlamlandırma’dır. “İnsan“, “yer“, “zaman“ gibi varlıkları öğrenebilen Doğal Dil Geliştirme algoritmalarına Adlandırılmış Varlık Algoritmaları denir. Cümleleri ayrıştırma Doğal Dil İşleme’nin en büyük meydan okumalarından birisidir. Zaman ve doğruluğu arttırma ters orantılı olduğundan dolayı Sığ Ayrıştırma algoritmaları bu konudaki en iyi çözümlerden biridir. Bir çok kelimenin birden çok anlamı vardır. Cümle içinde kullanılan kelimenin doğru anlamını algılamak zorlu bir problemdir. Kelime Anlamlandırma literatüründe bu problemi çözümlemek için bir çok algoritma mevcuttur. Bu tezde bu üç alan için makine öğrenimi algoritmalarıyla çözümler üretilmeye çalışılmıştır. Deneyler 9,557 cümlelik bir veri kümesi üzerinde yapılmıştır.en_US
dc.description.tableofcontentsNamed Entity Recognitionen_US
dc.description.tableofcontentsShallow Parseen_US
dc.description.tableofcontentsWord Sense Disambiguationen_US
dc.description.tableofcontentsPrevious / Related Worksen_US
dc.description.tableofcontentsNamed Entity Recognitionen_US
dc.description.tableofcontentsLinguistic Backgrounden_US
dc.description.tableofcontentsComputational Backgrounden_US
dc.description.tableofcontentsShallow Parseen_US
dc.description.tableofcontentsLinguistic Backgrounden_US
dc.description.tableofcontentsComputational Backgrounden_US
dc.description.tableofcontentsWord Sense Disambiguationen_US
dc.description.tableofcontentsLinguistic Backgrounden_US
dc.description.tableofcontentsComputational Backgrounden_US
dc.description.tableofcontentsDataen_US
dc.description.tableofcontentsPreworken_US
dc.description.tableofcontentsDataen_US
dc.description.tableofcontentsPreparing Educational Videosen_US
dc.description.tableofcontentsControlling Other Studentsen_US
dc.description.tableofcontentsTaggingen_US
dc.description.tableofcontentsMorphological Disambiguationen_US
dc.description.tableofcontentsNER Taggingen_US
dc.description.tableofcontentsShallow Parse Taggingen_US
dc.description.tableofcontentsWord Sense Disambiguation Taggingen_US
dc.description.tableofcontentsAlgorithmsen_US
dc.description.tableofcontentsFeaturesen_US
dc.description.tableofcontentsExperimentsen_US
dc.description.tableofcontentsExperiment Setupen_US
dc.description.tableofcontentsInter-annotator Agreementen_US
dc.description.tableofcontentsNERen_US
dc.description.tableofcontentsShallow Parseen_US
dc.description.tableofcontentsWord Sense Disambiguationen_US
dc.identifier.citationTopsakal, O. (2019). Word sense disambiguation, named entity recognition, and shallow parsing tasks for Turkish. İstanbul: Işık Üniversitesi Fen Bilimleri Enstitüsü.en_US
dc.identifier.urihttps://hdl.handle.net/11729/1547
dc.institutionauthorTopsakal, Ozanen_US
dc.language.isoenen_US
dc.publisherIşık Üniversitesien_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.rightsAttribution-NonCommercial-NoDerivs 3.0 United States*
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/3.0/us/*
dc.subjectMachine learningen_US
dc.subjectNamed entity recognitionen_US
dc.subjectNatural language processingen_US
dc.subjectNERen_US
dc.subjectNLPen_US
dc.subjectShallow parsingen_US
dc.subjectWord sense disambiguationen_US
dc.subjectAdlandırılmış varlık tanımaen_US
dc.subjectDoğal dil işlemeen_US
dc.subjectKelime anlamlandırmaen_US
dc.subjectMakine öğrenmesien_US
dc.subjectSığ ayrıştırmaen_US
dc.subject.lccQA76.9.N38 T67 2019
dc.subject.lcshNatural language processing (Computer science)en_US
dc.subject.lcshNatural language processing.en_US
dc.titleWord sense disambiguation, named entity recognition, and shallow parsing tasks for Turkishen_US
dc.title.alternativeTürkçe için kelime anlamlandırma, adlandırılmış varlık tanıma ve sığ ayrıştırmaen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
11729-1547.pdf
Boyut:
443.23 KB
Biçim:
Adobe Portable Document Format
Açıklama:
MasterThesis
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.71 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: