All-words word sense disambiguation for Turkish
dc.authorid | 0000-0001-9821-4362 | |
dc.authorid | 0000-0003-2008-243X | |
dc.authorid | 0009-0003-9031-1485 | |
dc.authorid | 0000-0003-2843-2334 | |
dc.authorid | 0000-0002-2782-8217 | |
dc.authorid | 0000-0001-5838-4615 | |
dc.contributor.author | Açıkgöz, Onur | en_US |
dc.contributor.author | Gürkan, Ali Tunca | en_US |
dc.contributor.author | Ertopçu, Burak | en_US |
dc.contributor.author | Topsakal, Ozan | en_US |
dc.contributor.author | Özenç, Berke | en_US |
dc.contributor.author | Kanburoğlu, Ali Buğra | en_US |
dc.contributor.author | Çam, İlker | en_US |
dc.contributor.author | Avar, Begüm | en_US |
dc.contributor.author | Ercan, Gökhan | en_US |
dc.contributor.author | Yıldız, Olcay Taner | en_US |
dc.date.accessioned | 2019-03-28T00:17:13Z | |
dc.date.available | 2019-03-28T00:17:13Z | |
dc.date.issued | 2017 | |
dc.department | Işık Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü | en_US |
dc.department | Işık University, Faculty of Engineering, Department of Computer Engineering | en_US |
dc.description.abstract | Identifying the sense of a word within a context is a challenging problem and has many applications in natural language processing. This assignment problem is called word sense disambiguation(WSD). Many papers in the literature focus on English language and data. Our dataset consists of 1400 sentences translated to Turkish from the Penn Treebank Corpus. This paper seeks to address and discuss 6 different feature extraction methods and its classification performances using C4.5, Random Forests, Rocchio, Naive Bayes, KNN, Linear and multilayer Perceptron. This paper calls into question how the described features perform on a morphologically rich language (Turkish) with several classifiers. | en_US |
dc.description.abstract | Bir kelimenin geçtiği bağlam içindeki anlamını belirlemek , doğal dil işleme alanında, zorlu ve çokça uygulaması olan bir problemdir. Bu problemin literatürdeki bilinen adı, kelime belirsizlik gidermedir. Bir çok yayın İngiliz dili ve verileri üzerine yoğunlaşmış çalışmalardır. Bu çalışmada kullandığımız veri kümesi, Penn Treebank Corpus'dan derlenmiş ve Türkçe'ye çevrilmiş 1400 cümleden oluşmaktadır. Çalışmamızın amacı 6 farklı öznitelik çıkarım algoritmasının performanslarını farklı sınıflandırıcılarla ölçmektir. Kullandığımız sınıflandırma algoritmaları, C4.5, Random Forests, Rocchio, Naive Bayes, KNN, Linear ve multilayer Perceptron'dır. yayınımızın amacı açıklanan özniteliklerin morfolojik açıdan zengin olan bir dilde (Türkçe), farklı sınıflandırıcılarla verdiği performans ölçmektir. | en_US |
dc.description.version | Publisher's Version | en_US |
dc.identifier.citation | Açıkgöz, O., Gürkan, A. T., Ertopçu, B., Topsakal, O., Özenç, B., Kanburoğlu, A. B., Çam, İ., Avar, B., Ercan, G. & Yıldız, O. T. (2017). All-words word sense disambiguation for turkish. Paper presented at the 2017 International Conference on Computer Science and Engineering (UBMK), 490-495. doi:10.1109/UBMK.2017.8093442 | en_US |
dc.identifier.doi | 10.1109/UBMK.2017.8093442 | |
dc.identifier.endpage | 495 | |
dc.identifier.isbn | 9781538609309 | |
dc.identifier.scopus | 2-s2.0-85040547964 | |
dc.identifier.scopusquality | N/A | |
dc.identifier.startpage | 490 | |
dc.identifier.uri | https://hdl.handle.net/11729/1516 | |
dc.identifier.uri | http://dx.doi.org/10.1109/UBMK.2017.8093442 | |
dc.identifier.wos | WOS:000426856900091 | |
dc.identifier.wosquality | N/A | |
dc.indekslendigikaynak | Web of Science | en_US |
dc.indekslendigikaynak | Scopus | en_US |
dc.indekslendigikaynak | Conference Proceedings Citation Index – Science (CPCI-S) | en_US |
dc.institutionauthor | Açıkgöz, Onur | en_US |
dc.institutionauthor | Gürkan, Ali Tunca | en_US |
dc.institutionauthor | Ertopçu, Burak | en_US |
dc.institutionauthor | Topsakal, Ozan | en_US |
dc.institutionauthor | Özenç, Berke | en_US |
dc.institutionauthor | Kanburoğlu, Ali Buğra | en_US |
dc.institutionauthor | Çam, İlker | en_US |
dc.institutionauthor | Ercan, Gökhan | en_US |
dc.institutionauthor | Yıldız, Olcay Taner | en_US |
dc.institutionauthorid | 0000-0001-9821-4362 | |
dc.institutionauthorid | 0000-0003-2008-243X | |
dc.institutionauthorid | 0009-0003-9031-1485 | |
dc.institutionauthorid | 0000-0002-2782-8217 | |
dc.institutionauthorid | 0000-0001-5838-4615 | |
dc.language.iso | en | en_US |
dc.peerreviewed | Yes | en_US |
dc.publicationstatus | Published | en_US |
dc.publisher | IEEE | en_US |
dc.relation.ispartof | 2017 International Conference on Computer Science and Engineering (UBMK) | en_US |
dc.relation.publicationcategory | Konferans Öğesi - Uluslararası - Kurum Öğretim Elemanı | en_US |
dc.rights | info:eu-repo/semantics/closedAccess | en_US |
dc.subject | Word sense disambiguation | en_US |
dc.subject | Semantics | en_US |
dc.subject | Predictive models | en_US |
dc.subject | Tools | en_US |
dc.subject | Computer bugs | en_US |
dc.subject | Pragmatics | en_US |
dc.subject | Syntactics | en_US |
dc.subject | Distributed databases | en_US |
dc.subject | Feature extraction | en_US |
dc.subject | Multilayer perceptrons | en_US |
dc.subject | Natural language processing | en_US |
dc.subject | Pattern classification | en_US |
dc.subject | Random processes | en_US |
dc.subject | Turkish penn-treebank corpus | en_US |
dc.subject | Assignment problem | en_US |
dc.subject | Penn treebank corpus | en_US |
dc.subject | Morphologically rich language | en_US |
dc.subject | English language | en_US |
dc.subject | Feature extraction methods | en_US |
dc.subject | Turkish language | en_US |
dc.subject | WSD | en_US |
dc.subject | C4.5 | en_US |
dc.subject | Random forests | en_US |
dc.subject | Rocchio classification | en_US |
dc.subject | Naive bayes | en_US |
dc.subject | KNN | en_US |
dc.subject | Multilayer perceptron | en_US |
dc.subject | Kelime belirsizlik giderme | en_US |
dc.subject | Türkçe Penn-Treebank corpus | en_US |
dc.title | All-words word sense disambiguation for Turkish | en_US |
dc.title.alternative | Türkçe için çoklu-kelime belirsizlik giderme | en_US |
dc.type | Conference Object | en_US |
dspace.entity.type | Publication |