7 sonuçlar
Arama Sonuçları
Listeleniyor 1 - 7 / 7
Yayın Visual modeling of Turkish morphology(European Language Resources Association (ELRA), 2020-05-16) Özenç, Berke; Solak, ErcanIn this paper, we describe the steps in a visual modeling of Turkish morphology using diagramming tools. We aimed to make modeling easier and more maintainable while automating much of the code generation. We released the resulting analyzer, MorTur, and the diagram conversion tool, DiaMor as free, open-source utilities. MorTur analyzer is also publicly available on its web page as a web service. MorTur and DiaMor are part of our ongoing efforts in building a set of natural language processing tools for Turkic languages under a consistent framework.Yayın İngilizce-Türkçe istatistiksel makine çevirisinde biçimbilim kullanımı(IEEE, 2012-04-18) Görgün, Onur; Yıldız, Olcay TanerBu çalışmada, İngilizce-Türkçe dil ikilisi için biçimbilimsel çözümleme yardımı ile SIU dermecesi üzerinde istatistiksel makine çevirisi denemeleri yapılmıştır. Kelime biçimlerinin baz alındığı çeviri denemeleri İngilizce-Türkçe dil ikilisi gibi biçimbilimsel ve çekimsel olarak birbirinden uzak diller için düşük performans göstermektedir. Bu durumda, çeviri temel birimi olarak kelime formlarının yerine alt-sözcüksel temsiller kullanmak, makine çevirisi performansını önemli ölçüde arttırmaktadır.Yayın Unsupervised morphological analysis using tries(Springer London, 2012) Ak, Koray; Yıldız, Olcay TanerThis article presents an unsupervised morphological analysis algorithm to segment words into roots and affixes. The algorithm relies on word occurrences in a given dataset. Target languages are English, Finnish, and Turkish, but the algorithm can be used to segment any word from any language given the wordlists acquired from a corpus consisting of words and word occurrences. In each iteration, the algorithm divides words with respect to occurrences and constructs a new trie for the remaining affixes. Preliminary experimental results on three languages show that our novel algorithm performs better than most of the previous algorithms.Yayın AnlamVer: Semantic model evaluation dataset for Turkish - word similarity and relatedness(Association for Computational Linguistics (ACL), 2018-08-26) Ercan, Gökhan; Yıldız, Olcay TanerIn this paper, we present AnlamVer, which is a semantic model evaluation dataset for Turkish designed to evaluate word similarity and word relatedness tasks while discriminating those two relations from each other. Our dataset consists of 500 word-pairs annotated by 12 human subjects, and each pair has two distinct scores for similarity and relatedness. Word-pairs are selected to enable the evaluation of distributional semantic models by multiple attributes of words and word-pair relations such as frequency, morphology, concreteness and relation types (e.g., synonymy, antonymy). Our aim is to provide insights to semantic model researchers by evaluating models in multiple attributes. We balance dataset word-pairs by their frequencies to evaluate the robustness of semantic models concerning out-of-vocabulary and rare words problems, which are caused by the rich derivational and inflectional morphology of the Turkish language.Yayın A FST description of noun and verb morphology of Azarbaijani Turkish(Association for Computational Linguistics (ACL), 2021) Ehsani, Razieh; Özenç, Berke; Solak, Ercan; Drewes F.We give a FST description of nominal and finite verb morphology of Azarbaijani Turkish. We use a hybrid approach where nominal inflection is expressed as a slot-based paradigm and major parts of verb inflection are expressed as optional paths on the FST. We collapse adjective and noun categories in a single nominal category as they behave similarly as far as their paradigms are concerned. Thus, we defer a more precise identification of POS to further down the NLP pipeline.Yayın Shallow parsing in Turkish(IEEE, 2017) Topsakal, Ozan; Açıkgöz, Onur; Gürkan, Ali Tunca; Kanburoğlu, Ali Buğra; Ertopçu, Burak; Özenç, Berke; Çam, İlker; Avar, Begüm; Ercan, Gökhan; Yıldız, Olcay TanerIn this study, shallow parsing is applied on Turkish sentences. These sentences are used to train and test the per-formances of various learning algorithms with various features specified for shallow parsing in Turkish.Yayın Emlak alanına özgü kelime ağı(Institute of Electrical and Electronics Engineers Inc., 2019-04) Parlar, Selen; Nas Arıcan, Bilge; Erkek, Mehmet; Çayırlı, Kamil; Yıldız, Olcay TanerKelime ağı, anlamlarına göre organize edilmiş kelimeleri barındıran bir veritabanıdır. Bir kelime ağı, sahip olduğu kelimelerin anlamlarını, bilişsel eş anlamlılarını, türlerini, diğer anlamlar ile arasındaki ilişkilerini ve bu anlamların tanımlarını temsil eder. Bu çalışma ile, emlak alanına özgü bir sözlük oluşturmak ve bu yeni sözlüğü kullanarak daha küçük bir kelime ağı tasarlamak yoluyla biçimbilimsel çözümleme ve anlam belirsizliği giderme gibi Doğal Dil İşleme görevlerini kolaylaştıracak bir yöntem öneriyoruz. Ön çalışma olarak, emlak alanına özgü 7,000 kelime içeren bir sözlük ve yaklaşık 11,000 eş anlam kümesinden oluşan bir kelime ağı oluşturuldu ve bunlar çeşitli görevlerle doğrulandı.












