Türkçe WordNet oluşturulması ve makine çevirisinde kullanılması
Yükleniyor...
Katkıda Bulunanlar
Fon verenler
Araştırmacılar
Kimlik
Açıklama
Dilbilim ve doğal dil işleme alanlarında anlambilimsel çıkarımın gerektiği tüm işlemlerde WordNet kritik bir rol oynamaktadır. WordNet bir dildeki tüm kelimeleri anlamsal gruplara ayırır ve oluşan anlamsal grupların arasındaki anlamsal ilişkileri belirler. Halihazırda Türkçe için kullanılan WordNet’in, çeviri amacı ile oluşturulmuş olup genel anlamda dilbilim ve doğal dil işleme görevleri için yetersiz olduğu görülmektedir.
Projenin amacı, Türkçe doğal dil işleme araştırmalarında kullanılması mümkün kapsamlı bir WordNet oluşturulması ve İngilizce-Türkçe makine çevirisinde WordNet’i kullanarak, gerçek bir alanda uygulamasının başarım analizinin yapılmasıdır. Oluşturulacak WordNet’in, 120.000 kelimelik bir veri tabanı içermesi, İngilizce WordNet 3.1 ile uyumlu olması, BalkaNet’e göre 5 kat daha büyük olması ve BalkaNet içinde yer almayan kavramsal ilişkileri içermesi hedeflenmektedir.
Proje, yedi iş paketinden oluşmaktadır: synset oluşturma, synsetler arası ilişkileri belirleme, veride semantik etiketleme, İngilizce synsetler ile Türkçe synsetleri eşleştirme, istatistiksel modelli çeviri için kelime-tabanlı ve kelime-grubu tabanlı istatistiksel modellerin üretilmesi, ağaç-tabanlı çeviri modellerinin üretilmesi, başarım analizi.
Proje ekibimizin yaptığı ön çalışmalarda elde edilen paralel İngilizce-Türkçe ağaç yapıları mevcuttur. Bu ağaçlar sözdizimsel olarak etiketlenmiştir ve biçimbilimsel belirsizlikleri insan tarafından giderilmiştir. Bununla beraber hem biçimbilimsel hem sözdizimsel olarak etiketlense de anlamsal olarak etiketlenmemiş olup, proje kapsamında gerçekleştirilecektir. Projemiz kapsamında oluşturulacak olan WordNet tüm araştırmacılara ücretsiz olarak açılacak, yeni projelerin üretilmesi için bir kaynak olarak yerini alacaktır.
Anahtar kelimeler
Kelime ağı
Makine çevirisi
Makine çevirisi