Türkçe WordNet oluşturulması ve makine çevirisinde kullanılması

Yükleniyor...
Küçük Resim

Katkıda Bulunanlar

Fon verenler

Araştırmacılar

Kimlik

Yazarlar

Yayınlar

Organizasyon Birimleri

Açıklama

Dilbilim ve doğal dil işleme alanlarında anlambilimsel çıkarımın gerektiği tüm işlemlerde WordNet kritik bir rol oynamaktadır. WordNet bir dildeki tüm kelimeleri anlamsal gruplara ayırır ve oluşan anlamsal grupların arasındaki anlamsal ilişkileri belirler. Halihazırda Türkçe için kullanılan WordNet’in, çeviri amacı ile oluşturulmuş olup genel anlamda dilbilim ve doğal dil işleme görevleri için yetersiz olduğu görülmektedir. Projenin amacı, Türkçe doğal dil işleme araştırmalarında kullanılması mümkün kapsamlı bir WordNet oluşturulması ve İngilizce-Türkçe makine çevirisinde WordNet’i kullanarak, gerçek bir alanda uygulamasının başarım analizinin yapılmasıdır. Oluşturulacak WordNet’in, 120.000 kelimelik bir veri tabanı içermesi, İngilizce WordNet 3.1 ile uyumlu olması, BalkaNet’e göre 5 kat daha büyük olması ve BalkaNet içinde yer almayan kavramsal ilişkileri içermesi hedeflenmektedir. Proje, yedi iş paketinden oluşmaktadır: synset oluşturma, synsetler arası ilişkileri belirleme, veride semantik etiketleme, İngilizce synsetler ile Türkçe synsetleri eşleştirme, istatistiksel modelli çeviri için kelime-tabanlı ve kelime-grubu tabanlı istatistiksel modellerin üretilmesi, ağaç-tabanlı çeviri modellerinin üretilmesi, başarım analizi. Proje ekibimizin yaptığı ön çalışmalarda elde edilen paralel İngilizce-Türkçe ağaç yapıları mevcuttur. Bu ağaçlar sözdizimsel olarak etiketlenmiştir ve biçimbilimsel belirsizlikleri insan tarafından giderilmiştir. Bununla beraber hem biçimbilimsel hem sözdizimsel olarak etiketlense de anlamsal olarak etiketlenmemiş olup, proje kapsamında gerçekleştirilecektir. Projemiz kapsamında oluşturulacak olan WordNet tüm araştırmacılara ücretsiz olarak açılacak, yeni projelerin üretilmesi için bir kaynak olarak yerini alacaktır.

Anahtar kelimeler

Kelime ağı
Makine çevirisi