Türkçe nin Bağlılık Ayrıştırması. Gülşen Cebiroğlu Eryiğit

Benzer belgeler
Türkçe nin olasılık tabanlı bağlılık ayrıştırması

DOKTORA TEZİ. Anabilim Dalı : Bilgisayar Mühendisliği Programı : Bilgisayar Mühendisliği. Tez Danışmanı : Prof. Dr. Eşref ADALI

Türkçe için ardışık şartlı rastgele alanlarla bağlılık ayrıştırma

Türkçe Cümlelerin Kural Tabanlı Ba lılık Analizi

Türkçe Dokümanlar Ġçin Yazar Tanıma

Uzaktan Algılama Teknolojileri

İSTANBUL TEKNİK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ TÜRKÇE İÇİN BİÇİMBİRİMSEL BELİRSİZLİK GİDERİCİ. YÜKSEK LİSANS TEZİ Müh. Z.

Sigma 32, 23-30, 2014 Research Article / Araştırma Makalesi PREDICTION OF FUNCTION TAGS OF THE SIMPLE TURKISH SENTENCES BY CONDITIONAL RANDOM FIELDS

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

Türkçe ve Doğal Dil İşleme Turkish Natural Language Processing. Özet. Kemal Oflazer Carnegie Mellon Üniversitesi - Katar Doha, Katar ko@cs.cmu.

TÜRKÇE ULUSAL DİL DERLEMİ PROJESİ BİÇİMBİRİM ÇALIŞMALARINDA BELİRSİZLİKLERİN SINIFLANDIRILMASI VE DAĞILIMI

AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

2018 Proje ve 2019 Proje KA103/KA107 ERASMUS+ ÖĞRENİM VE ST OĞRENCİLERİ HAZIRLIK VE DESTEK PROGRAMINA (ORYANTASYON) HOŞGELDİNİZ 24 MART 2019 R.

YAPAY ZEKA (Artificial Intelligence)

CJ MTP11 AYRINTILAR. 5. Sınıf Türkçe. Konu Tarama Adı. 01 Sözcük ve Söz Gruplarında Anlam - I. 02 Sözcük ve Söz Gruplarında Anlam - II

1. DÜNYADAKİ BAŞLICA DİL AİLELERİ

Uygulamalı Türkçe Doğal Dil İşleme Evreleri

Biçimbilimsel Çözümleme Morphological Analysis

Heceleme Yöntemiyle Kök Sözcük Üretme

YZM Biçimsel Diller ve Otomata Teorisi. Ders#06

ÖZGEÇMİŞ. Unvan Bölüm Üniversite Yıl Yrd. Doç. Dr. Yazılım Mühendisliği Bahçeşehir Üniversitesi 2007

BCA605 Bilgisayar Oyunlarında Yapay Zeka

ANA DİL Mİ, ANA DİLİ Mİ? IS IT PARENT LANGUAGE OR OR MOTHER TONGUE?

BURSA GÖÇMEN AĞIZLARI FİİL İŞLETİMİNDE ŞİMDİKİ ZAMAN Şükrü BAŞTÜRK * Mustafa ULUOCAK ** Erol OGUR *** Süleyman EROĞLU **** Hatice ŞAHİN ***** ÖZET

Google Site Araması Kuruluşunuz İçin Google Web Sitesi Araması

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması

GÜR EMRE GÜRAKSIN AFYON KOCATEPE ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ / BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ / AFYONKARAHİSAR

Web Madenciliği (Web Mining)

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : Unvanı : Doç. Dr. 4. Öğrenim Durumu :

Ö Z G E Ç M İ Ş. 1. Adı Soyadı: Mustafa GÖÇKEN. 2. Doğum Tarihi: 12 Haziran Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D.

Uygur Tümcesinin Bilgisayar ile Çözümlenmesi

Koşullu Rastgele Alanlar ile Türkçe Haber Metinlerinin Etiketlenmesi (Labelling Turkish News Stories with Conditional Random Fields)

SEDAT ERSÖZ ÖZGEÇMİŞ VE YAYIN BİLGİLERİ

Tercüme çeviri hizmeti verdiğimiz konular

Metin Sınıflandırma. Akış

Yetkin Bul ve Değiştir

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir.

İTÜ LİSANSÜSTÜ DERS KATALOG FORMU (GRADUATE COURSE CATALOGUE FORM)

FIRAT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ/YAZILIM MÜHENDİSLİĞİ (DR)

Kelime Gösterimleri (Word Representation Word Embeddings)

Doktora Sayısal Yöntemler İstanbul Üniversitesi 2015 Yüksek Ortaöğretim Matematik Öğretmenliği Selçuk Üniversitesi 2005

Anadolu Üniversitesi Endüstri Mühendisliği Bölümü İST328 Yöneylem Araştırması 2 Dersi Bahar Dönemi. Hazırlayan: Doç. Dr.

BİÇİMBİRİM AÇIMLAMA VE BELİRGİNLEŞTİRME. Ümit MERSİNLİ, Mustafa AKSAN Mersin Üniversitesi

ÖZGEÇMİŞ. 1. Adı Soyadı : Birim BALCI 2. Doğum Tarihi : Unvanı : Yrd. Doç. Dr. 4. Öğrenim Durumu: Derece Alan Üniversite Yıl Lisans

Yard. Doç. Dr. İrfan DELİ. Matematik

FATMA KANCA. Derece Alan Üniversite Yıl Doktora Matematik Gebze Yüksek Teknoloji Enstitüsü Yüksek Lisans Matematik Kocaeli Üniversitesi 2004

Kablosuz Sensör Ağlar ve Eniyileme. Tahir Emre KALAYCI. 21 Mart 2008

CBS ve Coğrafi Hesaplama

Araştırma Görevlisi İSMAİL ÇÖLKESEN

Öğrenim Durumu: Derece Bölüm/Program/Alan Üniversite Bitirme Yılı Lisans Fizik / Fen Edebiyat / Fizik Dicle Üniversitesi 2004

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama

YAPAY ÖĞRENME İLE TÜRKİYE NİN KURULU GÜCÜNÜN 2023 YILINA KADAR TAHMİNİ

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 ( yılı öncesinde birinci

ELECO '2012 Elektrik - Elektronik ve Bilgisayar Mühendisliği Sempozyumu, 29 Kasım - 01 Aralık 2012, Bursa

6. SINIF TÜRKÇE DERSİ KURS KAZANIMLARI VE TESTLERİ

Yrd. Doç. Dr. Kerem OK Işık Üniversitesi Fen-Edebiyat Fakültesi Enformasyon Teknolojileri Bölümü

ÖZGEÇMİŞ. Derece Alan Üniversite Yıl

Bahar Keçeli-Kaysılı, Ph. D. Ankara Üniversitesi Eğitim Bilimleri Fakültesi, Özel Eğitim Bölümü (0312) /7104

VERİ MADENCİLİĞİNE BAKIŞ

Tarih Saat Modül Adı Öğretim Üyesi. 01/05/2018 Salı 3 Bilgisayar Bilimlerine Giriş Doç. Dr. Hacer Karacan

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

TÜRKÇE METİNLERDEKİ YAZIM YANLIŞLARINA YÖNELİK OTOMATİK DÜZELTME MODELİ

Türkçe için Wikipedia Tabanlı Varlık İsmi Tanıma Sistemi

RUS DİLİ VE EDEBİYATI ANABİLİM DALI EĞİTİM-ÖĞRETİM YILI BAHAR PROGRAMI

ÖZGEÇMİŞ VE ESERLER LİSTESİ

ÖZGEÇMİŞ VE YAYIN LİSTESİ

FRANSIZ DİLİ VE EDEBİYATI ANABİLİM DALI EĞİTİM ÖĞRETİM ÖĞRETİM YILI GÜZ PROGRAMI

Örüntü Tanıma ve Öznitelik Seçme Yöntemleri Kullanarak Kısa Zaman Sonraki Yol Trafik Hız Öngörüsü

Matris Analizi (MATH333) Ders Detayları

TÜRKÇE İÇİN BİR SIKLIK ANALİZİ PROGRAMI



ç ç ç ç Ö ç ç Ş ç ç Ç

TÜRKÇE CÜMLELERDE İSİM TAMLAMALARININ BULUNMASI YÜKSEK LİSANS TEZİ. Kübra ADALI. Bilgisayar Mühendisliği Anabilim Dalı. Bilgisayar Mühendisliği Bölümü

ÖZGEÇMİŞ VE ESERLER LİSTESİ

İTÜ LISANSÜSTÜ DERS KATALOG FORMU (GRADUATE COURSE CATALOGUE FORM)

ÖZGEÇMİŞ. BSc - Matematik ve Bilgisayar Öğretmenliği, Doğu Akdeniz Üniversitesi, Gazimağusa, 2000

SOFTWARE ENGINEERS EDUCATION SOFTWARE REQUIREMENTS/ INSPECTION RESEARCH FINANCIAL INFORMATION SYSTEMS DISASTER MANAGEMENT INFORMATION SYSTEMS

TAM METİN YAZIM KURALLARI

Ankara Üniversitesi, Eğitim Bilimleri Enstitüsü, Bilgisayar ve Öğretim Teknolojileri Eğitimi Anabilim Dalı, Eğitim Teknolojisi Programı.

Sözlük Kullanarak Türkçe El yazısı Tanıma

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik

Ankara Üniversitesi Spor Bilimleri Fakültesi

EK 4. DESTEKLENEN BİLİMSEL TOPLANTILAR

Üç Fazlı Sincap Kafesli bir Asenkron Motorun Matlab/Simulink Ortamında Dolaylı Vektör Kontrol Benzetimi

YD 101 İngilizce-I (A1) 4+0 English-I (A1) 4 YD 107 Almanca-I (A-1) 4+0 German-I (A-1) 4 I. Yarıyıl Toplam Kredi 17 I. Yarıyıl Toplam AKTS 30

ÖZGEÇMİŞ. Derece Üniversite Alanı Yılı. Lisans Uroumieh Üniversitesi İnşaat Mühenlisliği

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Üst Düzey Programlama

MAKİNE ÖĞRENMESİ YARDIMIYLA OPTİK KARAKTER TANIMA SİSTEMİ OPTICAL CHARACTER RECOGNITION SYSTEM VIA MACHINE LEARNING

Derece Alan Üniversite Yıl Lisans İletişim T.C. Galatasaray Üniversitesi Sanat ve Tasarım Fakültesi, İletişim Sanatları Bölümü

YÜKSEK LİSANS TEZİ. Umut SULUBACAK. Bilgisayar Mühendisliği Anabilim Dalı. Bilgisayar Mühendisliği Programı




5.3 Elektronik kaynaklar Elektronik sözlükler. (a) elektronik sözlükler, (b) metin bütünceleri.

ÖZGEÇMİŞ VE ESERLER LİSTESİ

Transkript:

Türkçe nin Bağlılık Ayrıştırması Gülşen Cebiroğlu Eryiğit

Bağlılık Ayrıştırması Doğal Dil İşleme ve Bölümleri Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 2/45

Bağlılık Ayrıştırması Sözcükler arasındaki ikili bağlılık ilişkilerinin ayrıştırma başarımındaki önemli etkisinin anlaşılması, Bağlılık Ayrıştırması yönteminin, tümce içi sözcük dizilişleri serbest diller üzerindeki yetenekleri, Üst düzey uygulamalar için anlamlı bilgi üretmesi, bu yöntemin son yıllarda sıkça kullanılır hale gelmesini sağlamıştır. Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 3/45

Bağlılık Ayrıştırması Güncel bağlılık grameri kuramının, Tesnière'in 1959'daki çalışmasına dayandığı söylenebilir. Tesnière'e göre ``Tümce, kendisini oluşturan öğeleri sözcükler olan düzenli bir topluluktur' ``Zihin, tümceyi oluşturan sözcükler ve komşuları arasında ilişkileri bulur ve bu ilişkilerin bütünü tümcenin iskeletini oluşturur. Her bir ilişki bir alt terimi bir üst terime bağlamaktadır.'' Günümüzde DDA alanında kullanılan bağlılık gramerlerinde bu ilişki uydu (alt terim) - iye (üst terim) ilişkisi olarak tanımlanmaktadır. Bağlılık grameri tabanlı metin ayrıştırmasının amacı metin içerisinde geçen her tümce için tümceyi oluşturan sözcükler arasındaki uydu-iye ilişkilerini bulmaktır. Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 4/45

Bağlılık Ayrıştırması Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 5/45

Bağlılık Ayrıştırması Uydu İye Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 6/45

Türkçe Tümce içi öğe dizilişleri serbest Genelde ÖNY veya NÖY kalıpları Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 7/45

Türkçe Çok zengin bitişken biçimbirimsel yapı Eklerin sona eklenmesiyle yüzlerce farklı yeni sözcük gidiyorum gidiyorsun gideceğim gideceksin gidebilirim gitmekteyim... Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 8/45

Türkçe Çok zengin bitişken biçimbirimsel yapı Eklerin sona eklenmesiyle yüzlerce farklı yeni sözcük Sözcük çeşitliliğindeki zenginlik Sözcük etiketlerinin durum, kişi, sayı, cinsiyet gibi birçok bilgiyi taşımaları ve bu nedenle çok sayıda etiket oluşması Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 9/45

Türkçe Zengin türetim yapısı Veda laş ma Oku t ul an Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 10/45

Türkçe Çekim Kümeleri sağlamlaştırdığımızdaki Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 11/45

Türkçe - Çekim Kümeleri sağlamlaştırdığımızdaki Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 12/45

Türkçe - Çekim Kümeleri sağlamlaştırdığımızdaki Çekim Kümesi Türetim Sınırı Sözcük başına ortalama 1.26 ÇK Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 13/45

Türkçe Çoğunlukla sağa bağımlı türde bağlılıklar Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 14/45.

Türkçe Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 15/45

Türkçe - Bağlılık Yapısı Bağlılıklar ÇK ler arasında kurulur küçük odadayım İsim + 3.tekil kişi eki + İyelik eki Eylem yok + + ismin şimdiki de zaman hali eki + 1. tekil kişi eki Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 16/45

Türkçe - Bağlılık Yapısı Bağlılıklar ÇK ler arasında kurulur Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 17/45

Türkçe Ağaç Yapılı Derlem ODTÜ-Sabancı Türkçe Ağaç Yapılı Derlem 5635 tümce yetkin biçimbirimsel etiketler etiketli bağlılıklar bağlılıkların %95 i sağa bağımlı bağlılıklar XML biçiminde ÇK ler arası bağlılıklar Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 18/45

Derlem Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 19/45

Derlem Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 20/45

Derlem Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 21/45

Derlem Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 22/45

Sınıflandırıcı Tabanlı Ayrıştırıcı Bağlılık grafiğini oluşturmak için kullanılan gerekirci bir ayrıştırma algoritması, (Kudo ve Matsumoto, 2002; Yamada ve Matsumoto, 2003; Nivre,2003 ) Ayrıştırıcının bir sonraki hareketini belirlemek üzere kullanılan geçmişe dayalı ayrıştırma modeli (Black ve diğ., 1992; Magerman, 1995; Collins, 1999) Geçmişte olan olayları ayrıştırıcının hareketleri ile ilişkilendirmek üzere kullanılan ayırdedici sınıflandırıcı (Veenstra ve Daelemans, 2000; Kudo ve Matsumoto,2002; Nivre ve diğ., 2004) (KDM: karar destek makineleri) Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 23/45

Geçmişe dayalı özellik modeli Hedef birimler ve bunlarla ilişkili birimler için özellik vektöründe kullanılabilecek özellikler: Görünüm bilgisi (tümü veya gövdesi) Sözcük sınıfı (ana sınıf veyaalt sınıf) Biçimbirimsel özellikler Bağlılık türü(eğer bağlanmışsa) Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 24/45

Tasarım Modelleri Birim Seçim Modelleri Sözcük Tabanlı Model ÇK Tabanlı Model ÇK Tabanlı Belirlenimci Model Biçimbirimsel Özelliklerin Kullanımı ile ilgili Modeller ÇK tabanlı (INF birleşik) model ÇK tabanlı (INF parçalı) model Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 25/45

Birim Seçim Modelleri Sözcük Tabanlı Model Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 26/45

Birim Seçim Modelleri Sözcük Tabanlı Model +Noun +P2pl +Loc +Verb (Eryiğit and Oflazer (2006) e benzer şekilde) Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 27/45

Birim Seçim Modelleri Sözcük Tabanlı Model +Noun +P2pl +Loc +Verb Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 28/45

Birim Seçim Modelleri Sözcük Tabanlı Model araba LEX +Noun +P2pl +Loc POS +Verb Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 29/45

Birim Seçim Modelleri ÇK Tabanlı Model Ayrıştırma Birimi : ÇK ler Sözcük İçi bağlılıklar, gerçek bağlılıklar gibi KDM tarafından belirlenirler. Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 30/45

Birim Seçim Modelleri ÇK Tabanlı Model Ayrıştırma Birimi : ÇK ler Sözcük İçi bağlılıklar, gerçek bağlılıklar gibi KDM tarafından belirlenirler. ÇK Tabanlı Belirlenimci Model Sözcük İçi bağlılıklar, KDM ye başvurulmadan belirlenimci bir şekilde işlenirler. Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 31/45

Birim Seçim Modelleri Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 32/45

Biçimbirimsel Özelliklerin Kullanımı ÇK tabanlı (INF birleşik) model Biçimbirimsel özellikler üzerinde indirgeme yok Tüm biçimbirimsel özellikler kullanımda Ana sözcük sınıfına ek olarak ve Özellik modelinde ayrı bir özellik olarak Noun +A3sg+P2pl+Loc POS INF Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 33/45

Biçimbirimsel Özelliklerin Kullanımı ÇK tabanlı (INF birleşik) +A3sg+P2pl+Loc ÇK tabanlı (INF parçalı): her bir parçacık ayrı bir özellik olarak kullanılır. +A3sg +P2pl +Loc Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 34/45

Sınıflandırıcı Tabanlı Ayrıştırıcı Deney Sonuçları Tüm Derlem Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 35/45

Özellik Kalıbı En yüksek başarımların elde edildiği özellik kalıbı: Uydunun Uydunun en sol Aday uydu Aday İye Yığın 1 sağındaki uydusu birim Kuyruk1 Uydunun en sağ uydusu İyenin en sol uydusu Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 36/45

Ayrıştırıcı Başarımları Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 37/45 SB TB

CoNLL-X Ortak Çalışması CoNLL-X (Conference on Natural Language Learning) Shared Task on Multi-lingual Dependency Parsing, Haziran 2006, New York 17 araştırma grubu 14 farklı dil Arapça, Çince, Çekçe, Danca, Macarca, Felemenkçe, Almanca, Japonca, Portekizce, Slovakça, İspanyolca, İsveççe, Türkçe, Bulgarca CoNLL-X veri biçimi, derlem dönüşümleri Başarım ölçütü ÇKB E Türkçe için en yüksek başarım Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 38/45

CoNLL-X Ortak Çalışması Türkçe derlem, ortak çalışmanın en zor derlemi olarak gösterilmiştir. (Buchholz ve Marsi, 2006) Sekiz farklı türden metin, 25 farklı bağlılık türü Sınama verisinde yeni sözcük görülme oranı en yüksek dil Başarımlar %37.8 - %65.7 arasında Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 39/45

CoNLL-X Ortak Çalışması Türkçe Bölümü Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 40/45

Sonuçlar Türkçe nin bağlılık ayrıştırması konusunda literatürdeki en yüksek sonuçlar elde edilmiştir. Ayrıştırmada ana birim olarak sözcükler yerine ÇK lerin kullanılmasının başarımı arttırdığı, Biçimbirimsel özelliklerin kullanılmasının Türkçe nin ayrıştırmasında vazgeçilemez bir yere sahip olduğu gösterilmiştir. Görünüm bilgisi özelliklerini kullanmanın, Türkçe'nin bağlılık ayrıştırması başarımında önemli artışa neden olduğu gösterilmiştir. Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 41/45

Araçlar Türkçe Derlem, Kemal Oflazer, Bilge Say, Nart Atalay Biçimbirimsel Çözümleyici, Kemal Oflazer Sözcük Etiketleyici, Deniz Yüret Maltparser sınıflandırıcı tabanlı ayrıştırıcı platformu, Joakim Nivre ve ekibi LibSVM, C.W. Hsu, C.C. Chang, C.J. Lin Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 42/45

Referanslar Nivre, J., Hall, J., Nilsson, J., Chanev, A., Eryiğit, G., Kübler, S., Marinov, S., and Marsi, E., 2007. MaltParser: A Language- Independent System for Data-Driven Dependency Parsing, Natural Language Engineering Journal 13(1), 1-41 Cambridge Press. Eryiğit, G., and Oflazer, K., 2006. Statistical dependency parsing of Turkish. In Proceedings of the 11th Conference of the European Chapter of the Association for Computational Linguistics, Trento, Italy, April. Nivre, J., Hall, J., Nilsson, J., Eryiğit, G. and Marinov, S., 2006. Labeled Pseudo-Projective Dependency Parsing with Support Vector Machines. Proceedings of the Tenth Conference on Computational Natural Language Learning, New York, USA, June. Eryiğit, G., Adalı, E. and Oflazer, K., 2006. Türkçe Cümlelerin Kural Tabanlı Bağlılık Analizi. In Proceedings of the 15th Turkish Symposium on Artificial Intelligence and Neural Networks, Muğla, Turkey, June. Eryiğit, G., Nivre, J. and Oflazer, K., 2006. The incremental use of morphological information and lexicalization in data-driven dependency parsing, Proceedings of the 21st International Conference on the Computer Processing of Oriental Languages, Sentosa, Singapore, December. Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 43/45