Gramer Geliştirilmesi



Benzer belgeler
Türkçe ve Doğal Dil İşleme Turkish Natural Language Processing. Özet. Kemal Oflazer Carnegie Mellon Üniversitesi - Katar Doha, Katar ko@cs.cmu.

Türkçe nin Bağlılık Ayrıştırması. Gülşen Cebiroğlu Eryiğit

Dağıtık Sistemler CS5001

3. Snf Sözdizim Sunumu

Sözdizimsel Analiz (Syntactic Analysis)

TÜRKÇE BİÇİM KISA ÖZET.

» Ben işlerimi zamanında yaparım. cümlesinde yapmak sözcüğü, bir yargı taşıdığı için yüklemdir.

BAĞLAÇ. Eş görevli sözcük ve sözcük gruplarını, anlamca ilgili cümleleri birbirine bağlayan sözcüklere "bağlaç" denir.

BİÇİMBİRİM AÇIMLAMA VE BELİRGİNLEŞTİRME. Ümit MERSİNLİ, Mustafa AKSAN Mersin Üniversitesi

Koşullu Rastgele Alanlar ile Türkçe Haber Metinlerinin Etiketlenmesi (Labelling Turkish News Stories with Conditional Random Fields)

BASICS OF ENGLISH SENTENCE STRUCTURE

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması

Türkçe Eğitimi Anabilim Dalı- Tezli Ortak Yüksek Lisans Programı Ders İçerikleri

H. Cem Bozşahin. 1. Giriş

Algoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması. Mustafa Kemal Üniversitesi

TÜRKLER İÇİN TÜRKÇE DİLBİLGİSİ

Uygur Tümcesinin Bilgisayar ile Çözümlenmesi

CÜMLE ÇEŞİTLERİ. Buna yükleminin türüne göre de denebilir. Çünkü cümleyi yüklemine göre incelerken yüklemi oluşturan sözcüklerin türüne bakılır.

Dilbilgisi ve Diller

TÜRKİYE TÜRKÇESİNDE TARİH İFADE ETMEK İÇİN KULLANILAN YAPILARIN SÖZ DİZİMİ BAKIMINDAN İNCELENMESİ *

6.12 Örnekler PROBLEMLER

BÖLÜM 1: MADDESEL NOKTANIN KİNEMATİĞİ

ÜRETİMDE SONLU KAPASİTE ÇİZELGELEME VE YAZILIMIN ÖNEMİ! Üretim ve Planlama Direktörü

KKTC de ilkokulda zihin engelli öğrencilere okuma öğretiminde uygulanan yöntem cümle çözümleme yöntemidir. Bu yöntem Türkiye deki Eğitim Uygulama

TÜRKÇE ULUSAL DİL DERLEMİ PROJESİ BİÇİMBİRİM ÇALIŞMALARINDA BELİRSİZLİKLERİN SINIFLANDIRILMASI VE DAĞILIMI

Türkçe Eğitimi Anabilim Dalı- Tezli Yüksek Lisans Programı Ders İçerikleri


5.3 Elektronik kaynaklar Elektronik sözlükler. (a) elektronik sözlükler, (b) metin bütünceleri.

TÜRKÇENİN BİÇİMBİRİM VE SÖZCÜK TÜRÜ İŞARETLEMESİ 1. Ümit MERSİNLİ ve Mustafa AKSAN Mersin Üniversitesi

VT Sistem Gerçeklemesi. Ders Notları- #8

Ders Adı : TÜRK DİLİ II: CÜMLE VE METİN BİLGİSİ Ders No : Teorik : 2 Pratik : 0 Kredi : 2 ECTS : 3. Ders Bilgileri.

Uygulamalı Yapay Zeka. Dr. Uğur YÜZGEÇ Ders 2: Prolog Giriş

Türkçe Söylem İşaretleme Çalışması: ODTÜ-MEDİD. Deniz Zeyrek. Orta Doğu Teknik Üniversitesi

FİİLİMSİLER. a)isim FİİL(MASTARLAR):Fiillere getirilen (MA y IŞ MAK) ekleriyle türetilen sözcüklere isim fiil denir.

Yetkin Bul ve Değiştir

Lisans Türk Dili ve Edebiyatı Selçuk Üniversitesi Y. Lisans Türk Dili ve Edebiyatı Cumhuriyet Üniversitesi

Anlambilim ve Edimbilim. Giriş Konuları

LC Sınıflama Sistemi. Doç. Dr. Özlem (Gökkurt) Bayram

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

Türkçe nin olasılık tabanlı bağlılık ayrıştırması

BİL 542 Paralel Hesaplama. Dersi Projesi. MPJ Express Java Paralel Programlama

Mantıksal Operatörlerin Semantiği (Anlambilimi)

VERİTABANI Veritabanı Normalizasyonu

sayıların kümesi N 1 = { 2i-1: i N } ve tüm çift doğal sayıların kümesi N 2 = { 2i: i N } şeklinde gösterilebilecektir. Hiç elemanı olmayan kümeye

Bu durumu, konum bazında bileşenlerini, yani dalga fonksiyonunu, vererek tanımlıyoruz : ) 1. (ikx x2. (d)

NESNE YÖNELİMLİ PROGRAMLAMA HAFTA # 6. Yrd.Doç.Dr.Hacer Karacan

Küme temel olarak belli nesnelerin ya da elamanların bir araya gelmesi ile oluşur

Ara Katman Yazılımları İçin İşlemci Değer Birimi Lisanslaması

İSTANBUL TEKNİK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ TÜRKÇE İÇİN BİÇİMBİRİMSEL BELİRSİZLİK GİDERİCİ. YÜKSEK LİSANS TEZİ Müh. Z.

ELN1001 BİLGİSAYAR PROGRAMLAMA I

TÜRKÇE METİNLERDEKİ YAZIM YANLIŞLARINA YÖNELİK OTOMATİK DÜZELTME MODELİ

CAEeda TM ONERA M6 KANADI NAVIER-STOKES ÇÖZÜMAĞI OLUŞTURMA VE ÖNİŞLEM. EDA Tasarım Analiz Mühendislik

CÜMLENİN ÖGELERİ YÜKLEM / ÖZNE

Veritabanı Tasarımı Ve Yönetimi. Varlık-İlişki Modeli

NESNEYE YÖNELİK PROGRAMLAMA. Yrd.Doç.Dr. Zeynep ORMAN

Max - Min Heap Tree (Max ve Min Yığıt Ağaçları) Veri Yapıları ve Algoritmalar 2 - Mustafa EGE Ders Notları

BIP116-H14-1 BTP104-H014-1

Aşağıdaki şemaya dikkat edin. Sorgulamalarımızı genellikle bu şemaya göre yapacağız.

VEKTÖR UZAYLARI 1.GİRİŞ

İÇİNDEKİLER. Çeviri Ekibi /5 Çeviri Önsözü / 6 Şekiller Listesi / 8 Tablolar listesi / 9 Ayrıntılı İçerik / 10

Algoritmalar. Arama Problemi ve Analizi. Bahar 2016 Doç. Dr. Suat Özdemir 1

Doç. Dr. Bilge DORAN

Ulusal Yeterlilikler Çerçevesine Dayalı AKTS Uygulamaları. Prof. Dr. Oğuz ESEN

Pardus Temel Seviye Kullanıcı Eğitimi. Sürüm Ağustos 2012 Pardus K Fatih Akıllı Tahta sürümüne göre hazırlanmıştır.

PROGRAMLAMAYA GİRİŞ. Öğr. Gör. Ayhan KOÇ. Kaynak: Algoritma Geliştirme ve Programlamaya Giriş, Dr. Fahri VATANSEVER, Seçkin Yay.

GRAFİKLER WORD PROGRAMINDA GRAFİK OLUŞTURMA DERS KİTABI. HAZIRLAYAN Mehmet KUZU

Bilgiyi Keşfedin! Özelleştirme, Eklenti ve Veri Entegrasyonu Kurumsal Seviyede Yönetim ve Performans

İDV ÖZEL BİLKENT ORTAOKULU SINIFLARINA KONTENJAN DAHİLİNDE ÖĞRENCİ ALINACAKTIR.

Ders 8: Konikler - Doğrularla kesişim

PERFORMANS YÖNETĐMĐ. Hedefe Odaklı Çalışma ve Yetkinlik Yönetimi.

DOSYA ORGANİZASYONU. Çarpışma çözümleme yöntemleri ÖZLEM AYDIN TRAKYA ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Algoritma ve Akış Diyagramları

Türkçenin Biçimdizimsel İşlemlenmesinde Yapısal Hazırlama

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;

Bir işaretli büyüklük sayısında en soldaki basamak bir işaret içerir. Diğer basamaklarda ise sayısal değerin büyüklüğü (mutlak değeri) gösterilir.

Özetçe. Abstract. 1. Giriş

VERİ TABANI YÖNETİM SİSTEMLERİ Melih BÖLÜKBAŞI

Uygurca ile Türkçe Birleşik Sözcüklerin Karşılaştırılması

TÜRKÇEDE ÜÇÜNCÜ GRUP (ARA) EKLER

Sınıf Diyagramları Amaç: Sınıf Diyagramları Nasıl Çizilir?

CJ MTP11 AYRINTILAR. 5. Sınıf Türkçe. Konu Tarama Adı. 01 Sözcük ve Söz Gruplarında Anlam - I. 02 Sözcük ve Söz Gruplarında Anlam - II

Ders Notlarının Creative Commons lisansı Feza BUZLUCA ya aittir. Lisans:

1. Medisoft ile ETS arasındaki bütünle ik yapı : hatasız ve hızlı ETS hastane otomasyonu için neden çok önemlidir :

BM202 AYRIK İŞLEMSEL YAPILAR. Yrd. Doç. Dr. Mehmet ŞİMŞEK

1.Yazılım Geliştirme Metotları 1

Ölçme Yöntemleri 1) Dilbilgisi ve dil bilimin temel kavramlarını tanır. 1,2 1,2

T I M U R K A R A Ç AY - H AY D A R E Ş C A L C U L U S S E Ç K I N YAY I N C I L I K A N K A R A

Fiiller nesne alıp almamalarına göre değişik şekillerde adlandırılır. Bunları dört grupta inceleyebiliriz.

EĞİTİM-ÖĞRETİM YILI 6. SINIF TÜRKÇE DERSİ DESTEKLEME VE YETİŞTİRME KURSU KAZANIMLARI VE TESTLERİ

BTP203 VERİTABANI YÖNETİM SİSTEMLERİ

KULLANILABİLİRLİK TESTLERİ VE UYGULAMALARI

Arş.Gör.Muhammet Çağrı Gencer Bilgisayar Mühendisliği KTO Karatay Üniversitesi 2015

1 ÇALIŞMANIN NASIL SUNULACAĞINI İŞARETLEYİNİZ

DANIŞMAN ÖĞRETMEN İlknur ÖZDEMİR ÖZEL EGE LİSESİ İLKÖĞRETİM OKULU 5/C SINIFI BİLGİSAYAR YILLIK PROJESİ

Öykü AKINGÜÇ

MATEMATİĞİ SEVİYORUM OKUL ÖNCESİNDE MATEMATİK

abstract Sınıflar 1 Sınıf sınıf1 new class Ama aşağıdaki şekilde referans alınabilir;

Adlar ADLAR (İSİMLER) Bütün sözcük türleri,iki gruba ayrılarak değerlendirilir. A)Ad Soylu Sözcükler: 1)Ad (İsim) 2)Sıfat (Önad) 3)Zamir (Adıl)

Uygurca ile Türkçe Birleşik Sözcüklerin Karşılaştırılması

Transkript:

Altsözcüksel Birimlerle Türkçe için Sözcüksel İşlevsel Gramer Geliştirilmesi Özlem Çetinoğlu ve Kemal Oflazer Mühendislik ve Doğa Bilimleri Fakültesi Sabancı Üniversitesi İstanbul, 34956, Türkiye ozlemc@su.sabanciuniv.edu, oflazer@sabanciuniv.edu Özetçe. Bu bildiri Türkçe nin karmaşık biçimbilimsel yapısı ve zengin türetme olaylarını ele alırken bir çözüm olarak altsözcüksel birimler kullanmayı incelemekte ve önerilen yaklaşımı Pargram projesi dahilinde gerçeklenmekte olan Türkçe Sözcüksel İşlevsel Gramer üzerinden anlatmaktadır. İzlediğimiz yaklaşım sayesinde kurallar daha düzenli ve özlü bir şekilde yazılabilmekte, böylece hem genelleme imkanı arttığı için daha az sayıda olan hem de içerik olarak karmaşık olmayan kuralarla gramer kapsamı genişletilebilmektedir. Üstelik türetmelerin sözcüklere anlambilimsel katkıları programın çalışması sırasında yaratılan PRED değerleri sayesinde sistematik bir biçimde ifade edilebilmektedir. Çalışmamız altsözcüksel birimlerin basit yapım ekleri ile kullanımına yer vermekte daha sonra ettirgen yapılar gibi görece daha karmaşık dil olaylarına değinmektedir. Öncelikli amacımız kullandığımız yaklaşımı mümkün olduğunca birbirinden farklı dilbilimsel alanlarda incelemek olduğu için bu bildiride sayısal bir değerlendirmeye yer verilmemiştir. 1 Giriş Bu bildiride Pargram projesi 1 dahilinde gerçekleştirilen, Türkçe için geniş kapsamlı Sözcüksel İşlevsel Gramer (Lexical Functional Grammar - LFG) projesinin ana hatlarını sunmayı amaçlıyoruz. Türkçe nin karmaşık biçimbilimsel yapısı ile sözdizimsel yapısını birleştirebilmek, özellikle de yapım ekleriyle değişen anlambilimsel gösterimleri doğru ve etkin bir biçimde gösterebilmek için çekimli gruplar kullanıyoruz. Çekimli gruplar, kısaca ÇG, ˆDB yani türetme sınırı ile birbirinden ayrılan ve sadece çekimsel özniteliklerden oluşan biçimbirimsel alt-gösterimler olarak tanımlanır. Genel olarak bir ÇG bir biçimbirimden büyük, ama bir sözcükten de küçüktür (sözcüğün hiç yapım eki almadığı ve ÇG nin sözcüğün tamamına denk geldiği durum hariç). Sözcükler arasındaki sözdizimsel ilişkileri belirleyen de aslen ÇG ler olmaktadır. Eğer Türkçe için kural yazımında en küçük birim olarak sözcükleri temel alan bir gramer yazılırsa, özellikle türetilmiş sözcüklerde iç içe yapılardaki bilgiye ulaşmayı gerektireceği için gramer yazarının işini zorlaştıracaktır. Diğer yandan, temel birim olarak biçimbirimler alınırsa, bu sefer de çekim eklerini de kurallar içine almak gerekeceği için gramerin gereksiz yere şişmesi söz konusudur. ÇG lerin kullanımı ise bütün sözcüklerin standart bir gösterime sahip olmasını ve karmaşık sözcük yapılarında sözcüğe daha kolay ulaşmayı sağlar. ÇG lerin sözcüklerde türetme süreçlerini belirlemesi yapım ekleriyle karşılaşıldığında bunu anlambilimsel gösterime yansıtacak bir mekanizma ihtiyacı doğurur. İngilizce 1 http://www2.parc.com/istl/groups/nltt/ pargram/ 207

için geliştirilen sözcüksel işlevsel gramerde türemiş sözcükler, örneğin happy (mutlu) ve happiness (mutluluk) sözlüğün bir parçasıdır. Öte yandan easy (kolay) ve easier (daha kolay) gibi sıfatların sözcüksel gösterimleri arasındaki ilişki beautiful (güzel) ve more beautiful (daha güzel) sıfatları arasındaki ilişki ile aynı olduğu için easier sözcüğü her ne kadar türemiş bir sözcük olsa da Örnek 1 de verilen işlevsel yapı gösterimi more beautiful işlevsel yapısına paraleldir. (1) PRED easy ADJUNCT PRED more DEG-DIM DEGREE pos comparative Türetmelerin sözlükte gösterimi, görece daha az türetme özelliklerine sahip dillerde uygulanabilir olsa da Türkçe gibi eklemeli dillerde bütün türemiş formların sözlükbirim olarak gramer sözlüğüne girilmesi kesinlikle olası değildir. Dolayısıyla yapım ekleriyle oluşturulmuş sözcüklerin hem anlambilimsel gösterim açısından belli kurallar ile gösterilmesi hem de bu sürecin algoritmik bir yapıya oturtulması gerekmektedir. Sözcüksel İşlevsel Gramer de [1], sözdizimi iki düzeyde temsil edilmektedir: bileşen yapısı bağlamdan bağımsız öbek yapısı ağacı şeklindedir, işlevsel yapı ise öznitelikdeğer çiftlerinin oluşturduğu bir küme olarak tanımlanabilir. Öznitelikler zaman, kişi gibi özellikler olabileceği gibi, özne, nesne gibi işlevler de olabilirler. Bir özniteliğin değeri bir başka öznitelik olabilir, yani iç içe karmaşık yapılar mümkündür. Bileşen yapısında sözdizimsel gösterim işlevsel yapıda ise anlambilimsel gösterim ön plana çıkar bu yüzden bir öbeğin bileşen yapıları her dil için farklılık gösterirken işlevsel yapılarının birbirine benzemesi beklenir. Bildirinin geri kalanı şu şekilde düzenlenmiştir: Bölüm 2, Türkçe için daha önce yapılmış gramer çalışmalarından ve bildiride bahsedilen çalışmanın benzerlerinden söz etmektedir. Bölüm 3, ÇG leri kullanmamızın sebeplerini belirtirken Bölüm 4 bu yapıtaşlarının LFG içindeki kullanımını örneklerle açıklamaktadır. Bölüm 5 sistemimizin genel mimarisini ve şu anki durumunu açıklamakta, Bölüm 6 ise sonuçları vermektedir. 2 İlgili Çalışmalar Güngördü ve Oflazer [2] Türkçe için LFG kuramını kullanan oldukça geniş kapsamlı bir gramer çalışması yapmışlardır. Ancak bu çalışma LFG nin temellerinden birleşme kavramı yerine sözde birleşme kavramı ile gerçeklenmiştir. Daha önemlisi, sözcüklerin gösteriminde daha standart bir yol izlenmiş ve türemiş olsun olmasın her sözcük bir bütün olarak ele alınmış, bu da özellikle birden çok türetme uygulanan sözcüklerde ilgili bilginin iç içe geçmiş yapılarda tutulması sonucu bağımlılık ilişkilerini kurmak için yazılan kuralların karmaşık ve hantal olmasına yol açmıştır. Türkçe için sözcüklerden daha küçük bir birim kullanılarak gramer geliştirilmesi ile ilgili Bozşahin in bir çalışması [3] bulunmaktadır. Bu çalışma prototip bir uygulamada çeşitli dilbilim olaylarını temel birim olarak biçimbirim kullanarak Birleşenli Ulamsal Gramer (Combinatory Categorial Grammar - CCG) çatısında gerçeklemiştir. Sistem, biçimdizimlerin işlenmesini de tümce için geliştirilen gramer seviyesinde yapmakta, dilin iki seviyesini tek bir düzlemde çözümlemektedir. Oflazer in [4] geliştirdiği bağımlılık grameri ise ÇG leri bağımlılık ilişkilerinin kurulduğu yapıtaşları olarak kullanmıştır. Çakıcı [5] ise Türkçe ağaç yapılı derlemdeki ÇG lere dayanan ilişki gösterimlerini temel alarak CCG gramer için otomatik bir şekilde sözlük üreten bir çalışma yapmıştır. 208

Bizim bu bildiride kullandığımız yönteme benzer şekilde Butt ve King [6] de Urdu dilindeki biçimbirimsel ettirgen yapılar için biçimbirimi de kurallar seviyesine çıkaran bir yöntem seçmişlerdir. Bizim yöntemimizden farklı olarak söz konusu olan bir biçimbirim öbeği değil, tek bir biçimbirimdir. Ayrıca ortaya çıkan ağaç yapısı ve anlambilimsel gösterim de bizim yaklaşımımızla farklılıklar göstermektedir. 3 Alt Birim Olarak Çekimli Gruplar Türkçe, bir dizi yapım ve çekim ekinin kökün ardından belli bir sıraya uyarak eklendiği sondan eklemeli bir dildir [7]. Sözdizim seviyesinde ise her ne kadar genel sıralama özne-nesne-yüklem şeklinde ise de tüm ögeler tümce içinde farklı yerlerde olabilirler. Türkçe nin biçimdizimi ise oldukça karmaşıktır. Bir sözcük birden çok türetme içerebilir ve isim ya da fiil kökünden türetilebilecek sözcük sayısı kuramsal olarak sonsuzdur. Tipik bir Türkçe metinde ortalama biçimbirim sayısı kök de dahil edilirse 3-4 iken sözcük başına ortalama 1.23 türetme düşmektedir. İlgeç, belirteç gibi ek almayan sözcükler çıkartıldığında ise bu rakam 2 ye yaklaşmaktadır. Bir sözcüğün biçimbirimsel çözümlemesi her biçimbirime karşılık bir etiket gelecek şekilde oluşturulmuş dizilerle ifade edilebilir. Biçimbirimsel çözümleyicimizde ˆDB etiketi bizim çekimli grupları belirlemekte kullandığımız türetme sınırlarını göstermektedir. Eğer Türkçe deki biçimbirimsel bilgiyi kök+çg DB+ÇG DB+ DB+ÇG şeklinde gösterirsek, her ÇG bir çekim ekinin etiketlerinden oluşan bir diziye karşılık gelmektedir. Örneğin aşağıda belirtilen biçimbirimsel çözümleyici çıktısına sahip gerçekleştirilebilir sözcüğü için altı ÇG bulunmaktadır. Bu ÇG ler aşağıdaki şekildedir: gerçek+adjˆdb+verb+becomeˆdb+verb+causˆdb+verb+pass+pos symbol94db+verb+able+aorˆdb+adj+zero 1.+Adj 2.+Verb+Become 3.+Verb+Caus 4.+Verb+Pass+Pos 5.+Verb+Able+Aor 6.+Adj+Zero Sözcüklerin ÇG ler ile tanımlanması sözdizimsel ilişkilerin doğru bir şekilde gösterimini oldukça kolaylaştırmıştır. Bağımlı sözcükten baş sözcüğe doğru olan işlevsel bağımlılık aslında bağımlı sözcüğün son ÇG sinden baş sözcüğün bir ÇG sine bir bağlantıdır. Eski kitaplarımdaki hikayeler isim öbeğini bir örnek olarak verirsek, bu öbeğin işlevsel bağımlılıkları Şekil 1 deki gibi gösterilebilir. Şekil. 1. Eski kitaplarımdaki hikayeler isim öbeğinin işlevsel bağımlılıkları 209

Küçük dikdörtgenler ÇG leri, noktalı dikdörtgen ise sözcük sınırını göstermektedir. Görüldüğü gibi, her sözcüğün son ÇG si, kendinden sonra gelen bir sözcüğün ÇG lerinden birine bağlıdır. Aynı isim öbeğinin bileşen yapısı Örnek 2 de, işlevsel yapısı Örnek 3 te gösterilmiştir. Bileşen yapısı gösteriminde her ÇG bir düğüme karşılık gelmektedir, dolayısıyla gramer içindeki kurallar ÇG leri temel alarak yazılmıştır. Eğer bir ÇG kök biçimbirimi içeriyorsa, ağaçta o ÇG ye karşılık gelen düğüm kökün sözdizimsel türü ile adlandırılır. Diğer ÇG ler ise içeriklerinden bağımsız olarak DS şeklinde bir düğümle gösterilirler (2) AP NP NP AP NP DS ki NP N hikayeler (3) PRED hikaye ADJUNCT PRED rel kitap ATYPE CASE NOM, NUM PL PRED ADJUNCT kitap CASE loc, NUM pl attributive PRED ATYPE eski attributive A eski N kitaplar mda İşlevsel yapı oluşturulmasında yapım eklerinin anlambilimsel gösterimlerinin büyük rolü vardır. Yüzey gösteriminde bir biçimbirime karşılık gelsin gelmesin hemen hemen tüm yapım ekleri, işlevsel yapı içinde bir nesne () özelliğine sahip olurlar ve bu özellik türetilen sözcüğün asıl kökünü temsil eden işlevsel yapı ile birleşir. Yapım ekinin anlambilimsel gösterimi ise PRED özelliği içinde yer alır ve özelliği ile ilgili bilgi de içerdiği için programın çalışması sırasında oluşturulur. Öte yandan PRED özelliği her ne kadar yapım ekinin anlamsal gösterimini içerse de, bu gösterim oluşturulan sözcüğün gerçek anlamından sapmalar gösterebilir. Bunun sebebi bazı yapım eklerinin birden çok anlama gelmesidir, bu tür yapım ekleri için gerekli olan anlamsal ayrıştırma bizim çalışmamızda göz önüne alınmamıştır. Bileşen yapısındaki her bir düğüm ayrı bir işlevsel yapıya karşılık gelmektedir. Böylece işlevsel bağımlılık ile ilgili kurallar yazılırken sadece ÇG lere ulaşmak yeterlidir. Örneğin eski kitaplarımdaki öbeğini çözümlemek için önce eski kitaplarımda öbeğini çözümleyen bir kural kullanılmış ve bir isim öbeği olduğu görülmüş, bir isim öbeğine -ki eki ekleyerek sıfat öbeği elde edilebileceğine dair ikinci kural kullanılmıştır. Alternatif yöntemde sözcüklerin bir bütün olarak işlevsel yapıda temsil edildiğini düşünelim. Böyle bir durumda, sıfatların önlerine sıfat belirteni almaları ancak sıfat isim öbeğinden türediyse mümkündür şeklindeki kural gerçeklenirken türemiş sıfatın kökü bir isim midir şeklinde bir kontrol gereklidir. Kitaplarındaki sözcüğü işlevsel yapıda iki düzeyli temsil edilecek ve içteki düzeyde kitap kökü bulunacaktır dolayısıyla kuralın içteki düzeye ulaşması gerekir. Tek yapım ekine sahip bir sözcükte bu yaklaşım çok sorun çıkarmasa da örneğin elbiselideki sözcüğü gibi birden çok yapım ekine sahip bir sözcük söz konusu olursa elbise kökü içten dördüncü düzeyde bulunacaktır. Bu da farklı yapıda fakat benzer işlevli sözcükler için yazılması gereken kuralların çok daha karmaşık olması anlamına gelir. Üstelik sözcükler bütün olarak ele alındığında kitaplarımdaki sözcüğü bir sıfattır ve eski kitaplarımdaki tamlamasının bileşen yapısını çizmeye çalışırsak iki sıfatı bir araya getirerek bir sıfat tamlaması elde ederiz ki bu asıl anlatmak istediğimiz ilişkiyi yanlış şekilde aktarmak olur. 210

4 Çekimli Grupların Gramerde Kullanımı Çekimli grupları kullanma amacımızı ve bileşen yapısı ve işlevsel yapı oluştururken nasıl kullanıldıklarını bir önceki bölümde açıklamaya çalıştık. Bu bölümde ise bu yaklaşımı kullanarak çeşitli dilbilim olaylarını nasıl gerçeklediğimizi anlatmak istiyoruz. 4.1 İsim-fiiller ve sıfat-fiiller Türkçe de fiilimsiler, fiillerin yapım ekleri alarak isim soylu hale getirilmeleri ile oluşturulur. Fiil aldığı yapım ekine göre isim, sıfat ya da zarf olarak kullanılabilir. Örnek 4 te verilen basit tümce bundan sonraki örneklerin temelini oluşturacaktır. (4) Kız adamı aradı. Örnek 5 te basit tümcenin söyledi fiilinin nesnesi olacak şekilde bir isim-fiil haline dönüştürüldüğünü görüyoruz. Fiilimsiyi oluşturan bütün sözcükler, fiil sonundaki yapım ekine kadar normal bir tümce gibi çözümlenmiştir. Yapım ekinin içinde bulunduğu ÇG ise, hal eki, kişi eki gibi özelliklerin işlevsel yapıya eklenmesini sağlamış, böylece türetilmiş isim öbeği, basit bir isimden oluşan bir isim öbeğinden farksız şekilde ana tümcenin yüklemi olan söyledi fiilinin nesnesi () görevini üstlenebilmiştir (Örnek 6). (5) Manav kızın adamı aradığını söyledi. (6) PRED söyle manav, ara PRED manav CASE nom, NUM sg, PERS 3 PRED ara k z, adam PRED k z CASE gen, NUM sg, PERS 3 PRED adam CASE acc, NUM sg, PERS 3 CHECK PART pastpart CASE acc, NUM sg, PERS 3, VTYPE main CLAUSE-TYPE nom TNS-ASP TENSE past NUM SG, PERS 3, VTYPE MAIN Sıfat-fiiller de bu mekanizmaya benzer şekilde çözümlenmişlerdir. Türkçe de sıfatfiiller, isimleri niteleyen boşluklu tümceler şeklinde yer alırlar. Kaplan ve Zaenen [8] uzun mesafeli bağımlılık ilişkileri için genel bir yaklaşım önermişler, yaptıkları genişletmelerle LFG notasyonunda kısıt kuralları yazılırken sadece basit özellikler değil düzenli ifadeler yazmaya da olanak sağlamışlardır. Böylelikle sonsuz sayıda ayırtımı sonlu bir ifade ile yazmak mümkün olmuştur. Notasyondaki bu kolaylık, boşluğa sahip tümleçlerin boşluklarını dolduran sözcüklerin işlevsel yapıda hangi derinlikte olduğuna bakılmaksızın genel birleştirme kuralları yazılmasını sağlamıştır. Örnek 7 nin de gösterdiği tümcede, fiilimsiyi oluşturan tümce, ara- fiili bir nesne beklemesine rağmen boşluklu bir şekilde incelenmiş ve -dığı eki ile karşılaşılınca tümcenin işlevsel yapısı bir fiilimsiye dönüştürülmüştür. Daha sonra ise işlevsel belirsizlik kuralı uyarınca fiilimsideki boşluk, fiilimsinin nitelediği isim ile birleştirilmiştir. Örnek 8 tüm tümcenin işlevsel yapısını göstermekte ve numaralandırılmış kutular birbiriyle birleştirilen alt işlevsel yapıları işaretlemektedir. 211

(7) Manavın kızın [] aradığını söylediği adam Örnek 7, Örnek 5 tümcesini bir sıfat-fiil olarak içermektedir, dolayısıyla iki tümcenin de işlevsel yapılarına daha yakından bakarsak ne kadar benzediklerini görebiliriz. Örnek 8 deki niteleyici (ADJUNCT) Örnek 6 nın bütün işlevsel yapısıyla neredeyse aynıdır ve TNS-ASP ve ADJUNCT-TYPE özelliklerinde farklılık göstermektedir. Kurallar düzeyinde duruma bakarsak, fiilimsi de tam tümce de aynı çekirdek tümce kuralı ile incelenmekte, daha sonra tümcenin tam bir tümce olup olmadığına sonlu fiil koşulu denetlenerek karar verilmektedir. Bu koşul Örnek 5 te TENSE özelliğinin varlığı ile sağlandığı için çekirdek tümce tam bir tümcedir. Aslında sıfat fiil de -dı ğı ekinin işlevsel yapıya kattığı PART özelliğinin pastpart değeriyle, geçmiş zamana ait bir olayı belirten zaman bilgisi içermektedir. (8) PRED adam PRED söyle manav, ara PRED manav CASE gen, NUM sg, PERS 3 PRED ara k z, adam PRED k z CASE gen, NUM sg, PERS 3 ADJUNCT PRED adam CHECK PART pastpart CASE acc, NUM sg, PERS 3, VTYPE main CLAUSE-TYPE nom CHECK PART pastpart NUM sg, PERS 3, VTYPE main ADJUNCT-TYPE relative CASE NOM, NUM SG, PERS 3 4.2 Ettirgen Fiiller Türkçe fiil biçimdizimi fiiller için birden çok ettirgen çatıyı yapım ekleriyle ifade edebilme olanağı sağlar. Her ne kadar fiillerin alabileceği ettirgen türetmeler kuramsal olarak sınırlı değilse de, pratikte 2-3 türetmeden fazlası kullanılmaz. Bu tür türetmeler de biçimbirimsel çözümleme sırasında türetme sınırlarıyla ayrılan etiket dizileri ile gösterildikleri için ÇG ler kullanılarak kurallar yazılmasına uygundurlar. Örneğin, aradı sözcüğünün biçimbirimsel çözümlemesi(ara+verb+pos+past+a3sg) iken, fiilin ettirgen hali arattı için çözümleme(ara+verbˆdb+verb+caus+pos+past+a3sg) şeklindedir. Örnek 9 basit bir tümceyi ve tümcenin ettirgen halini örneklerken, bu tümcelerin işlevsel yapıları sırasıyla Örnek 10 ve 11 de verilmiştir. Ettirgen hale getirilmiş bir fiili çözümlemek, bir öncekine oranla daha büyük olan ve PRED özelliği özne (), nesne () ve tümleç (XCOMPlement) bekleyen bir işlevsel yapı yaratmak anlamına gelmektedir. İlk tümcenin işlevsel yapısının tamamı ikinci tümcenin tümleci konumundadır. Ettirgen fiilin nesnesi ilk fiili gösteren işlevsel yapının içindeki özne ile birleştirilmiştir. Eğer ilk fiil geçişli ise, bu fiilin nesnesi, ettirgen fiilde ikinci nesne (TH) görevini alır. Örnek tümcelerde açıkça görülemese de önemli olan tümcede nesne ve önceki özneyi doğru hal ekini denetleyerek bulmaktır, çünkü serbest sözcük sırası kuralı gereği tümcedeki öbeklerin görevlerini hal ekleri belirtmektedir. (9) a. Kız adamı aradı. b. Manav kıza adamı arattı. 212

(10) PRED ara k z, adam PRED k z CASE nom NUM sg, PERS 3 PRED adam CASE acc NUM sg, PERS 3 TNS-ASP TENSE past NUM SG, PERS 3,VTYPE MAIN (11) PRED caus manav, k z, adam, ara k z, adam PRED manav PRED k z TH PRED adam XCOMP PRED ara k z, adam VTYPE PRED k z CASE dat, NUM sg, PERS 3 PRED adam CASE acc, NUM sg, PERS 3 main TNS-ASP TENSE past NUM SG, PERS 3,VTYPE MAIN 5 Gramerin Güncel Durumu Türkçe LFG grameri XLE (Xerox Linguistic Environment) [9] kullanılarak gerçeklenmektedir. XLE geniş ölçekli gramerler yazmayı kolaylaştırmak amacıyla geliştirilmiştir ve önçözümleyici, biçimbirimsel çözümleyici, işaretleyici gibi araçların bağımsız bir şekilde geliştirilip bütünleştirilmesine olanak sağlamaktadır. Bizim gramerimizde de biçimbirimsel çözümleme ve bileşik sözcükler için sonlu durumlu değiştiriciler sisteme eklenmiştir. Sonlu durumlu birimler sözcüğün bütün olası biçimbirimsel çözümlemelerini vermekte, anlambilimsel işaretleme ise köklerin yer aldığı sözlük bölümünde yapılmaktadır. Şu ana kadar geliştirilen gramer, serbest sözcük sırasından, uzun mesafeli ilişkilere birçok önemli dil olayını gerçeklemiştir ve özellikle isim öbekleri konusunda oldukça kapsamlı bir alt gramere sahiptir. ÇG lerle türetme yapan kurallar haricindeki diğer kurallar, mesela isim tamlaması kuralı ÇG lerden bağımsızdır. Yani sözcükler ister basit ister türemiş olsun aynı kural içinde ele alınırlar. Yine de Türkçe nin bazı ilginç dil olaylarını ele almada ÇG kullanmak yetersiz kalmaktadır. Örneğin, bağlaç kullanılan eşlemelerde en son sözcük grubunun çekim eklerinin tüm grup üzerinde etkisi vardır. Ertelenmiş ekleme [10] adı verilen bu olayı Örnek 12a ve 12b ile gösterebiliriz. Görüldüğü gibi kadın sözcüğünün sonundaki hal eki aslında adam sözcüğünün de hal ekidir. (12) a. Kız adam ve kadını aradı. b. Kız [adam ve kadın]-ı aradı. Ertelenmiş ekleme, sözcükleri ÇG lerden bölmek şeklindeki yaklaşımla ters düşen bir durumdur çünkü ismin hal eki çekim eki olmasına rağmen, yapım ekleri gibi sözcüğü değil tüm grubu etkilemektedir. 6 Sonuçlar ve İleri Konular Bu bildiri Türkçe için geliştirilmekte olan geniş kapsamlı LFG gramerinin, çekimli gruplar olarak adlandırdığımız altsözcüksel birimleri temel alarak gerçeklenmesini anlatmaktadır. Kurallarda temel birim olarak ÇG lerin alınmasıyla hem anlambilimsel 213

olarak daha doğru bir gösterim söz konusu olmuş hem de Türkçe nin üretken türetme biçimbirimi düzenli bir şekilde sözdizim düzeyine aktarılmıştır Öncelikli hedefimiz halen yazmakta olduğumuz grameri mümkün olduğu kadar genişletmek ve bunu yaparken sözlüğü de gramerin gerektirdiği şekilde etiketlemektir. Şu anda kullandığımız gramer sözlüğü biçimbirimsel çözümleyicinin kullandığı kök sözlüğünün küçük bir alt kümesini içermektedir. Bir sonraki adımda ise, gramer belli bir kapsamın üzerine çıktığında, Türkçe Ağaç Yapılı Derlem den [11] yararlanmak ve [12, 13] çalışmalarında olduğu gibi istatistiki bilgilerle, ulaşılan çözümleri en iyi hale getirmek gibi hedeflerimiz bulunmaktadır. Ek Bilgi: Yapılan çalışma, 105E021 numaralı Türkçe için Geniş Kapsamlı Sözcüksel İşlevsel Gramer Tabanlı Tümce Çözümleyicisi Geliştirilmesi ve Akıllı Kitap Ortamına Entegrasyonu projesi dahilinde TÜBİTAK tarafından desteklenmektedir. Kaynakça 1. Kaplan, R.M., Bresnan, J.: Lexical-functional grammar: A formal system for grammatical representation. In Bresnan, J., ed.: The Mental Representation of Grammatical Relations. MIT Press, Cambridge, MA (1982) 173 281 2. Güngördü, Z., Oflazer, K.: Parsing Turkish using the Lexical Functional Grammar formalism. Machine Translation 10(4) (1995) 515 544 3. Bozşahin, C.: The combinatory morphemic lexicon. Computational Linguistics 28(2) (2002) 145 186 4. Oflazer, K.: Dependency parsing with an extended finite-state approach. Computational Linguistics 29(4) (2003) 515 544 5. Çakıcı, R.: Automatic induction of a CCG grammar for Turkish. In: Proceedings of the ACL Student Research Workshop, Ann Arbor, Michigan, Association for Computational Linguistics (2005) 73 78 6. Butt, M., King, T.H.: Restriction for morphological valency alternations: The Urdu causative. In: Proceedings of The 10th International LFG Conference, Bergen, Norway, CSLI Publications (2005) 7. Oflazer, K.: Two-level description of Turkish morphology. Literary and Linguistic Computing 9(2) (1994) 137 148 8. Kaplan, R.M., Zaenen, A.: Long-distance dependencies, constituent structure, and functional uncertainty. In Baitin, M., Kroch, A., eds.: Alternative Conceptions of Phrase Structure. University of Chicago Press, Chicago (1988) 9. Maxwell III, J.T., Kaplan, R.M.: An efficient parser for LFG. In Butt, M., King, T.H., eds.: The Proceedings of the LFG 96 Conference, Rank Xerox, Grenoble (1996) 10. Kabak, B.: Turkish suspended affixation. Linguistics 45 (2007) (to appear). 11. Oflazer, K., Say, B., Hakkani-Tür, D.Z., Tür, G.: Building a Turkish treebank. In Abeille, A., ed.: Building and Exploiting Syntactically-annotated Corpora. Kluwer Academic Publishers (2003) 12. Frank, A., Sadler, L., van Genabith, J., Way, A.: From treebank resources to LFG f- structures:automatic f-structure annotation of treebank trees and CFGs extracted from treebanks. In Abeille, A., ed.: Treebanks. Kluwer Academic Publishers, Dordrecht (2003) 13. O Donovan, R., Burke, M., Cahill, A., van Genabith, J., Way, A.: Large-scale induction and evaluation of lexical resources from the Penn-II and Penn-III Treebanks. Computational Linguistics 31(3) (2005) 329 365 214