TÜMEVARIMLI MANTIK PROGRAMLAMANIN KELİME ANLAMI BELİRGİNLEŞTİRMEYE UYGULANABİLİRLİĞİNİN İNCELENMESİ



Benzer belgeler
Tümevarımlı Mantık Programlama İle Türkçe İçin Kelime Anlamı Belirginleştirme Uygulaması

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik

YAPAY ZEKA (Artificial Intelligence)

MÜFREDAT DERS LİSTESİ

Kablosuz Sensör Ağlar ve Eniyileme. Tahir Emre KALAYCI. 21 Mart 2008

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

BCA605 Bilgisayar Oyunlarında Yapay Zeka

Türkçe nin Bağlılık Ayrıştırması. Gülşen Cebiroğlu Eryiğit

Türkçe Dokümanlar Ġçin Yazar Tanıma

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

Kelime Gösterimleri (Word Representation Word Embeddings)

Yeşim AKSAN, Selma Ayşe ÖZEL, Yasin BEKTAŞ, Mustafa AKSAN, Umut Ufuk DEMİRHAN, Ümit MERSİNLİ, Hakan YILMAZER. Sunan : Yasin BEKTAŞ.

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven

Veri ve Metin Madenciliği. Zehra

Veri ve Metin Madenciliği

DENİZ HARP OKULU BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 ( yılı öncesinde birinci

1. GİRİŞ Kılavuzun amacı. Bu bölümde;

ÖZGEÇMİŞ. Derece Alan Üniversite Yıl

EĞİTİM-ÖĞRETİM YILI MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ (İNGİLİZCE) BÖLÜMÜ DERS PROGRAMINDA YAPILAN DEĞİŞİKLİKLER

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: END 4907

Araştırma Problemleri: Problem İfadeleri, Araştırma Soruları ve Hipotezler

Web Madenciliği (Web Mining)

BÝLDÝRÝ KÝTABI EJER CONGRESS 2014 EJER CONGRESS 2014 CONFERENCE PROCEEDINGS NISAN 2014 Istanbul Üniversitesi Kongre Merkezi

Uygulamalı Yapay Zeka. Dr. Uğur YÜZGEÇ Ders 2: Prolog Giriş

T.C. TRAKYA ÜNĠVERSĠTESĠ FEN BĠLĠMLERĠ ENSTĠTÜSÜ

Başlıca Ürün-Bilgi Sistemleri

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

Anlam Belirsizliği İçeren Türkçe Sözcüklerin Hesaplamalı Dilbilim Uygulamalarıyla Belirginleştirmesi

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : Unvanı : Doç. Dr. 4. Öğrenim Durumu :

1. YARIYIL / SEMESTER 1

ICATT ÇEVİRİ UYGULAMASI SİSTEM MİMARİSİ VE VERİTABANI TASARIMI

Gevşek Hesaplama (COMPE 474) Ders Detayları

YÖNETİM BİLİŞİM SİSTEMLERİ BÖLÜMÜ YENİ DERS MÜFREDATI (1) FAKÜLTESİ: İŞLETME FAKÜLTESİ / BUSINESS SCHOOL

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

Veritabanı Uygulamaları Tasarımı

Esnek Hesaplamaya Giriş

YZM Biçimsel Diller ve Otomata Teorisi. Ders#06

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

VERİ TABANI YÖNETİM SİSTEMLERİ

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

Ekonometri II (ECON 302T) Ders Detayları

K En Yakın Komşu Methodu (KNearest Neighborhood)

Görev Unvanı Alan Üniversite Yıl Prof. Dr. Elek.-Eln Müh. Çukurova Üniversitesi Eylül 2014

Şifrebilimde Yapay Sinir Ağları

ÖZGEÇMİŞ Doç. Dr. BÜLENT ÖZKAN

VERİ YAPILARI VE PROGRAMLAMA (BTP104)

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CME 4410

BİÇİMSEL YÖNTEMLER (FORMAL METHODS) Betül AKTAŞ Suna AKMELEZ

ve Sonrası Girişli Öğrenciler için Uygulanacak Ders Program

DENİZ HARP OKULU BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

5.3 Elektronik kaynaklar Elektronik sözlükler. (a) elektronik sözlükler, (b) metin bütünceleri.

Bilgisayar Mühendisliği Bölümü Lisans Ders Programı / Computer Engineering Undergraduate Curriculum

HUNGAROLOJİ ANABİLİM DALI EĞİTİM ÖĞRETİM ÖĞRETİM YILI GÜZ PROGRAMI

Örüntü Tanıma (EE 448) Ders Detayları

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme

Evrimsel Çok amaçlı eniyileme. Tahir Emre Kalaycı Ege Üniversitesi Bilgisayar Mühendisliği Bölümü 25 Mart 2010

Zeki Optimizasyon Teknikleri

Yapay Zeka (MECE 441) Ders Detayları

SİSTEM ANALİZİ VE TASARIMI

Güz Dönemi Zorunlu Dersleri

Veritabanı Tasarımı. NOT NULL ve UNIQUE Kısıtlamaları Tanımlama

ANKARA ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ

BİLGİ VE BELGE YÖNETİMİ BÖLÜMÜ LİSANS EĞİTİM BAHAR DÖNEMİ PROGRAMI

GENELLEŞTİRİLMİŞ FUZZY KOMŞULUK SİSTEMİ ÜZERİNE

Kimya Mühendisliğinde Uygulamalı Matematik

ÖZGEÇMİŞ. Unvan Bölüm Üniversite Yıl Yrd. Doç. Dr. Yazılım Mühendisliği Bahçeşehir Üniversitesi 2007

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir.

VERI TABANLARıNDA BILGI KEŞFI

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, Nisan 2009, ODTÜ, Ankara

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Mobil Uygulama Geliştirmeye Giriş (ISE 407) Ders Detayları

Yard. Doç. Dr. İrfan DELİ. Matematik

Wordnet ve Bilgisayar Ağ Terimleri Sözlüğünün Oluşturulması

YÖNEYLEM ARAŞTIRMASI - III

Makine Öğrenmesi (COMPE 565) Ders Detayları

ÖZGEÇMİŞ. 1. Adı Soyadı : Birim BALCI 2. Doğum Tarihi : Unvanı : Yrd. Doç. Dr. 4. Öğrenim Durumu: Derece Alan Üniversite Yıl Lisans

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

Hafta 10 - Vektör Uzay Modelleri

1) Programlama dillerinin temel kavramlarını öğrenir. 1,2,4 1

İnşaat Mühendisliği Bölüm Başkanlığı na

Concept Learning. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ. Yapay Zeka - Kavram Öğrenme

Semantik Web Programlama (COMPE 567) Ders Detayları

ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTUSÜ BİLGİSAYAR MÜHENDİSLİĞİ ANABİLİMDALI. I. GENEL BİLGİLER Ders Adı

Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü. Bilgisayar Mühendisliği

Yaz.Müh.Ders Notları #6 1

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

Akdeniz Üniversitesi

İleri Algoritma (COMPE 574) Ders Detayları

Sistem Modelleme ve Simülasyon (SE 360) Ders Detayları

AVRASYA ÜNİVERSİTESİ

ÜNİT E ÜNİTE GİRİŞ. Algoritma Mantığı. Algoritma Özellikleri PROGRAMLAMA TEMELLERİ ÜNİTE 3 ALGORİTMA

Transkript:

TÜMEVARIMLI MANTIK PROGRAMLAMANIN KELİME ANLAMI BELİRGİNLEŞTİRMEYE UYGULANABİLİRLİĞİNİN İNCELENMESİ Özlem Aydın 1 Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü ozlema@trakya.edu.tr Yılmaz Kılıçaslan 2 Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü yilmazk@trakya.edu.tr ÖZET Bilgisayarlı dilbilimde, kelime anlamı belirginleştirme (Word Sense Disambiguation), bağlamdaki bir kelimenin doğru anlamının belirlenmesi olarak tanımlanır. Doğal dil uygulamaları arasında önemli bir yere sahiptir. Tümevarımlı mantık programlama (Inductive Logic Programming, ILP) ise makine öğrenmesi ve mantık programlama disiplinlerinin kesişim alanını kapsar. Bu sebeple tümevarımlı mantık programlama, makine öğrenmesi ve mantık programlama tekniklerinin her ikisini de kullanır. Tümevarımlı Mantık Programlama ile yapılan çalışmalarda elde edilen deneysel sonuçlar tümevarımlı mantık programlamanın artalan bilgisini (background knowledge) kullanmada başarılı olduğunu göstermiştir. Tümevarımlı mantık programlamanın bu yeteneğinin kelime anlamı belirginleştirme konusunda kullanılması bu alanda önemli bir gelişme sağlayabilir. Bu çalışmada, tümevarımlı mantık programlama konusu incelenmiş ve kelime anlamı belirginleştirmeye uygulanabilirliği Türkçe veriler üzerinden elde edilen deneysel örneklerle gösterilmiştir. Anahtar Kelimeler: Kelime anlamı belirginleştirme, tümevarımlı öğrenme, tümevarımlı mantık programlama, makine öğrenmesi. 1. GİRİŞ Doğal dil işleme çalışmalarında amaca uygun doğru sonuçlar elde etmek oldukça zordur. Çünkü dillerdeki esneklik nedeniyle farklı belirsizlik durumları ile karşılaşılır. Doğal dil işlemede farklı dillerdeki bu belirsizlik durumlarının çözülmesi gerekmektedir. Kelime anlamı belirsizliği bu belirsizlik tiplerinden biridir ve bir kelime çok anlamlı olduğu zaman ortaya çıkar. Bu belirsizlik durumunu bir örnek ile açıklayalım. Elimizde el kelimesinin içinde geçtiği bir tümce bulunsun. İnce uzun parmaklı elleri masanın üstündeydi. El kelimesinin Türk Dil Kurumu Türkçe Sözlük ünden aldığımız en sık kullanılan üç anlamı aşağıdaki gibidir: 1. anlam: Kolun bilekten parmak uçlarına kadar olan, tutmaya ve iş yapmaya yarayan bölümü. 2. anlam: Sahiplik, mülkiyet. 3. anlam: İskambil oyunlarında her bir tur. Görüldüğü gibi el kelimesinin birden fazla anlamı bulunmaktadır. Bu aşamada verilen tümcede 1. anlamı ile kullanıldığı belirlemek için KAB işlemi uygulanması gereklidir. KAB hesaplamalı dilbilimde temel bir problem olarak ele alınmaktadır. Makine çevirisi (machine translation) ve yapay zekâ (artificial intelligence) alanlarına olan bilimsel ilginin artışı ile KAB bir araştırma alanı olarak ortaya çıkmıştır. Bu alandaki ilk çalışmalar 1950 li yıllarda makine çevirisi için gerek duyularak başlamıştır [1][2]. 1960 lı yıllarda ise yapay zekânın doğal dil anlama uygulamalarında kullanılmaya başlamasıyla yeniden bir yükselişe geçmiştir [3][4][5]. 1980 li yıllardan itibaren büyük boyutlardaki sözlüklerin (dictionaries), gömü (thesauri) ve derlem (corpus) gibi sözlük benzeri kaynakların kullanılmasıyla KAB çalışmalarında artış olmuştur [6][7][8]. KAB, birden fazla anlamı olan bir kelimenin bulunduğu bağlamda hangi anlamıyla kullanıldığının belirlenmesi işlemidir. Bu işlem iki temel adıma ayrıştırılabilir [9]: 1. Metinde bulunan ilgili kelimenin tüm farklı anlamlarının belirlenmesi. 2. Uygun anlamın atanması. Son yıllarda yapılan çoğu KAB çalışmaları birinci adım için aşağıda verilen bilgilerle anlamların önceden belirlenmesine dayanır. Günlük sözlüklerde de bulanabilen bir anlam listesi. Bir özellikler, kategoriler veya ilgili kelimeler kümesi (örneğin, bir gömüdeki eşanlamlılar). Bir makine çevirisi uygulaması için KAB işlemi yapılacaksa diğer dillere çevirileri içeren bir çeviri sözlüğündeki bir giriş. İkinci adım kelimelere anlamların atanmasıdır. İki büyük bilgi kaynağı kullanılabilir: belirginleştirilecek

kelimenin bulunduğu bağlam ve harici bilgi kaynakları [9]. KAB birçok alana uygulanmaktadır. Bu uygulama alanlarından bazıları şunlardır: Makine Çevirisi (Machine Translation), Bilgi Geri Getirimi (Information Retrieval), Ses İşleme (Speech Processing), İnsan-Makine Haberleşmesi (Man- Machine Communication), Metin İşleme (Text Processing), İçerik ve Tematik Analiz (Content and Thematic Analysis) ve Gramer Çözümlemesi (Gramatical Analysis). KAB genelde doğal dil işleme uygulamalarında kullanılmasına rağmen son yıllarda Biyoenformatik (Bioinformatics) ve Semantik Web alanlarındaki önemi artmıştır. KAB işlemi sürecinde faydalı bazı bilgi türleri de bulunmaktadır. Bunlar kategori bilgisi (Part of speech- POS), anlamların sıklıkları (frequency of senses), eşdizimlilikler (collocations), seçilebilir tercihler (selectional preferences), alt-öğeleme bilgisi (subcategorization information) ve semantik bağlam vb. olabilir. Bu bilgi türlerini elde etmek için kullanılan bazı bilgi kaynakları vardır. Bunlardan bazıları elektronik sözlükler, teknik sözlükler ve derlemlerdir. KAB sistemleri verilen hedef kelimenin bağlamsal özelliklerini bu bilgi kaynaklarından elde edip kelimenin farklı anlam karşılıklarını kıyaslamada kullanır. Günümüze kadar yapılan çalışmalarda kullanılan kaynaklar ve tekniklerin farklı birleşimlerinden çeşitli KAB yöntemleri ortaya çıkmıştır. Bu yöntemler genel olarak sınıflandırılacak olursa, bilgi tabanlı KAB ve derlem tabanlı KAB olmak üzere iki grup altında toplanabilir. 1. Bilgi tabanlı KAB da sözlük benzeri kaynaklardan alınan bilgi kullanılmaktadır. Büyük boyutlardaki elektronik sözlüklerin hazırlanması ile 1980 li yıllarda bu sözlükler kullanılmaya başlamıştır. Bu kaynakların oluşturulması bilginin otomatik olarak çıkarılması çalışmalarını hızlandırmıştır. 2. Derlem tabanlı KAB da en başarılı yaklaşımlar derlemden sınıflayıcı veya istatistiksel modelleri öğrenmek için kullanılan istatistiksel veya makine öğrenmesi algoritmalarıdır. Zaten bu yöntemlerin çoğu doğal dil işleme çalışmalarına uygulanmaktadır. Bu algoritma ve tekniklere olan ilgideki artış, makine öğrenmesi konusuna duyulan ilgiden kaynaklanmaktadır. Çünkü makine öğrenme algoritmaları çoğu doğal dil işleme çalışmalarında dikkat çekici bir başarı göstermiştir. Bu algoritmalar genel olarak öngörmeli (supervised) ve öngörmesiz (unsupervised) olmak üzere ikiye ayrılır. KAB için yapılan çalışmalarda öngörmeli yaklaşımların, belirsizliği fazla olan kelimeler üzerinde öngörmesiz yaklaşımlardan daha iyi sonuçlar verdiği görülmüştür. Öngörmesiz KAB yönteminde anlam etiketli olmayan bir derlem kullanmadan belirginleştirme gerçekleştirilir. Öngörmeli makine öğrenme ile gerçekleştirilen KAB da bir sınıflayıcı yaratılır. Burada amaç geçmiş durumlara bakarak yeni durumları doğru olarak sınıflandıran bir sınıflayıcı oluşturmaktır. Bayes öğrenme (Bayesian learning), karar listeleri (decision lists), karar ağaçları (decision trees), k-en yakın komşuluk algoritması (k-nearest neighbor algorithm) ve yapay sinir ağları (neural networks) gibi makine öğrenmesi algoritmaları sınıflayıcı örnekleridir. KAB işlemi için bu çalışmada uygulanabilirliğini incelenecek olan Tümevarımlı Mantık Programlama (TMP) da öğrenmeyi gerçekleştirmek için makine öğrenmesi teknikleri kullanılmaktadır. Takip eden bölümde TMP konusu anlatılmış, KAB işleminde kullanımı çeşitli yönleriyle incelenmiştir. 2. TÜMEVARIMLI MANTIK PROGRAMLAMA Tümevarımlı öğrenme gözlemlerden, deneylerden veya bir veritabanından elde edilen örnek kümesinden genel bir kural çıkarmaya yönelik bir öğrenme tekniğidir. Elde edilen kural tüm örnek kümesini en iyi şekilde açıklayabilen bilgidir. gözlemler geçmiş tecrübeler Bilgi tabanlı tümevarımlı öğrenme Şekil 1. Tümevarımlı Öğrenme Tekniği hipotez TMP, makine öğrenme si ve mantık programlamanın kesişimi olarak tanımlanabilir. Amacı gözlemlerden (örneklerden) hipotezler geliştiren ve artalan bilgisinden yeni bilgiler elde eden teknikler ve araçlar geliştirmektir. Bu sebeple TMP, makine öğrenmesi ve mantık programlama tekniklerinin her ikisini de kullanır [10]. Makine öğrenmesi TMP Mantık programlama tahminler İstatistiksel tekniklerin Teori uygulamasının uygulanması Örneklerden mantık programları oluşturmak için teori uygulaması ve program uygulaması gösterimi Şekil 2. Makine Öğrenmesi, Mantık Programlama ve TMP

TMP araştırmalarında amaç Horn tümceciği 1 mantığında tanımlanan örnekler ve artalan bilgisi ile mantık programlamadır. Öğrenilen mantık programları genellikle Prolog sözdiziminde tanımlanır ve mantık programlarındaki bildirimsel (declarative) olma özelliği TMP nin etkili olmasının ana nedenidir [10]. TMP, hipotezler ve gözlemler için gösterimsel mekanizma olarak hesaplamalı mantığı kullanarak klasik makine öğrenmesi tekniklerinde var olan iki önemli kısıtın üstesinden gelebilmektedir. 1. Sınırlı bilgi gösterimi formalizmini kullanmak. 2. Öğrenme sürecinde çok miktarda artalan bilgisini kullanmadaki zorluklar. İlk sınırlama önemlidir; çünkü bazı alanlardaki incelemeler sadece birinci dereceden yüklem mantığı ile açıklanır, önermeler mantığı ile açıklanamaz. Açıkça problem şudur ki; mantık programı alanı örneklerden sentez yapar ve çoğu mantık programı sadece önermeler mantığı ile tanımlanamaz. Alan bilgisinin kullanımı önemlidir, çünkü yapay zekâdaki önemli buluşlardan biri zekâ davranışına ulaşmak için alan bilgisi kullanımının gerekli olduğudur [10]. Mantık bilginin gösterimine mükemmel bir formalizm sunar ve bundan dolayı tümevarımla bütünleşir. TMP, çıkarımda temel mod olarak tümevarımı inceleyerek hesaplamalı mantığı uygular ve teoriyi genişletir. Her ne kadar şimdiki hesaplamalı mantık teorileri kullanıcıdan alınan mantık formülünden tümdengelimli çıkarım olarak tanımlansa da, TMP teorisi örneklerden ve artalan bilgisinden mantık programlarının tümevarımlı çıkarım yapması olarak tanımlanır. TMP de kullanılan mantıksal terimlerin tanımları aşağıda açıklanmıştır. - B sonlu sayıda tümcecik içeren artalan bilgisidir. - E sonlu sayıda örnek setidir = E E Pozitif örnekler. { 1, e 2,...} Boş olmayan tanımlı tümce kümesidir. Negatif örnekler. E { f 1, f 2,...} Horn tümceciği kümesidir (boş olabilir). - B ve E aşağıdaki durumları sağladığında algoritmanın çıktısı H dir. Öncelikli kabul edilebilirlik (prior satisfiability). B E Sonraki kabul edilebilirlik (posterior satisfiability). B H E Öncelikli gereklilik (prior necessity).b E + Sonraki yeterlilik (posterior sufficiency). B H e 1 e 2 1 Horn tümceciği en fazla bir pozitif atomik önerme içeren, pozitif veya olumsuzlanmış atomik önermelerin veya bağlacı ile bağlanması ile elde edilir. Bu mantıksal terimlerin ne ifade ettiğini birinci dereceden yüklem mantığına benzer bir gösterim kullanarak bir örnek ile açıklayalım. Aile içindeki akrabalık ilişkilerinin öğrenileceği bir aile örneğini ele alalım. Bunun için verilenler şunlardır: B = dede X, Y baba X, Z, ebeveyn Z, Y baba ali, ayşe anne(ayşe, ahmet) anne(ayşe, suna) Dede ve torunları arasındaki ilişkiyi gösteren pozitif örnekler aşağıda verilmiştir. E + = dede ali, ahmet dede(ali, suna) Ek olarak aşağıdaki negatif örneklerin de verildiğini varsayalım. E = dede ahmet, ali dede(suna, ali) B nin doğrulunu kabul edip, yeni E + ve E gerçekleri ile karşılaşıldığında aşağıdaki ilişki tahmin edilebilir. H = ebeveyn(x, Y) anne(x, Y) Burada H, elde edilen hipotezdir. Literatürde uygulaması ve testi yapılmış birçok TMP öğreniciler vardır. Bu sistemler girdi biçimine göre deneysel (empirical) ve etkileşimli (interactive) olarak veya arama yönüne göre aşağıdan-yukarıya (bottom-up) ve yukarıdan-aşağıya (top-down) olmak üzere sınıflandırılır. Deneysel sistemler giriş olarak örnek kümesini ve artalan tümcelerini alırlar ve hipotez üreterek bunu çıktı olarak verirler. Bu sistemlerden bazıları FOIL, MFOIL, GOLEM, ALEPH, PROGOL, LINUS, MARKUS ve MOBAL dir. Etkileşimli sistemler bir örnek seti ile başlarlar ve bir hipotez üretirler ve bu hipotezi sistemdeki bir uzman tarafından yönlendirilen soru cevaplar ile güncelleştirirler. Etkileşimli TMP sistemlerine örnek olarak MIS, CLINT, CIGOL ve MARVIN verilebilir. TMP nin farklı uygulama alanları vardır. Bunlardan bazıları; yazılım mühendisliği, sistemlerin modellenmesi ve kontrolü, doğal dil işleme, veritabanından bilginin çıkarımı, veritabanı tasarımı, veri analizi, tıbbi teşhisler, çevresel izleme sistemleri ve moleküler biyolojidir [11]. Ayrıca, TMP bilimsel buluşların çeşitli aşamalarında; örneğin teori oluşturmada, deneysel tasarım ve teori doğrulamada bir araç olarak kullanılabilir [12]. Çalışmamıza uygun olarak doğal dil işleme için bu konuyu daha ayrıntılı ele alalım. Doğal dil işleme için ilişkileri, özyinelemeleri ve sınırsız yapısal gösterimleri içeren çok zengin bir gösterimsel dil gerekmektedir. TMP de birinci dereceden mantığın

kullanılmasının yarattığı zenginlik doğal dil işleme uygulamalarında esnekliği arttırarak ve yapıcı tümevarıma olan gereksinim miktarını sınırlayarak ümit verici avantajlar kazandırmıştır [13]. 3. GELİŞTİRİLEN UYGULAMA TMP ile yapılan çalışmalarda elde edilen deneysel sonuçlar TMP nin artalan bilgisini kullanmada başarılı olduğunu göstermiştir. TMP nin bu yeteneğinin kelime anlamı belirginleştirme konusunda kullanılması bu alanda önemli bir gelişme sağlayabilir [14]. Belirginleştirme için artalan bilgisi olarak KAB da faydalı olan bilgi türleri kullanılmaktadır. Bu bilgiler belirginleştirilecek kelime ve bulunduğu bağlamdaki diğer kelimelere ait sözdizimsel ve anlambilimsel özellikleri içermektedir. Bahsedilen özellikleri elde edilmesi için kullanılan Türkçe doğal dil işleme kaynaklarının yeterince bulunmaması nedeniyle Türkçe için yapılmış KAB çalışması çok az bulunmaktadır. Bu eksikliği gidermek amacı ile bir sözlüksel kaynak olarak Türkçe Sözlüksel Örnek Görevi (Turkish Lexical Sample Task) oluşturulmuştur. Bu çalışma Semeval-2007 sunulmuştur [15]. KAB uygulamamızı bir TMP sistemi olan Aleph (A Learning Engine for Proposing Hypotheses) ile gerçekleştirdik [16]. Aleph de teorileri oluşturmak için 3 veri dosyası gerekmektedir: - Artalan bilgisinin bulunduğu.b uzantılı bir dosya. - Pozitif örneklerin bulunduğu.p uzantılı bir dosya. - Negatif örneklerin bulunduğu.n uzantılı bir dosya. Bu dosyaların içerik bilgisini elde etmek için kaynak olarak Türkçe Sözlüksel Örnek Görevi kullanılmıştır. Şimdi bu veri dosyalarının nasıl oluşturulduğuna bakalım. Artalan Bilgisi Artalan bilgisi için kullandığımız özellikleri aşağıda vermiş olduğumuz bir örnek tümce üzerinden açıklayalım: Tümce: İnce uzun parmaklı elleri masanın üstündeydi. Hedef kelime: el 1. Anlamı belirginleştirilecek hedef kelimenin sağında ve solunda bulunan kelimeler. Uygulamada hedef kelimenin yanındaki ilk kelimeler alınmıştır. Yapılmış bazı çalışmalarda hedef kelimenin yanından alınan kelime sayısı beşe kadar çıkmaktadır. Ancak Türkçe Sözlüksel Örnek Görevi içinde hedef kelimenin yanındaki ilk kelimeler verildiği için uygulamamızı tek kelime sınırladık. Bu özelliğin programdaki gösterimi aşağıdaki gibidir: has_bag(snt1, üst). 2. Hedef kelimenin sağında ve solunda bulunan kelimeler ve bu kelimelerin hedef kelimeye göre konum bilgisi. has_narrow(tümce_no, kelimenin_konumu, kelime). has_narrow(snt1, first_content_word_left, parmak). has_narrow(snt1, first_content_word_right, üst). 3. Hedef kelimenin sağında ve solunda bulunan kelimelerin kategori bilgisi ve hedef kelimeye göre konum bilgileri. has_pos(tümce_no,kelimenin_konumu,kelimenin_ka tegori_bilgisi). has_pos(snt1, first_content_word_left,noun). has_pos(snt1, first_content_word_right, verb). 4. Hedef kelimenin sağında ve solunda bulunan kelimelerin ontolojik düzey bilgisi. Ontoloji düzeyi 3 olarak sınırlandırılmıştır. has_ont(tümce_no,kelimenin_konumu,ontoloji_düze yi, ontoloji). has_ont(snt1,first_content_word_left,1,physical_ent ity). has_ont(snt1,first_content_word_left,2,organism). has_ont(snt1,first_content_word_left,3,body). has_ont(snt1,first_content_word_right,1,physical_e ntity). has_ont(snt1,first_content_word_right,2,location). has_ont(snt1,first_content_word_right,3,region). 5. Hedef kelimenin sağında ve solunda bulunan kelimelerin hal bilgileri ve hedef kelimeye göre konum bilgileri. has_case(tümce_no,kelimenin_konumu,kelimenin_h ali). has_case(tümce1, first_content_word_left, _). has_case(tümce1,first_content_word_right, _). 6. Hedef kelimenin sağında ve solunda bulunan kelimeler ile olan ilişki türü ve bu kelimelerin hedef kelimeye göre konum bilgileri. has_rel( tümce, kelimenin_konumu, ilişki_türü). has_rel(snt1, first_content_word_left, modifier). has_rel(snt1, first_content_word_right, sentence). Artalan bilgisi dosyasında eğitim kümesi ve test kümesi örneklerinin özellikleri bulunmaktadır. Pozitif Örnekler Hedef kelimenin doğru anlamını gösteren bilgidir. sense(tümce, hedef_kelimenin_anlamı). sense(snt1,sense1). has_bag(tümce_no, kelime). has_bag(snt1, parmak).

Negatif Örnekler Hedef kelimenin doğru anlamını sağlamayacak şekilde diğer anlam etiketleri kullanılarak elde edilen bilgidir. sense(tümce, hedef_kelimenin_hatalı_anlamı). sense(snt1,sense3). Geliştirilen uygulamada hedef kelime olarak belirlenen el kelimesi için Türkçe Sözlüksel Örnek Görevi nde eğitim kümesinde 113 tümce, test kümesinde 38 tümce bulunmaktadır. Öncelikle eğitim kümesi tümcelerine ait artalan bilgisi, pozitif örnekler ve negatif örnekler alınarak Aleph sistemine verilecek olan veri dosyaları oluşturuldu. Sonrasında sisteme verildi ve bir model elde edildi. Bu modelde bulunan kurallardan (hipotezlerden) biri aşağıdaki gibidir: sense(a, B) :- has_rel(a, first_content_word_left, modifier), B=1. Bu kural bize verilen bir tümcede has_rel(a, first_content_word_left, modifier) özelliği olması durumunda el kelimesi için anlam karşılığının birinci anlamı (kolun bilekten parmak uçlarına kadar olan, tutmaya ve iş yapmaya yarayan bölümü) olacağını söylemektedir. 4. SONUÇ Çoğu KAB tekniği, belirginleştirme için farklı sözlüksel kaynaklardan alınan bilgilerin aralarındaki ilişkiyi tespit edememektedir. Ancak TMP ilişkisel bilginin gösteriminde başarılıdır ve çeşitli kaynaklardan alınan verilerle farklı bir yapı oluşturabilmektedir. Birinci dereceden yüklem mantığını kullanarak bu veriler arasındaki bağlamsal ilişkileri kapsayacak gücü kazanır. Sonuç olarak Türkçe için, Türkçe Sözlüksel Örnek görevini kaynak olarak kullanan ve bir TMP sisteminden faydalanan bir KAB uygulaması geliştirilebilir. 5. KAYNAKLAR [1] Weaver, W., Translation. Mimeographed, 12 pp.,. Reprinted in Locke, William N. and Booth, A. Donald, 1955 (Eds.), Machine Translation of Languages. John Wiley & Sons, New York, 1949. [2] Masterman, M., The thesaurus in syntax and semantics. Mechanical Translation, 4, 1-2, 1957. [3] Quillian, M. R., A design for an understanding machine. Communication presented at the colloquium Semantic problems in natural language. September 1961. King s College, Cambridge University, Cambridge, United Kingdom, 1961. [4] Masterman, M., Semantic message detection for machine translation, using an interlingua. 1961 International Conference on Machine Translation of Languages and Applied Language Analysis, Her Majesty s Stationery Office, London, 1962, 437-475, 1961. [5] Wilks, Y. A., On-line semantic analysis of English texts. Mechanical Translation, 11(3-4), 59-72, 1968. [6] Lesk, M., Automated SenseDisambiguation Using Machine-readable Dictionaries, Proceedings of the SIGDOC Conference,1986. [7] Wilks, Yrick, Dan Fass, Cheng-Ming Guo, James E. MacDonald, Tony Plate &Brian A. Slator., Providing Machine Tractable Dictionary Tools, Semantics and the Lexicon, ed. by James Pustejovsky, 341 401. Dordrecht: Kluwer Academic Publishers,1990. [8] Veronis, J., Ide, N., WSD with Very Large Neural Networks Extracted from MRDs, Int. Conf. on Computational Linguistics, 1990. [9] Ide, N. and Veronis, J., Word Sense Disambiguation: The State of the Art, Computational Linguistics, 1998. [10] Muggleton, S. and De Raedt, L. Inductive logic programming: Theory and methods., J. Logic Program, 1994. [11] Dzeroski, S., Bratko, I., Applications of inductive logic programming, In:De Raedt,L.(ed.). Advances in ILP. Amsterdam: IOS Press :Ohmsha, pp.65-81, 1995. [12] De Raedt, L., Inductive logic programming and scientific discovery, Technical report, Katholieke Universiteit Leuren, Leuren, Belgium, 1993. [13] Mooney, R.J.: Inductive Logic Programming for Natural Language Processing, In:Inductive Logic Programming. LNCS, vol. 1314, pp. 3 24. Springer, Heidelberg, 1997. [14] Specia, L., Nunes, M.G.V., Srinivasan, A., Ramakrishnan, G., Word Sense Disambiguation using Inductive Logic Programming, Proceedings of the 16th International Conference on ILP, Springer-Verlag, 2007. [15] Orhan, Z., Çelik, E., Demirgüç, N., SemEval- 2007 Task 12: Turkish Lexical Sample Task, 2007. [16] Srinivasan, A.: The Aleph Manual Available at http://www.comlab.ox.ac.uk/oucl/research/areas/ machlearn /Aleph/, 1999.