Uygur Dili ve Makineli Çeviri



Benzer belgeler
Uygur Tümcesinin Bilgisayar ile Çözümlenmesi

Uygurca ile Türkçe Birleşik Sözcüklerin Karşılaştırılması

Uygurca ile Türkçe Birleşik Sözcüklerin Karşılaştırılması

Uygurcadan Türkçeye bilgisayarlı çeviri

Türkçe ve Arapçada Sessiz Harfler Karşılaştırma Çalışması

Yıldırım Beyazıt Üniversitesi İnsan ve Toplum Bilimleri Fakültesi Güvenevler Mahallesi Cinnah Caddesi No:16/A Çankaya-ANKARA

Bundan sonra Sabahlatan da hayatın çeşitli alanlarına dair eğitim serileri bulunacak. Bunlara da bu İspanyolca eğitim makalesi ile başlıyoruz.

ARAP DİLİ VE EDEBİYATI ANABİLİM DALI EĞİTİM ÖĞRETİM ÖĞRETİM YILI GÜZ PROGRAMI

Heceleme Yöntemiyle Kök Sözcük Üretme

TÜRKÇE İÇİN BİR SIKLIK ANALİZİ PROGRAMI

Türkçe nin Bağlılık Ayrıştırması. Gülşen Cebiroğlu Eryiğit

ARDAHAN ÜNİVERSİTESİ İNSANİ BİLİMLER VE EDEBİYAT FAKÜLTESİ ÇAĞDAŞ TÜRK LEHÇELERİ VE EDEBİYATLARI BÖLÜMÜ DÖRT YILLIK-SEKİZ YARIYILLIK DERS PROGRAMI

TÜRKÇE METİNLERDEKİ YAZIM YANLIŞLARINA YÖNELİK OTOMATİK DÜZELTME MODELİ

SES (HARF) BİLGİSİ. Türkçe alfabemizde (abecemizde) 29 harf vardır. Alfabetik sırası şöyledir.

Zeus tarafından yazıldı. Cumartesi, 09 Şubat :20 - Son Güncelleme Pazartesi, 15 Şubat :23

İspanyol Alfabesi 27 harf ve 2 digraf, yani tek ses veren ikili harf kombinasyonundan oluşur.

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

TÜRK DİLİ VE EDEBİYATI BÖLÜMÜ DERS PLANI

(TÜRKÇE) I. (Ana sayfada görünecektir.)

Türkçede Orta Hece Düşmesi

ÖZGEÇMİŞ : : cuneyt.akin@hotmail.com

İÇİNDEKİLER BÖLÜM 1 BÖLÜM 2

TÜRK DİLİ - I İÇİNDEKİLER HEDEFLER DİL AİLELERİ, DİL GRUPLARI, DİL TÜRLERİ. Dil Aileleri Dil Grupları Dil Türleri

OKUMA ANLAMA ANLATMA. 1 Her yerden daha güzel olan yer neresiymiş? 2 Okulda neler varmış? 3 Siz okulda kendinizi nasıl hissediyorsunuz?

3. Yarıyıl. 4. Yarıyıl. Eski Türk Edebiyatı Programı Ders Listesi KODU DERSİN ADI Z/S T P K AKTS TDE ÖZEL KONULAR Z

YD 101 İngilizce-I (A1) 4+0 English-I (A1) 4 YD 107 Almanca-I (A-1) 4+0 German-I (A-1) 4 I. Yarıyıl Toplam Kredi 17 I. Yarıyıl Toplam AKTS 30

TÜRK DİLİ I DERSİ UZAKTAN EĞİTİM DERS SUNULARI. 6.Hafta

UYGURCADAN TÜRKÇEYE BĠLGĠSAYARLI ÇEVĠRĠ. DOKTORA TEZĠ Murat ORHUN

PSİKOLOJİ I. Dersin Adı Sınav Tarihi Sınav Saati Sınav Salonu. TDB 101 Türk Dili-I :00 D 303

TÜRKÇE BİÇİM KISA ÖZET.

HUNGAROLOJİ ANABİLİM DALI EĞİTİM ÖĞRETİM ÖĞRETİM YILI GÜZ PROGRAMI

Doç.Dr. ENGİN ÇETİN ÖZGEÇMİŞ DOSYASI

TÜRK DİL BİLGİSİ ÖĞRETİMİNDE ÜNLÜLERİN SINIFLANDIRILMASINA YÖNELİK ELEŞTİREL BİR DEĞERLENDİRME. 2. Araştırmanın Kapsamı ve Kaynakları

RUS DİLİ VE EDEBİYATI ANABİLİM DALI EĞİTİM-ÖĞRETİM YILI BAHAR PROGRAMI

Sınav Tarihi. Sınav Saati. Sınav Salonu. Dersin Adı. Dersin Kodu. MAT 101 Sosyal Bilimler için Matematik :00 D 303

ZEMBEREK. nin kullanılması ile yazılı sözcüklerin çevrilmesi, heceleme gibi temel NLP işlemlerini sağlamaktadır.

ERMENİ DİLİNDE SESSİZ HARFLERİN İMLASI Güzin ÇAYKIRAN *

Yetkin Bul ve Değiştir

Türkçede heceler şöyle meydana gelmiştir.

Büyük Ünlü Uyumu (Kalınlık-İncelik Uyumu)

ARAPÇA DİLBİLGİSİ BELİRLİLİK TAKISI, ŞEMSÎ VE KAMERÎ HARFLER. Abdullâh Saîd el-müderris

Öğr. Gör. Murat KEÇECĠOĞLU. Elbistan Meslek Yüksek Okulu Güz Yarıyılı

1. Yarıyıl. Türk Dili ve Edebiyatı Programı Ders Listesi KODU DERSİN ADI Z/S T P K AKTS İNG127 TEMEL İNGİLİZCE I Z

İNGİLİZCE KURSLARI İÇİN KAYIT KABUL FORMU

ÖZGEÇMİŞ. Derece Üniversite Alanı Yılı Bütünleşik Doktora Ege Üniversitesi Matematik (Cebirsel Lisans Ege Üniversitesi Matematik 2009

FAKÜLTE VE BÖLÜMLERİMİZ

Harf ve Hece Bilgisi. Seç Bakalım. Aşağıdaki sözcüklerin doğru hecelenmiş biçimlerini yuvarlak içine alın.

Derece Kabul Eden Taraf İlgili Bölüm Kontenjan Lisans Yüksek Lisans Doktora Alan Kodu Çağdaş Türk Lehçeleri ve Karşılaştırmalı Dil 1 6saat

Tezkire-i Şeyh Safî (İnceleme-Metin-Dizin) Cilt I

DETERMINATION OF VELOCITY FIELD AND STRAIN ACCUMULATION OF DENSIFICATION NETWORK IN MARMARA REGION

ÖZGEÇMİŞ. Yüksek Lisans Tezi: Çin in Ming Döneminde Yapılmış olan Türkçe-Uygurca Sözlük: Ġdikut Mahkemesi Sözlüğü (1997 Ankara)

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

Dilbilgisi ve Diller

ANKARA ÜNİVERSİTESİ ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

UYGHUR WORDS AND THEIR DEVELOPMENT. Yrd. Doç. Dr. Murat ORHUN İstanbul Bilgi Üniversitesi UYGURCA SÖZCÜKLER VE ONLARIN GELİŞİMİ

ÜNLÜLER BÜYÜK ÜNLÜ UYUMU. Türkçe bir sözcükte kalın ünlülerden sonra kalın, ince ünlülerden sonra ince ünlülerin gelmesine büyük ünlü uyumu denir.

1. DÜNYADAKİ BAŞLICA DİL AİLELERİ

TC MEB ve TÜBİTAK-BİDEB YİBO ÖĞRETMENLERİ ( FEN ve TEKNOLOJİ FİZİK, KİMYA, BİYOLOJİ ve MATEMATİK ) PROJE DANIŞMANLIĞI EĞİTİMİ ÇALIŞTAYLARI

Latin Alfabesi ile Çince Karakterler Arasında www Tabanlı Dönüşüm Sisteminin Tasarımı ve Geliştirilmesi

2. Yıl / III. Dönem (Second Year Third Semester)

Oku Anla Eğlen Öğren

EĞİTİM ÖĞRETİM YILI KAHRAMANMARAŞ ANADOLU İMAM HATİP LİSESİ 10. SINIF OSMANLI TÜRKÇESİ DERSİ ÜNİTELENDİRİLMİŞ YILLIK PLANI


PENTRU DISCIPLINA LIMBA ŞI LITERATURA TURCĂ MATERNĂ

KKTC de ilkokulda zihin engelli öğrencilere okuma öğretiminde uygulanan yöntem cümle çözümleme yöntemidir. Bu yöntem Türkiye deki Eğitim Uygulama

RUS DİLİ VE EDEBİYATI ANABİLİM DALI EĞİTİM-ÖĞRETİM YILI BAHAR DÖNEMİ KATALOĞU

RUS DİLİ VE EDEBİYATI ANABİLİM DALI EĞİTİM-ÖĞRETİM YILI GÜZ PROGRAMI

KIRIKKALE ÜNİVERSİTESİ FEN-EDEBİYAT FAKÜLTESİ BATI DİLLERİ VE EDEBİYATLARI BÖLÜMÜ FRANSIZCA MÜTERCİM-TERCÜMANLIK ANABİLİM DALI

1. YARIYIL / SEMESTER 1

3. Emine Yılmaz Ceylan, Çuvaşça Çok Zamanlı Ses Bilgisi, TDK yay., 675, Ankara 1997.

ÜNİTE TÜRK DİLİ - I İÇİNDEKİLER HEDEFLER TÜRKÇENİN KİMLİK BİLGİLERİ

TÜRKÇE. Değerlendirme 1 Harf Bilgisi. A. Seviyorum B. Süt. A. Anne B. Dede. C. Baba. A. Kaplumbağa B. Tavşan C. Kurbağa. A. Okul B.

Turkish and Kurdish influences in the Arabic Dialects of Anatolia. Otto Jastrow (Tallinn)

Formal Diller Ve Otomat Teorisi

SAKARYA ÜNİVERSİTESİ. Hafta 7

BASICS OF ENGLISH SENTENCE STRUCTURE

1. Adı Soyadı : Gökçe Yükselen ABDURRAZAK PELER

LATİNCE GRAMER I 1. DERS DÜZENİ 2. DERSE DEVAM ZORUNLULUĞU 3. DERS İÇİN GEREKLİ KAYNAKLAR 4. DİJİTAL KAYNAKLAR 5. DERSİN İŞLENİŞ BİÇİMİ

Öz Geçmiş. Öğretmen MEB ( ) Yıldırım Beyazıt Üniversitesi, Türk Dili ve Edebiyatı Bölümü, Yeni Türk Dili Anabilim Dalı ( )

Ö Z G E Ç M İ Ş. 1. Adı Soyadı: Mustafa GÖÇKEN. 2. Doğum Tarihi: 12 Haziran Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D.

BOĞAZİÇİ ÜNİVERSİTESİ FEN EDEBİYAT FAKÜLTESİ DİLBİLİM BÖLÜMÜ

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

Türkçe ve Kırım Tatarcası Arasında Bir Çeviri Sistemi

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

SES BILGISI YAZIM (İMLA) KURALLARI NOKTALAMA. Telaffuz (Söyleyiş) Türkçenin Sesleri ve Özellikleri

DYNAMIC BUSINESS ENGLISH

KIRIKKALE ÜNİVERSİTESİ FEN-EDEBİYAT FAKÜLTESİ/YÜKSEKOKULU BATI DİLLERİ VE EDEBİYATLARI BÖLÜMÜ/PROGRAMI MÜTERCİM-TERCÜMANLIK ANABİLİM DALI

T.C. KARABÜK ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİĞİ BÖLÜMÜ. Karabük Üniversitesi Mühendislik Fakültesi Tez Hazırlama Kılavuzudur

Yard. Doç. Dr. İrfan DELİ. Matematik

Kur an da Geçen zevc ve imrae Kelimeleri Üzerine

Türkiye Türkçesindeki Farsça Sözcükler ve Kullanım Şekilleri

OĞUZ KAĞAN DESTANI METİN-AKTARMA-NOTLAR-DİZİN-TIPKIBASIM

Üniversiteyi Kazanan Öğrencilerin Temel Bilgi Teknolojilerini Kullanabilme Düzeylerinin Bölgesel Analizi

DYNAMIC BUSINESS ENGLISH

BİREYSELLEŞTİRİLMİŞ TÜRKÇE DERSİ EĞİTİM PLANI

ISBN NUMARASI: ISBN NUMARASI: ISBN NUMARASI: ISBN NUMARASI:

ÖZGEÇMİŞ. : Fen Edebiyat Fakültesi Türk Dili ve Edebiyatı Bölümü. : :

TDE 101 Türkiye Türkçesi I Turkey Turkish I TDE 102 Türkiye Türkçesi II Turkey Turkish II

Transkript:

Akademik Bilişim 2008 Çanakkale Onsekiz Mart Üniversitesi, Çanakkale, 30 Ocak - 01 Şubat 2008 Uygur Dili ve Makineli Çeviri Murat ORHUN 1, Eşref ADALI 2, A.Cüneyd TANTUĞ 2 1 İstanbul Bilgi Üniversitesi, Bilgisayar Bilimleri Bölümü, İstanbul 2 İstanbul Teknik Üniversitesi, Bilgisayar Mühendisliği Bölümü, İstanbul muratmehmet@cs.bilgi.edu.tr, {adali,cuneyd}@cs.itu.edu.tr Özet: Bu makalede, Uygur dilinin gramer yapısı, Uygur dilinde kullanılan alfabeler hakkında kısaca bilgi verilecektir. Uygur dili üzerinde yapılan son araştırma ve gelişmeler özetlenecektir. Özellikle, Uygur dili ile ilgili yapılan Doğal dil çakışmaı ve Makineli çeviri üzerinde elde edilen sonuç özetlenecektir. Makineli çeviride kullanılan yöntemlerin Uygurca için nasıl kullanılabileceği hakkında yaptığımız araştırmaımız ve önerimiz verilecektir. Sonunda, Uygurca ile Türkçe arasında makineli çevrinin nasıl yapılabileceği hakkında sistem yapısı verilecektir. Anahtar Kelimeler: Makineli Çeviri, Uygurca Gramer, Uygur dili, Kural Tabanlı Çeviri. Uygur Language And Machine Translation Abstract: This paper gives some information about the structure of the Uygur Grammar and Uygur Alphabets. Summarizes the resent researches about the language and some results achieved so far. Mainly, we discuss the researches and achievements about the Natural Language Processing and the Machine Translation of the Uygur Language, which are done so far. We explain some rules which used for Machine Translations in general, and give our suggestions about these rules which could be used for the Uygur Language. At last, we suggest a system which implements the machine translation between Turkish and Uygur. Keywords: Machine Translations, Uygur Grammar, Uygur Language, Rule Based Translation. 1. Giriş Uygur dili yaygın oak, Doğu Türkistan da kullanılmaktadır. Bun Hariç, Orta Asya, Afganistan, Türkiye gibi Ülkelere bile birçok kişiler tarafından kullanılmaktadır. Uygur günümüze kadar birçok alfabe kullanmıştır. Günümüzde Uygur yaşadığı bölgelere göre farklı alfabeler kullanmaktadır. Orta Asya da yaşayan Uygur Kırıl alfabesini kullanırken, Afganistan da yaşayan ise, Araf alfabesini kullanmaktadır. Doğu Türkistan da yaşayan Uygur ise, 80 - yıla kadar Latin Alfabesini temel alan alfabe kullanırken, günümüzde ise Araf alfabesini temel alan 32 harften oluşan alfabe kullanmaktadır. Araf Alfabesine geçiş yakın tarihlerde gerçekleştirildiğinden dolayı, birçok kişiler, halen Latin Alfabesini temel alan Uygur alfabesini kullanmaktadır. Resmi yazışmada, okulda, Araf alfabesini temel alan alfabe kullanılırken, bilgisayarlı yazışmada ise, Latin alfabeli yazışma yasal olması bile kullanılmaktadır. Bilgisayar kullanımın yaygınlaşmasıyla, Latin alfabesini standartlaşma çabaı yapılmıştır. Bu işlemleri yürütmek için UKIJ[1] adında bir kurum kurulmuştur. Hatta Araf alfabesi ile Latin alfabesi arasında unikodlu[2] çevri yapan ücretsiz yazılım geliştirilmiştir [1]. Uygur- 633

Uygur Dili ve Makineli Çeviri cada kullanılan Araf alfabesi ile Latin alfabesinin karşılaştırılması Tablo1 de verilmiştir [1]. Bu makalede gösterilen örneklerde Latin alfabesinde kullanılan harfleri temel almıştır. 2.1 Uygur Alfabesinde Kullanılan Harfler Uygur dili alfabesi,8 sesli,24 sessiz toplam 32 harften oluşmaktadır. Sesli harfler ise: A,, E, İ, O, Ö, U, Ü Sesli harfler, telaffuz edilirken, dil yerine göre üç türe ayrılır. 1. Dil aldı sesli harfler:, Ö, Ü 2. Dil Arka sesli harfler: A, O, U 3. Dil Ortası sesli harfler: E, İ Sesli harfler, telaffuz edilirken dudak şekline göre iki türe ayrılır. 1. Yuvarlak dudaklı sesli harfler: O, U, Ö, Ü 2. Yuvarlak dudaklı olmayan sesli harfler: A,, E, İ Uygurcada kullanılan sessiz har ise: B, P, T, J, CH, X, D, R, Z, J, S, SH, GH, F, Q, K, G, NG, L, M, N, H, W, Y Sessiz harada iki türe ayrılır ünlü, ünsüz diye. 1. Ünlü sessiz harfler: B, J, D, R, Z, J, GH, G, NG, L, M, N, H, W, Y 2. Ünsüz sessiz harfler: P, T, CH, X, S, SH, F, Q, K Uygurcada tüm sesli harfler ünlü sessiz türüne dâhil edilebilinilmektedir [3]. Uygurca başka Türkî dilleri gibi bir bitişen dildir. Bir kök sözcüğe eklerin eklenmesi ile farklı anlam veren sözcükler oluşturulabilmektedir. Köklere ekler eklenirken, sesli ve sessiz uyumu sağlanması gereklidir. Bun hariç, bazen harflerin telaffuz edildiği andaki sese göre, bazı eklerin eklenme şeklide değişmektedir. Bundan dolayı Uygurcada eklerin eklenmesi başka Türk dillerine göre daha karmaşıktır. Özellikle, Farsça, Rusça, Çince ve Arapça sözcüklerin içermesi, kuralın daha çok karmaşık olmasına neden oluşturmaktadır. 2.2 Uygurcada Sesli Harflerin Uyumu Uygurcada, sözcüklerin son hecesinde yer alan sesli harflerin, dil aldı ya da dil arkası olmasına göre ekler ekleniyor. Yanı son hecelerde yer alan sesli har belirtici rolü üsteleniyor. Mesela: kitap + mektep+ ler Ama son hecelerde yer alan sesli harfler, dil orta türüne dâhil ise, farklı durum söz konusu oluyor. Böyle durumda, bu heceleri oluşturan sessiz harflere, hatta tüm sözcüğe bakılması gerekiyor[4], [5]. Mesela: pilik +ler it+ Uygurcada, sözcüklere ekler eklendikten sonra, kök sözcüğünde bulunan bazı sesli ve sessiz harflerde da değişikler oluyor. 1.Sözcükleri oluşturan sesli harflerin sırası - İ, Ü - E - İ, E - İ - İ şeklinde ise, ekler eklenirken, son hecelere değil, bir önceki eklerde yer alan harfine bakılacaktır. 2. A, ile harfleri ile oluşan, bir ve çok heceli sözcüklere i harfi ile oluşan ekler eklenerek, o sözcüklerde, eskiden yer alan A, harfleri 634

Akademik Bilişim 2008 Murat ORHUN, Eşref ADALI, A.Cüneyd TANTUĞ E, İ lere değişirse bile, yeniden ekler eklenecekse, o sözcüklerin eski orijinal durumu göz ününe alınacaktır. 3. Yuvarlak dudaklı sesli har ile oluşan tek heceli sözcüklere ve, son hecesi yuvarlak dudaklı sesli harf ile sonlanan çok heceli sözcüklere ekler eklenirken, eklerde yuvarlak dudaklı sesli hardan oluşan ekler eklenecektir. Mesela: qol + um yüz +üm 4: Yuvarlak dudaklı olmayan sesli har ile oluşan tek heceli sözcüklere ve son hecesi yuvarlak dudaklı olmayan sesli harf ile sonlanan çok heceli sözcüklere ekler eklenirken, eklerde yuvarlak dudaklı olmayan sesli hardan oluşan ekler eklenecektir. Mesela: ügen + is en +is 5: A harfi ile oluşan tek heceli sözlere i ile başlanan ekeler eklendiğinde, o hece açık hece halinde kalır. Ve A harfi ise, i harfi ile değişecektir. Mesela: Al + ip = ilip 6: E harfi ile oluşan tek heceli sözcüklere ekler eklenirken, E harfi ise i harfine değişecektir. Mesela: Kel + er = Kiler 7: Bazı iki heceli sözcüklerin ikin hecesindeki yüksek sesli harfler, o sözcüklere ekler eklenirken, kendi vurgusunu kayıp eder. Yanı o sesli harf kayıp olacaktır. Mesela: köngül + i = köngli Burada ü harfi kayıp oldu. 2.3 Uygurcada Sessiz Harflerin Uyumu 1. D, B, H den başka ünlü sessiz harfler ile sonlanan sözcüklere, ünlü sessiz harfler ile başlanan ekler, ünsüz harfler ile sonlanan sözcüklere, ünsüz harfler ile başlanan ekler ekleneceklerdir. Mesela: baj + din al+ dim 2. Son hecesi açık hece olan sözcüklere, birinci, ikinci şahıs ekleri eklendiğinde, eklerin Mesela: imla +yim imla + ying imla + si su +süyüm su + süyüng 2.4 Uygurcada Bağımsız ve Türetilmiş Sözcüklerin Yazılması Uygurcada bir birinden bağımsız iki ya da daha fazladan sözcükler birleşerek, yeni anlam veren sözcükler oluşturur. Buna Türetilmiş sözcükler denir. Türetilmiş sözcükleri oluşturan bağımsız sözcükler, bazen hiç bir değişime uğramadan bir-biriyle birleşebilirken, bazı durumda değişmektedir. Mesela: aş + tahta = aştahta ( burda değişme olmadı) beng + bash = bengwash (burada, ikinci sözcükte gecen b harfi ise w ile değişti.) Yani, ikinci sözcük b ile başlanan bazı sözcüklerde (hepsinde değil), b harfi ise w ile değişecektir, w sesi ile okunacaktır. 635

Uygur Dili ve Makineli Çeviri Araf Alfabesi Latin Alfabesi Harfler Örnekler Harfler Örnekler Türkçe Anlamı a at at e eynek ayna b beliq balık p paqa kurbağa t toshqan tavşan j juwa ch cheynek çaydan x xoraz horoz d dap def r rawap revap z zenjir zincir j jurnal jurnal s saat saat sh shir aslan gh ghaz gaz f fontan fıskiye q qoy koyun k kala inek g gül gül ng yangaq ceviz l lampa ampul m müshük kedi n nan ekmek h harwa o oghaq orak u uwa yuva ö öy ev ü üzüm üzüm w welespit bisiklet é éyiq ayı i it it y yolwas kaplan Tablo1. Uygurcada kullanılan Arap alfabesi ile Latin alfabesinin karşıcılaştırılması. 636

Akademik Bilişim 2008 Murat ORHUN, Eşref ADALI, A.Cüneyd TANTUĞ 2.5 Yardımcı Sözcüklerin Yazılması al, qal, chal, sal, bol, k l, gibi filler, dolaylı geçmiş zaman anlamında kullanıldığında, l harfı ortalıktan kalkacaktır. Mesela: al+di -> Aptu qal+di -> qaptu, sal + di -> saptu Ama bu filler, geçmiş zamanda, dolaysız anlamında kullanılırsa, l harfi olduğu gibi kullanılacaktır. Mesela: eliwaldi. seliwaldi. Burada, harflerin düşüp ya da düşmeyeceği ise, sözcüğün anlamına göre yapılmaktadır. Bun hariç, Çince, Rusça den gelen sözcükler içinde özel yazama kuralı kullanılmaktadır. 3.1 Makineli Çeviri Makineli çevri ise, Doğal Dili çalışmaının bir alt dalıdır. Genelde bilgisayara dayanır. Çeşitli yazılım kullanarak, bir doğal dili bir başka doğal dile çevrime işlemidir.[6]. Bilgisayar teknolojisinin gelişmesi ve bilgisayarın yaygınlaşmasıyla, Makineli Çevri baya yaygınlaşmıştır. Şimdiye kadar Türk dilleri için yapılan çalışma Türkiye Türkçesi üzerinde yapılmıştır [7][8][9][10]. En son yapılan çakışma ise, Türkiye Türkçesi ile Türkmence arasında geliştirilen çeviri sistemidir. Ayni anda bu çeviri sistemi İstanbul Teknik Üniversitesi Doğal Diller Çalışma Grubunda, Tüm Türk dilleri arsında Makineli çeviri geliştirme ponjesinde geliştirilmektedir. Bundan daha önce, ZEMBİREK[11] adında açık kaynaklı biçimbirimsel çözümleyici çalışması bulunmaktadır. Bu yazılım ise TÜBİTAK tarından geliştirilmiş olan, açık kaynaklı bir sistemdir. Bu sistem Şimdi Türkçe ve Azerice, Diller üzerinde çözümleme yapabilmektedir. Dolaysıyla, Uygurca üzerinde araştırma yapmak gerçekten çok önemlidir. Ama Uygurca için yapılan doğal dil ile ilgili az sayıda çalışma bulunmamaktadır.[12]. Yapılmış olan çalışmada[2], belirsizliği giderme hakkında çalışma yapılmamıştır. Uygurcada kullanılan kelimeler ve yapısı yönünden karmaşık kelimeler içerin bir dildir. Eş anlamlı bir çok kelimeleri içermektedir. Mesela: yüz,isim, nesnelerin yüzü yüz,sayı, 100 yüz,fiil, suda yüz yüz,fiil kafasını yüz 3.2 İki Düzeyli Biçimbirimde Kural Türleri Uygurca çok ekler içerin ve eklerin eklenmesi ile yeni sözcükler üreten bilen bir dildir. Bundan dolayı, Uygurcacının biçimbirimsel yapısını analız etmek, için, Biçim birimsel çözümlemede en çok kullanılan yöntemlerden[13], [14], [15], [16], iki düzeyli biçimbirimsel kural yöntemi kullan ılınabilinir[17]. İki düzeyli biçimbirimde kural yöntemi ise, yapısal(lexicon) biçim ve görünen(surface) biçimden oluşuyor. Görünen biçimde bazı kural uygulanarak, yazıın görünme şekli kontrol edile bilinir. Bunun ili ilgili sonlu durum-otomat tabanlı yazılım geliştirilmiştir. Mesela, XEROX[19], KIMMO[20]. Bu yazılım herhangi bir dilden bağımsızdır. Her dilini kendi yapısına göre kural tanımlana bilinir, alfabesi verilebilinir. Bu kural iki yönü çalışmaktadır. Yani, verdigimiz ya- 637

Uygur Dili ve Makineli Çeviri zılım ve biçimbirimsel kural göre normal kelimeler üretebilirken, ayni anda, verdiğimiz düzgün bir kelimenin biçim birimsel yapısın çöze bilmektedir. Bu yazılımdan Ya da bunun tarzda yazılım geliştirerek, farklı diller araında makineli çeviri sistemi geliştirilmiştir. [21],[22][23] [24][25]. Genelde İki düzenli çözümleyicilerde kullanılan kural altta verilmiştir a:b => LC _ RC Yapısal gösterimdeki bir a sesi, kendinden önce ve sonra belirtilen bağlam varsa (LC - left context ve RC right context) görünen biçimde b sesine dönüşebilir, (ancak bu dönüşüm zorunlu değildir). a:b <= LC _ RC Yapısal gösterimdeki bir a sesi, kendinden önce ve sonra belirtilen bağlam varsa (LC -left context ve RC right context) görünen biçimde b sesine mutlaka dönüşür (bu dönüşüm zorunludur, koşul sağlandığında gerçeklenmelidir). a:b <=> LC _ RC Yapısal gösterimdeki bir a sesi, kendinden önce ve sonra belirtilen bağlam varsa (LCleft context ve RC right context) görünen biçimde b sesine mutlaka dönüşür, (bu dönüşüm zorunludur) ve başka hiçbir bağlamda bu dönüşüm olmaz. a:b /<= LC _ RC Yapısal gösterimdeki bir a sesi, kendindenönce ve sonra belirtilen bağlam varsa (LC - left context ve RC right context) görünen biçimde b sesine kesinlikle dönüşemez. Tablo 2 de iki düzenli biçimbirimsel kural karşılaştırılmıştır ve örnekler verilmiştir. a:b =>l _ r a:b <=l _ r a:b <=>l _ r a:b / <=l _ r (olamaz) (olamaz) (olamaz) Tablo 2. İki düzenli biçimbirimsel kural ve örnekler[17] xay xby (olamaz) xay xby xay xby(olamaz) xay xby 3. Uygurca Cümlelerin Yapısı ve Türkçe Cümleler ile Karışsılaştırılması Uygurca ile Türkçe cümle yapısı yanı söz dizimi oak yönünden benziyor, ayni anda çok sayıda fark bulunmaktadır. Türkçe ile Orta Asya da konuşulan Türkçenin ayni lehçe olup olmadığı yönde tartışma bulunmaktadır. [26]. Altta, Uygurca ve Türkçe cümleler verilmiştir. Men bazargha kettim. Ben pazara gittim. Sen su ichting mu? Sen su içtin mi? Qoy taghqa ketti. Koyun dağa gitti. 638

Akademik Bilişim 2008 Murat ORHUN, Eşref ADALI, A.Cüneyd TANTUĞ Bu cümleler bir-birine cok benziyor. Hatta bazı kelimeler ayni anlam veiyor. Ama bazen, tam tersin durum söz konusu oluyor. Men bazargha badim ve sebze aldim. Ben pazara gittim ve havuç aldım. Bundan dolayı, Uygurca ile Türkçenin cümle yapısı ne kadar benzese bile, doğrudan çeviri yapmak çok yanlış sonuç getirebilmektedir. Dolaysıyla, biçim birimsel analız yaptıktan sonra, kesin oak belirsizlik, karşılıkı gidermek çalışması yapılması gerekmektedir. 4. Kısaltma UKIJ Uygur Komputer Ilmi Jemiyeti 5. Kaynak [1]. http://www.ukij.org [2]. http://unicode.org [3]. Hamit T. Modern Uygur Grammar (Morphology). Yıldız Teknik Üniversitesi, Fen-Ed Fak. T.D.E Bölümü. Istanbul 2003.(İngilizce baskı). [4]. Mirsultan Osmanof, Hazirqi Zaman Uyghur Edebiy Tilining İmla ve Teleppuz Lughiti. Shin Jiang Xeliq Neshiryatı. Ocak 1997. (Uygurca baskı) [5]. Yi Shen Xiu Gao Xhi Ju, Uyghur Dili Grammatkası. Çin Halik Cumhuriyeti Merkezi Milletler Üniversitesi Baskısı, Şubat 1998. (Çince baskı). [6]. http://www.aaai.org/aitopics/html/ma chtr.html [7]. Tantuğ A:C, Adalı E, Oflazer K.,2006. Computer Analysis of The Turkmen Language Morphology Proceeding of the 5th International Conference on Natural Language Processing,Fin TAL 2006, Turku, Finland. [8]. Gülşen Eryiğit and Eşref Adalı. An Affix Stripping Morphological Analyzer for Turkish [9]. İ. Hamzaoğlu, Machine translation from Turkish to other Turkic languages and an implementation for the Azeri languages, in Institute for Graduate Studies in Science and Engineering. vol. MSc Thesis İstanbul: Bogazici University, 1993. [10]. K. Altıntaş, Turkish to Crimean Tatar Machine Translation System, in Bilgisayar Mühendisliği Bölümü. vol. MSc Ankara: Bilkent Üniversitesi, 2000. [11]. https://zemberek.dev.java.net/ [12]. Muhtar Mahsut, Yasuhiro Ogawa, Kazeu Sugino, Katsuhiko Tuyama, ans Yasuyoshi Inagaki, An Experiment on Japanese- Uighur Machine Translation and Its Evalutation AMTA 2004, LNAI 3265,pp.208-216 2004 [13]. K. Koskenniemi, Two-Level Morphology : A General Computational Model for Word Form Recognition and Production, Department of General Linguistics, University of Helsinki 1983. 639

Uygur Dili ve Makineli Çeviri [14]. L. Karttunen, KIMMO : A General Morphological Processor, in Texas Linguistic Forum, Texas, USA, 1983, pp. 163-186. [15]. E. L. Antworth, PC-KIMMO: A Two-Level Processor for Morphological Analysis, Summer Institute of Linguistics, Dallas, Texas, USA 1990. [16]. R. Sproat, Morphology and Computation: MIT Press 1992. [17]. Two Level Morphology. http://www.ling.helsinki.fi/~koskenni/ esslli-2001-karttunen/ [19]. PC-KIMMO. http://www.sil.org/pckimmo/ pc-kimmo.html [20]. http://www.xrce.xerox.com/ competencies /content-analysis/fst/ [21]. K. Oflazer, Two-level Description of Turkish Morphology, Literary and Linguistic Computing, vol. 9, pp. 137-148, 1995. [22]. L. Karttunen and K. Wittenburg, A Two-Level Morphological Analysis of English, in Texas Linguistic Forum, Texas, USA, 1983, pp. 217-228. [23]. R. Khan, A Two-Level Morphological Analysis of Rumanian, in Texas Linguistic Forum, Texas, USA, 1983, pp. 253-270. [24]. K. Koskenniemi, An Application of the Two-Level Model to Finnish, University of Helsinki Department of General Linguistics (1985. 104 [25]. S. Lun, A Two-Level Morphological Analysis of French, in Texas Linguistic Forum, Texas, USA, 1983, pp. 271-278. [26]. Ahmet Cüneyd Tantuğ, Türk Dilleri Arasında Sonlu Durum Modeli Tabanlı Metin Aktarımı. Doktora Tezi. Mayıs 2007. 640