TÜRKÇE ULUSAL DİL DERLEMİ PROJESİ BİÇİMBİRİM ÇALIŞMALARINDA BELİRSİZLİKLERİN SINIFLANDIRILMASI VE DAĞILIMI

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "TÜRKÇE ULUSAL DİL DERLEMİ PROJESİ BİÇİMBİRİM ÇALIŞMALARINDA BELİRSİZLİKLERİN SINIFLANDIRILMASI VE DAĞILIMI"

Transkript

1 TÜRKÇE ULUSAL DİL DERLEMİ PROJESİ BİÇİMBİRİM ÇALIŞMALARINDA BELİRSİZLİKLERİN SINIFLANDIRILMASI VE DAĞILIMI Yeşim AKSAN, Ümit MERSİNLİ, Yılmaz YALDIR ve Umut Ufuk DEMİRHAN Mersin Üniversitesi 1. GİRİŞ 1.1. Alanyazın Türkçe için yapılan biçimbirim belirginleştirme çalışmaları incelendiğinde Oflazer ve Kuruöz (1994) ün Tagging and Morphological Disambiguation of Turkish Text başlıklı çalışmalarında Türkçenin iki düzeyli biçimbilimsel bir tanımının PC-KIMMO yazılımına Türkçe kural setlerini tanımlanarak yapıldığı gözlenmektedir. Uyarlanan açımlayıcı, olasılık temelli bilgi toplanması ve kullanımı, çok sözcüklü yapı tanıma ve kısıtlama ve sözcük türü belirginleştirme çözümleyicisi ile genişletilmiştir. Sözcük kullanım sıklıklarıyla ilgili hesaplamalı bilgiler, belirsizliklerin çözümlenmesinde kullanılmaktadır. İstatistiki bilgilerin kullanıldığı yerlerden biri de, bir sözcüğün çok ender kullanılan anlamlarının elenmesidir. Oflazer ve Kuruöz (1994) bu istatistiklerin toplanmasının yanı sıra, işaretleyicinin kullanıcı tarafından belirtilen hatalı ayrıştırmalarını da kayda geçirdiğini ve böylelikle biçimbilimsel çözümleyicinin düzeltilebildiğini ifade etmektedir. Biçimbirimsel belirsizlik, istatistiki bilgi kullanılarak, otomatik olarak çözümlenemezse, bu belirsizlikleri çözmek için sözdizimsel bağlamlara gitmek durumunda kalınacaktır. Bir sözcüğün çoklu açımlamalarının belirginleştirilmesi için, sözcüğün yerel bağlamı üzerindeki kısıtlamaların neler olduğu saptanmaktadır. Tür (1996) ün Using Multiple Sources of Information for Constraint-Based Morphological Disambiguation başlıklı çalışması otomatik belirginleştirme yöntemini kullanarak; eğitici derlemden (training corpus), eğiticisiz öğrenme (unsupervised learning) yoluyla öğrenilen elle hazırlanmış kısıtlama kurallarını, biçimbilimsel belirginleştirilmesi yapılan derlemden elde edilen ek olasılıksal bilgiyle birleştirmektedir. Elle oluşturulmuş kuralların geri çağırmadan (recall) kısıtlama yapmaksızın, kesinlik (precision) artıracak şekilde düzenlenen dilbilimsel kurallar olduğu bildirilmektedir. Geri çağırma doğru olarak işaretlenmiş örnekçe sayısının, işaretlenen toplam örnekçe sayısına bölünmesiyle elde edilen orandır. Kesinlik ise işaretleyicinin metinden attığı istenmeyen işaret sayısıdır. Tür (1996) de tanıtılan bu çözümleyici %93-94 lük bir kesinlik ve örnekçe başına lük çözümleme (parse) oranındaki belirsizlikle, %96-97 lik geri çağırmaya sahiptir. Yüret ve Türe (2006) nin Learning Morphological Disambiguation Rules for Turkish adlı çalışması Türkçe metinlerin kural temelli bir biçimbirimsel belirginleştirme çalışmasıdır. Çalışma karar listelerini temel alan yeni bir yöntem kullanmaktadır. Karar listeleri, sıralanmış kural dizileridir. Her bir kural ise bir örüntü (pattern) ve bir sınıflandırmadan (classification) meydana gelmiştir. Bu kurallar, kural-temelli denetlemeli çalıştırma yöntemi (supervised learning) kullanan algoritma tarafından üretilmektedir. Algoritma, bir problemin çözümünde kullanılan işlemler dizisidir. Yeni karar listesi öğrenebilen bu algoritma ile 126 biçimbirimsel özelliğin her biri için farklı bir model eğitilmiş, elde edilen karar listeleriyle bir sözcüğün olası ayrıştırılmalarına olasılık değeri verilerek son işaretleme yapılmıştır. Çalışmada en iyi çözümü seçmek üzere her bir karar listesinin doğruluğu da hesaba katılarak sonuçlar olasılık temelinde birleştirilmiştir. Yüret & Türe (2006) modellerinin doğruluk oranını %96 olarak vermekte ve bu oranın kendilerinden önceki bildirilmiş en iyi doğruluk oranlarından biraz daha yüksek olduğunu ifade etmektedirler. Daybelge ve Çiçekli (2007) Türkçe için kural-temelli bir biçimbilimsel belirginleştirici geliştirmiştir. Geliştirdikleri biçimbirimsel belirginleştirici İngilizce ile Türkçe arasında örnektemelli makine-çeviri sisteminin bir parçası olarak kullanılmak üzere planlanmıştır. Bu kural-

2 temelli biçimbirimsel belirginleştiriciyi değerlendirmek üzere internet ortamından rastgele seçilmiş 15 makaleyi içeren bir test kümesi hazırlamışlardır. Farklı işlem basamakları sonucunda ulaştıkları duyarlık düzeyi % 81,2 ve geri çağırma oranıda % 98,5 olmuştur. Morphological Disambiguation of Turkish Text with Perceptron Algorithm adlı çalışmada Sak vd. (2007) ise Türkçe metinlerin biçimbilimsel işaretlemesini ve biçimbilimsel belirginleştirilmesini olasılık temelli Perceptron Algoritması kullanarak yapmıştır. Bu çalışmanın en önemli özelliği Türkçe metinlerin biçimbilimsel belirginleştirilmesi için perceptron algoritmasını uygulamasıdır. Perceptron terimi, insan beyninin tanıma ve ayırtetme yetilerini taklit etmeye çalışan modeller için kullanılmaktadır. Sak vd. (2007) ne göre biçimbilimsel belirginleştirme yapmak üzere eğitilmiş perceptron, temel modelin doğruluk derecesini % 93,61 den % 96,80 e yükseltmektedir. Perceptron un sözcük türü işaretleyicisi olarak eğitildiği durumda ise doğruluk oranı % 98,27 olarak bildirilmektedir. Elde edilen Türkçenin biçimbilimsel belirginleştirilmesi ve sözcük türü işaretlemesi sonuçlarının bugüne kadar bildirilen en iyi sonuçlar olduğu vurgulanmaktadır Biçimbirim Açımlamada Kullanılan Temel Kavramlar Biçimbirim açımlamada sıklıkla kullanılan temel kavramlar Belirsizlik (ambiguity), Belirginleştirme (disambiguation), Kural tabanlı belirginleştirme (rule-based disambiguation), Olasılığa dayalı belirginleştirme (probabilistic disambiguation) olarak sıralanabilir Belirsizlik Kullanılan temel kavramlardan ilki belirsizlik kavramıdır. Derlem açımlamada, belirsizliğin ortaya çıktığı durumlar, bir derlem metni içinde herhangi bir noktada iki ya da daha fazla işaretleme seçeneğinin bulunduğu durumlardır. Örneğin; sözcük türü işaretlemede, bazı sözcüklerin dilbilgisel ulamlarını belirlemek kolay değildir. Bazı durumlarda belirsizliği gidermek için ikili işaret (portmanteau tag) kullanılabilir. Sözcüğün içinde bulunduğu bağlamın incelenmesi de belirsizliği gidermede kullanılmaktadır (Baker vd., 2006) Belirginleştirme Belirginleştirme, derlem açımlamada, metnin verili bir noktasında, mümkün olan bir grup işaret arasından doğru açımlamanın seçilme işlemidir. Bu işlem elle veya otomatik olarak yapılabilir. Sözcük türü işaretlemeye yönelik pek çok yaklaşım belirginleştirme yapmaya odaklanmıştır. Belirginleştirme yapılırken, öncelikle, her bir örnekçeye, işaretleme sözlüğüne bakarak ya da bir biçimbilimsel çözümleyici kullanarak farklı bağlamlarda alabileceği bütün işaretler atanır. Belirginleştirme yazılımı doğru işareti seçmek için çoğunlukla bağlamı kullanır. Belirginleştirme; kural-tabanlı ya da olasılık temelli yaklaşımlarla, çoğu zaman da bunların karması olan melez yaklaşımlarla gerçekleştirilir (Baker vd., 2006) Kural tabanlı belirginleştirme Derlemdeki bir ögenin doğru işaretinin belirlenmesinde olasılıktan çok, kuralları kullanan bir işaretleme tekniğidir. Örneğin, ad ya da eylem olma ihtimali bulunan bir sözcükten hemen önce bir sıfat geliyorsa ya da bir eylem tarafından takip ediliyorsa, bu sözcüğün ad olarak işaretlenmesinin anlamlı olacağını söyler (Baker vd., 2006) Olasılığa dayalı belirginleştirme Olasılığa dayalı belirginleştirme, otomatik derlem açımlamada iki ya da daha fazla alternatif arasından doğru işareti seçmek amacıyla, doğru işaretlemenin ne olabileceğine ilişkin iyi bir

3 tahmin yapmak üzere geliştirilmiş; olasılık ya da istatistik hesaplarına dayanan bir dizi yönteme verilen addır. Olasılığa dayalı belirginleştirmede kullanılan bu istatistikler temelde sözcük sıklıklarıdır. İstatistikler, çoğunlukla işaretlenmemiş metinler üzerinde ileride bir çözümlemenin yapılabilmesi için, daha önceden açımlanmış derlemlerden türetilmektedirler (Baker vd., 2006). 2. AMAÇ Bu çalışmanın amacı Türkçe Ulusal Derlemi (TUDD) Oluşturma Projesi kapsamında oluşturulan, 5 milyon sözcüklük, biçimbirim açımlaması yapılmış bir alt derlem kullanarak; biçimbirim açımlamada ortaya çıkan belirsizlik türlerini sınıflandırmak, sınıflandırılan türlerin gözlenen sıklıklarını belirlemek ve belirsizlik türlerini ortadan kaldırabilecek kural tabanlı belirginleştirme örnekleri sunmaktır. 3. YAZILIM Türkçe Ulusal Dil Derlemi Projesi Biçimbirim Çalışmalarında Belirsizliklerin Sınıflandırılması ve Dağılımı adlı bu çalışma Silberztein (2003) tarafından ayrıntılandırılan NooJ uygulamasının Türkçe Eklentisi aracılığıyla yapılmıştır. Türkçe eklentisi, uygulamanın Türkçe için uyarlanmış sözlüklerini ve kural dosyalarını içermektedir. 4. VERİ Çalışma öncesinde yapılan pilot uygulama kapsamında TUDD Oluşturma Projesi veri tabanları kullanılarak hazırlanan 250 bin sözcüklük alt derlemden belirsizlik listeleri alınmıştır. Pilot çalışma sonucunda gözlemlenen yanlış işaretlemeleri içeren çizelgeler düzeltilmiş, yapay belirsizlikler kaldırılmış ve çalışmada kullanılacak 5 milyon sözcüklük derlem üzerinde çalışma tamamlanmıştır. Oluşturulan 5 milyon sözcüklük, yıllarında yayınlanmış metin örneklerinden oluşan alt derlem aşağıda belirtilen yayın türlerini ve sözcük sayılarını kapsamaktadır: Bilgilendirici Metin (1 milyon sözcük) Kurgusal Metin (1 milyon sözcük) Süreli Yayın (2 milyon sözcük) Yazılı / Basılmamış Metin ( sözcük) Sözlü Metin ( sözcük) 5. YÖNTEM Çalışmanın ilk aşamasını; 5 milyon sözcükten oluşan alt derlemin NooJ uygulamasının Türkçe Eklentisi ile işaretlenmesi oluşturmuştur. İşaretlenen alt derlemin belirsizlik listeleri yine aynı uygulama yardımıyla alınmış ve gözlenen sıklık değeri 100 den fazla olan belirsizlikler çalışma kapsamına alınmıştır. Gözlenen sıklık değeri 100 den fazla olan belirsizlik sınıfları aşağıda belirtilen başlıklar altında File Maker Pro 8.5 aracılığıyla sınıflandırılmıştır: Eşyazımlı başsözcükler et (V), et (N) Eşyazımlı ekler defter+in (p2s), defter+in (gen) Ekleme sonucu oluşan eşyazımlılıklar birlikte (AV), birlik+te(loc) Eşyazımlı ek-ek birleşimleri taşı+makta (cont), taşı+mak (nz1)+ta(loc) 6. BELİRSİZLİKLERİN SINIFLANDIRILMASI TUDD Oluşturma projesi kapsamında 5 milyon sözcüklük veri tabanı kullanılarak yapılan çalışmanın bu bölümünde ortaya çıkan belirsizlik türleri ve gözlenen sıklık değerleri belirtilecektir. NooJ Türkçe Eklentisi kullanılarak yapılan çalışma sonucunda eşyazımlı

4 başsözcükler, eşyazımlı ekler, ekleme sonucu ortaya çıkan eşyazımlılıklar ve eşyazımlı ek-ek birleşimleri olmak üzere 4 farklı belirsizlik türü ortaya çıkmıştır. Ortaya çıkan eşyazımlı başsözcüklere ait belirsizlik türlerinin İngilizce-Türkçe gösterimleri ve kısaltmaları Tablo 1 de ve eşyazımlı eklerle ilgili belirsizlik türlerine ait İngilizce-Türkçe gösterimler ve kısaltmalar ise Tablo 2 de yer almaktadır. Tablo 1 Eşyazımlı başsözcüklerin NooJ Türkçe Eklentisindeki İngilizce-Türkçe gösterimleri ve kısaltmaları İngilizce Noun Türkçe Ad Gösterim N Verb Eylem V Adjective Sıfat A Pronoun Adıl PN Adverb Belirteç AV Postposition İlgeç PP Determiner Belirleyici DT Tablo 2 Eşyazımlı eklerin NooJ Türkçe Eklentisindeki İngilizce-Türkçe gösterimleri ve kısaltmaları Biçimbirim Açıklama (Türkçe) Gösterim I Belirtme durumu acc In Tamlayan durumu gen Im Kişi Eki c1s m İyelik Eki p1s I(n) İyelik Eki p2s I İyelik Eki p3s mak Adlaştırıcı nz1 AcAk Adlaştırıcı pc1 A Yönelme Durumu dat da Kalma Durumu loc ile Araç Durumu ins DAn Çıkma Durumu abl Belirtecimsi AV0* r z Geniş Zaman aor DI Bitmişlik / Geçmiş past An Sıfatlaştırıcı pc3 DIr Koşaç cop In 2. çoğul Emir Kipi imp I Ara ses I bfi n Ara ses n bfn 6.1. Eşyazımlı Başsözcükler Çalışma sonucunda; eşyazımlı başsözcükler ulamında en sık belirsizlik oluşturan sözcük türleri; belirleyici (determiner) ve adıl (pronoun) olarak ortaya çıkmıştır. Eşyazımlı başsözcüklerle ilgili oluşan belirsizlik ulamında karşılaşılan belirsizliklerin gözlenen sıklık değeri tır. İkinci sırada; ad (N) - eylem (V) belirsizliği gelmektedir ve gözlenen sıklık değeri dir. Belirteç

5 (AV) ve belirleyici (DT) belirsizliği üçüncü sırada karşımıza çıkmış ve sıklık değerine sahiptir. Dördüncü sırada yer alan bir diğer belirsizlik türü ise sıfat(a) ve ad (N) belirsizliğidir. İlgili belirsizliğin gözlenen sıklık değeri dır. Eşyazımlı başsözcükler ulamında yer alan diğer belirsizlik türleri Şekil 1 de yer almaktadır. Şekil 1: Sözcük türlerine göre eşyazımlı başsözcükler Eşyazımlı başsözcükler ulamında 1. sırada yer alan belirleyici (DT) ve adıl (PN) belirsizliğine ait bağlam içi örnek (1) ve (2) de gösterilmektedir: (1) 1950 lerde liberal ekonomi anlayışının tekrar uygulanmaya konulması ile ilgili bir çaba sarfedilse de bu (PN) çok uzun sürmedi. (2) Maliye Bakanlığı bu (DT) konuda gerekli düzenlemeleri yapmaya yetkilidir. Eşyazımlı başsözcükler ulamında 2. sırada yer alan ad (N) ve eylem (V) belirsizliği ile ilgili belirsizliğin bağlam içi örneği ise (3) ve (4) te yer almaktadır: (3) İşte bunları duyunca ona yeniden yol göründü. Önce Marmaris, sonra Gökova Akyaka Köyü İzmir in kurtuluş günü 9 Eylül de oraya vardı (V). (4) Bu sefer aile üyeleri yerine sanatçı arkadaşları, Suna Yıldızoğlu, Çetin Alp, Perihan Sözen vardı (N) yanlarında Yukarıda adı geçen ve 4. sırada yer alan ad (N) ve sıfat (A) belirsizliğine ait bağlam içi örnekler (5) ve (6) daki gibidir: (5) Fonlar ın finansman dengesinin 1998 yılında 76 trilyon Türk lirası açık (N) vererek, GSMH ya oranının binde 1 düzeyinde olması beklenmektedir. (6) Birim hissesinin getirisi konusunda açık (A), şeffaf ve geniş katılım içeren usul ve esaslarla tamamen üniversitelerce yapılması öngörülmektedir Eşyazımlı Ekler Çalışmanın sonunda en sık karşılaşılan belirsizlik ulamı 3. tekil kişi iyelik eki (p3s) ve belirtme durum ekinde (acc) göze çarpmaktadır. İkinci sırada 2. tekil iyelik eki (p2s) ve 3. tekil kişi iyelik eki (p3s) belirsizliği gelmektedir. Bu bağlamda, eşyazımlı eklerin oluşturduğu belirsizlik türleri incelendiğinde Tablo 3 teki bulgulara erişilmiştir:

6 Tablo 3 Eşyazımlı eklerin oluşturduğu belirsizlik türleri ve sayıları 3. Tekil Kişi iyelik eki (p3s) belirtme durum eki (acc) Tekil Kişi iyelik eki (p2s) 3. Tekil Kişi iyelik eki (p3s) Tekil Kişi iyelik eki (p2s) Tamlayan durum eki (gen) Tekil Kişi iyelik eki (p2s) Ara ses n (bfn) Kişi eki (c1s) 1. Tekil Kişi iyelik eki (p1s) Bitmemişlik / sürerlilik eki (cont) - Adlaştırıcı (nz1) (-mak) Diğerleri Yukarıda adı geçen belirsizliklerden ilk sıradaki 3. tekil iyelik eki (p3s) ve belirtme durum ekinin (acc) oluşturduğu belirsizliğin bağlam içi örüntülerine aşağıdaki örnekler verilebilir: (7) Kimsenin işi (iş,n+ p3s (3. tekil iyelik eki) kimseyi ilgilendirmez. (8) İşi (iş,n+acc (belirtme durum eki) aldığımı biliyorum Ekleme Sonucu Oluşan Eşyazımlılıklar Ekleme sonucu oluşan eşyazımlılık ulamları incelendiğinde ise ilk üç sırada yer alan sözcüklerin yönelme durum eki (dat), 2. tekil kişi iyelik eki (p2s) ve 1. tekil kişi iyelik ekinin tek harfli morfemler ile çekimlenerek, 4. ve 5. sıradaki sözcüklerin ise kalma durum eki (loc) ve araç durum (ins) ekiyle çekimlenerek belirsizlik oluşturduğu söylenebilir. Şekil 3 ekleme sonucu oluşan eşyazımlılıkların dağılımını göstermektedir. Şekil 2: Ekleme sonucu oluşan eşyazımlılıkların belirsizlik türleri Ekleme sonucu oluşan belirsizlik türlerinden sıfatlaştırıcı (-An (pc3)) ekin sözcüğe eklendiğinde oluşturduğu belirsizlik türü aşağıdaki bağlam içi örnekte görünmektedir. (9) Birinci basamak sınavından (ÖSS) en az 120 puan alan (-An (pc3)) öğrenciler, ikinci basamak sınavı olarak bilinen Öğrenci Yerleştirme Sınavı'na (ÖYS) girmeye hak kazanmaktadırlar.

7 (10) Öğrenciler, çeşitli alan (Ad (N)) bilgisi testlerinden oluşan ikinci basamak sınavı sonuçlarına göre lisans düzeyindeki örgün öğretim programlarına (fakülteler ve 4 yıllık yüksekokullar) yerleştirilmektedir Eşyazımlı Ek-Ek Birleşimleri Son olarak; eşyazımlı ek-ek birleşimleri ulamları incelendiğinde ise belirtecimsi (AV08) ve adlaştırıcı+çıkma durum eki (nz2+abl) birleşimi saptanmıştır (Örneğin, bilmeden). Bu belirsizlik ulamının gözlenen sıklık değerinin toplamda 672, bitmemişlik/sürerlik eki ve adlaştırıcı+kalma durum eki+koşaç birleşiminin (Örneğin, taşımaktadır) gözlenen sıklık değerinin 330 olduğu çalışma sonunda ortaya çıkmıştır. Her iki belirsizlik türü toplamda olarak belirlenmiştir. Belirtecimsi (AV08) ve adlaştırıcı+çıkma durum ekinin (nz2+abl) oluşturduğu bağlam içi örnekler aşağıda yer almaktadır: (11) Batıdaki pek çok insan doğuyu, orada gerçekte ne olup bittiğini bilmeden (belirtecimsi (AV08)) ve anlamadan yargılıyor. (12) Biz Müslümanlar bu gerçekleri bilmeden (adlaştırıcı+çıkma durum eki (nz2+abl)) önce de iman edip misvağı kullandık. 6. BELİRGİNLEŞTİRME ÇALIŞMALARI Bu bölümde, yukarıda dizinlenen belirsizliklerin giderilmesi konusunda yararlanılan araçların kullanımına kısaca değinilecektir. Öncelikle eşyazımlı başsözcükler konusunda, elde edilen çoklu açımlamaların gözlenen sıklık değerleri arasında belirgin bir fark görüldüğünden (en, AV/N gibi) birden çok sözlük oluşturularak, işlemlemede öncelik sırası belirlemek uygun görünmektedir. Eşyazımlı ekler konusunda ise oluşturulan çizelgelerde belirleyici bağlam bulunmaması durumunda, sözdizimsel kural yazımına gidilmesi yolu benimsenmiştir. Kural yazımı Şekil 4 teki gibi çizelgelerle yapılmaktadır. Şekil 3. Örnek belirginleştirme çizelgesi

8 Yukarıdaki örnekte, öyle, böyle, şöyle sözcüklerinin belirteç ve belirleyici kullanımları arasındaki bağlam farklılığı gösterilerek, açımlamada söz konusu bağlamın gözetilmesi sağlanmaktadır. Yine aynı belirginleştirme, metinsel kural yazımı yoluyla (13) deki gibi gerçekleştirilebilmektedir. (13) A = (öyle böyle şöyle)/<av> (<V> <AJ>) ; B = (öyle böyle şöyle)/<dt> (<N> <PN>) ; NooJ v3 (Silberztein, 2003) te, belirsizliğin araştırmacı tarafından giderilmesi de mümkün olmaktadır. Böylece özellikle eğitici-derlem oluşturmada araştırmacılar tarafından kullanılabilir bir araç olmaktadır. 7. SONUÇ Bu çalışmada Doğal Dil İşleme çalışmaları için yararlı olabileceğini düşündüğümüz, Türkçedeki belirsizlik kaynaklarının bir dökümü sunulmuştur. Yine gözlenen sıklık değerlerine yer verilerek Türkçede odaklanılması gereken yapılar sunulmaya çalışılmıştır. Yapılan sınıflama kural-tabanlı belirsizlik giderme çalışmalarında kullanılabilecektir. Türkçe Ulusal Derlemi Oluşturma Projesi kapsamında yürütülen kural-tabanlı belirginleştirme çalışmalarında da bu bildiride ayrıntılandırılan bulgulardan yararlanılmıştır ve bu konudaki çalışmalar sürmektedir. Notlar Bu bildiri TÜBİTAK 108K242; BAP-FEF (SYA) A ve BAP-FEF İDE (MŞA) A no lu projeler kapsamında hazırlanmıştır. Katkılarından dolayı TÜBİTAK a ve Mersin Üniversitesi Bilimsel Araştırma Projeleri Birimine teşekkür ederiz. Kaynakça Baker, P. A. Hardie & T. McEnery A Glossary of Corpus Linguistics. Edinburgh University Press. Biber, D.,S. Conrad & V. Cortes If you look at Lexical Bundles in University Teaching and Textbooks. Applied Linguistics 25 (3), Daybelge, T. & İ. Çiçekli A Rule-Based Morphological Disambiguator for Turkish. Proceedings of Recent Advances in Natural Language Processing (RANLP 2007). Oflazer, K. & İ.Kuruöz Tagging and Morphological Disambiguation of Turkish Text. Proceedings of the 4th Applied Natural Language Processing Conference. Sak, H., T. Güngör & M. Saraçlar Morphological Disambiguation of Turkish Text with Perceptron Algorithm. Gelbukh, A. (Haz.), Proceedings of International Conference on Intelligent Text Processing and Computational Linguistics. Springer. Silberztein, M Nooj Manual. Erişim Tarihi: 13 Mayıs Tür, G Using Multiple Sources of Information for Constraint-Based Morphological Disambiguation. Yüksek Lisans Tezi. Bilkent Üniversitesi. Ankara. Yuret. D. & Türe, F Learning Morphological Disambiguation Rules for Turkish. Proceedings of HLT-NAACL 2006 Türkçe Ulusal Derlemi Oluşturma Projesi.

TS Corpus: Herkes için Türkçe Derlem

TS Corpus: Herkes için Türkçe Derlem TS Corpus: Herkes için Türkçe Derlem Taner Sezer Bengü Sever Sezer Mersin Ünivesitesi Çalışmanın Amacı Derlemdilbilim ülkemizde son dönemde oldukça ilgi görmeye başlamış bir alandır. Bu alanda çeşitli

Detaylı

Türkçedeki ilgi-iyelik yapılarında yapısal hazırlama* Gözde Bahadır ve Annette Hohenberger Orta Doğu Teknik Üniversitesi, Türkiye

Türkçedeki ilgi-iyelik yapılarında yapısal hazırlama* Gözde Bahadır ve Annette Hohenberger Orta Doğu Teknik Üniversitesi, Türkiye Türkçedeki ilgi-iyelik yapılarında yapısal hazırlama* Gözde Bahadır ve Annette Hohenberger Orta Doğu Teknik Üniversitesi, Türkiye 1. Giriş 1.1. Yapısal hazırlama Son dönemde psikodilbilim alanında pek

Detaylı

Eğitim Özel Derlemine Ait Söylem Çözümlemeleri. Discourse Analyses on a Special Corpus of Education

Eğitim Özel Derlemine Ait Söylem Çözümlemeleri. Discourse Analyses on a Special Corpus of Education Ahi Evran Üniversitesi Kırşehir Eğitim Fakültesi Dergisi (KEFAD) Cilt 13, Sayı 2, Ağustos 2012, Sayfa 205-230 Eğitim Özel Derlemine Ait Söylem Çözümlemeleri Serkan ÇELİK 1 ÖZ Derlem destekli söylem çözümleme

Detaylı

Yrd. Doç. Dr.Erdinç UZUN

Yrd. Doç. Dr.Erdinç UZUN T.C. NAMIK KEMAL ÜNİVERSİTESİ ÇORLU MÜHENDİSLİK FAKÜLTESİ WEB SAYFALARINDAN BİLGİ ÇIKARIMI: WEB SİTELERİNDEN BİLGİ ÇIKARIMI YAPAN BİR UYGULAMA ve CÜMLE SINIFLAMASI AKILLI BİLGİ ERİŞİMİ Kadriye EREN Mustafa

Detaylı

TÜRKÇE BİR SÖZLÜKTEKİ TANIMLARDAN KAVRAMLAR ARASINDAKİ ÜST-KAVRAM İLİŞKİLERİNİN ÇIKARILMASI

TÜRKÇE BİR SÖZLÜKTEKİ TANIMLARDAN KAVRAMLAR ARASINDAKİ ÜST-KAVRAM İLİŞKİLERİNİN ÇIKARILMASI Akademik Bilişim 2007 Dumlupınar Üniversitesi, Kütahya 31 Ocak-2 Şubat 2007,? -? TÜRKÇE BİR SÖZLÜKTEKİ TANIMLARDAN KAVRAMLAR ARASINDAKİ ÜST-KAVRAM İLİŞKİLERİNİN ÇIKARILMASI Onur Güngör*, Tunga Güngör*

Detaylı

T.C. BAHÇEŞEHİR ÜNİVERSİTESİ YÜKSEK LİSANS PROGRAMLARI TEZ YAZMA KILAVUZU

T.C. BAHÇEŞEHİR ÜNİVERSİTESİ YÜKSEK LİSANS PROGRAMLARI TEZ YAZMA KILAVUZU T.C. BAHÇEŞEHİR ÜNİVERSİTESİ YÜKSEK LİSANS PROGRAMLARI TEZ YAZMA KILAVUZU Nisan, 2007 İÇİNDEKİLER 1. GİRİŞ VE ÖN BİLGİLER... 2 1.1 TEZ HAZIRLAMA... 3 1.1.1 Tez Önerisi Hazırlama... 3 1.1.2 Tez Araştırmasının

Detaylı

VERİ MADENCİLİĞİNDE KARAR AĞACI ALGORİTMALARI İLE BİLGİSAYAR VE İNTERNET GÜVENLİĞİ ÜZERİNE BİR UYGULAMA

VERİ MADENCİLİĞİNDE KARAR AĞACI ALGORİTMALARI İLE BİLGİSAYAR VE İNTERNET GÜVENLİĞİ ÜZERİNE BİR UYGULAMA Endüstri Mühendisliði Dergisi Cilt: 5 Sayý: 3-4 Sayfa: (-19) Makale VERİ MADENCİLİĞİNDE KARAR AĞACI ALGORİTMALARI İLE BİLGİSAYAR VE İNTERNET GÜVENLİĞİ ÜZERİNE BİR UYGULAMA Aslı ÇALIŞ, Sema KAYAPINAR*,

Detaylı

Türkiye de E-Okul Yönetim Bilgi Sisteminin İlköğretim Okulu Müdür Yardımcılarının Görüşlerine Göre Değerlendirilmesi 1

Türkiye de E-Okul Yönetim Bilgi Sisteminin İlköğretim Okulu Müdür Yardımcılarının Görüşlerine Göre Değerlendirilmesi 1 Türkiye de E-Okul Yönetim Bilgi Sisteminin İlköğretim Okulu Müdür Yardımcılarının Görüşlerine Göre Değerlendirilmesi 1 Çetin ERDOĞAN 2, İnayet AYDIN 3, Uğur AKIN 4 & Nihan DEMİRKASIMOĞLU 5 ÖZET Bu araştırmanın

Detaylı

T.C. FIRAT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ METEOROLOJİK VERİLERİN VERİ MADENCİLİĞİ İLE DEĞERLENDİRİLMESİ Ömer Osman DURSUN Tez Yöneticisi: Prof. Dr. Asaf VAROL YÜKSEK LİSANS TEZİ ELEKTRONİK - BİLGİSAYAR

Detaylı

TESE (AESS) - Avrupa Eğitim Sistemleri Sözlüğü

TESE (AESS) - Avrupa Eğitim Sistemleri Sözlüğü TESE (AESS) - Avrupa Eğitim Sistemleri Sözlüğü Türkçe Versiyon 2009 Basımı European commission AESS SUNUMU İÇİNDEKİLER SUNUŞ... 3 AESS nin TANIMI... 5 1. Kapsam ve amaç... 5 2. Sözcük denetimi... 5 2.1.

Detaylı

DİL BİLGİSİ ÖĞRETİMİNDE YENİ YAKLAŞIMLAR

DİL BİLGİSİ ÖĞRETİMİNDE YENİ YAKLAŞIMLAR DİL BİLGİSİ ÖĞRETİMİNDE YENİ YAKLAŞIMLAR Prof. Dr. Firdevs GÜNEŞ Bartın Üniversitesi, Eğitim Fakültesi, İlköğretim Bölümü Firdevs.gunes@gmail.com Özet Dil eğitiminin önemli bir anahtarı olan dil bilgisi,

Detaylı

The Relationship Between The Structure And Socio-Culturel Crime Case: The Case Of Malatya

The Relationship Between The Structure And Socio-Culturel Crime Case: The Case Of Malatya KMÜ Sosyal ve Ekonomịk Araştırmalar Dergịsi 16 (Özel Sayı I): 181-188, 2014 ISSN: 2147-7833, www.kmu.edu.tr Türkçe Çevirimiçi Derlemler Üzerine Serdar Karaoğlu Afyon Kocatepe Üniversitesi, Fen-Edebiyat

Detaylı

ANADOLU ÜNİVERSİTESİ AÇIKÖĞRETİM FAKÜLTESİ İLE İLGİLİ OLARAK YAPILAN ÇALIŞMALAR KAYNAKÇASI

ANADOLU ÜNİVERSİTESİ AÇIKÖĞRETİM FAKÜLTESİ İLE İLGİLİ OLARAK YAPILAN ÇALIŞMALAR KAYNAKÇASI AÖF ün 25. YILINDA ANADOLU ÜNİVERSİTESİ AÇIKÖĞRETİM FAKÜLTESİ İLE İLGİLİ OLARAK YAPILAN ÇALIŞMALAR KAYNAKÇASI 1982-2007 (Genişletilmiş ve Gözden Geçirilmiş Beşinci Baskı) Derleyenler Uğur DEMİRAY Özden

Detaylı

WEB TABANLI UZAKTAN EĞİTİM SİSTEMLERİNİN ÖĞRENCİ BAŞARISINA VE BİLGİSAYARA YÖNELİK TUTUMLARINA ETKİSİ *

WEB TABANLI UZAKTAN EĞİTİM SİSTEMLERİNİN ÖĞRENCİ BAŞARISINA VE BİLGİSAYARA YÖNELİK TUTUMLARINA ETKİSİ * ELEKTRONİK EĞİTİM BİLİMLERİ DERGİSİ ELECTRONIC JOURNAL OF EDUCATION SCIENCES Yıl:2012 Cilt 1 Sayı 2 Year:2012 Volume 1 Issue 1 (058-067) WEB TABANLI UZAKTAN EĞİTİM SİSTEMLERİNİN ÖĞRENCİ BAŞARISINA VE BİLGİSAYARA

Detaylı

UYSAL KAVRAMSAL VE YAPISAL DÜZEYDE ÖĞRENME STİLLERİNE UYARLANAN BİLGİSAYAR DESTEKLİ ALIŞTIRMALARIN AKADEMİK BAŞARIYA ETKİSİ. Murat Paşa UYSAL 1 ÖZET

UYSAL KAVRAMSAL VE YAPISAL DÜZEYDE ÖĞRENME STİLLERİNE UYARLANAN BİLGİSAYAR DESTEKLİ ALIŞTIRMALARIN AKADEMİK BAŞARIYA ETKİSİ. Murat Paşa UYSAL 1 ÖZET KAVRAMSAL VE YAPISAL DÜZEYDE ÖĞRENME STİLLERİNE UYARLANAN BİLGİSAYAR DESTEKLİ ALIŞTIRMALARIN AKADEMİK BAŞARIYA ETKİSİ Murat Paşa UYSAL 1 ÖZET Bu çalışma, bilgi nesnesi tabanlı ve öğrenme stillerine uyarlanabilen

Detaylı

Preparation of a Web-Based Teaching Material Designed for Science Education and Evaluation of This Material According to Teachers and Students Views

Preparation of a Web-Based Teaching Material Designed for Science Education and Evaluation of This Material According to Teachers and Students Views Ahi Evran Üniversitesi Eğitim Fakültesi Dergisi, Cilt 12, Sayı 2, Haziran 2011 Özel Sayı, Sayfa 175-202 Fen Eğitimine Yönelik Örnek Bir Web Tabanlı Öğretim Materyalinin Hazırlanması ve Bu Materyalin Öğretmen

Detaylı

İZMİR BÖLGESEL AR-GE VE YENİLİK KAPASİTESİ ANALİZİ

İZMİR BÖLGESEL AR-GE VE YENİLİK KAPASİTESİ ANALİZİ İZMİR BÖLGESEL AR-GE VE YENİLİK KAPASİTESİ ANALİZİ İZMİR BÖLGESEL AR-GE VE YENİLİK KAPASİTESİ ANALİZİ HAZIRLAYAN EBİLTEM Ege Üniversitesi, Bilim ve Teknoloji İZKA İzmir Kalkınma Ajansı Uygulama ve Araştırma

Detaylı

YÜKSEK LİSANS TEZİ Mehmet BOZUYLA

YÜKSEK LİSANS TEZİ Mehmet BOZUYLA PAMUKKALE ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BİLGİSAYAR YARDIMI İLE KİTAP SONU İNDEKSİ HAZIRLANMASI YÜKSEK LİSANS TEZİ Mehmet BOZUYLA Anabilim Dalı : Bilgisayar Mühendisliği Programı : Bilgisayar Mühendisliği

Detaylı

Bilgisayar Destekli Türkçe Tabanlı Medya İçerik Çözümleme Sistemi 107K209 Projesi: Bir Olgu İncelemesi*

Bilgisayar Destekli Türkçe Tabanlı Medya İçerik Çözümleme Sistemi 107K209 Projesi: Bir Olgu İncelemesi* Bilgisayar Destekli Türkçe Tabanlı Medya İçerik Çözümleme Sistemi 107K209 Projesi: Bir Olgu İncelemesi* Computer Assisted Turkish Based Media Content Analysis System - Project 107K209: A Case Study Öz

Detaylı

VERİ MADENCİLİĞİ VE ANADOLU ÜNİVERSİTESİ AÇIKÖĞRETİM SİSTEMİNDE BİR UYGULAMA

VERİ MADENCİLİĞİ VE ANADOLU ÜNİVERSİTESİ AÇIKÖĞRETİM SİSTEMİNDE BİR UYGULAMA VERİ MADENCİLİĞİ VE ANADOLU ÜNİVERSİTESİ AÇIKÖĞRETİM SİSTEMİNDE BİR UYGULAMA Yard. Doç. Dr. Sinan Aydın Anadolu Üniversitesi snaydin@anadolu.edu.tr Prof. Dr. Ali Ekrem Özkul Anadolu Üniversitesi aeozkul@anadolu.edu.tr

Detaylı

İSTANBUL TEKNİK ÜNİVERSİTESİ FEN EDEBİYAT FAKÜLTESİ ORACLE DATA MINER İLE ÖĞRENCİ KAYITLARI ÜZERİNE BİR VERİ MADENCİLİĞİ UYGULAMASI

İSTANBUL TEKNİK ÜNİVERSİTESİ FEN EDEBİYAT FAKÜLTESİ ORACLE DATA MINER İLE ÖĞRENCİ KAYITLARI ÜZERİNE BİR VERİ MADENCİLİĞİ UYGULAMASI İSTANBUL TEKNİK ÜNİVERSİTESİ FEN EDEBİYAT FAKÜLTESİ ORACLE DATA MINER İLE ÖĞRENCİ KAYITLARI ÜZERİNE BİR VERİ MADENCİLİĞİ UYGULAMASI BİTİRME ÖDEVİ Ceyda DURMAZ Murat KOCAMIŞ Anabilim Dalı: MÜHENDİSLİK BİLİMLERİ

Detaylı

Sınıf Öğretmeni Adaylarının Kullandıkları Sayı Duyusu Stratejilerinin Belirlenmesi

Sınıf Öğretmeni Adaylarının Kullandıkları Sayı Duyusu Stratejilerinin Belirlenmesi Kuram ve Uygulamada Eğitim Bilimleri Educational Sciences: Theory & Practice - 13(3) 1951-1974 2013 Eğitim Danışmanlığı ve Araştırmaları İletişim Hizmetleri Tic. Ltd. Şti. www.edam.com.tr/kuyeb DOI: 10.12738/estp.2013.3.1365

Detaylı

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Burak GÜHER İKİNCİ EL TRAKTÖR SATINALMA BEDELLERİNİN DEĞERLENDİRİLMESİ VE VERİ TABANI OLUŞTURULMASI İÇİN İNTERNET TABANLI BİR YAZILIMIN

Detaylı

Tek Değişkenli Fonksiyonların İki Değişkenli Fonksiyonlara Genellenmesi, Fonksiyon Makinesi ve APOS

Tek Değişkenli Fonksiyonların İki Değişkenli Fonksiyonlara Genellenmesi, Fonksiyon Makinesi ve APOS Kuram ve Uygulamada Eğitim Bilimleri Educational Sciences: Theory & Practice - 11(1) Kış/Winter 465-499 2011 Eğitim Danışmanlığı ve Araştırmaları İletişim Hizmetleri Tic. Ltd. Şti. Tek Değişkenli Fonksiyonların

Detaylı

Firma Derecelendirme Çalışmaları Konusunda Çok Değişkenli İstatistiksel Analize Dayalı Karar Destek Sistemlerinin Kullanımı

Firma Derecelendirme Çalışmaları Konusunda Çok Değişkenli İstatistiksel Analize Dayalı Karar Destek Sistemlerinin Kullanımı Bankacılar Dergisi, Sayı 54, 2005 Firma Derecelendirme Çalışmaları Konusunda Çok Değişkenli İstatistiksel Analize Dayalı Karar Destek Sistemlerinin Kullanımı Hüseyin Tatlıdil 1, Murat Özel 2 1. Giriş Kredi

Detaylı

TIP VE SAĞLIK BİLİMLERİ ALANINDA TÜRKİYE'DE YAYINLANAN AKADEMİK SÜRELİ YAYINLARDA NİTELİĞİ ETKİLEYEN NEDENLER VE KALİTEYİ YÜKSELTME

TIP VE SAĞLIK BİLİMLERİ ALANINDA TÜRKİYE'DE YAYINLANAN AKADEMİK SÜRELİ YAYINLARDA NİTELİĞİ ETKİLEYEN NEDENLER VE KALİTEYİ YÜKSELTME T.C. ANKARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ BİLGİ VE BELGE YÖNETİMİ BÖLÜMÜ ANABİLİM DALI TIP VE SAĞLIK BİLİMLERİ ALANINDA TÜRKİYE'DE YAYINLANAN AKADEMİK SÜRELİ YAYINLARDA NİTELİĞİ ETKİLEYEN NEDENLER

Detaylı

Editör Ali Güneş. Uygulamalı Örneklerle

Editör Ali Güneş. Uygulamalı Örneklerle Editör Ali Güneş BİLGİSAYAR I - II (TEMEL BİLGİSAYAR BECERİLERİ) Uygulamalı Örneklerle Bilişim Teknolojileri Temel Kavramları, Genel Olarak İşletim Sistemleri ve Bilgisayar Kullanımı, Kelime İşlemci, Elektronik

Detaylı

İLKOKUMA YAZMA ÖĞRETİMİNDE ÇOKLU ORTAM UYGULAMALARININ OKUMA BECERİSİ ÜZERİNDE ETKİLİLİĞİ

İLKOKUMA YAZMA ÖĞRETİMİNDE ÇOKLU ORTAM UYGULAMALARININ OKUMA BECERİSİ ÜZERİNDE ETKİLİLİĞİ Abant İzzet Baysal Üniversitesi Sosyal Bilimler Enstitüsü Dergisi Journal of Social Sciences Cilt / Volume: 2010-1 Sayı / Issue: 20 İLKOKUMA YAZMA ÖĞRETİMİNDE ÇOKLU ORTAM UYGULAMALARININ OKUMA BECERİSİ

Detaylı

VERİ MADENCİLİĞİ VE TÜRKİYE DEKİ UYGULAMA ÖRNEKLERİ

VERİ MADENCİLİĞİ VE TÜRKİYE DEKİ UYGULAMA ÖRNEKLERİ İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi Yıl:11 Sayı: 21 Bahar 2012 s. 1-23 VERİ MADENCİLİĞİ VE TÜRKİYE DEKİ UYGULAMA ÖRNEKLERİ Serkan SAVAŞ 1, Nurettin TOPALOĞLU 2, Mithat YILMAZ 3 Geliş: 11.01.2012

Detaylı

EXAMINATION OF VOCABULARY ELEMENTS IN TEXTBOOKS FOR TEACHING TURKISH TO FOREIGNERS

EXAMINATION OF VOCABULARY ELEMENTS IN TEXTBOOKS FOR TEACHING TURKISH TO FOREIGNERS ISSN: 2342-0251 Volume 2/4 Winter 2014 p. 247/265 EXAMINATION OF VOCABULARY ELEMENTS IN TEXTBOOKS FOR TEACHING TURKISH TO FOREIGNERS Yabancılara Türkçe Öğretimi Ders Kitaplarında Söz Varlığı Unsurlarının

Detaylı