Kavram Çıkarma Çalışmalarında Terim Benzerliklerinin Bulunması

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Kavram Çıkarma Çalışmalarında Terim Benzerliklerinin Bulunması"

Transkript

1 Kavram Çıkarma Çalışmalarında Terim Benzerliklerinin Bulunması Kerime BALKAN Türkiye Bilimsel ve Teknolojik Araştırma Kurumu, Kocaeli, Türkiye Hidayet TAKÇI Gebze Yüksek Teknoloji Enstitüsü, Kocaeli, Türkiye Özet: Kavram çıkarma; bir veri madenciliği uygulaması olan kavram madenciliğinin bir alt alanıdır. Kavram çıkarma çalışması; karmaşıklığı oldukça yüksek, terim tabanlı metin madenciliği çalışmalarının performansını artırmayı vaat etmektedir. Kavram çıkarmanın ilk aşaması dokümanları temsil edecek belli sıklıktaki terimlerin belirlenmesidir. Daha sonra bu terimler gruplanarak kavramlaşma yolunda önemli bir işlev yerine getirilecektir. Terimlerden kavramlara geçiş; terimlerin, benzerliklerine göre kümelenmesi ve bu kümelerin uzman tarafından etiketlenmesi ile yapılabilecek bir çalışmadır. Bu aşamanın başarısı, veri setinin kalitesi ve seçilecek yöntemler ile yakından ilgilidir. Bu çalışmada kavram çıkarmanın bir aşaması olan terim benzerliklerine dayalı kümelemede kullanılan üç yöntem incelenmiş ve en başarılı yöntem bulunmaya çalışılmıştır. Çalışma Türkçe dili üzerinde yerine getirilmiştir. Anahtar Kelimeler : Metin madenciliği, Kavram çıkarma, Terim benzerliği Abstract: The concept extraction is a sub-area of the concept mining which is a data mining application. Concept extraction work, promises to improve the performance of the term-based text mining work which complexity is very high. The first phase of the concept extraction is to detect the terms have notable frequency to represent the documents.after an important function on the way conception will be implemented with grouping these terms. Transition from terms to concepts; by clustering the terms according to similarities in terms, and then by labeling these clusters with an expert. The parameters of clustering algorithm and the quality of the data set will affect the success of this process. In this study, the three methods for term similarity are examined and the the most successful one is tried to find. Study is performed on Turkish language. Keywords : Text mining, Concept Extraction, Term similarity 1. Giriş Metin madenciliği çalışmalarına her geçen gün artan ihtiyacın karşısında çok ciddi bir problem vardır, o da performans. Bir metnin terimlere dayalı olarak işlenmesi, metinden anlamlar çıkarılması, metnin sınıflandırılması gibi işlemler binlerce terim kullanılarak yapıldığında ciddi performans sorunları meydana gelmektedir. Performansı artırmak amacıyla özellik seçimi gibi yöntemler sıklıkla kullanılmıştır. Bu problemin bir çözümü de terimlerin kavramlara dönüştürülmesi ve ardından kavram seviyesinde metin madenciği yapılmasıdır. Çalışmamız, terimlerden kavramlara geçişin nasıl olabileceği ve bu geçiş sırasında kullanılabilecek algoritmaların karşılaştırması üzerine bir çalışmadır. Konunun anlaşılabilmesi için kavram çıkarmanın da içinde yer aldığı kavram madenciliği bilinmelidir. Kavram madenciliğinin amacı bilgisayarın hızı ve doğruluğunu insanın anlama yöntemiyle birleştirip teknoloji üretmektir. Kavram madenciliği metnin altındaki anlamla ilgilenir. Kullandığımız her kelime birden çok anlama sahip olabilir, ve anlamdaki muğlaklığı ortadan kaldırmak için kavramı kullanırız [9]. Kavram madenciliği dört aşama ile yapılır [7]. Sözdizimsel Analiz : Verilen dil bilgisi kurallarına göre kelimelerden oluşan bir metni analiz edebilmek için parçalamayı sağlar. Anlamsal Analiz : Büyük doküman kümelerinden kavramları ifade edecek yapıları belirlemeyi sağlar. Genellikle dokümanlar için daha önceden belirlenmiş anlamsal bilgileri kullanmaz. İlişkilerin belirlenmesi : Anlamsal analiz ile elde edilen kavramların birbirleriyle ilişkilerini belirlemeyi sağlar. Bu aşamada kavram haritası madenciliği kullanılır. Tasnif : Elde edilen kavramlar ve bu kavramlar arasındaki ilişkiler kullanılarak dokümanların dizinlenmesini ve sınıflandırılmasını sağlar. Bu dört aşamanın sonunda sunulan başarılı değerlendirme sonuçları, sistemin kavramları ve ilişkileri öğrendiğini gösterir ve bu kavramlar dokümanları dizinlemede kullanılabilirler [7]. Çalışmamız, kavram madenciliği aşamalarından ilk ikisi olan sözdizimsel analiz ve anlamsal analiz adımlarını kapsamaktadır. Çalışmamızın sözdizimsel analiz aşamasında dokümanlardaki kelimeler ayrıştırılacak ve belli sıklıktaki olanları seçilecektir. Sözdizimsel analiz aslında bir tür veri önişleme adımıdır. Anlamsal analiz aşamasında ise terim benzerliği yöntemleri araştırılarak, en iyi terim benzerliği yöntemi ile terimlerden kavramlara geçişe yardımcı olunacaktır. Makine öğrenmesi algoritmaları ile dokümanlar üzerinde sınıflandırma veya kümeleme yapılmadan evvel dokümanlarda

2 yer alan terimleri kavramlar şeklinde belirlenerek yapısal olarak düzenlenmesi performansı artıracaktır. Kavramlar dokümanın konusunun ne olduğu hakkında bilgi veren doğal dildeki kelimeler ya da kelime öbekleridir, dokümanlarda bire bir olarak geçebilir veya başka kelimeler ile anlatılabilir [2]. Bir kavramın birden çok terim ile anlatıldığı durumda, hangi terimlerin hangi kavrama denk geldiğini bulma anlamsal analizin konusudur. Anlamsal analiz, dokümanlarda kullanılan terimlerin kavramı belirtecek şekilde kümelenmesini gerekmektedir. Kümeleme işlemi ise terim benzerliklerine dayalı olarak yerine getirilecektir. Çünkü genellikle, benzer içeriğe sahip terimler kavramları oluştururlar ve benzer terimler dokümanlarda daha sık birlikte yer alırlar. Bu yüzden, dokümanlardan çıkarılan terimlerin benzerliklerine dayalı olarak kümelenmesi terimlerden kavramlara geçişte önemli bir adımdır. Dolayısıyla en iyi kümelenmeyi verecek terim benzerliği yönteminin tespit edilmesi çalışmanın başarısı açısından elzemdir. Terim benzerliklerine dayalı olarak kümeleme için üç algoritma tercih edilmiştir. Bunlardan ilki LSA yöntemidir. LSA tabanlı yöntem, terimler arasındaki anlamsal benzerliği ortaya çıkarma yeteneğinden dolayı terim benzerlikleri için kullanılabilir bir yöntemdir [10]. Diğeri EMIM tabanlı benzerlik hesaplama yöntemidir [1]. EMIM tabanlı yöntem kullanılırken brute force hesaplamalar yapıldığı için, büyük dokümanlarda daha verimli çalışacak şekilde algoritmanın gelişmiş hali Sezgisel Quadtree (Quadtree Heuristic) de kullanılabilir. Ancak Sezgisel Quadtree yöntemi kısa dokümanlar için zahmetli olduğundan dolayı bu çalışmada bu yöntemle ilgilenilmemiştir. Bu arada; kavramlar arasındaki ilişkileri otomatik olarak elde etmeyi planlayan Kavram Haritası madenciliği (Concept Map Mining) aşamalarından birisi de kavram çıkarmadır. Diğer aşamalar ise İlişki Çıkarma ve Topoloji Çıkarmadır [10]. Kavram çıkarma kendi içinde; kavramların tanımlanması ve önemli kavramların dokümanlardan seçilmesi olarak 2 parçaya ayrılabilir. Önemli kavramların dokümanlardan seçilmesi işlemi, yani özetleme Gizli Anlamsal Analiz (LSA) tekniği ile yapılabilir [10]. Özetleme ayrıca uygunluk ölçütü (Relevant Measure) kullanılarak da yapılabilir [4]. Uygunluk ölçütü yöntemi dokümanı tekil cümlelere bölerek her cümlenin tüm doküman üzerindeki uygunluk ölçütünü hesaplayıp, uygunluk skoru en yüksek olanı kavram olarak ayırmak amacındadır. Çalışmanın planı şu şekildedir. İkinci bölümde kavram çıkarma aşamasının ilk adımı olan belli sıklıktaki terimlerin seçilmesi yöntemi anlatılacak, bölüm 3 de kavram çıkarma işinde kullanılabilecek terim benzerliği yöntemleri verilecek ve dördüncü bölümde yöntemler karşılaştırıldıktan sonra sonuç ve gelecek çalışmalar beşinci bölümde sunulacaktır. 2. Terim Seçimi İşlem yükünü azaltmak için belirli bir sıklığın altındaki terimlerin eliminasyonu uygun olacaktır. Veri madenciliğinde belli sıklıktaki öğelerin diğerleri arasından seçilmesi genel olarak birliktelik kuralları analizi ve minsup eşiği ile yapılmaktadır. Ancak bu çalışmada terim seçimi için Gizli Anlam Analizi (LSA Latent Semantic Analysis) yöntemi kullanılacaktır. Bu yöntemin seçilmesinin amacı, kavram fikrine daha yakın bir terim seçme yöntemi olmasıdır. LSA yöntemi ile birliktelik kuralları ile fark edilemeyen bağlantılar da gözlemlenebilecektir. Ayrıca daha hızlı ve verimli sonuçlar elde edilecektir. Terim seçimi yaparken ilk seçim terim türü bazında yapılmış ve bütün terimler yerine, isim kökenli terimler seçilmiştir. Bu işlemi gerçekleştirmedeki varsayımımız kavramların isim kökenli kelimelerde gizli olduğudur. Bir terimin türünü belirleme konusunda açık kaynak kodlu zemberek ( kütüphanesinden faydalanılmıştır. Veri setinde yer alan dokümanların, isim türündeki sözcükleri ile bir sözlük oluşturularak, bu sözlük yardımıyla önce terim uzayı ardından da doküman terim matrisi elde edilmiştir. Terim1 Terim2 Terimj Terimm Dok 1 A11 A12 A1j A1m Dok 2 A21 A22 A2j A2m Dok i Ai1 Ai2 Aij Aim Dok n An1 An2 Anj Anm Tablo 1: Doküman terim matrisi (A) Sözlük oluşturulurken isim türündeki sözcüklerin sadece kökleri kullanılmıştır. Frekans hesabı da sözcüğün kök hali ile yapılmıştır. Bu durumda; ağaçlar, ağacı, ağaçta, ağaçtaki, ağacın, ağaçlarımız gibi sözcükler sadece ağaç sözcüğü ile ilişkilendirilmiş ve hepsi ağaç teriminin frekansı olarak hesap edilmiştir. Amaç kavram olacak sözcükleri elde etmek olduğundan sözcüklerin çekim eklerinin atılması sonuca etki etmeyecektir. Ancak sözcüğün gövdesini değiştiren yapım ekleri atılmamalıdır. Örneğin kitap ve kitaplık farklı kavramları ifade edebilirler. Doküman terim matrisindeki her A(i,j) hücresinde j.nci terimin i.nci dokümandaki geçme sıklığı (frekansı) bulunmaktadır. Geçme sıklığının hesabında kullanılan formül: A(i,j)=( j.nci terimin i.nci dokümandaki geçme sayısı) / (i.nci dokümandaki toplam sözcük sayısı) Gizli Anlam Analizi yönteminin 2. Aşamasında; doküman terim matrisi (A), U ve V ortagonal vektörleri ve S özvektörüne ayrıştırılır. Elde edilecek ortagonal vektörlerden U dokümanlar arasındaki korelasyonu ifade ederken V matrisi terimler arasındaki korelasyonu verir. Ayrıştırma işlemi için Tekil Değer Ayrıştırması (SVD - Singular Value Decomposition) kullanılır. Bu ayrıştırmanın sonunda; elimizde artık üç adet vektör bulunmaktadır. A= U * S * V T (1) Elde edilen S matrisi bir özvektördür, U ve V matrisleri ise ortogonal vektörlerdir. S matrisi ayrımın özdeğerlerini tutar, ve büyükten küçüğe doğru sıralıdır. Dolayısı ile eğer S matrisinin ilk değeri ile işlem yaparsak vektörler arasındaki ayrımın maksimuma ulaştığını görürüz. Belli sıklıktaki terimleri seçmek için S matrisinin en büyük değerleri ile işlem yapmalıyız. Bu arada önemli bir konu; veri setinde yer alan dokümanların

3 yapısına bağlı olarak seçilecek terim sayısının belirlenmesidir. İlk aşamada 25 terim seçilmesi hedeflenmiş ve S matrisindeki ilk 25 değer kullanılmıştır. Bu aşamadan sonra artık her dokümanı 25 terim ile temsil edilecektir. Dolayısıyla terim seçme işlemi ardından her dokümanı temsil edecek 25 adet terim bulunmuştur. Bu aşamada dokümanlar için elde edilen terim kümeleri, dokümanlar hakkında bilgi vermekten uzaktır. Halbuki bu terimlerin anlamsal yakınlıklarına göre kavramlar şeklinde ifade edilmesi lazımdır. Bu sebeple her dokümanı tanıtıcı terimler kullanılarak bunlar arasındaki benzerlikler bulunacak ve birbirine benzer terimlerin gruplarından kavramlara ulaşılacaktır. Bu aşamada kullanılacak terim benzerliği yöntemi performansı etkileyecektir. 2. Terim Benzerliği Yöntemleri Çalışmamızda terim benzerliği yöntemi olarak LSA tabanlı yöntem, EMIM algoritması ve k-means kullanılacaktır LSA Tabanlı yöntem Bu yöntem dokümanlardan oluşturulan doküman terim matrisinin SVD yöntemi ile parçalanması sonucu elde edilen U matrisi üzerinde, öklid uzaklık yöntemi ile benzerlikleri bulmayı amaçlar. Bazı kaynaklarda [10] LSA matrisinin bu amaçla kullanılabileceği söylense de bu konuda yapılmış bir çalışma bulunmamaktadır. Terimlerin ilk seçiminde de bu yaklaşım kullanıldığından dolayı, bu yaklaşımı terim benzerliği yöntemimiz olarak sunulmuştur. Terimler bu uzaklık değerlerine göre, kümeleneceklerdir. Kümeleme işleminde kaç adet küme olacağı seçimi uzmana bırakılmıştır. Terim_LSA_Matris = SIK_TERIMLER_ICIN _LSA_MATRISI_AL(Ana_LSA_Matris, Terimler) Her terim_bir : Terimler için Her terim_iki : Terimler için Benzerlik[terim1,terim2] = ÖKLİD_HESAPLA (Terim_LSA_Matris[terim_bir], Terim_LSA_Matris[terim_iki]) ÇIKTI(Benzerlik) Tablo 2: LSA Benzerlik Hesaplama sözde kodu 2.2. kmeans Kümeleme yöntemi kmeans veri madenciliği ve istatistik alanlarında en çok kullanılan kümeleme algoritmalarından biridir. [3 ; 5].Yöntemin uygulaması basittir ve büyük veri setlerinde başarılıdır. Çalışmalarda görülmüştür ki özellikle metin kümelemede kmeans iyi sonuçlar vermektedir [6]. kmeans algoritması, veri setini k adet kümeye ayırır. Bunun için öncelikle rastgele k adet küme merkezi belirlenir. Veri setindeki her bir elemanın küme merkezine uzaklığı öklid yöntemi ile hesaplandıktan sonra veri hangi küme merkezine daha yakınsa veri o kümeyle eşleştirilir. Bu işlemleri kümeler stabil hale gelene kadar devam eder. k = AL(k degeri) Veriseti = AL (veriseti) Veri_Kümeleri = VERI_KUMELERINI_ILKLE(veriseti) Kume_merkezleri=RASTGELE_KUME_MERKEZLERI_ATA(k) değişim=doğru değişim= doğru olduğu sürece devam et değişim=yanlış Her veri : Veriseti için Her küme_merkezi : Küme_merkezleri için Uzaklık[küme_merkezi] = ÖKLID_HESAPLA(veri,küme_merkezi) En_yakin_Küme = EN_YAKIN_KUMEYI_AL(Uzaklık) Eğer Veri_Kümeleri[veri]!=En_yakin_Küme değişim=doğru Veri_Kümeleri[veri] = En_yakin_Küme ÇIKTI(Veri_Kümeleri) Tablo 3: kmeans kümeleme yöntemi sözde kodu Terim benzerliği için diğer kümeleme algoritmalarının yerine kmeans seçilmesinin önemli bir sebebi vardır o da veriye uygunluk. Çalıştığımız verinin nitelikleri sürekli değerlerden oluştuğu için kmeans algoritması seçilmiştir. kmeans yöntemini kullanmak için terim sıklıklarına göre doküman terim matrisi elde edilmeli; ve bu matris kmeans için eğitim veri seti olarak kullanılmalıdır EMIM tabanlı benzerlik yöntemi Bein ve arkadaşları tarafından [1] önerilen beklenen ortak bilgi ölçütü (EMIM - Expected Mutual Information Measure) yönteminde EMIM değerini hesaplamadan önce her k terimi için t vektörü elde edilir. T vektöründe her doküman için k teriminin o dokümanda bulunup bulunmadığı bilgisi vardır. Her k terimi için, k teriminin bulunduğu, ve k teriminin bulunmadığı olarak 2 adet f değeri de hesaplanır. Sonrasında her ikili terim k ve l için, 4 adet n değeri hesaplanır. n değeri, terimlerin birlikte bulunup bulunmama durumlarını vermektedir. n Açıklama K ve l terimlerinin ikisinin de bulunmadıkları doküman sayısı K teriminin bulunmayıp l teriminin bulunduğu K teriminin bulunup l teriminin bulunmadığı K ve l terimlerinin ikisinin de bulunduğu Tablo 4: Terimler arasındaki ilişkiyi gösteren n değerleri hesaplama yöntemi (2) (3) (4)

4 Bu değerler arasındaki ilişki şekildeki gibi verilebilir. Bu durumda fk(1) ve nkl(1,1) hesaplanırsa diğer değerler bu değerlerden elde edilebilir. Bu değerlerin hesaplanmasından sonra terim benzerliklerini ifade edebileceğimiz EMIM değeri hesaplanabilir. EMIM değeri yüksek olan ikili en çok benzer terimler olacaktır. Dokümanlar = AL (Doküman Kümesi) Her terim : Terimler için F1[terim] = TERIM_GECEN_DOKUMAN_ SAYISI_HESAPLA(terim,Dokümanlar) Her terim_bir : Terimler için Her terim_iki : Terimler için N11[terim_bir,terim_iki] = TERIMLERIN_ORTAK_GECTIGI _DOKUMAN_SAYISI_HESAPLA (terim_bir, terim_iki, Dokümanlar) Benzerlik[terim_bir,terim_iki] = EMIM_BENZERLİK_HESAPLA (F1[terim_bir],F1[terim_iki], N11[terim_bir, terim_iki]) ÇIKTI(Benzerlik) Tablo 5: EMIM tabanlı benzerlik yöntemi sözde kodu 2.4. LSA ve EMIM tabanlı benzerlik yöntemleri sonrasında kullanılan kümeleme yöntemi Benzerlikler hesaplandıktan sonra, bu değerlere göre kümeleme yapılmalıdır. Bu çalışmada olasılıkların hepsini denemek suretiyle (brute force yöntemi) kümeleme işlemi yapılmıştır. Benzerlikler = AL (Terim benzerlikleri) Her terim : Terimler için KümeT=KUME_OLUSTUR(terim) Küme_Listesi= KUME_LISTESINE_EKLE(Küme_Listesi,KümeT) Küme_Sayısı= KUME_ADEDİ_AL(Küme_Listesi) Küme_Sayısı > 10 olduğu sürece devam et Küme1,Küme2 = EN_BENZER_KUMELERI_BUL (Benzerlikler) Küme_Listesi = KUME_LISTESINDEN_CIKART (Kume_Listesi,Küme1,Küme2) Küme3=BIRLESTIR(Küme1,Küme2) Küme_Listesi = KUME_LISTESINE_EKLE(Küme_Listesi,Küme3) Küme_Sayısı= KUME_ADEDİ_AL(Küme_Listesi) ÇIKTI(Küme_Listesi) Tablo 6: Kümeleme yöntemi sözde kodu (5) (6) 3. Deneysel Çalışma Yapmış olduğumuz deneysel çalışmanın amacı kavram madenciliği için en uygun terim benzerliği yönteminin bulunmasıdır. Çalışmamızda; kavram çıkarmaya yardımcı üç farklı terim benzerliği yöntemi kullanılmıştır. En uygun yöntem belirlendikten sonra performansı yüksek veri madenciliği mümkün hale gelecektir. Terim benzerliği yöntemleri kümeleme tabanlıdır. Kümeleme algoritmaları için sonuçların değerlendirilmesi ise büyük bir problemdir. Bugüne kadar objektif değerlendirme kriterleri tam olarak geliştirilmemiştir. Sıklıkla kullanılan yöntemlerden birisi, elde edilen sonuçların konu uzmanı tarafından değerlendirilmesidir. Çalışmamız için de en büyük sıkıntı uzman görüşü ve veri setinin probleme uygunluğu konusunda ortaya çıkmıştır. Kümelemenin başarısı için veri setinin yeteri kadar veriye sahip olması, küme sayısı ve küme merkezlerinin tayini önemli problemlerdir. Terim benzerliği yöntemlerinin karşılaştırılmasında sonuçları kolayca inceleyebilmek için 11 dokümandan oluşan küçük bir veriseti kullanılmıştır. Dokümanların hepsi eğitim konusundadır. Deneylere başlamadan önce her bir dokümanı sunacak terim özellik seti çıkarılmıştır. Bunun için LSA algoritması kullanılmış ve derlem içerisinde sık geçen terimler dokümanları sunmada kullanılmıştır. Terimler belirlendikten sonra ise her bir doküman terim uzayında, terim sıklıkları ile sunulmuştur. Çalışmamız iki aşamalı olarak yülütülmüştür. Çalışmanın ilk aşamasında 11 adet doküman ve 25 adet terim kullanılarak kümeleme yapılmıştır. Ancak elde edilen terim kümesindeki sonuçların uzman tarafından değerlendirilmesi efektif olmadığından ve uzun sürdüğünden veri seti küçültülmüştür. Çalışmanın ikinci aşamasında uzmanın iş yükünü hafifletmek ve daha net sonuçlar elde etmek için doküman sayısı aynı tutulmuş fakat seçilen terim sayısını doküman başına 10 olarak belirlenmiştir. Dokümanlardan gelen terimler tek bir kavram sözlüğüne yerleştirilmiştir. Çakışmalar ortadan kaldırıldıktan sonra derlemdeki dokümanları sunmak için toplam terim sayısı 52 olarak belirlenmiştir. Terim benzerlikleri tabanlı kümelemede üç adet algoritma kullanılmış ve bu algoritmaların kullanımı esnasında bazı karakteristik özelliklere rastlanmıştır. Bir tablo şeklinde sunmak gerekirse; LSA tabanlı yöntem EMIM tabanlı yöntem Kmeans yöntemi İkili olarak terimlerin benzerlik hesabında diğer algoritmalara göre daha başarılı olsa da, kümeleme sonucunda terimlerin kümelere dağılımı homojen olmamıştır, birkaç küme üzerinde yığılmalar gözlemlenmiştir. İkili karşılaştırmalarda LSA tabanlı yönteme benzer sonuçlar üretmiştir, sonuçta elde edilen kümelerde bir kaç küme üzerinde yığılmalar gözlense de LSA sonuçlarından daha homojen olduğu söylenebilir En homojen sonucu kmeans yöntemi üretmiştir. Ancak ikili karşılaştırmalarda ürettiği değerler LSA ve EMIM yöntemlerinden daha kötüdür

5 Tablo 7: Yöntemlerin sonuçlarının genel değerlendirilmesi Soru, bu üç algoritmadan hangisinin en iyi olduğudur. Performans kriterimiz homojen olarak terimlerin dokümanlara dağılması ise en başarılı algoritma K-means algoritmasıdır. Ancak amacımız kavram oluşturabilecek terim kümelerini elde etmek olduğundan sonuçları değerlendirirken bu kritere çok önem vermemekteyiz. Türk dili uzmanlarına göre bazı durumlarda tek bir terim bile bir kavramı ifade edebilirken, bazı durumlarda bir çok kelime kavramı ifade etmede yetersiz kalabilmektedir [8]. Karşılaştırma sonuçlarını daha net sunabilmek için algoritmaların çıktıları üzerinde doğrulama işlemi yapılmıştır. Bir uzman yardımıyla her kelimenin, algoritma tarafından atandığı kümeye ait olup olmadığı belirlenmiştir. Bu aşamada kümelerin bütün olarak doğru şekilde ayrılmasından ziyade terimlerin tek olarak küme içindeki diğer kelimelerle ilişkilerini göz önünde bulundurulmuştur. Sonrasında ise her algoritma için doğru kümelenmiş kelime sayısı elde edilmiştir. K-means algoritmasını oluşturduğu kümelerin kavram mantığından uzak olmasından dolayı elemek mümkün olacaktır. Geriye kalan iki yöntem LSA ve EMIM tabanlı yöntemlerdir. Eldeki veri seti ile bu iki yöntemin karşılaştırılması zor görülmektedir. Sonuçlar benzerdir ve uzmanın hangisinin daha iyi olduğuna karar verebilmesi zordur. Ancak genel karşılaştırma değerlendirmesinden de anlaşılacağı gibi LSA tabanlı yöntemde kümelere dağılım çok orantısızdır. Sonuçların değerlendirilmesinde bu orantı çok önemli olmamakla birlikte bu aşamada EMIM tabanlı yöntemin daha güvenilir sonuç verdiğini söylemek mümkündür. Ancak bu değerlendirmeler veri setinin kalitesiyle birebir alakalı olduğundan dolayı başka veri setlerinde aynı sonuçları elde edeceğimizi iddia edemeyiz. Kmeans Yöntemi EMIM Tabanlı Yöntem LSA Tabanlı Yöntem Şekil 1 : Üç algoritma için doğru kümelenmiş terim sayısı Bu çalışma bize göstermiştir ki, terim benzerliklerini hesaplarken metin madenciliğine özel yöntemler kullanılmalıdır, geleneksel veri madenciliği yöntemleri terimlerin anlamlarını ifade etmede yetersiz kalmıştır. LSA tabanlı yöntem ve EMIM LSA Tabanlı Yöntem EMIM Tabanlı Yöntem Kmeans Yöntemi tabanlı yöntem de terim benzerliklerini hesaplamada tercih edilebilir. Belki terim benzerlikleri hesaplama yönteminin ardından kullanılan kümeleme yöntemi iyileştirilerek kümelerin daha güvenilir olması sağlanabilir. 4. Sonuç ve Gelecek Çalışmalar Terim benzerliklerine göre terimler kümelendikten sonra, elde edilen kümeler uzman yardımıyla etiketlenecektir. Terim kümelerine verilen etiketler bizim için kavramlar olacaktır. Bir kavramın birden fazla kelime ile sunulduğu ve benzer terimlerin aynı kavramları anlatmak için benzer dokümanlarda kullanıldığı bilindiğinden çalışma bu yönde ilerleyecektir. Projenin son aşaması kavramlara dayalı veri madenciliği uygulanmasıdır. Klasik veri madenciliği yöntemleri ile dokümanlar özetlenebilecek, sınıflandırılabilecek ve birbiriyle ilişkili kavramlar ortaya çıkarılabilecektir. Kaynakça 1. Bein, W. W., Coombs, J. S., & Taghva, K. (2003). A method for calculating term similarity on large document collections. In Int. conf. on information technology: Computers and communications (pp ). 2. Colleen Crangle, Alex Zbyslaw, J. Michael Cherry, Eurie L. Hong. (2004). Concept Extraction and Synonymy Management for Biomedical Information Retrieval. ConverSpeech LLC, Palo Alto, California Department of Genetics, Stanford University, California, TREC Duda, R. O. & Hart, P. E. (1973). Pattern Classification and Scene Analysis. New York, NY,USA: J. Wiley & Sons. 4. Gong Y. & Liu X. (2001). Generic Text Summarization Using Relevance Measure and Latent Semantic Analysis in International conference on Research and development in information retrieval. pp Hartigan, J. (1975). Clustering Algorithms. John Wiley and Sons, New York. 6. Hotho, A., Nürnberger, A., and Paaß, G. (2005). A Brief Survey of Text Mining. LDV-Forum, 20(1): I. Bichindaritz and S. Akkineni (2005). Concept Mining for Indexing Medical literature, Lecture Notes in Computer Science, vol. 3587, pp , Lovins, J.B. (1968). Development of a stemming algorithm. Mechanical Translation and Computational Linguistics, 11, Shady Shehata (2009). Concept Mining:A Conceptual Understanding based Approach, a thesis presented to the University of Waterloo 10. Villalón J.J & Calvo R.A. (2009). Concept Extraction from Student Essays, Towards Concept Map Mining. ICALT pp

VERİ MADENCİLİĞİ Metin Madenciliği

VERİ MADENCİLİĞİ Metin Madenciliği VERİ MADENCİLİĞİ Metin Madenciliği Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Metin için Veri Madenciliği Metin Madenciliğinde Sorunlar Metin madenciliği: Veri madenciliği teknikleri ile yazılı belgeler arasındaki

Detaylı

Metin Sınıflandırma. Akış

Metin Sınıflandırma. Akış Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

Türkçe Dokümanlar Ġçin Yazar Tanıma

Türkçe Dokümanlar Ġçin Yazar Tanıma Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

ELECO '2012 Elektrik - Elektronik ve Bilgisayar Mühendisliği Sempozyumu, 29 Kasım - 01 Aralık 2012, Bursa

ELECO '2012 Elektrik - Elektronik ve Bilgisayar Mühendisliği Sempozyumu, 29 Kasım - 01 Aralık 2012, Bursa Türkçe Metinlerin Kümelenmesinde Farklı Yöntemlerinin Etkisinin Araştırılması Examining the Impact of Different Stemming Methods on Clustering Turkish Texts Volkan Tunalı, Turgay Tugay Bilgin Yazılım Mühendisliği

Detaylı

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu

Detaylı

Veri ve Metin Madenciliği. Zehra

Veri ve Metin Madenciliği. Zehra Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği

Detaylı

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

Metin Madenciliği Kullanarak Yazılım Kullanımına Dair Bulguların Elde Edilmesi

Metin Madenciliği Kullanarak Yazılım Kullanımına Dair Bulguların Elde Edilmesi Metin Madenciliği Kullanarak Yazılım Kullanımına Dair Bulguların Elde Edilmesi Deniz Kılınç 1, Fatma Bozyiğit 1, Akın Özçift 1, Fatih Yücalar 1, Emin Borandağ 1 1 Celal Bayar Üniversitesi, Hasan Ferdi

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5

Detaylı

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi

Detaylı

Kümeleme Algoritmaları. Tahir Emre KALAYCI

Kümeleme Algoritmaları. Tahir Emre KALAYCI Tahir Emre KALAYCI 2010 Gündem En önemli gözetimsiz öğrenme (unsupervised learning) problemi olarak değerlendirilmektedir Bu türdeki diğer problemler gibi etiketsiz veri kolleksiyonları için bir yapı bulmakla

Detaylı

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama

Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama Mehmet Yavuz ONAT Yrd.Doç.Dr.Engin YILDIZTEPE Dokuz Eylül Üniversitesi, İstatistik Bölümü Akademik Bilişim 2015, Anadolu Üniversitesi, Eskişehir

Detaylı

Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı

Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı Akademik Bilişim 2013 Akdeniz Üniversitesi, Antalya, 23-25 Ocak 2013 Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı Oğuz Akpolat 1 *, Sinem Çağlar Odabaş 2, Gülçin Özevci 3, Nezahat İpteş 4 1 Muğla

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME YZM 317 YAPAY ZEKA DERS#10: KÜMELEME Sınıflandırma (Classification) Eğiticili (supervised) sınıflandırma: Sınıflandırma: Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz (unsupervised)

Detaylı

Makine Öğrenmesi 2. hafta

Makine Öğrenmesi 2. hafta Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

VERİ YAPILARI VE PROGRAMLAMA

VERİ YAPILARI VE PROGRAMLAMA VERİ YAPILARI VE PROGRAMLAMA (BIP116) Yazar: Doç.Dr.İ.Hakkı.Cedimoğlu SAKARYA ÜNİVERSİTESİ Adapazarı Meslek Yüksekokulu Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi ne aittir.

Detaylı

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça.

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça. Apriori Algoritması Konu İçeriği Giriş Tarihçesi Apriori Nedir? Örnekler Algoritma Açıklama Weka İle Kullanımı Kaynakça Giriş Veri madenciliğinde kullanılan ve veri kümeleri veya veriler arasındaki ilişkiyi

Detaylı

GİZLİ ANLAMBİLİMSEL DİZİNLEME YÖNTEMİNİN N-GRAM KELİMELERLE GELİŞTİRİLEREK, İLERİ DÜZEY DOKÜMAN KÜMELEMESİNDE KULLANIMI

GİZLİ ANLAMBİLİMSEL DİZİNLEME YÖNTEMİNİN N-GRAM KELİMELERLE GELİŞTİRİLEREK, İLERİ DÜZEY DOKÜMAN KÜMELEMESİNDE KULLANIMI GİZLİ ANLAMBİLİMSEL DİZİNLEME YÖNTEMİNİN N-GRAM KELİMELERLE GELİŞTİRİLEREK, İLERİ DÜZEY DOKÜMAN KÜMELEMESİNDE KULLANIMI Ahmet GÜVEN 1, Ö. Özgür BOZKURT 2 ve Oya KALIPSIZ 3 Bilgisayar Mühendisliği Bölümü,

Detaylı

Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı

Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı Oğuz Akpolat 1 *, Sinem Çağlar Odabaş 2, Gülçin Özevci 3, Nezahat Đpteş 4 1 Muğla SKÜ, Fen Fakültesi, Kimya Bölümü, Muğla, Türkiye 2 Muğla SKÜ Fen Bilimleri

Detaylı

Bilgiye Erişim Sistemlerinde Veri Arama ve Eşleştirme

Bilgiye Erişim Sistemlerinde Veri Arama ve Eşleştirme Bilgiye Erişim Sistemlerinde Veri Arama ve Eşleştirme M. Erkan YÜKSEL 1, Özgür Can TURNA 1, M. Ali ERTÜRK 1 1 İstanbul Üniversitesi, Bilgisayar Mühendisliği Bölümü, İstanbul {eyuksel, ozcantur}@istanbul.edu.tr,

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

Görüntü Segmentasyonu (Bölütleme)

Görüntü Segmentasyonu (Bölütleme) Görüntü Segmentasyonu (Bölütleme) Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. 20 Aralık 2014 Cumartesi 1 Görüntü Segmentasyonu 20 Aralık 2014 Cumartesi 2 Gestalt kanunları Görüntü

Detaylı

Bilgisayar programlamanın üç temel mantık yapısından biridir. Diğer ikisi ise Seçilim(Selection) ve Döngü(Loop, Iteration)dür.

Bilgisayar programlamanın üç temel mantık yapısından biridir. Diğer ikisi ise Seçilim(Selection) ve Döngü(Loop, Iteration)dür. SEQUENCE ALGORİTMASI Bilgisayar programlamanın üç temel mantık yapısından biridir. Diğer ikisi ise Seçilim(Selection) ve Döngü(Loop, Iteration)dür. Bir dizi yapısı içinde, bir eylem ya da bir olay, geçmiş

Detaylı

Analitik Hiyerarşi Prosesi (AHP) Yrd.Doç.Dr. Sabahattin Kerem AYTULUN

Analitik Hiyerarşi Prosesi (AHP) Yrd.Doç.Dr. Sabahattin Kerem AYTULUN Analitik Hiyerarşi Prosesi (AHP) Yrd.Doç.Dr. Sabahattin Kerem AYTULUN Giriş AHP Thomas L.Saaty tarafından 1970'lerde ortaya atılmıştır. Amaç alternatifler arasından en iyisinin seçilmesidir. Subjektif

Detaylı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı ARAŞTIRMA MODELLİLERİNDE KULLANILACAK İSTATİSTİKLERİ BELİRLEME ÖLÇÜTLERİ Parametrik mi Parametrik Olmayan mı? Kullanılacak İstatistikleri Belirleme Ölçütleri Değişken Sayısı Tek değişkenli (X) İki değişkenli

Detaylı

K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ

K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ Fen Bilimleri Enstitüsü Dergisi, 22 (2) -8 Marmara Üniversitesi K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ Meltem IŞIK ve Ali Yılmaz ÇAMURCU 2 Şişli Endüstri Meslek Lisesi, Bilgisayar

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

Veri Madenciliği Yöntemleriyle İGDAŞ Çağrı Merkezi Veri Analizi VE Kalite Fonksiyon Yayılımı Yöntemiyle Süreç İyileştirme Çalışması

Veri Madenciliği Yöntemleriyle İGDAŞ Çağrı Merkezi Veri Analizi VE Kalite Fonksiyon Yayılımı Yöntemiyle Süreç İyileştirme Çalışması Veri Madenciliği Yöntemleriyle İGDAŞ Çağrı Merkezi Veri Analizi VE Kalite Fonksiyon Yayılımı Yöntemiyle Süreç İyileştirme Çalışması Nilay Kurşunoğlu, PwC Yönetim Danışmanlığı Biz Kimiz? Orhan Cem Sorumlu

Detaylı

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme 1 Cem Rıfkı Aydın, 1 Ali Erkan, 1 Tunga Güngör, 2 Hidayet Takçı 1 Boğaziçi Üniversitesi, 2 Cumhuriyet Üniversitesi Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme AB 14 7 Şubat 2014

Detaylı

Kelime Gösterimleri (Word Representation Word Embeddings)

Kelime Gösterimleri (Word Representation Word Embeddings) Kelime Gösterimleri (Word Representation Word Embeddings) Kelime, cümlede kullanımına göre farklı anlamlar kazanabilir Anlamsal bilginin çıkarılması metinlerin işlenmesinde önemlidir Kelimelerin işlenebilir

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

Uzaktan Algılama Uygulamaları

Uzaktan Algılama Uygulamaları Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

VERİ MADENCİLİĞİNE BAKIŞ

VERİ MADENCİLİĞİNE BAKIŞ VERİ MADENCİLİĞİNE BAKIŞ İçerik Veri Madenciliği Neden Veri Madenciliği? Veri ve Veri Madenciliğinin Önemi Günümüzde Kullanılan Veri Madenciliğinin Çeşitli İsimleri Veri Madenciliği Nedir? Neden Veri Madenciliği?

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest

Detaylı

Geliştirilmiş Fisher Ayraç Kriteri Kullanarak Hiperspektral Görüntülerde Sınıflandırma

Geliştirilmiş Fisher Ayraç Kriteri Kullanarak Hiperspektral Görüntülerde Sınıflandırma Geliştirilmiş Fisher Ayraç Kriteri Kullanarak Hiperspektral Görüntülerde Sınıflandırma Mustafa TEKE, Dr. Ufuk SAKARYA TÜBİTAK UZAY IEEE 21. Sinyal İşleme, İletişim ve Uygulamaları Kurultayı (SİU 2013),

Detaylı

Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi

Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi Emre Güngör 1,2, Nesibe Yalçın 1,2, Nilüfer Yurtay 3 1 Bilecik Şeyh Edebali Üniversitesi, Bilgisayar Mühendisliği Bölümü, 11210, Merkez, Bilecik

Detaylı

Görüntü Segmentasyonu (Bölütleme) Dijital Görüntü İşleme Fevzi Karslı, KTÜ Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır.

Görüntü Segmentasyonu (Bölütleme) Dijital Görüntü İşleme Fevzi Karslı, KTÜ Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. Görüntü Segmentasyonu (Bölütleme) Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. 16 Ocak 2014 Perşembe 1 Görüntü Segmentasyonu 16 Ocak 2014 Perşembe 2 Görüntüden Objelere Bir objeyi

Detaylı

Mühendislik ve Fen Bilimleri Dergisi Journal of Engineering and Natural Sciences

Mühendislik ve Fen Bilimleri Dergisi Journal of Engineering and Natural Sciences Mühendislik ve Fen Bilimleri Dergisi Journal of Engineering and Natural Sciences Sigma 5 8-14, 2013 Araştırma Makalesi / Research Article METİNLERİN ANLAMSAL UZAYDAKİ TEMSİL YÖNTEMLERİNİN SINIFLANDIRMA

Detaylı

Programlama Dilleri 1. Ders 3: Rastgele sayı üretimi ve uygulamaları

Programlama Dilleri 1. Ders 3: Rastgele sayı üretimi ve uygulamaları Ders 3: Rastgele sayı üretimi ve uygulamaları Ders 3 Genel Bakış Giriş Rastgele Sayı Rastgele Sayı Üreteci rand Fonksiyonunun İşlevi srand Fonksiyonunun İşlevi Monte Carlo Yöntemi Uygulama 1: Yazı-Tura

Detaylı

T.C. ÇANAKKALE ONSEKİZ MART ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ İLERİ VERİTABANI SİSTEMLERİ DERSİ RAPORUN SUNULDUĞU TARİH 24.05.

T.C. ÇANAKKALE ONSEKİZ MART ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ İLERİ VERİTABANI SİSTEMLERİ DERSİ RAPORUN SUNULDUĞU TARİH 24.05. T.C. ÇANAKKALE ONSEKİZ MART ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ İLERİ VERİTABANI SİSTEMLERİ DERSİ RAPORUN SUNULDUĞU TARİH 24.05.2011 PROJE KONUSU Genel Seçim Çalışmaları PROJE GRUBU Semih Erdem 080401009

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

GENETİK ALGORİTMA ÖZNUR CENGİZ HİLAL KOCA

GENETİK ALGORİTMA ÖZNUR CENGİZ HİLAL KOCA GENETİK ALGORİTMA ÖZNUR CENGİZ 201410306014 HİLAL KOCA 150306024 GENETİK ALGORİTMA Genetik Algoritma yaklaşımının ortaya çıkışı 1970 lerin başında olmuştur. 1975 te John Holland ın makine öğrenmesi üzerine

Detaylı

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir.

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir. DİZİN Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir. A ağırlıklandırma bkz. terim ağırlıklandırma AltaVista, 6, 31, 37, 45-47, 93, 135 anahtar sözcükler,

Detaylı

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Örüntü Tanıma Dersin Orjinal Adı: Pattern Recognition Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora) Lisansüstü Dersin Kodu: CSE

Detaylı

AHP ye Giriş Karar verici, her alternatifin her kriterde ne kadar başarılı olduğunu değerlendirir. Her kriterin amaca ulaşmadaki görece önemini değerl

AHP ye Giriş Karar verici, her alternatifin her kriterde ne kadar başarılı olduğunu değerlendirir. Her kriterin amaca ulaşmadaki görece önemini değerl AHP ye Giriş 2 Analitik Hiyerarşi Süreci Bölüm 3 AHP, birebir değerlendirerek alternatifleri sıralamaya dayanan çok nitelikli karar verme yöntemidir. Amaçlar ve alt amaçlar iç içe katmanlar halinde ve

Detaylı

Mesleki Terminoloji II Veri Madenciliği

Mesleki Terminoloji II Veri Madenciliği Mesleki Terminoloji II Veri Madenciliği Burak Düşün - 14011055 Akif Berkay Gürcan - 14011023 Veri Madenciliği Nedir? Veri madenciliği, büyük miktarda verinin anlamlı örüntüler bulmak amacıyla otomatik

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Metin Sınıflandırmada Benzerlik Hesaplama Tekniklerinin Değerlendirilmesi. Evaluation of Similarity Measurement Techniques for Text Classification

Metin Sınıflandırmada Benzerlik Hesaplama Tekniklerinin Değerlendirilmesi. Evaluation of Similarity Measurement Techniques for Text Classification Metin Sınıflandırmada Benzerlik Hesaplama Tekniklerinin Değerlendirilmesi Mehmet Fatih KARACA1, Mustafa GÜNEL1, Akif Alkan TAŞTAN1 1Gaziosmanpaşa Üniversitesi, Erbaa Meslek Yüksekokulu, Tokat mehmetfatih.karaca@gop.edu.tr,

Detaylı

WEB BELGELERİ KÜMELEMEDE BENZERLİK VE UZAKLIK ÖLÇÜTLERİ BAŞARILARININ KARŞILAŞTIRILMASI

WEB BELGELERİ KÜMELEMEDE BENZERLİK VE UZAKLIK ÖLÇÜTLERİ BAŞARILARININ KARŞILAŞTIRILMASI Fen Bilimleri Enstitüsü Dergisi, (8) 35-49 Marmara Üniversitesi WEB BELGELERİ KÜMELEMEDE BENZERLİK VE UZAKLIK ÖLÇÜTLERİ BAŞARILARININ KARŞILAŞTIRILMASI Meltem IŞIK ve Ali Yılmaz ÇAMURCU Şişli Endüstri

Detaylı

Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.

Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır. ÇOK ÖLÇÜTLÜ KARAR VERME TOPSIS (Technique For Order Preference By Similarity To Ideal Solution) PROF. DR. İBRAHİM ÇİL 1 Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Giriş Bilgi Erişiminde Temel Yaklaşımlar Bilgi Erişim Modelleri Boolean model Vector space

Detaylı

CBS ve Coğrafi Hesaplama

CBS ve Coğrafi Hesaplama Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr

Detaylı

GENETİK ALGORİTMALAR BÜŞRA GÜRACAR

GENETİK ALGORİTMALAR BÜŞRA GÜRACAR GENETİK ALGORİTMALAR BÜŞRA GÜRACAR 201420404036 İÇERİK Genetik Algoritmanın, Amacı Kullanım Alanları Kavramları Uygulama Adımları Parametreler Genetik Algoritma Kodlama Türleri Genetik Algoritma Genetik

Detaylı

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir.

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir. ÇELĐK YÜZEYLERĐN SINIFLANDIRILMASI * Cem ÜNSALAN ** Aytül ERÇĐL * Ayşın ERTÜZÜN *Boğaziçi Üniversitesi, Elektrik-Elektronik Mühendisliği Bölümü unsalan@boun.edu.tr **Boğaziçi Üniversitesi, Endüstri Mühendisliği

Detaylı

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı Veri Madenciliği, örüntü tanıma, istatistik ve matematiksel yöntemlerin kullanımıyla devasa miktardaki güncel ya da geçmiş veri içerisinden ilgi çekici ( önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel

Detaylı

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Birliktelik Kurallarının Tanımı Destek ve Güven Ölçütleri Apriori Algoritması Birliktelik Kuralları (Association

Detaylı

AHP ANALİTİK HİYERARŞİ PROSESİ AHP AHP. AHP Ölçeği AHP Yönteminin Çözüm Aşamaları

AHP ANALİTİK HİYERARŞİ PROSESİ AHP AHP. AHP Ölçeği AHP Yönteminin Çözüm Aşamaları ANALİTİK HİYERARŞİ PROSESİ 1970 li yıllarda Wharton School of Business da çalışan Thomas L.Saaty tarafından Karmaşık çok kriterli karar verme problemlerinin çözümü için geliştirilmiştir. Tüm kriterler

Detaylı

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir Bilimsel Araştırma Yöntemleri Prof. Dr. Şener Büyüköztürk Doç. Dr. Ebru Kılıç Çakmak Yrd. Doç. Dr. Özcan Erkan Akgün Doç. Dr. Şirin Karadeniz Dr. Funda Demirel Örnekleme Yöntemleri Evren Evren, araştırma

Detaylı

Doküman Sınıflandırma Text Categorization - TC

Doküman Sınıflandırma Text Categorization - TC Doküman Sınıflandırma Text Categorization - TC Doç.Dr.Banu Diri Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Hiyerarşik eklemeli kümeleme Metin kümelerinin birbirine benzerliği

Detaylı

KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN

KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN Giriş Bilgi teknolojisindeki gelişmeler ve verilerin dijital ortamda saklanmaya başlanması ile yeryüzündeki bilgi miktarı her 20 ayda iki katına

Detaylı

Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları. Neleri göreceğiz?

Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları. Neleri göreceğiz? KÜMELEME Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları Neleri göreceğiz? Tanımı Veriyi birbirlerine benzeyen elemanlardan oluşan kümelere ayırarak, heterojen bir

Detaylı

BÖLÜM 13 HİPOTEZ TESTİ

BÖLÜM 13 HİPOTEZ TESTİ 1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin

Detaylı

LSI Keywords İle Sitenizin Sıralamasını Ve Trafiğini Arttırın

LSI Keywords İle Sitenizin Sıralamasını Ve Trafiğini Arttırın LSI Keywords İle Sitenizin Sıralamasını Ve Trafiğini Arttırın Giriş Her web sitesi sahibi, Seo açısından anahtar kelimelerin önemi çok iyi bilir. Fakat içeriğinizi optimize etmek için kullandığınız ana

Detaylı

A. SCI ve SCIE Kapsamındaki Yayınlar

A. SCI ve SCIE Kapsamındaki Yayınlar A. SCI ve SCIE Kapsamındaki Yayınlar A.1. Erilli N.A., Yolcu U., Egrioglu E., Aladag C.H., Öner Y., 2011 Determining the most proper number of cluster in fuzzy clustering by using artificial neural networks.

Detaylı

Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997

Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997 Mühendislik Fakültesi Endüstri Mühendisliği Bölümü Doç. Dr. Nil ARAS ENM411 Tesis Planlaması 2016-2017 Güz Dönemi Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997 2 Tesis Yer Seçimi Problemi (TYSP) TEK AMAÇLI

Detaylı

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması 1 Emre DANDIL Bilecik Ş. Edebali Üniversitesi emre.dandil@bilecik.edu.tr +90228 214 1613 Sunum İçeriği Özet Giriş

Detaylı

APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM

APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ Nesibe Yalçın 1 Emre Güngör 1 Nilüfer Yurtay ÖZET Bu çalışmada, Veri Madenciliği' nde Birliktelik Kuralı çıkarım algoritmalarından biri olan Apriori

Detaylı

Ara Sınav 1. Algoritmalara Giriş 14 Ekim 2005 Massachusetts Institute of Technology Profesörler Erik D. Demaine ve Charles E. Leiserson Kitapçık 14

Ara Sınav 1. Algoritmalara Giriş 14 Ekim 2005 Massachusetts Institute of Technology Profesörler Erik D. Demaine ve Charles E. Leiserson Kitapçık 14 Algoritmalara Giriş 14 Ekim 2005 Massachusetts Institute of Technology 6.046J/18.410J Profesörler Erik D. Demaine ve Charles E. Leiserson Kitapçık 14 Ara Sınav 1 Dağıtılan sınav kitapçığını, size söylenene

Detaylı

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik BLM 4811 MESLEKİ TERMİNOLOJİ II 2017-1 Salı 13.00 14.50, D-109 Dr. Göksel Biricik goksel@ce.yildiz.edu.tr Ders Planı Hafta Tarih Konu 1 19.09 Tanışma, Ders Planı, Kriterler, Giriş 2 26.09 Bilgisayarın

Detaylı

ALIŞTIRMA-UYGULAMA YAZILIMLARI

ALIŞTIRMA-UYGULAMA YAZILIMLARI ALIŞTIRMA-UYGULAMA YAZILIMLARI Öğretim Aşamaları Bilginin Sunulması Öğrencinin Yönlendirilmesi Öğretici Programlar Uygulama Alıştırma- Uygulama Yazılımları Değerlendirme 2 Alıştırma-Uygulama Yazılımları

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Makine Öğrenmesi Erhan AKDOĞAN, Ph.D. Bu ders notunun hazırlanmasında Dr. U.Orhan ve Banu Diri nin ders notlarından yararlanılmıştır. Makine öğrenmesi

Detaylı

ISSN: El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 ( )

ISSN: El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 ( ) www.tubiad.org ISSN:2148-3736 El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 (315-323) El-Cezerî Journal of Science and Engineering Vol: 3, No: 2, 2016 (315-323) ECJSE Makale / Research Paper

Detaylı

Algoritmalar. Arama Problemi ve Analizi. Bahar 2016 Doç. Dr. Suat Özdemir 1

Algoritmalar. Arama Problemi ve Analizi. Bahar 2016 Doç. Dr. Suat Özdemir 1 Algoritmalar Arama Problemi ve Analizi Bahar 2016 Doç. Dr. Suat Özdemir 1 Arama Problemi Sıralama algoritmaları gibi arama algoritmaları da gerçek hayat bilgisayar mühendisliği problemlerinin çözümünde

Detaylı

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ Algoritma Analizi Çerçevesi Algoritma Analizinde Göz Önünde Bulundurulması Gerekenler Neler? Algoritmanın Doğruluğu (Correctness) Zaman

Detaylı

Çok-öbekli Veri için Aradeğerlemeci Ayrışım

Çok-öbekli Veri için Aradeğerlemeci Ayrışım Interpolative Decomposition for Data with Multiple Clusters Çok-öbekli Veri için Aradeğerlemeci Ayrışım İsmail Arı, A. Taylan Cemgil, Lale Akarun. Boğaziçi Üniversitesi, Bilgisayar Mühendisliği 25 Nisan

Detaylı

Bilişim Sistemleri Değerlendirme Modeli ve Üç Örnek Olay İncelemesi

Bilişim Sistemleri Değerlendirme Modeli ve Üç Örnek Olay İncelemesi Bilişim Sistemleri Değerlendirme Modeli ve Üç Örnek Olay İncelemesi Özet Dr. Sevgi Özkan ve Prof. Dr Semih Bilgen Enformatik Enstitüsü, Orta Doğu Teknik Üniversitesi, Ankara Tel: (312) 210 3796 e-posta:

Detaylı

Bulanık Mantık Tabanlı Uçak Modeli Tespiti

Bulanık Mantık Tabanlı Uçak Modeli Tespiti Bulanık Mantık Tabanlı Uçak Modeli Tespiti Hüseyin Fidan, Vildan Çınarlı, Muhammed Uysal, Kadriye Filiz Balbal, Ali Özdemir 1, Ayşegül Alaybeyoğlu 2 1 Celal Bayar Üniversitesi, Matematik Bölümü, Manisa

Detaylı

İlk Yapay Sinir Ağları. Dr. Hidayet Takçı

İlk Yapay Sinir Ağları. Dr. Hidayet Takçı İlk Yapay Sinir Ağları Dr. Hidayet htakci@gmail.com http://htakci.sucati.org Tek katmanlı algılayıcılar (TKA) Perceptrons (Rosenblat) ADALINE/MADALINE (Widrow and Hoff) 2 Perseptron eptronlar Basit bir

Detaylı

TOPSIS yönteminin adımları 5 Adım 1. Normalize karar matrisinin oluşturulması 6 Karar matrisinin normalizasyonu aşağıdaki formül kullanılarak yapılır:

TOPSIS yönteminin adımları 5 Adım 1. Normalize karar matrisinin oluşturulması 6 Karar matrisinin normalizasyonu aşağıdaki formül kullanılarak yapılır: Giriş 2 TOPSIS Bölüm 5 TOPSIS (Technique for Order Preference by Similarity to Ideal Solution) 1981 yılında Hwang ve Yoon tarafından geliştirilmiştir. Uygulanması basit, ulaşılan sonuçlar çok gerçekçidir.

Detaylı

Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009

Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009 Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması Doğan Can, Murat Saraçlar Elektrik Elektronik Mühendisliği Bölümü Boğaziçi Üniversitesi Bebek, İstanbul 9 Mart, 2009 Bir Bakışta GDSKT

Detaylı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü haticenizam@outlook.com Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar

Detaylı

SENTEZ TABANLI YAZILIM MİMARİSİ TASARIM YAKLAŞIMININ ESSENCE ÇERÇEVESİYLE MODELLENMESİ

SENTEZ TABANLI YAZILIM MİMARİSİ TASARIM YAKLAŞIMININ ESSENCE ÇERÇEVESİYLE MODELLENMESİ SENTEZ TABANLI YAZILIM MİMARİSİ TASARIM YAKLAŞIMININ ESSENCE ÇERÇEVESİYLE MODELLENMESİ G Ö R K E M G I R AY, T U R K E Y B E D I R T E K I N E R D O G A N, W A G E N I N G E N U N I V E R S I T Y, N E

Detaylı

LİNGO ALGORİTMASININ KÜMELERLE İLİŞKİLİ DOKÜMANLARIN BELİRLENMESİ VE KÜME ETİKETLERİNİN ÇIKARILMASI AŞAMALARININ İYİLEŞTİRİLMESİ

LİNGO ALGORİTMASININ KÜMELERLE İLİŞKİLİ DOKÜMANLARIN BELİRLENMESİ VE KÜME ETİKETLERİNİN ÇIKARILMASI AŞAMALARININ İYİLEŞTİRİLMESİ LİNGO ALGORİTMASININ KÜMELERLE İLİŞKİLİ DOKÜMANLARIN BELİRLENMESİ VE KÜME ETİKETLERİNİN ÇIKARILMASI AŞAMALARININ İYİLEŞTİRİLMESİ ENHANCING THE CLUSTER CONTENT DISCOVERY AND THE CLUSTER LABEL INDUCTION

Detaylı

İSTATİSTİK. Bölüm 1 Giriş. Ankara Üniversitesi SBF İstatistik 1 Ders Notları Prof. Dr. Onur Özsoy 4/4/2018

İSTATİSTİK. Bölüm 1 Giriş. Ankara Üniversitesi SBF İstatistik 1 Ders Notları Prof. Dr. Onur Özsoy 4/4/2018 İSTATİSTİK Bölüm 1 Giriş 1 Bu Bölümde Anlatılacak Konular Bir Yönetici Neden İstatistik Bilmeli? Modern İstatistiğin Gelişimi İstatistiksel Düşünce ve Yönetim Tanımsal ve Yargısal İstatistik Data Türleri

Detaylı

AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Değerlendirilmesi AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Akademik Bilişim 12 - XIV Akademik Bilişim Konferansı Bildirileri Otomatik Doküman Sınıflandırma Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr,

Detaylı

İŞLETMELERDE KURUMSAL İMAJ VE OLUŞUMUNDAKİ ANA ETKENLER

İŞLETMELERDE KURUMSAL İMAJ VE OLUŞUMUNDAKİ ANA ETKENLER ANKARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ HALKLA İLİŞKİLER VE TANITIM ANA BİLİM DALI İŞLETMELERDE KURUMSAL İMAJ VE OLUŞUMUNDAKİ ANA ETKENLER BİR ÖRNEK OLAY İNCELEMESİ: SHERATON ANKARA HOTEL & TOWERS

Detaylı

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DÖNEM PROJESİ TAŞINMAZ DEĞERLEMEDE HEDONİK REGRESYON ÇÖZÜMLEMESİ. Duygu ÖZÇALIK

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DÖNEM PROJESİ TAŞINMAZ DEĞERLEMEDE HEDONİK REGRESYON ÇÖZÜMLEMESİ. Duygu ÖZÇALIK ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DÖNEM PROJESİ TAŞINMAZ DEĞERLEMEDE HEDONİK REGRESYON ÇÖZÜMLEMESİ Duygu ÖZÇALIK GAYRİMENKUL GELİŞTİRME VE YÖNETİMİ ANABİLİM DALI ANKARA 2018 Her hakkı saklıdır

Detaylı

Sözlük Tabanlı Kavram Madenciliği: Türkçe için bir Uygulama

Sözlük Tabanlı Kavram Madenciliği: Türkçe için bir Uygulama Sözlük Tabanlı Kavram Madenciliği: Türkçe için bir Uygulama Cem Rıfkı Aydın Boğaziçi Üniversitesi, Bebek 34342, Beşiktaş, İstanbul cemrifkiaydin@gmail.com Ali Erkan Boğaziçi Üniversitesi, Bebek 34342,

Detaylı

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ - 150110046 İÇERİK Uygulama ve uygulamaya ilişkin temel kavramların tanıtımı Uygulamanın yapısı Ön yüz Veritabanı Web Servisler K-Means Algoritması ile kategori

Detaylı