Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques"

Transkript

1 Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques Oğuz Kaynar Management Information System Cumhuriyet University Sivas, Turkey Mustafa Yıldız Management Information System Cumhuriyet University Sivas, Turkey Yasin Görmez Management Information System Cumhuriyet University Sivas, Turkey Ayşegül Albayrak Management Information System Cumhuriyet University Sivas, Turkey Özet- Günümüz teknolojisinde forumlar, bloglar ve sosyal medyanın her kesim tarafından çok yoğun kullanılmasından dolayı insanlar artık görüş, fikir ve hislerini bu ortamlar aracılığı ile paylaşmaya başlamıştır. Sosyal medya kullanımının artmasına paralel olarak araştırmacılar bu alana yönelik çalışmalarını arttırmışlardır. Özellikle Twitter üzerinde çalışılan önemli veri kaynaklarından biridir. Bu paylaşımlar araştırma ve analizler için önemli bir veri kaynağı oluşturmaktadır. Duygu-düşünce analizi kısaca verinin duygu içerip içermediğinin saptanması ve bu duygunun olumlu, olumsuz ve ya tarafsız olma durumunun belirlenmesidir. Bu çalışmada ise film yorumlarının içeriğine göre Naive Bayes, Merkez Tabanlı Sınıflayıcı, Çok Katmanlı Yapay Sinir Ağları (MLP) ve Destek Vektör Makineleri (SVM) gibi sınıflandırma algoritmaları kullanılarak duygudüşünce analizi yapılmıştır. Yapılan analizler sonucunda gerek eğitim gerekse test verilerinde yapay sinir ağları ve destek vektör makinalarının diğer yöntemlere oranla daha iyi sonuç verdiği gözlemlenmiştir. Anahtar kelimeler Duygu analizi, yapay sinir ağları, Destek vektör makinaları, Naive Bayes, Merkez tabanlı sınıflayıcı Abstract Because of the popularity of forums, blogs and many of the social media platforms among all of the society in our days, these tools have been accepted as distribution channels for people s opinions, ideas, and feelings. The increasing amount of social media usage in particularly Twitter has motivated researchers to study in this area. These expressions in the web have been used as important data sources for researches and analysis. The process of detection whether these data has any sentimenet and whether these sentiment positive, negative or neutral is defined as sentiment analysis. In this study, sentiment analysis has been performed by using classification algorithms depends on the context of the review, such as Naive Bayes, Central Based Classifier, Multi Layer Perception (MLP), and Support Vector Machines (SVM). According to experiments, it is seen that neural networks and support vector machines outperforms with both training and test sets. Index Terms Sentiment analysis, Neural network, Support vector machine, Naive Bayes, Centroid Based Classifier September 7-8, 206 Malatya/TURKEY 234

2 I. GİRİŞ İnternet kullanım imkânlarının yaygınlaşmasıyla beraber günümüzde insanlar vakitlerinin önemli bir kısmını internet üzerinde yer alan sosyal paylaşım ortamlarında harcamaktadırlar. Özellikle kişilerin kendilerini özgürce ifade edebildikleri ve bilgi paylaşımında bulunabildikleri sosyal medya, forum, blog gibi ortamlar günlük hayatımızda büyük bir yer edinmiştir. Kullanıcıların bu ortamlar vasıtasıyla ruh hallerini belirtmeleri, toplumu etkileyen olaylar, spor müsabakaları ve filmler gibi konularda kendi duygu ve düşüncelerini paylaşmaları bu ortamları toplumun genel kanısını belirtebilecek bir araca dönüştürmüştür. Hatta normal hayatlarında bazı nedenlerden dolayı gerçek duygu ve düşüncelerini paylaşamayan kişilerin, sosyal medya üzerinden kendilerini rahatça ifade edebilmeleri, sosyal medya ve diğer ortamları duygu analizi açısından daha gerçekçi sonuçlar verebilecek bir veri kaynağına dönüştürmüştür. Duygu analizi (Sentiment Analysis) olarak ifade edilen bilimsel çıkarım yöntemi, internet ortamının global çerçevede toplumun birçok kesiminin günlük hayatında çok önemli ölçüde yer alması ve bunun sonucunda bireylerin sosyal ve siyasi olaylar, ürün ve hizmet, marka vb. olgular hakkındaki düşüncelerini ifade ettikleri elektronik platformlardaki büyük hacimli verilerin yazılım sistemleri ile hızlı olarak raporlanması ve anlam çıkartılması işlemidir. Duygu analizi çalışmalarında metinlerin olumlu, olumsuz ya da tarafsız içeriğe sahip olup olmadığı sorgulanır ve analiz edilir. Bu analiz sonucuna göre bireylerin ya da belirli bir grubun çalışmayla ilgili konu hakkındaki tutumu belirlenmiş olur. Bu açıdan duygu analizi işletmeler açısından piyasaya yeni sürülecek bir ürün için ön pazar araştırması, bir topluluk için alınacak bir kararın olumlu veya olumsuz nasıl tepki alacağı, film izleyecek kişilerin önceki yapılan yorumlara göre filmi izlemeye karar vermesi gibi konularda yönlendirme yapabilir. Ancak olumlu veya olumsuz görüşün elde edileceği verilerin çok olması bu analizin tek tek inceleyerek yapılmasını zorlaştırmaktadır. Bu yüzden duygu analizi metin madenciliği ile makine öğrenmesi alanlarının önemli ve üzerine çalışılan konularından biri haline gelmiştir. Duygu analizi yapılırken, daha önceden görüş tarafı belli olan (pozitif / negatif /nötr) metinsel veriler kullanılarak bir eğitim veri seti oluşturulur. Daha sonra bu veriler metin madenciliği yöntemleri ile çeşitli ön işlemlerden geçirilip temizlenerek sınıflamaya uygun hale getirilmektedir. Bu ön işlemler arasında iletideki simge ve noktalama işaretlerinin temizlenmesi, metni kelimelere ayırma ve her bir kelimenin köklerinin bulunarak terim listelerinin oluşturulması, metin içerisindeki edat, bağlaç ve zamirlerden oluşan durak kelimelerin kaldırılması, terim frekansları ve ters doküman frekansları yardımıyla vektör uzay modelinin oluşturulması sayılabilir. Vector uzay modellerinde binary, terim frekansı, ters döküman frekansı, n gram gibi çeşitli yöntemler kullanılmaktadır. Vektör uzay modeli oluşturulan bu veriler, makine öğrenmesinde sıklıkla kullanılan yapay sinir ağları, destek vektör makinaları, karar ağaçları gibi sınıflama algoritmaları yardımıyla eğitilmektedir. Çeşitli sınıflayıcılar tarafından eğitilen modeller yardımıyla yeni gelen duygu ve görüşler sınıflandırılmaktadır. Genel olarak duygu ve düşünce analizi aşağıda belirtilen işlevleri yerine getirmek amacıyla kullanılmaktadır. Duygu görüş sınıflandırma: Bir doküman veya metinde bir olgu hakkında görüş ifade edilmesi ve görüş sahibinden olguya yönelik olan duygunun ölçülmesi fikrine dayanır. Öznellik Sınıflandırma: Genel olarak bir cümlenin öznel olup olmadığını tespit etmek olarak ifade edilebilir. Başarılı bir öznellik sınıflandırma daha iyi duygu sınıflandırmayı sağlar. Bu işlem olumlu, olumsuz ve nötr cümleleri ayırmaktan daha zor bir süreç olarak görülmektedir. Görüş özetleme: Dokümandan ve içeriğindeki duygudan ana konuyu çıkarmakla ilgili kavramdır. Görüş elde edilmesi: Yapılan sorguyla, görüş belirten dokümanların çıkartılmasıdır. Bu tür sistemlerde, iki tür puan hesaplaması yapılmalıdır; bunlar sorguya karşılık ilgililik puanı ve sorgu hakkında görüş puanı olup bu ikisi genellikle dokümanların seviyesini belirlemekte kullanılır. Alaycılık ve ironi: Alay ve ironi içeren ifadelerin bulunmasına yöneliktir. Özellikle araştırmacılar içerisinde alay ve ironinin nasıl tanımlanması gerektiğine dair anlaşmazlıkların bulunmasından dolayı, bu görev duygu analizindeki en karmaşık alanlardandır. Diğerleri: Tür ve yazar tespiti, türü ve metni tekrardan yazan yazarı bulmaya yöneliktir. Sahte/yanıltıcı (spam) mesaj tespiti, mesajı belli bir kesimin, şirketin veya ürünün lehine ya da aleyhine çarpıtan, güvenilmeyen içeriğe sahip görüş ve yorumları tespit etmeye çalışır []. Duygu analizinde günümüze kadar yapılan çalışmalar, genellikle İngilizce metinler üzerinde pozitif ve negatif olmak üzere iki sınıfta ele alınmıştır. Bazı çalışmalarda ise düşüncenin nötr olma durumu da dikkate alınarak üç sınıf üzerinden incelemeler gerçekleştirilmiştir. Duygu Analizi alanı ile ilgili literatür incelendiğinde ilk çalışmanın Pang, Lee ve Vaithyanatham tarafından yapıldığı, veri seti olarak Internet Movie Database arşivindeki film yorumlarının kullanıldığı görülmektedir. Çalışmalarında ilgili veri seti üzerinde unigram, bigram, Part Of Speech (POS) gibi öznitelik çıkarma yöntemlerini kullanarak sınıflama için gerekli vektör uzay (vector space) modellerini September 7-8, 206 Malatya/TURKEY 235

3 oluşturmuşlardır. Vektör uzay modelleri sonucunda elde edilen veri seti üzerinde Naive Bayes, Maximum Entropi ve SVM gibi makine öğrenmesi algoritmalarını kullanarak sınıflandırma işlemini gerçekleştirmişlerdir. Elde edilen bulgular sonucunda duygu analiziyle ilgili yapılan sınıflandırmada en iyi sonuç, unigram veri seti üzerinde 82,9% doğruluk oranıyla SVM makine öğrenmesi yöntemi ile alınmıştır [2]. Pennacchiatti ve Popescu 20 yılındaki çalışmalarında sosyal medya kullanıcı sınıflandırma işini Twitter verileri üzerinde uygulamışlardır. Twitter kullanıcılarının davranışları, ağ yapıları ve Twitter akışındaki dilsel içerik bilgileri kullanılarak siyasi yönelim ve etnik köken gibi özelliklerin otomatik olarak tespiti için makine öğrenmesi yaklaşımını kullanmışlardır. Politik ilişki, etnik köken ve belirli bir iş alanına olan ilgiyi belirleme gibi 3 farklı uygulama üzerinde çalışmış ve sonuçların çeşitlilik gösterdiğini belirtmişlerdir [3]. Go vd. çalışmalarında Twitter verisini kullanarak uzaktan denetimli öğrenme yöntemiyle duygu analizi yapmayı amaçlamışlardır. Çalışmadaki veri seti olumlu tweet olumsuz tweet olmak üzere toplam tweetten oluşmaktadır. Oluşan veri seti bigram, unigram ve bigram, unigram ile birleştirerek analiz edilmiştir ve makine öğrenmesi algoritmalarından SVM, Naive Bayes, Maximum Entropi sınıflandırma yöntemleri kullanılmıştır. Çalışma sonucunda SVM unigrama göre 82,2% doğruluk oranı, Naive Bayes bi-grama göre 8,6% doğruluk oranı elde etmiş ve 83% doğruluk oranı ile en iyi performans Maximum Entropi unigram ile bi-gramın birlikte kullanılması sonucu elde edilmiştir [4]. Glid Katz vd., çalışmalarında diğerlerinden farklı olarak içerik tabanlı duygu analiz modeli olarak ConSent'i ortaya koymuşlardır. Ortaya koyulan bu model ilk aşama olarak eğitim seti içindeki anahtar terimlerin belirlenip analiz edilerek özniteliklerin bu terimlere göre oluşturulmasıyla başlar. İkinci aşama olarak ise her dokümanın terimleri ile anahtar kelimeleri incelenir, bulunanlara göre öznitelikler çıkartılır ve doküman sınıflandırılır. Yapılan çalışmada oluşturulan model Naive Bayes ve SVM yöntemleri ile karşılaştırılarak seyahat hizmeti veren site olan TripAdvisor dan elde edilen pozitif işaretli 5070 negatif işaretli yoruma ve IMDB'den elde edilen 000 negatif 000 pozitif olmak üzere 2000 veriye uygulanmıştır. Elde edilen sonuçlar incelendiğinde ortaya koyulan yeni modelin SVM ile yaklaşık sonuçlar verse de çok az daha başarılı olduğu görülmüştür. Çalışma sonucunda ortaya koyulan diğer bir durum ise ConSent modelinin kısa metinlerden oluşan verisetlerinde daha düşük başarı puanı elde etmesidir. [5] Duygu analizi çalışmalarında genellikle n-gram ile tümcenin ikili veya üçlü şekilde terimlerine bakılırken Matsumoto vd., kelimeler arasında sözdizimi bağını temel alan yeni bir model önermişlerdir. Örneğin, film çok güzeldi kelimesi 2-gram yöntemiyle film çok ve çok güzeldi olarak iki farklı şekilde dizilir. Bu çalışmada ortaya atılan modelde ise kelimelerin sırası korunarak sıralı olmayan Film güzeldi gibi sözdizimlerinin görülme olasılığını hesaba katar. Sözcükler arasındaki ilişki bağlılık alt ağacı yöntemiyle temsil edilmiştir. Bu sayede n-gram yöntemine göre daha fazla temsiliyet sağlanabilmiştir. Model, sırasıyla 380 ve 2000 verinin bulunduğu 2 ayrı film yorumlarına sınıflayıcı olarak SVM kullanılarak uygulanmıştır. Edilen sonuçlara göre, ortaya atılan yeni yöntem ilk veri setinde %87,3, ikinci veri setinde ise %92,9 başarı göstererek n-gram yönteminden daha iyi sonuçlar elde etmiştir [6]. Nikfarjam ve Azadeh duygu analizini twitter ve sağlık ile ilgili forumlardaki yorumlar üzerine uygulayarak hastaların ilaçların yan etkileri hakkındaki olumsuz düşüncelerini araştırmışlardır. Uygulamada yine kendileri tarafından ortaya atılmış ilaç alanındaki kavramları çıkartmak için koşullu rastgele alanları kullanan makine öğrenme tabanlı ADRMine yöntemi kullanılmıştır. Veriseti olarak sağlık sitesi olan DailyStrength ile Twitter'dan 6279 ve 784 yorum kullanılmıştır. Sonuçlar incelendiğinde ortaya atılan ADRMine yönteminin %82, ile SVM ve yine sağlık alanında kullanılan bir sınıflayıcı olan MetaMap yöntemlerinden daha yüksek başarı verdiği gözlemlenmiştir.[7] Duygu analiziyle ilgili olarak Türkçe veri setleri üzerinde çalışılan birçok çalışma mevcuttur. Nizam ve Akın'ın çalışmalarında sınıflar içerisindeki veri dağılımının sınıflandırma algoritmasındaki başarı oranına etkisi olup olmadığı araştırılmıştır. Gıda sektöründeki bazı firmaların farklı ürünlerine ait tweetlerinden dengeli ve dengesiz olmak üzere 2 veri seti kullanılmıştır. Bu 2 farklı veri seti olumlu, olumsuz ve tarafsız olmak üzere 3 ayrı sınıfa tek tek ayrılmıştır. Dengesiz veri seti için olumlu sınıfta 3, olumsuz sınıfta 277 ve tarafsız sınıfta 60 veri olmak üzere toplam 2000, dengeli veri seti içinse olumlu sınıfta 257, olumsuz sınıfta 277 ve tarafsız sınıfta 299 veri olmak üzere toplam 824 tweetten oluşan veri kümesi incelenmiştir. Naive Bayes (NB), Rassal Orman (RF), Destek Vektör Makineleri (SVM), Karar Ağacı (J48) ve k-en Yakın Komşu (k-nearest Neighbors) sınıflandırma algoritmaları kullanılarak 2 veri kümesi doğruluk (accuracy), kesinlik (precision), duyarlılık (recall) ve kappa istatistiği sonuçlarına göre karşılaştırılmıştır. Bu 4 modelin başarım ölçütleri ve kappa istatistiği sonuçlarına göre dengeli veri seti dengesiz veri setine kıyasla daha iyi performans göstermiştir. Diğer bir deyişle sınıflandırma algoritmalarının başarısı üzerindeki etkenlerden bir tanesi sınıflardaki veri dağılımlarıdır. En iyi performansı %72,33 doğruluk oranı ile SVM sınıflandırma algoritmasından elde etmişlerdir [8]. September 7-8, 206 Malatya/TURKEY 236

4 Türkmen ve Cemgil çalışmalarında SVM ve Rassal Orman sınıflayıcı yaklaşımıyla İstanbul' da 203 yılında gerçekleşen Gezi Parkı gösterileri süresinde gönderilen tweetlerden bireylerin politik ilgililiğinin ve eğiliminin olup olmadığını tahmin etmeyi amaçlamışlardır. El ile işaretlenen 35 Twitter mesajını sınıflandırmayı kolaylaştırmak amacıyla gösteri yanlısı, gösteri karşıtı ve nötral mesajlar olarak etiketlemiş ve öznitelik seçiminde ki-kare yönteminden faydalanmışlardır. Sınıflandırma başarısı doğruluk (accuracy) ölçütüne ek olarak kesinlik (precision) ve duyarlılık (recall) ölçütlerinin harmonik ortalaması olan f-ölçütü dikkate alınarak belirlenmiştir ve ilgililik tahmininde SVM algoritmasından daha verimli sonuç alırken eğilim tahmininde Rassal Orman algoritmasından %80 in üstünde başarım elde etmişlerdir [9]. Sevindi tez çalışmasında Türkçe film yorumlarının duygu kutuplarını çeşitli makine öğrenmesi yöntemleri kullanarak belirlemeye çalışmış ve bu yöntemleri karşılaştırmıştır. Karar Ağacı (C4.5), k-en Yakın Komşu (KNN), Naive Bayes ve Destek Vektör Makineleri (SVM) yöntemlerini kullanmış ve en iyi sonucu SVM sınıflandırma algoritması ile elde etmiştir [0]. Sosyal ortamlardaki bilgi sosyal, iş amaçlı ve birçok konuda kullanılabilir. Ancak bu bilgilerin tek tek çıkartılması hem zaman hem de maliyet açısından makul bir strateji olmayacaktır. Bundan dolayı bu işlemler otomatik hesaplama sistemleri geliştirilerek yapılmaktadır. Bu çalışmada, izlenen filmler hakkında dijital platformlarda yapılan yorumların içeriğine göre duygu barındırıp barındırmadığı ve bu duygunun olumlu ya da olumsuz olma durumunun saptanması amaçlanmıştır. Bu amaçla çalışmada yapay sinir ağları, destek vektör makinaları, Naive Bayes ve merkez tabanlı sınıflayıcı yöntemleri kullanılarak sonuçlar karşılaştırılmıştır. II. DENEYLER A. Veri Seti Deneyler için film yorumları tercih edilmiştir. İlk olarak 204 yılında Bo Pang ve Lillian Lee tarafından kullanılan veri setinin veri kaynağı olarak Internet Movie Database (IMDb) rec. arts. movies. reviews haber kaynağı kullanılmıştır. Veri seti pozitif ve negatif duyguları ayırt etmeye yoğunlaşmıştır ve pozitif sınıfta 000, negatif sınıfta 000 veri olmak üzere toplam 2000 veriden oluşmaktadır. B. Veri Özellikleri Bu bölümde, 000 i pozitif sınıfa, 000 i negatif sınıfa ayrılmış veri setlerinin eğitim ve sınıflandırma süreçlerine hazırlanması amacıyla tüm yorumlardaki simge ve noktalama işaretleri temizlenip karakterler küçük harfe çevrilmiş ve her bir kelimenin kökleri bulunmuştur. Bunun için PYTHON ortamında hazırlanan NLTK kütüphanesinden yararlanılmıştır ve terim listeleri oluşturulmuştur. Metin içerisindeki edat, bağlaç ve zamirlerden oluşan durak kelimeler ve 3 harften kısa olan kelimeler kaldırılmıştır. Özellik değerlendirme metotlarından terim frekansı (TF) ve ters doküman frekansı (IDF) kullanılmıştır. TF bir terimin dokümanlarda geçme sıklığını gösteren bir değerdir. IDF ise dokümanlarda çok sık geçen terimlerin hiçbir ayırt edici öneme sahip olmamasına rağmen terimin yüksek skora sahip olmasının önüne geçmektedir. C. Deneylerde Kullanılan Sınıflandırma Algoritmaları Bütün deneyler MATLAB yazılımı kullanılarak gerçekleştirilmiştir. Veri seti üzerinde Naive Bayes, Merkez Tabanlı Sınıflayıcı, Çok Katmanlı Yapay Sinir Ağları(MLP), Destek Vektör Makineleri (SVM) sınıflandırma algoritmaları kullanılmıştır. Sınıflandırma algoritmalarının arka planında metin içerikli verinin sayısal veriye dönüştürülme işlemi vardır. Bunun sonucunda, metin içerikli yorumlar makine öğrenimi algoritmalarının çalışabileceği sayısal matrislere dönüştürülmelidir. Bu işlem bazı metotlarla gerçekleştirilmektedir; örneğin: CountVectorizer: Metin içerikli dökümanlar sayısal matrislere çevirilmektedir. Term frequency Inverse document frequency (TF-IDF): Dökümandaki kelimenin önemini göstermektedir. Bir kelimenin doküman da geçme sıklığının artmasıyla TF-IDF değeri artmaktadır [].. Naive Bayes Naive Bayes, Bayes teoreminden faydalanılarak oluşturulmuş metin sınıflandırmada kullanılan anlaşılabilir ve kolaylıkla uygulanabilir en basit makine öğrenme algoritmalarından biridir. Bu yöntemle bir örneğin hedef niteliğinin sınıf değerine ait olma olasılıkları bulunabilmektedir [2]. Bayes teoremi: () Eşitlikte X; öznitelik vektörü, H ise bir öznitelik vektörünün C gibi bir sınıfa ait olma olasılığını ifade eden hipotezdir. P(H X) ise ardıl olasılığı temsil eder. Bayes teoremi göz önüne September 7-8, 206 Malatya/TURKEY 237

5 alınarak Naive Bayes sınıflandırıcısının algoritması ise şu şekildedir: D nin veri setini temsil ettiği ve D deki her X in sınıf etiketinin belli olduğu varsayılsın. X, n tane öznitelikten oluşan bir vektördür ve X=(x, x 2, x n ) olarak temsil edilmektedir. C, C 2, C m ile temsil edilen m tane sınıf olduğu varsayılsın. Naive Bayes sınıflandırıcısı bir X vektörünün C i sınıfına ait olup olmadığını bulmak için, bütün sınıflar içinde en yüksek P(C i X) ardıl olasılığına sahip değeri bulmaya çalışır. Bu durum Bayes teoremi ile eşitlik 2 de ifade edilmiştir. (2) P(X) değeri tüm sınıflar için aynı olduğundan, yalnızca P(X C i )P(C i ) ifadesi maksimum yapılmalıdır. P(C i ) ifadesi, C i sınıfındaki eleman sayısının, tüm eleman sayısına oranıdır. P(X C i ) ifadesi ise, X in n tane değer içeren bir öznitelik vektörü olduğu varsayıldığında aşağıdaki eşitlik 3 ile hesaplanır. vektör o sınıftaki vektörlerin skaler toplamının sınıftaki doküman sayısına bölümüyle elde edilir [3]. Merkez tabanlı sınıflayıcının çalışma mantığının gerisinde de vektörlerin benzerlik ilkesi yatar. Benzerlik için kosinüs yöntemi kullanılır. Aşağıdaki denklemde benzerliğin bulunması gösterilmektedir. 3. Çok Katmanlı Yapay Sinir Ağları (MLP) (5) Yapay Sinir Ağları(YSA) insan sinir sistemini taklit ederek öğrenmeyi hedefleyen denetimli bir makine öğrenmesi yöntemidir. Yapay sinir ağı modeli, Şekil de gösterildiği gibi bir katmanda bulunan nöronların takip eden katmandaki nöronlara bağlanması ile oluşturulur. En sık kullanılan yapay sinir ağı modeli olan çok katmanlı algılayıcı sinir ağı (MLP) modeli; girdi katmanı, gizli katman ve çıktı katmanı olmak üzere üç farklı katmandan meydana gelmektedir. Girdi katmanı verilerin okunduğu katmandır. Her bir nöron bir özelliği temsil ettiği için özellik sayısı kadar nöron içermektedir. Çıktı katmanı ise sınıfların belirlendiği katmandır. X v 0 j Eşik Degeri Z w 0 k Eşik Degeri Y (3) Sonuçta, sınıflandırıcı en büyük P(X C i )P(C i ) ifadesine sahip olan C i sınıfını, X vektörünün sınıfı olarak seçer [0]. 2. Merkez Tabanlı Sınıflayıcı X 2.. X n Giriş Katmanı i=..n vij.. Z 2 Z P Gizli Katman j=..p w jk Çıkış Katmanı k=..m Şekil.Çok Katmanlı İleri Beslemeli Yapay Sinir Ağı Y 2 Y m Merkez tabanlı sınıflayıcı vektör uzay tabanlı olup performansı yüksek bir sınıflandırma yöntemidir. Model her bir dokümanı terim uzayında bir vektör olarak ele alır. Vektörün her bir boyutu dokümanda geçen terimin ağırlıklandırılmış frekansını tutar. Merkez tabanlı sınıflandırmada sınıflar merkez adı verilen vektörlerde sunulur. Merkez, sınıf elemanlarını sunan ortalama bir değerdir ve bu orta değerlerin bütün sınıfı temsil ettiği kabul edilir. Eğitim seti k farklı nitelik içeriyorsa bu eğitim verilerinden k adet merkez vektörü elde edilir []. (4) Eşitlikte 4 ilgili sınıftaki dokümanların kümesini göstermektedir. İlgili sınıftaki ortalama Bu katman oluşturulan modele göre tek bir nöron içerebileceği gibi sınıf çeşidi sayısı kadar nöron da içerebilmektedir. Gizli katman ise girdi katmanı ile çıktı katmanı arasında yer alan verilerin ara işleme maruz kaldığı katmandır. Gizli katman sayısı ve bir gizli katmandaki nöron sayısı tam olarak belli olmamakla birlikte eğitimin kalitesini etkileyen önemli iki faktördür [4]. MLP modelinde öğrenme bir önceki katmandan takip eden katmana doğru yapıldığı için ileri beslemeli YSA olarak da bilinir. Kullanılan eğitim algoritması hatanın karesini en aza indirecek şekilde ağırlıkları güncellemeyi hedefler. (6) September 7-8, 206 Malatya/TURKEY 238

6 (7) Eşitlik 6, MLP modelinde ileri beslemeyi, Eşitlik 7 ise geri beslemeyi formüle etmektedir. Eşitlik 6 da x_j mevcut katmandaki j. nöronun değerini, y_i takip eden katmandaki i. nörona aktarılan değeri, n mevcut katmandaki nöron sayısını, w_ji mevcut katmandaki j. nörondan takip eden katmandaki i. nörona giden ağırlığı, f ise aktivasyon fonksiyonunu (örneğin: gauss, softmax, sigmoid ) temsil etmektedir. Eşitlik 7 de k, veri setindeki örnek sayısını, t_k verilerin gerçek sınıfını, o_k ise modelin üretmiş olduğu sınıf değerini temsil etmektedir. 4. Destek Vektör Makineleri (DVM) Destek vektör makinesi iki boyutlu uzayda doğrusal, üç boyutlu uzayda düzlemsel ve çok boyutlu uzayda hiperdüzlem şeklindeki ayırma mekanizmaları ile veriyi iki ya da daha çok sınıfa ayırma yeteneğine sahiptir [5]. Lineer olarak ayrıştırılabilen sınıfların belirlenmesinde sıkça kullanılan yöntem, kernel fonksiyonları sayesinde doğrusal olarak ayrıştırılamayan girdi uzayını daha yüksek boyutlu lineer olarak ayrıştırılabilen bu uzaya taşıyarak, doğrusal olmayan verilerin sınıflandırılmasında başarıyla kullanılmaktadır. Eğitim için kullanılacak N elemandan oluşan verinin, i =,2,N olduğu varsayılırsa özellik vektörünü, ise sınıf değerlerini gösterir. Lineer olarak ayrılma durumunda, bu iki değerli veriler direkt olarak bir ayırıcı düzlem ile ayrılabilir. Veri setini sınıflara ayırabilecek sonsuz sayıda çoklu düzlem çizilebilmesine karşın, amaç, bilinmeyen sınıflama hatasını en küçük yapacak hiperdüzlemi seçmektir. Şekil 2 de görüleceği üzere durumu birinci sınıfı, ( ve durumu ise ikinci sınıfı ( ) temsil eder. problem, Lagrange denklemleri, Eşitlik 9 ve Eşitlik 0 da verilen Karush Kuhn Tucker (KKT) ın kısıtları yardımıyla çözülür [4]., (8) (9) (0) Kernel fonksiyonu kullanılarak doğrusal olmayan dönüşümler yapılabilmekte ve bu sayede yüksek boyutta doğrusal olarak ayrımına imkân vermektedir. En yaygın kernel fonksiyonları Gauss, Polinomial ve Sigmoid fonksiyonlarıdır. D. Sınıflandırma Algoritmalarının Karşılaştırılmasında Kullanılan Kriterler. Model başarım ölçütleri Sınıflama performansını karşılaştırmak için kullanılan metrikler ve bunlara ilişkin formüller aşağıda verilmiştir. Kesinlik (Precision): Sınıflandırıcı sonucunun kesinlik derecesini verir. Pozitif olarak etiketlenen örneklerin sayısının pozitif olarak sınıflandırılmış toplam örneklere oranıdır. () Duyarlılık (Recall): Pozitif olarak etiketlenmiş örneklerin gerçekten pozitif olan örneklerin toplam sayısına oranıdır. (2) Doğruluk (Accuracy): Sınıflandırma işleminde en çok kullanılan ölçümdür. Doğru olarak sınıflandırılmış örneklerin toplam örnek sayısına oranıdır. (3) F-Measure: F Ölçümü, kesinlik ve duyarlılık metrikleri kullanılarak hesaplanmaktadır. Sistemin, kesinlik ve ya duyarlılık yönüne doğru optimize edilmesinde kullanılmaktadır. (4) Şekil 2.Destek Vektör Makineleri ve Hiperdüzlem Seçimi İki sınır arasındaki uzaklık formülü ile ifade edilir. Amaç, değerini maksimum yapmak olduğu için ifadesi minimum olmalıdır. Buna bağlı sınırlama ise, dir. İlgili problemin duali, Eşitlik 8 de verilmiştir. Eşitlikteki Eşitliklerde kullanılan TP, FP, TN, FN değerleri sırasıyla; TP (True Positive Rate): Pozitif olan aynı zamanda sınıflandırıcı tarafından da pozitif olarak sınıflandırılmış yorumların sayısını gösterir. FP (False Positive Rate): Pozitif olan ancak sınıflandırıcı tarafından pozitif olarak sınıflandırılmamış yorumların sayısını gösterir. September 7-8, 206 Malatya/TURKEY 239

7 TN (True Nagative Rate): Negatif olan aynı zamanda sınıflandırıcı tarafından da negatif olarak sınıflandırılmış yorumların sayısını gösterir. FN (False Nagative Rate): Negatif olan ancak sınıflandırıcı tarafından negatif olarak sınıflandırılmamış yorumların sayısını gösterir. III. SONUÇLARIN DEĞERLENDİRİLMESİ VE TARTIŞILMASI A. Deneysel Sonuçlar Çalışmada 2000 adet film yorumu içeren veri seti kullanılmıştır. Makine öğrenmesi yöntemleri kullanılarak MATLAB de Naive Bayes, Merkez Tabanlı Sınıflayıcı, Çok Katmanlı Yapay Sinir Ağları ve Destek Vektör Makineleri sınıflandırma algoritmalarından yararlanılmıştır. Veri setinin eğitimi ve sınıflandırma sürecinden önce ön işlem aşamaları uygulanmıştır. Ön işlem aşamasından sonra TF ve IDF değerlerinden oluşan vektör uzay modeli elde edilmiştir. Tüm sınıflama algoritmalarında eğitim için veri setinin %75 i ayrılmış, kalan %25 lik bölüm ise test amacıyla kullanılmıştır. Yapay sinir ağlarında 3 katmanlı MLP modeli tercih edilmiş, orta katmanda 0 gizli nöron, çıkış katmanında ise 2 nöron kullanılmıştır. Giriş katmanındaki nöron sayısı ise özellik sayısıyla aynıdır. Ağın eğitimde trainscg (Scaled conjugate gradient backpropagation) algoritması ve performans değerlendirmek içinse crossentropy kullanılmıştır. SVM algoritmasında ise kernel fonksiyonu olarak radyal fonksiyon kullanıldığında eğitim veri seti için %00 doğruluk oranı elde edilirken test veri seti için doğruluk oranı %50 oranında bulunmuştur. Aşırı eğitimden dolayı (overftting) dolayı uygulamada RBF yerine liner fonksiyon tercih edilmiştir. Tablo de kullanılan sınıflandırma yöntemlerine göre eğitim, test, ve tüm veri setine ilişkin TP, TN, FP ve FN değerlerini gösteren çapraz karmaşıklık matrisleri verilmiştir. P değeri pozitif, N ise negatif yorum sayılarını ifade etmektedir. Performans ölçütlerinden görüleceği gibi en iyi sınıflama performansı destek vektör makinelerinde elde edilmiştir. Şekil 3 te verilen ROC eğrilerinden de bu durum görülmektedir, ROC eğrilerinde sol üst köşeye en yakın grafik, performansı en yüksek sınıflayıcıya ait grafiktir. Tablo 2. Sonuç Değerleri Yöntem A P R F AUC Naive Centroid ANN SVM Naive Centroid ANN SVM Naive Centroid ANN SVM Eğitim Test Tümü Tablo. Sınıflama sonucunda elde edilen karmaşıklık matrisleri Eğitim Test Tümü Gözlenen Gözlenen Gözlenen N. Bayes Tahmin N P N P N P N P Centroid Tahmin N P N P N P N P ANN Tahmin N P N P N P N P SVM Tahmin N P N P N P N P Şekil 3. ROC Eğrisi a)test verisi b) Tüm veri September 7-8, 206 Malatya/TURKEY 240

8 IV. Sonuç Bu çalışmada IMDB de yer alan film yorumlarını içeren veri seti üzerinde çeşitli makine öğrenme teknikleri kullanılarak bir duygu analizi çalışması yapılmıştır. Makine öğrenmesinde sıkça kullanılan sınıflandırma algoritmalarından yapay sinir ağları, destek vektör makinaları, Naive Bayes ve merkez tabanlı sınıflayıcı algoritmaları kullanılmış; ilgili sınıflayıcıların performans karşılaştırması model başarım ölçütlerine göre yapılmıştır. Bu başarım ölçütleri incelendiğinde en yüksek değerler Yapay sinir ağları ve Destek vektör makinalarında elde edilmiştir. Eğitim veri setinde YSA %89.73 doğru sınıflandırma oranıyla SVM den (%84.07) daha iyi başarı sergilerken her iki sınıflayıcı da test veri seti için %75 civarında doğru sınıflama oranıyla hemen hemen aynı performansı göstermişlerdir. Beklendiği üzere basit birer sınıflayıcı olan Merkez tabanlı sınıflayıcı ve Naive bayes sınıflayıcı diğer iki sınıflayıcıya oranla daha düşük bir başarı göstermişlerdir. KAYNAKLAR [] Serrano-Guerrero, J., Olivas, J. A., Romero, F. P., & Herrera-Viedma, E.. "Sentiment analysis: a review and comparative analysis of web services," Information Sciences 3, 205,pp [2] Pang, Bo, Lillian Lee, and Shivakumar Vaithyanathan. "Thumbs up?: sentiment classification using machine learning techniques," Proceedings of the ACL-02 conference on Empirical methods in natural language processing-volume 0. Association for Computational Linguistics, [3] Pennacchiotti, Marco, and Ana-Maria Popescu. "A Machine Learning Approach to Twitter User Classification," ICWSM, 20,pp [4] Go, Alec, Richa Bhayani, and Lei Huang. "Twitter sentiment classification using distant supervision," CS224N Project Report, Stanford, 2009,pp.2. [5] Katz, Gilad, Nir Ofek, and Bracha Shapira. "ConSent: Context-based sentiment analysis," Knowledge-Based Systems 84,205,pp [6] Matsumoto, Shotaro, Hiroya Takamura, and Manabu Okumura. "Sentiment classification using word sub-sequences and dependency sub-trees," Pacific-Asia Conference on Knowledge Discovery and Data Mining. Springer Berlin Heidelberg, [7] Nikfarjam, A., Sarker, A., O Connor, K., Ginn, R., & Gonzalez, G. "Pharmacovigilance from social media: mining adverse drug reaction mentions using sequence labeling with word embedding cluster features," Journal of the American Medical Informatics Association,205, pp ocu04. [8] Nizam, Hatice, and Saliha Sıla Akın. "Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması," XIX. Türkiye'de İnternet Konferansı,204. [9] Türkmen, Ali Caner, and Ali Taylan Cemgil. "Political interest and tendency prediction from microblog data," nd Signal Processing and Communications Applications Conference (SIU), IEEE, 204. [0] Sevindi, B. İbrahim. "Türkçe Metinlerde Denetimli ve Sözlük Tabanlı Duygu Analizi Yaklaşımlarının Karşılaştırılması," Yüksek Lisans Tezi, 203. [] Tripathy, Abinash, Ankit Agrawal, and Santanu Kumar Rath. "Classification of sentiment reviews using n-gram machine learning approach," Expert Systems with Applications 57, 206, pp [2] Kartal, Elif, Enformatik Programı, and M. Erdal BALABAN. Sınıflandırmaya Dayalı Makine Öğrenmesi Teknikleri ve Kardiyolojik Risk Değerlendirmesine İlişkin Bir Uygulama, Doktora Tezi, Haziran 205, pp [3] Kaynar, O., Yıldız S. Elektronik Postaların Centroid Tabanlı Sınıflayıcı, Yapay Sinir Ağları ve Destek Vektör Makinaları Yardımıyla Tespit Edilmesi, 2.Ulusal Yönetim Bilişim Sistemleri Kongresi, 205 [4] Arslan, H., Kaynar, O., Yüksek, A.G. &; Gün, O. Kurumsal Kolektif Süreçler için E-Posta İletilerinden Görev Keşfi ve Gerçek Zamanlı Görev Yönetim Sisteminin Geliştirilmesi, Global Journal on Technology, Kasım 205. [5] Güran, Aysun, Mitat Uysal, and Özge Doğrusöz. "Destek vektör makineleri parametre optimizasyonunun duygu analizi üzerindeki etkisi," DEÜ Mühendislik Fakültesi Mühendislik Bilimleri Dergisi 48, 204,pp September 7-8, 206 Malatya/TURKEY 24

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü haticenizam@outlook.com Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar

Detaylı

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması inet-tr 14 - XIX. Türkiye'de İnternet Konferansı Bildirileri 27-29 Kasım 2014 Yaşar Üniversitesi, İzmir Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının

Detaylı

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması Hatice Nizam 1, Saliha Sıla Akın 2 1 İstanbul Üniversitesi Bilgisayar Mühendisliği

Detaylı

Türkçe Dokümanlar Ġçin Yazar Tanıma

Türkçe Dokümanlar Ġçin Yazar Tanıma Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması 1 Emre DANDIL Bilecik Ş. Edebali Üniversitesi emre.dandil@bilecik.edu.tr +90228 214 1613 Sunum İçeriği Özet Giriş

Detaylı

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

Türkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi

Türkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi Türkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi Aytuğ Onan 1 1 Celal Bayar Üniversitesi, Yazılım Mühendisliği Bölümü, Manisa aytug.onan@cbu.edu.tr Özet: Duygu analizi, görüş

Detaylı

Naive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ

Naive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ Naive Bayes Yöntemi ile Spam Mail Teşhisi 2 17574006-Kübra KURNAZ Yıldız Teknik Üniversitesi, Elektrik-Elektronik Fakültesi, Bilgisayar Mühendisliği Bölümü, Tezsiz Yüksek Lisans Bilgi Teknolojileri Özet

Detaylı

Veri ve Metin Madenciliği. Zehra

Veri ve Metin Madenciliği. Zehra Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Otomatik Doküman Sınıflandırma Rumeysa YILMAZ, Rıfat AŞLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr, kgunel@aduedutr

Detaylı

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu Sunan : Esra Nergis Güven İçerik Giriş Amaç ve Kapsam Sınıflandırma Geliştirilen Sistem

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Akademik Bilişim 12 - XIV Akademik Bilişim Konferansı Bildirileri Otomatik Doküman Sınıflandırma Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr,

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

YÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ

YÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ YÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ http://dergipark.ulakbim.gov.tr/ybs Yayın Geliş Tarihi: 16.11.2017 Cilt:3, Sayı:2, Yıl:2017, Sayfa: 1-14 Yayına Kabul Tarihi: 23.11.2017 ISSN: 2148-3752 Online Yayın

Detaylı

DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014

DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014 DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014 DESTEK VEKTÖR MAKİNELERİ PARAMETRE OPTİMİZASYONUNUN DUYGU ANALİZİ ÜZERİNDEKİ ETKİSİ (EFFECTS OF SUPPORT VECTOR

Detaylı

VERİ MADENCİLİĞİ Metin Madenciliği

VERİ MADENCİLİĞİ Metin Madenciliği VERİ MADENCİLİĞİ Metin Madenciliği Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Metin için Veri Madenciliği Metin Madenciliğinde Sorunlar Metin madenciliği: Veri madenciliği teknikleri ile yazılı belgeler arasındaki

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

Kelime Gösterimleri (Word Representation Word Embeddings)

Kelime Gösterimleri (Word Representation Word Embeddings) Kelime Gösterimleri (Word Representation Word Embeddings) Kelime, cümlede kullanımına göre farklı anlamlar kazanabilir Anlamsal bilginin çıkarılması metinlerin işlenmesinde önemlidir Kelimelerin işlenebilir

Detaylı

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

İş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ

İş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ İş Zekası Hafta 6 Kestirimci Modelleme Teknikleri Business Intelligence and Analytics: Systems for Decision Support 10e isimli eserden adapte edilmiştir Bölüm Amaçları Yapay Sinir Ağları (YSA) kavramını

Detaylı

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR KAHKAHA TANIMA İÇİN RASSAL ORMANLAR Heysem Kaya, A. Mehdi Erçetin, A. Ali Salah, S. Fikret Gürgen Bilgisayar Mühendisliği Bölümü Boğaziçi Üniversitesi / Istanbul Akademik Bilişim'14, Mersin, 05.02.2014

Detaylı

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir.

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir. ÇELĐK YÜZEYLERĐN SINIFLANDIRILMASI * Cem ÜNSALAN ** Aytül ERÇĐL * Ayşın ERTÜZÜN *Boğaziçi Üniversitesi, Elektrik-Elektronik Mühendisliği Bölümü unsalan@boun.edu.tr **Boğaziçi Üniversitesi, Endüstri Mühendisliği

Detaylı

Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım

Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım Yılmaz KAYA 1, Ömer Faruk ERTUĞRUL 2, Ramazan TEKİN 3 1 Siirt Üniversitesi, Bilgisayar Mühendisliği Bölümü 2 Batman Üniversitesi, Elektrik-Elektronik

Detaylı

Hafta 10 - Vektör Uzay Modelleri

Hafta 10 - Vektör Uzay Modelleri BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler

Detaylı

Metin Sınıflandırma. Akış

Metin Sınıflandırma. Akış Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle

Detaylı

TANI TESTLERINE GIRIŞ & ROC ANALİZİ

TANI TESTLERINE GIRIŞ & ROC ANALİZİ TANI TESTLERINE GIRIŞ & ROC ANALİZİ Yrd.Doç.Dr. Selçuk Korkmaz Trakya Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Turcosa Analitik Çözümlemeler selcukorkmaz@gmail.com ÇOCUK NEFROLOJİ DERNEĞİ

Detaylı

Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval

Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval İsmail Haberal Bilgisayar Mühendisliği Bölümü Başkent Üniversitesi ihaberal@baskent.edu.tr Umut

Detaylı

Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması

Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması Yağız Nalçakan 1,Şan Sıtkı Bayramoğlu 2, Samed Tuna 3 1, 2, 3 Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü, Edirne yagiznalcakan@gmail.com,

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Giriş Bilgi Erişiminde Temel Yaklaşımlar Bilgi Erişim Modelleri Boolean model Vector space

Detaylı

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ Umut FIRAT ufirat@yahoo.com Öz: Depremler yeryüzünde en çok yıkıma neden olan doğal afetlerdir. Bu durum, depremlerin önceden tahmin edilmesi fikrini

Detaylı

Karaciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı. In the Diagnosis of Liver Failure Using Machine Learning Algorithms

Karaciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı. In the Diagnosis of Liver Failure Using Machine Learning Algorithms Karaciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı 1 Ekrem Alkuşak ve * 2 Murat Gök 1 Bilgisayar Mühendisliği Bölümü, Yalova Üniversitesi, Yalova, Türkiye 2 Bilgisayar Mühendisliği

Detaylı

Uzaktan Algılama Uygulamaları

Uzaktan Algılama Uygulamaları Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ

Detaylı

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr

Detaylı

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21 İçindekiler Önsöz İkinci Basım için Önsöz Türkçe Çeviri için Önsöz Gösterim xiii xv xvii xix 1 Giriş 1 1.1 Yapay Öğrenme Nedir?......................... 1 1.2 Yapay Öğrenme Uygulamalarına Örnekler...............

Detaylı

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi

Detaylı

Destekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines)

Destekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines) Destekçi Vektör Makineleri Destekçi Vektör Makineleri(Support Vector Machines) Değişkenler arasındaki örüntülerin bilinmediği veri setlerindeki sınıflama problemleri için önerilmiş bir makine öğrenmesi

Detaylı

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest

Detaylı

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI Yapay Sinir Ağları (Artificial Neural Networks) J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Yapay Sinir Ağları Tarihçe Biyolojik

Detaylı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım 2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı

Detaylı

Büyük Veri ve Endüstri Mühendisliği

Büyük Veri ve Endüstri Mühendisliği Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan

Detaylı

Global Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey.

Global Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey. Global Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey. DETERMINATION OF TWITTER USERS SENTIMENT POLARITY TOWARD AIRLINE MARKET IN TURKEY: A CASE OF OPINION MINING DOI: 10.17261/Pressacademia.2016118690

Detaylı

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi YRD. DOÇ. DR. HÜSEYİN GÜRÜLER MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ, TEKNOLOJİ FAKÜLTESİ, BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ Meslek Seçimi Meslek Seçimi

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

İÇİNDEKİLER ÖNSÖZ Bölüm 1 SAYILAR 11 Bölüm 2 KÜMELER 31 Bölüm 3 FONKSİYONLAR

İÇİNDEKİLER ÖNSÖZ Bölüm 1 SAYILAR 11 Bölüm 2 KÜMELER 31 Bölüm 3 FONKSİYONLAR İÇİNDEKİLER ÖNSÖZ III Bölüm 1 SAYILAR 11 1.1. Sayı Kümeleri 12 1.1.1.Doğal Sayılar Kümesi 12 1.1.2.Tam Sayılar Kümesi 13 1.1.3.Rasyonel Sayılar Kümesi 14 1.1.4. İrrasyonel Sayılar Kümesi 16 1.1.5. Gerçel

Detaylı

Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov

Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi Hazırlayan: Nury Amanmadov Göğüs Kanseri Nedir? Gögüs Kanseri göğüs hücrelerinde başlayan

Detaylı

AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Değerlendirilmesi AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Detaylı

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama

Detaylı

Makine Öğrenmesi 2. hafta

Makine Öğrenmesi 2. hafta Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde

Detaylı

Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı. Mehmet Ali Çavuşlu

Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı. Mehmet Ali Çavuşlu Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı Mehmet Ali Çavuşlu Özet Yapay sinir ağlarının eğitiminde genellikle geriye

Detaylı

Bulanık Mantık Tabanlı Uçak Modeli Tespiti

Bulanık Mantık Tabanlı Uçak Modeli Tespiti Bulanık Mantık Tabanlı Uçak Modeli Tespiti Hüseyin Fidan, Vildan Çınarlı, Muhammed Uysal, Kadriye Filiz Balbal, Ali Özdemir 1, Ayşegül Alaybeyoğlu 2 1 Celal Bayar Üniversitesi, Matematik Bölümü, Manisa

Detaylı

YÖNEYLEM ARAŞTIRMASI - III

YÖNEYLEM ARAŞTIRMASI - III YÖNEYLEM ARAŞTIRMASI - III Prof. Dr. Cemalettin KUBAT Yrd. Doç. Dr. Özer UYGUN İçerik Quadratic Programming Bir karesel programlama modeli aşağıdaki gibi tanımlanır. Amaç fonksiyonu: Maks.(veya Min.) z

Detaylı

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız. .4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin

Detaylı

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA Makine Öğrenmesi Çok büyük miktardaki verilerin elle işlenip analiz edilmesi mümkün değildir. Bu tür problemlere çözüm bulmak amacıyla makine öğrenmesi

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri Konular VERİ MADENCİLİĞİ Farklı Sınıflandırma Yöntemleri Yrd. Doç. Dr. Şule Gündüz Öğüdücü Örnek tabanlı yöntemler ken Yakın Komşu Yöntemi Genetik Algoritmalar Bulanık Küme Sınıflandırıcılar Öngörü Eğri

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

CBS ve Coğrafi Hesaplama

CBS ve Coğrafi Hesaplama Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Makine Öğrenmesi Erhan AKDOĞAN, Ph.D. Bu ders notunun hazırlanmasında Dr. U.Orhan ve Banu Diri nin ders notlarından yararlanılmıştır. Makine öğrenmesi

Detaylı

Yrd. Doç. Dr. A. Burak İNNER

Yrd. Doç. Dr. A. Burak İNNER Yrd. Doç. Dr. A. Burak İNNER Kocaeli Üniversitesi Bilgisayar Mühendisliği Yapay Zeka ve Benzetim Sistemleri Ar-Ge Lab. http://yapbenzet.kocaeli.edu.tr Regresyon o EnKüçük Kareler Yöntemi Doğru Uydurma

Detaylı

Çok katmanlı ileri sürümlü YSA da standart geri yayıyım ve momentum geri yayılım algoritmalarının karşılaştırılması. (Eğitim/Hata geri yayılım)

Çok katmanlı ileri sürümlü YSA da standart geri yayıyım ve momentum geri yayılım algoritmalarının karşılaştırılması. (Eğitim/Hata geri yayılım) Çok katmanlı ileri sürümlü YSA da standart geri yayıyım ve momentum geri yayılım algoritmalarının karşılaştırılması (Eğitim/Hata geri yayılım) Özetçe Bu çalışmada çok katmanlı ve ileri sürümlü bir YSA

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Eş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama

Eş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama Eş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama Katira Soleymanzadeh1, Ufuk Hürriyetoğlu1, Bahar Karaoğlan1, Senem Kumova Metin2, Tarık Kışla3 1 Ege Üniversitesi, Uluslararası Bilgisayar Enstitüsü,

Detaylı

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Akış Makine Öğrenmesi nedir? Günlük Hayatımızdaki Uygulamaları Verilerin Sayısallaştırılması Özellik Belirleme Özellik Seçim Metotları Bilgi Kazancı (Informaiton Gain-IG) Sinyalin Gürültüye Oranı: (S2N

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Ara sınav - 25% Ödev (Haftalık) - 10% Ödev Sunumu (Haftalık) - 5% Final (Proje Sunumu) - 60% - Dönem sonuna kadar bir optimizasyon tekniğiyle uygulama geliştirilecek (Örn:

Detaylı

EŞİTLİK KISITLI TÜREVLİ YÖNTEMLER

EŞİTLİK KISITLI TÜREVLİ YÖNTEMLER EŞİTLİK KISITLI TÜREVLİ YÖNTEMLER LAGRANGE YÖNTEMİ Bu metodu incelemek için Amaç fonksiyonu Min.z= f(x) Kısıtı g(x)=0 olan problemde değişkenler ve kısıtlar genel olarak şeklinde gösterilir. fonksiyonlarının

Detaylı

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Örüntü Tanıma Dersin Orjinal Adı: Pattern Recognition Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora) Lisansüstü Dersin Kodu: CSE

Detaylı

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Maltepe Üniversitesi, Yazılım Mühendisliği Bölümü, İstanbul zeynepguven@maltepe.edu.tr, turgaybilgin@maltepe.edu.tr Özet: Zaman serileri

Detaylı

BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY ZEKA İLE ZAMAN TAHMİNİ SONER ŞÜKRÜ ALTIN

BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY ZEKA İLE ZAMAN TAHMİNİ SONER ŞÜKRÜ ALTIN BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY ZEKA İLE ZAMAN TAHMİNİ SONER ŞÜKRÜ ALTIN YÜKSEK LİSANS TEZİ 2011 BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY

Detaylı

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan.   blog.mustafabaydogan. Veri Madenciliği Yrd. Doç. Dr. Mustafa Gökçe Baydoğan mustafa.baydogan@boun.edu.tr www.mustafabaydogan.com blog.mustafabaydogan.com İçerik p Veri Madenciliği nedir? n Bir örnek p Boğaziçi Üniversitesi

Detaylı

Dr. Ergün AKGÜN Kimdir?

Dr. Ergün AKGÜN Kimdir? Dr. Ergün AKGÜN Kimdir? Dr. Ergün AKGÜN 1985 yılında Bursa nın İnegöl İlçesinde doğmuştur. Lisans eğitimini Muğla Üniversitesi Sınıf Öğretmenliği bölümünde yapmıştır. Muğla Üniversitesinde Eğitim Programları

Detaylı

28/04/2014 tarihli LYS-1 Matematik-Geometri Testi konu analizi SORU NO LYS 1 MATEMATİK TESTİ KAZANIM NO KAZANIMLAR 1 / 31

28/04/2014 tarihli LYS-1 Matematik-Geometri Testi konu analizi SORU NO LYS 1 MATEMATİK TESTİ KAZANIM NO KAZANIMLAR 1 / 31 SORU NO LYS 1 MATEMATİK TESTİ A B KAZANIM NO KAZANIMLAR 1 1 / 31 11 32159 Rasyonel sayı kavramını açıklar. 2 12 32151 İki ya da daha çok doğal sayının en büyük ortak bölenini ve en küçük ortak katını bulur.

Detaylı

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ YAPAY SİNİR AĞLARI Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ İÇERİK Sinir Hücreleri Yapay Sinir Ağları Yapısı Elemanları Çalışması Modelleri Yapılarına Göre Öğrenme Algoritmalarına Göre Avantaj ve

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 6- İSTATİSTİK VE REGRESYON ANALİZİ Doç. Dr. Ali Rıza YILDIZ 1 İSTATİSTİK VE REGRESYON ANALİZİ Bütün noktalardan geçen bir denklem bulmak yerine noktaları temsil eden, yani

Detaylı

Veri madenciliği yöntemleri

Veri madenciliği yöntemleri Sınıflandırma ve Kümeleme Kavramları Giriş Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemi sınıflandırma olarak adlandırılır, veri madenciliği tekniklerinden en çok bilinenidir; veri tabanlarındaki

Detaylı

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri VERİ MADENCİLİĞİ Farklı Sınıflandırma Yöntemleri Yrd. Doç. Dr. Şule Gündüz Öğüdücü Örnek tabanlı yöntemler ken Yakın Komşu Yöntemi Genetik Algoritmalar Karar Destek Makinaları Bulanık Küme Sınıflandırıcılar

Detaylı

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH ORTALAMA ÖLÇÜLERİ Ünite 6 Öğr. Gör. Ali Onur CERRAH Araştırma sonucunda elde edilen nitelik değişkenler hakkında tablo ve grafikle bilgi sahibi olunurken, sayısal değişkenler hakkında bilgi sahibi olmanın

Detaylı

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ Doç.Dr Erhan Akyazı Marmara Üniversitesi Bilişim Bölümü eakyazi@marmara.edu.tr Şafak Kayıkçı Marmara Üniversitesi Bilişim Bölümü safak@safakkayikci.com

Detaylı

Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme

Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme Doç. Dr. Bilge Karaçalı Biyomedikal Veri İşleme Laboratuvarı Elektrik-Elektronik

Detaylı

YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI ARTIFICIAL NEURAL NETWORKS METHOD FOR MAP DIGITIZATION

YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI ARTIFICIAL NEURAL NETWORKS METHOD FOR MAP DIGITIZATION YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI Y.ŞİŞMAN 1, H. DEMİRTAŞ 2 1 Ondokuz Mayıs Üniversitesi, Harita Mühendisliği Bölümü, 55139, Samsun/TÜRKİYE ysisman@omu.edu.tr 2 Sağlık Bakanlığı,

Detaylı

Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.

Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır. ÇOK ÖLÇÜTLÜ KARAR VERME TOPSIS (Technique For Order Preference By Similarity To Ideal Solution) PROF. DR. İBRAHİM ÇİL 1 Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.

Detaylı

YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI

YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI DR. ÖĞR. ÜYESİ GÖKHAN ALTAN BİLGİSAYAR MÜH. BÖL. İSKENDERUN TEKNİK ÜNİVERSİTESİ KONUŞMA İÇERİĞİ Bilgisayar Bilimi Makine Öğrenmesi nedir? Makine

Detaylı

PARÇACIK SÜRÜ OPTİMİZASYONU BMÜ-579 METASEZGİSEL YÖNTEMLER YRD. DOÇ. DR. İLHAN AYDIN

PARÇACIK SÜRÜ OPTİMİZASYONU BMÜ-579 METASEZGİSEL YÖNTEMLER YRD. DOÇ. DR. İLHAN AYDIN PARÇACIK SÜRÜ OPTİMİZASYONU BMÜ-579 METASEZGİSEL YÖNTEMLER YRD. DOÇ. DR. İLHAN AYDIN 1995 yılında Dr.Eberhart ve Dr.Kennedy tarafından geliştirilmiş popülasyon temelli sezgisel bir optimizasyon tekniğidir.

Detaylı

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu

Detaylı

Çağrı Merkezi Metin Madenciliği Yazılım Çerçevesi. Call Center Text Mining Framework

Çağrı Merkezi Metin Madenciliği Yazılım Çerçevesi. Call Center Text Mining Framework Çağrı Merkezi Metin Madenciliği Yazılım Çerçevesi İbrahim Onuralp Yiğit Türk Telekom, İstanbul, Türkiye ibrahimonuralp.yigit@turktelekom.com.tr Özet. Çağrı merkezlerine gelen çağrıların sesten metne dönüştürülerek

Detaylı

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ Algoritma Analizi Çerçevesi Algoritma Analizinde Göz Önünde Bulundurulması Gerekenler Neler? Algoritmanın Doğruluğu (Correctness) Zaman

Detaylı

SİSMİK DARBELERİN SINIFLANDIRILARAK DEPREM TEHLİKESİNİN TAHMİN EDİLMESİ

SİSMİK DARBELERİN SINIFLANDIRILARAK DEPREM TEHLİKESİNİN TAHMİN EDİLMESİ SİSMİK DARBELERİN SINIFLANDIRILARAK DEPREM TEHLİKESİNİN TAHMİN EDİLMESİ Mehmet BİLEN 1, Ali Hakan IŞIK 2,Tuncay YİĞİT 3 1 Mehmet Akif Ersoy Üniversitesi, Çavdır Meslek Yüksek Okulu, Burdur 2 Mehmet Akif

Detaylı

Örüntü Tanıma (EE 448) Ders Detayları

Örüntü Tanıma (EE 448) Ders Detayları Örüntü Tanıma (EE 448) Ders Detayları Ders Adı Ders Kodu Dönemi Ders Saati Uygulama Saati Laboratuar Saati Kredi AKTS Örüntü Tanıma EE 448 Bahar 3 0 0 3 5 Ön Koşul Ders(ler)i Dersin Dili Dersin Türü Dersin

Detaylı

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Şekil Tanıma Final Projesi. Selçuk BAŞAK 08501008

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Şekil Tanıma Final Projesi. Selçuk BAŞAK 08501008 Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü Şekil Tanıma Final Projesi Selçuk BAŞAK 08501008 Not: Ödevi hazırlamak için geliştirdiğim uygulama ve kaynak kodları ektedir.

Detaylı

İÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR

İÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR İÇİNDEKİLER ÖNSÖZ III Bölüm 1 KÜMELER 11 1.1. Küme 12 1.2. Kümelerin Gösterimi 13 1.3. Boş Küme 13 1.4. Denk Küme 13 1.5. Eşit Kümeler 13 1.6. Alt Küme 13 1.7. Alt Küme Sayısı 14 1.8. Öz Alt Küme 16 1.9.

Detaylı

Sıralama Öğrenme ile Sağkalım Tahminleme

Sıralama Öğrenme ile Sağkalım Tahminleme Boğazda Yapay Öğrenme İsmail Arı Yaz Okulu 08 Sıralama Öğrenme ile Sağkalım Tahminleme Öznur Taştan Mühendislik ve Doğa Bilimleri Fakültesi Bilgisayar Bilimi ve Mühendisliği Moleküler Biyoloji, Genetik

Detaylı

Esnek Hesaplamaya Giriş

Esnek Hesaplamaya Giriş Esnek Hesaplamaya Giriş J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Esnek Hesaplama Nedir? Esnek hesaplamanın temelinde yatan

Detaylı