Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques
|
|
- Yavuz Örnek
- 6 yıl önce
- İzleme sayısı:
Transkript
1 Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques Oğuz Kaynar Management Information System Cumhuriyet University Sivas, Turkey Mustafa Yıldız Management Information System Cumhuriyet University Sivas, Turkey Yasin Görmez Management Information System Cumhuriyet University Sivas, Turkey Ayşegül Albayrak Management Information System Cumhuriyet University Sivas, Turkey Özet- Günümüz teknolojisinde forumlar, bloglar ve sosyal medyanın her kesim tarafından çok yoğun kullanılmasından dolayı insanlar artık görüş, fikir ve hislerini bu ortamlar aracılığı ile paylaşmaya başlamıştır. Sosyal medya kullanımının artmasına paralel olarak araştırmacılar bu alana yönelik çalışmalarını arttırmışlardır. Özellikle Twitter üzerinde çalışılan önemli veri kaynaklarından biridir. Bu paylaşımlar araştırma ve analizler için önemli bir veri kaynağı oluşturmaktadır. Duygu-düşünce analizi kısaca verinin duygu içerip içermediğinin saptanması ve bu duygunun olumlu, olumsuz ve ya tarafsız olma durumunun belirlenmesidir. Bu çalışmada ise film yorumlarının içeriğine göre Naive Bayes, Merkez Tabanlı Sınıflayıcı, Çok Katmanlı Yapay Sinir Ağları (MLP) ve Destek Vektör Makineleri (SVM) gibi sınıflandırma algoritmaları kullanılarak duygudüşünce analizi yapılmıştır. Yapılan analizler sonucunda gerek eğitim gerekse test verilerinde yapay sinir ağları ve destek vektör makinalarının diğer yöntemlere oranla daha iyi sonuç verdiği gözlemlenmiştir. Anahtar kelimeler Duygu analizi, yapay sinir ağları, Destek vektör makinaları, Naive Bayes, Merkez tabanlı sınıflayıcı Abstract Because of the popularity of forums, blogs and many of the social media platforms among all of the society in our days, these tools have been accepted as distribution channels for people s opinions, ideas, and feelings. The increasing amount of social media usage in particularly Twitter has motivated researchers to study in this area. These expressions in the web have been used as important data sources for researches and analysis. The process of detection whether these data has any sentimenet and whether these sentiment positive, negative or neutral is defined as sentiment analysis. In this study, sentiment analysis has been performed by using classification algorithms depends on the context of the review, such as Naive Bayes, Central Based Classifier, Multi Layer Perception (MLP), and Support Vector Machines (SVM). According to experiments, it is seen that neural networks and support vector machines outperforms with both training and test sets. Index Terms Sentiment analysis, Neural network, Support vector machine, Naive Bayes, Centroid Based Classifier September 7-8, 206 Malatya/TURKEY 234
2 I. GİRİŞ İnternet kullanım imkânlarının yaygınlaşmasıyla beraber günümüzde insanlar vakitlerinin önemli bir kısmını internet üzerinde yer alan sosyal paylaşım ortamlarında harcamaktadırlar. Özellikle kişilerin kendilerini özgürce ifade edebildikleri ve bilgi paylaşımında bulunabildikleri sosyal medya, forum, blog gibi ortamlar günlük hayatımızda büyük bir yer edinmiştir. Kullanıcıların bu ortamlar vasıtasıyla ruh hallerini belirtmeleri, toplumu etkileyen olaylar, spor müsabakaları ve filmler gibi konularda kendi duygu ve düşüncelerini paylaşmaları bu ortamları toplumun genel kanısını belirtebilecek bir araca dönüştürmüştür. Hatta normal hayatlarında bazı nedenlerden dolayı gerçek duygu ve düşüncelerini paylaşamayan kişilerin, sosyal medya üzerinden kendilerini rahatça ifade edebilmeleri, sosyal medya ve diğer ortamları duygu analizi açısından daha gerçekçi sonuçlar verebilecek bir veri kaynağına dönüştürmüştür. Duygu analizi (Sentiment Analysis) olarak ifade edilen bilimsel çıkarım yöntemi, internet ortamının global çerçevede toplumun birçok kesiminin günlük hayatında çok önemli ölçüde yer alması ve bunun sonucunda bireylerin sosyal ve siyasi olaylar, ürün ve hizmet, marka vb. olgular hakkındaki düşüncelerini ifade ettikleri elektronik platformlardaki büyük hacimli verilerin yazılım sistemleri ile hızlı olarak raporlanması ve anlam çıkartılması işlemidir. Duygu analizi çalışmalarında metinlerin olumlu, olumsuz ya da tarafsız içeriğe sahip olup olmadığı sorgulanır ve analiz edilir. Bu analiz sonucuna göre bireylerin ya da belirli bir grubun çalışmayla ilgili konu hakkındaki tutumu belirlenmiş olur. Bu açıdan duygu analizi işletmeler açısından piyasaya yeni sürülecek bir ürün için ön pazar araştırması, bir topluluk için alınacak bir kararın olumlu veya olumsuz nasıl tepki alacağı, film izleyecek kişilerin önceki yapılan yorumlara göre filmi izlemeye karar vermesi gibi konularda yönlendirme yapabilir. Ancak olumlu veya olumsuz görüşün elde edileceği verilerin çok olması bu analizin tek tek inceleyerek yapılmasını zorlaştırmaktadır. Bu yüzden duygu analizi metin madenciliği ile makine öğrenmesi alanlarının önemli ve üzerine çalışılan konularından biri haline gelmiştir. Duygu analizi yapılırken, daha önceden görüş tarafı belli olan (pozitif / negatif /nötr) metinsel veriler kullanılarak bir eğitim veri seti oluşturulur. Daha sonra bu veriler metin madenciliği yöntemleri ile çeşitli ön işlemlerden geçirilip temizlenerek sınıflamaya uygun hale getirilmektedir. Bu ön işlemler arasında iletideki simge ve noktalama işaretlerinin temizlenmesi, metni kelimelere ayırma ve her bir kelimenin köklerinin bulunarak terim listelerinin oluşturulması, metin içerisindeki edat, bağlaç ve zamirlerden oluşan durak kelimelerin kaldırılması, terim frekansları ve ters doküman frekansları yardımıyla vektör uzay modelinin oluşturulması sayılabilir. Vector uzay modellerinde binary, terim frekansı, ters döküman frekansı, n gram gibi çeşitli yöntemler kullanılmaktadır. Vektör uzay modeli oluşturulan bu veriler, makine öğrenmesinde sıklıkla kullanılan yapay sinir ağları, destek vektör makinaları, karar ağaçları gibi sınıflama algoritmaları yardımıyla eğitilmektedir. Çeşitli sınıflayıcılar tarafından eğitilen modeller yardımıyla yeni gelen duygu ve görüşler sınıflandırılmaktadır. Genel olarak duygu ve düşünce analizi aşağıda belirtilen işlevleri yerine getirmek amacıyla kullanılmaktadır. Duygu görüş sınıflandırma: Bir doküman veya metinde bir olgu hakkında görüş ifade edilmesi ve görüş sahibinden olguya yönelik olan duygunun ölçülmesi fikrine dayanır. Öznellik Sınıflandırma: Genel olarak bir cümlenin öznel olup olmadığını tespit etmek olarak ifade edilebilir. Başarılı bir öznellik sınıflandırma daha iyi duygu sınıflandırmayı sağlar. Bu işlem olumlu, olumsuz ve nötr cümleleri ayırmaktan daha zor bir süreç olarak görülmektedir. Görüş özetleme: Dokümandan ve içeriğindeki duygudan ana konuyu çıkarmakla ilgili kavramdır. Görüş elde edilmesi: Yapılan sorguyla, görüş belirten dokümanların çıkartılmasıdır. Bu tür sistemlerde, iki tür puan hesaplaması yapılmalıdır; bunlar sorguya karşılık ilgililik puanı ve sorgu hakkında görüş puanı olup bu ikisi genellikle dokümanların seviyesini belirlemekte kullanılır. Alaycılık ve ironi: Alay ve ironi içeren ifadelerin bulunmasına yöneliktir. Özellikle araştırmacılar içerisinde alay ve ironinin nasıl tanımlanması gerektiğine dair anlaşmazlıkların bulunmasından dolayı, bu görev duygu analizindeki en karmaşık alanlardandır. Diğerleri: Tür ve yazar tespiti, türü ve metni tekrardan yazan yazarı bulmaya yöneliktir. Sahte/yanıltıcı (spam) mesaj tespiti, mesajı belli bir kesimin, şirketin veya ürünün lehine ya da aleyhine çarpıtan, güvenilmeyen içeriğe sahip görüş ve yorumları tespit etmeye çalışır []. Duygu analizinde günümüze kadar yapılan çalışmalar, genellikle İngilizce metinler üzerinde pozitif ve negatif olmak üzere iki sınıfta ele alınmıştır. Bazı çalışmalarda ise düşüncenin nötr olma durumu da dikkate alınarak üç sınıf üzerinden incelemeler gerçekleştirilmiştir. Duygu Analizi alanı ile ilgili literatür incelendiğinde ilk çalışmanın Pang, Lee ve Vaithyanatham tarafından yapıldığı, veri seti olarak Internet Movie Database arşivindeki film yorumlarının kullanıldığı görülmektedir. Çalışmalarında ilgili veri seti üzerinde unigram, bigram, Part Of Speech (POS) gibi öznitelik çıkarma yöntemlerini kullanarak sınıflama için gerekli vektör uzay (vector space) modellerini September 7-8, 206 Malatya/TURKEY 235
3 oluşturmuşlardır. Vektör uzay modelleri sonucunda elde edilen veri seti üzerinde Naive Bayes, Maximum Entropi ve SVM gibi makine öğrenmesi algoritmalarını kullanarak sınıflandırma işlemini gerçekleştirmişlerdir. Elde edilen bulgular sonucunda duygu analiziyle ilgili yapılan sınıflandırmada en iyi sonuç, unigram veri seti üzerinde 82,9% doğruluk oranıyla SVM makine öğrenmesi yöntemi ile alınmıştır [2]. Pennacchiatti ve Popescu 20 yılındaki çalışmalarında sosyal medya kullanıcı sınıflandırma işini Twitter verileri üzerinde uygulamışlardır. Twitter kullanıcılarının davranışları, ağ yapıları ve Twitter akışındaki dilsel içerik bilgileri kullanılarak siyasi yönelim ve etnik köken gibi özelliklerin otomatik olarak tespiti için makine öğrenmesi yaklaşımını kullanmışlardır. Politik ilişki, etnik köken ve belirli bir iş alanına olan ilgiyi belirleme gibi 3 farklı uygulama üzerinde çalışmış ve sonuçların çeşitlilik gösterdiğini belirtmişlerdir [3]. Go vd. çalışmalarında Twitter verisini kullanarak uzaktan denetimli öğrenme yöntemiyle duygu analizi yapmayı amaçlamışlardır. Çalışmadaki veri seti olumlu tweet olumsuz tweet olmak üzere toplam tweetten oluşmaktadır. Oluşan veri seti bigram, unigram ve bigram, unigram ile birleştirerek analiz edilmiştir ve makine öğrenmesi algoritmalarından SVM, Naive Bayes, Maximum Entropi sınıflandırma yöntemleri kullanılmıştır. Çalışma sonucunda SVM unigrama göre 82,2% doğruluk oranı, Naive Bayes bi-grama göre 8,6% doğruluk oranı elde etmiş ve 83% doğruluk oranı ile en iyi performans Maximum Entropi unigram ile bi-gramın birlikte kullanılması sonucu elde edilmiştir [4]. Glid Katz vd., çalışmalarında diğerlerinden farklı olarak içerik tabanlı duygu analiz modeli olarak ConSent'i ortaya koymuşlardır. Ortaya koyulan bu model ilk aşama olarak eğitim seti içindeki anahtar terimlerin belirlenip analiz edilerek özniteliklerin bu terimlere göre oluşturulmasıyla başlar. İkinci aşama olarak ise her dokümanın terimleri ile anahtar kelimeleri incelenir, bulunanlara göre öznitelikler çıkartılır ve doküman sınıflandırılır. Yapılan çalışmada oluşturulan model Naive Bayes ve SVM yöntemleri ile karşılaştırılarak seyahat hizmeti veren site olan TripAdvisor dan elde edilen pozitif işaretli 5070 negatif işaretli yoruma ve IMDB'den elde edilen 000 negatif 000 pozitif olmak üzere 2000 veriye uygulanmıştır. Elde edilen sonuçlar incelendiğinde ortaya koyulan yeni modelin SVM ile yaklaşık sonuçlar verse de çok az daha başarılı olduğu görülmüştür. Çalışma sonucunda ortaya koyulan diğer bir durum ise ConSent modelinin kısa metinlerden oluşan verisetlerinde daha düşük başarı puanı elde etmesidir. [5] Duygu analizi çalışmalarında genellikle n-gram ile tümcenin ikili veya üçlü şekilde terimlerine bakılırken Matsumoto vd., kelimeler arasında sözdizimi bağını temel alan yeni bir model önermişlerdir. Örneğin, film çok güzeldi kelimesi 2-gram yöntemiyle film çok ve çok güzeldi olarak iki farklı şekilde dizilir. Bu çalışmada ortaya atılan modelde ise kelimelerin sırası korunarak sıralı olmayan Film güzeldi gibi sözdizimlerinin görülme olasılığını hesaba katar. Sözcükler arasındaki ilişki bağlılık alt ağacı yöntemiyle temsil edilmiştir. Bu sayede n-gram yöntemine göre daha fazla temsiliyet sağlanabilmiştir. Model, sırasıyla 380 ve 2000 verinin bulunduğu 2 ayrı film yorumlarına sınıflayıcı olarak SVM kullanılarak uygulanmıştır. Edilen sonuçlara göre, ortaya atılan yeni yöntem ilk veri setinde %87,3, ikinci veri setinde ise %92,9 başarı göstererek n-gram yönteminden daha iyi sonuçlar elde etmiştir [6]. Nikfarjam ve Azadeh duygu analizini twitter ve sağlık ile ilgili forumlardaki yorumlar üzerine uygulayarak hastaların ilaçların yan etkileri hakkındaki olumsuz düşüncelerini araştırmışlardır. Uygulamada yine kendileri tarafından ortaya atılmış ilaç alanındaki kavramları çıkartmak için koşullu rastgele alanları kullanan makine öğrenme tabanlı ADRMine yöntemi kullanılmıştır. Veriseti olarak sağlık sitesi olan DailyStrength ile Twitter'dan 6279 ve 784 yorum kullanılmıştır. Sonuçlar incelendiğinde ortaya atılan ADRMine yönteminin %82, ile SVM ve yine sağlık alanında kullanılan bir sınıflayıcı olan MetaMap yöntemlerinden daha yüksek başarı verdiği gözlemlenmiştir.[7] Duygu analiziyle ilgili olarak Türkçe veri setleri üzerinde çalışılan birçok çalışma mevcuttur. Nizam ve Akın'ın çalışmalarında sınıflar içerisindeki veri dağılımının sınıflandırma algoritmasındaki başarı oranına etkisi olup olmadığı araştırılmıştır. Gıda sektöründeki bazı firmaların farklı ürünlerine ait tweetlerinden dengeli ve dengesiz olmak üzere 2 veri seti kullanılmıştır. Bu 2 farklı veri seti olumlu, olumsuz ve tarafsız olmak üzere 3 ayrı sınıfa tek tek ayrılmıştır. Dengesiz veri seti için olumlu sınıfta 3, olumsuz sınıfta 277 ve tarafsız sınıfta 60 veri olmak üzere toplam 2000, dengeli veri seti içinse olumlu sınıfta 257, olumsuz sınıfta 277 ve tarafsız sınıfta 299 veri olmak üzere toplam 824 tweetten oluşan veri kümesi incelenmiştir. Naive Bayes (NB), Rassal Orman (RF), Destek Vektör Makineleri (SVM), Karar Ağacı (J48) ve k-en Yakın Komşu (k-nearest Neighbors) sınıflandırma algoritmaları kullanılarak 2 veri kümesi doğruluk (accuracy), kesinlik (precision), duyarlılık (recall) ve kappa istatistiği sonuçlarına göre karşılaştırılmıştır. Bu 4 modelin başarım ölçütleri ve kappa istatistiği sonuçlarına göre dengeli veri seti dengesiz veri setine kıyasla daha iyi performans göstermiştir. Diğer bir deyişle sınıflandırma algoritmalarının başarısı üzerindeki etkenlerden bir tanesi sınıflardaki veri dağılımlarıdır. En iyi performansı %72,33 doğruluk oranı ile SVM sınıflandırma algoritmasından elde etmişlerdir [8]. September 7-8, 206 Malatya/TURKEY 236
4 Türkmen ve Cemgil çalışmalarında SVM ve Rassal Orman sınıflayıcı yaklaşımıyla İstanbul' da 203 yılında gerçekleşen Gezi Parkı gösterileri süresinde gönderilen tweetlerden bireylerin politik ilgililiğinin ve eğiliminin olup olmadığını tahmin etmeyi amaçlamışlardır. El ile işaretlenen 35 Twitter mesajını sınıflandırmayı kolaylaştırmak amacıyla gösteri yanlısı, gösteri karşıtı ve nötral mesajlar olarak etiketlemiş ve öznitelik seçiminde ki-kare yönteminden faydalanmışlardır. Sınıflandırma başarısı doğruluk (accuracy) ölçütüne ek olarak kesinlik (precision) ve duyarlılık (recall) ölçütlerinin harmonik ortalaması olan f-ölçütü dikkate alınarak belirlenmiştir ve ilgililik tahmininde SVM algoritmasından daha verimli sonuç alırken eğilim tahmininde Rassal Orman algoritmasından %80 in üstünde başarım elde etmişlerdir [9]. Sevindi tez çalışmasında Türkçe film yorumlarının duygu kutuplarını çeşitli makine öğrenmesi yöntemleri kullanarak belirlemeye çalışmış ve bu yöntemleri karşılaştırmıştır. Karar Ağacı (C4.5), k-en Yakın Komşu (KNN), Naive Bayes ve Destek Vektör Makineleri (SVM) yöntemlerini kullanmış ve en iyi sonucu SVM sınıflandırma algoritması ile elde etmiştir [0]. Sosyal ortamlardaki bilgi sosyal, iş amaçlı ve birçok konuda kullanılabilir. Ancak bu bilgilerin tek tek çıkartılması hem zaman hem de maliyet açısından makul bir strateji olmayacaktır. Bundan dolayı bu işlemler otomatik hesaplama sistemleri geliştirilerek yapılmaktadır. Bu çalışmada, izlenen filmler hakkında dijital platformlarda yapılan yorumların içeriğine göre duygu barındırıp barındırmadığı ve bu duygunun olumlu ya da olumsuz olma durumunun saptanması amaçlanmıştır. Bu amaçla çalışmada yapay sinir ağları, destek vektör makinaları, Naive Bayes ve merkez tabanlı sınıflayıcı yöntemleri kullanılarak sonuçlar karşılaştırılmıştır. II. DENEYLER A. Veri Seti Deneyler için film yorumları tercih edilmiştir. İlk olarak 204 yılında Bo Pang ve Lillian Lee tarafından kullanılan veri setinin veri kaynağı olarak Internet Movie Database (IMDb) rec. arts. movies. reviews haber kaynağı kullanılmıştır. Veri seti pozitif ve negatif duyguları ayırt etmeye yoğunlaşmıştır ve pozitif sınıfta 000, negatif sınıfta 000 veri olmak üzere toplam 2000 veriden oluşmaktadır. B. Veri Özellikleri Bu bölümde, 000 i pozitif sınıfa, 000 i negatif sınıfa ayrılmış veri setlerinin eğitim ve sınıflandırma süreçlerine hazırlanması amacıyla tüm yorumlardaki simge ve noktalama işaretleri temizlenip karakterler küçük harfe çevrilmiş ve her bir kelimenin kökleri bulunmuştur. Bunun için PYTHON ortamında hazırlanan NLTK kütüphanesinden yararlanılmıştır ve terim listeleri oluşturulmuştur. Metin içerisindeki edat, bağlaç ve zamirlerden oluşan durak kelimeler ve 3 harften kısa olan kelimeler kaldırılmıştır. Özellik değerlendirme metotlarından terim frekansı (TF) ve ters doküman frekansı (IDF) kullanılmıştır. TF bir terimin dokümanlarda geçme sıklığını gösteren bir değerdir. IDF ise dokümanlarda çok sık geçen terimlerin hiçbir ayırt edici öneme sahip olmamasına rağmen terimin yüksek skora sahip olmasının önüne geçmektedir. C. Deneylerde Kullanılan Sınıflandırma Algoritmaları Bütün deneyler MATLAB yazılımı kullanılarak gerçekleştirilmiştir. Veri seti üzerinde Naive Bayes, Merkez Tabanlı Sınıflayıcı, Çok Katmanlı Yapay Sinir Ağları(MLP), Destek Vektör Makineleri (SVM) sınıflandırma algoritmaları kullanılmıştır. Sınıflandırma algoritmalarının arka planında metin içerikli verinin sayısal veriye dönüştürülme işlemi vardır. Bunun sonucunda, metin içerikli yorumlar makine öğrenimi algoritmalarının çalışabileceği sayısal matrislere dönüştürülmelidir. Bu işlem bazı metotlarla gerçekleştirilmektedir; örneğin: CountVectorizer: Metin içerikli dökümanlar sayısal matrislere çevirilmektedir. Term frequency Inverse document frequency (TF-IDF): Dökümandaki kelimenin önemini göstermektedir. Bir kelimenin doküman da geçme sıklığının artmasıyla TF-IDF değeri artmaktadır [].. Naive Bayes Naive Bayes, Bayes teoreminden faydalanılarak oluşturulmuş metin sınıflandırmada kullanılan anlaşılabilir ve kolaylıkla uygulanabilir en basit makine öğrenme algoritmalarından biridir. Bu yöntemle bir örneğin hedef niteliğinin sınıf değerine ait olma olasılıkları bulunabilmektedir [2]. Bayes teoremi: () Eşitlikte X; öznitelik vektörü, H ise bir öznitelik vektörünün C gibi bir sınıfa ait olma olasılığını ifade eden hipotezdir. P(H X) ise ardıl olasılığı temsil eder. Bayes teoremi göz önüne September 7-8, 206 Malatya/TURKEY 237
5 alınarak Naive Bayes sınıflandırıcısının algoritması ise şu şekildedir: D nin veri setini temsil ettiği ve D deki her X in sınıf etiketinin belli olduğu varsayılsın. X, n tane öznitelikten oluşan bir vektördür ve X=(x, x 2, x n ) olarak temsil edilmektedir. C, C 2, C m ile temsil edilen m tane sınıf olduğu varsayılsın. Naive Bayes sınıflandırıcısı bir X vektörünün C i sınıfına ait olup olmadığını bulmak için, bütün sınıflar içinde en yüksek P(C i X) ardıl olasılığına sahip değeri bulmaya çalışır. Bu durum Bayes teoremi ile eşitlik 2 de ifade edilmiştir. (2) P(X) değeri tüm sınıflar için aynı olduğundan, yalnızca P(X C i )P(C i ) ifadesi maksimum yapılmalıdır. P(C i ) ifadesi, C i sınıfındaki eleman sayısının, tüm eleman sayısına oranıdır. P(X C i ) ifadesi ise, X in n tane değer içeren bir öznitelik vektörü olduğu varsayıldığında aşağıdaki eşitlik 3 ile hesaplanır. vektör o sınıftaki vektörlerin skaler toplamının sınıftaki doküman sayısına bölümüyle elde edilir [3]. Merkez tabanlı sınıflayıcının çalışma mantığının gerisinde de vektörlerin benzerlik ilkesi yatar. Benzerlik için kosinüs yöntemi kullanılır. Aşağıdaki denklemde benzerliğin bulunması gösterilmektedir. 3. Çok Katmanlı Yapay Sinir Ağları (MLP) (5) Yapay Sinir Ağları(YSA) insan sinir sistemini taklit ederek öğrenmeyi hedefleyen denetimli bir makine öğrenmesi yöntemidir. Yapay sinir ağı modeli, Şekil de gösterildiği gibi bir katmanda bulunan nöronların takip eden katmandaki nöronlara bağlanması ile oluşturulur. En sık kullanılan yapay sinir ağı modeli olan çok katmanlı algılayıcı sinir ağı (MLP) modeli; girdi katmanı, gizli katman ve çıktı katmanı olmak üzere üç farklı katmandan meydana gelmektedir. Girdi katmanı verilerin okunduğu katmandır. Her bir nöron bir özelliği temsil ettiği için özellik sayısı kadar nöron içermektedir. Çıktı katmanı ise sınıfların belirlendiği katmandır. X v 0 j Eşik Degeri Z w 0 k Eşik Degeri Y (3) Sonuçta, sınıflandırıcı en büyük P(X C i )P(C i ) ifadesine sahip olan C i sınıfını, X vektörünün sınıfı olarak seçer [0]. 2. Merkez Tabanlı Sınıflayıcı X 2.. X n Giriş Katmanı i=..n vij.. Z 2 Z P Gizli Katman j=..p w jk Çıkış Katmanı k=..m Şekil.Çok Katmanlı İleri Beslemeli Yapay Sinir Ağı Y 2 Y m Merkez tabanlı sınıflayıcı vektör uzay tabanlı olup performansı yüksek bir sınıflandırma yöntemidir. Model her bir dokümanı terim uzayında bir vektör olarak ele alır. Vektörün her bir boyutu dokümanda geçen terimin ağırlıklandırılmış frekansını tutar. Merkez tabanlı sınıflandırmada sınıflar merkez adı verilen vektörlerde sunulur. Merkez, sınıf elemanlarını sunan ortalama bir değerdir ve bu orta değerlerin bütün sınıfı temsil ettiği kabul edilir. Eğitim seti k farklı nitelik içeriyorsa bu eğitim verilerinden k adet merkez vektörü elde edilir []. (4) Eşitlikte 4 ilgili sınıftaki dokümanların kümesini göstermektedir. İlgili sınıftaki ortalama Bu katman oluşturulan modele göre tek bir nöron içerebileceği gibi sınıf çeşidi sayısı kadar nöron da içerebilmektedir. Gizli katman ise girdi katmanı ile çıktı katmanı arasında yer alan verilerin ara işleme maruz kaldığı katmandır. Gizli katman sayısı ve bir gizli katmandaki nöron sayısı tam olarak belli olmamakla birlikte eğitimin kalitesini etkileyen önemli iki faktördür [4]. MLP modelinde öğrenme bir önceki katmandan takip eden katmana doğru yapıldığı için ileri beslemeli YSA olarak da bilinir. Kullanılan eğitim algoritması hatanın karesini en aza indirecek şekilde ağırlıkları güncellemeyi hedefler. (6) September 7-8, 206 Malatya/TURKEY 238
6 (7) Eşitlik 6, MLP modelinde ileri beslemeyi, Eşitlik 7 ise geri beslemeyi formüle etmektedir. Eşitlik 6 da x_j mevcut katmandaki j. nöronun değerini, y_i takip eden katmandaki i. nörona aktarılan değeri, n mevcut katmandaki nöron sayısını, w_ji mevcut katmandaki j. nörondan takip eden katmandaki i. nörona giden ağırlığı, f ise aktivasyon fonksiyonunu (örneğin: gauss, softmax, sigmoid ) temsil etmektedir. Eşitlik 7 de k, veri setindeki örnek sayısını, t_k verilerin gerçek sınıfını, o_k ise modelin üretmiş olduğu sınıf değerini temsil etmektedir. 4. Destek Vektör Makineleri (DVM) Destek vektör makinesi iki boyutlu uzayda doğrusal, üç boyutlu uzayda düzlemsel ve çok boyutlu uzayda hiperdüzlem şeklindeki ayırma mekanizmaları ile veriyi iki ya da daha çok sınıfa ayırma yeteneğine sahiptir [5]. Lineer olarak ayrıştırılabilen sınıfların belirlenmesinde sıkça kullanılan yöntem, kernel fonksiyonları sayesinde doğrusal olarak ayrıştırılamayan girdi uzayını daha yüksek boyutlu lineer olarak ayrıştırılabilen bu uzaya taşıyarak, doğrusal olmayan verilerin sınıflandırılmasında başarıyla kullanılmaktadır. Eğitim için kullanılacak N elemandan oluşan verinin, i =,2,N olduğu varsayılırsa özellik vektörünü, ise sınıf değerlerini gösterir. Lineer olarak ayrılma durumunda, bu iki değerli veriler direkt olarak bir ayırıcı düzlem ile ayrılabilir. Veri setini sınıflara ayırabilecek sonsuz sayıda çoklu düzlem çizilebilmesine karşın, amaç, bilinmeyen sınıflama hatasını en küçük yapacak hiperdüzlemi seçmektir. Şekil 2 de görüleceği üzere durumu birinci sınıfı, ( ve durumu ise ikinci sınıfı ( ) temsil eder. problem, Lagrange denklemleri, Eşitlik 9 ve Eşitlik 0 da verilen Karush Kuhn Tucker (KKT) ın kısıtları yardımıyla çözülür [4]., (8) (9) (0) Kernel fonksiyonu kullanılarak doğrusal olmayan dönüşümler yapılabilmekte ve bu sayede yüksek boyutta doğrusal olarak ayrımına imkân vermektedir. En yaygın kernel fonksiyonları Gauss, Polinomial ve Sigmoid fonksiyonlarıdır. D. Sınıflandırma Algoritmalarının Karşılaştırılmasında Kullanılan Kriterler. Model başarım ölçütleri Sınıflama performansını karşılaştırmak için kullanılan metrikler ve bunlara ilişkin formüller aşağıda verilmiştir. Kesinlik (Precision): Sınıflandırıcı sonucunun kesinlik derecesini verir. Pozitif olarak etiketlenen örneklerin sayısının pozitif olarak sınıflandırılmış toplam örneklere oranıdır. () Duyarlılık (Recall): Pozitif olarak etiketlenmiş örneklerin gerçekten pozitif olan örneklerin toplam sayısına oranıdır. (2) Doğruluk (Accuracy): Sınıflandırma işleminde en çok kullanılan ölçümdür. Doğru olarak sınıflandırılmış örneklerin toplam örnek sayısına oranıdır. (3) F-Measure: F Ölçümü, kesinlik ve duyarlılık metrikleri kullanılarak hesaplanmaktadır. Sistemin, kesinlik ve ya duyarlılık yönüne doğru optimize edilmesinde kullanılmaktadır. (4) Şekil 2.Destek Vektör Makineleri ve Hiperdüzlem Seçimi İki sınır arasındaki uzaklık formülü ile ifade edilir. Amaç, değerini maksimum yapmak olduğu için ifadesi minimum olmalıdır. Buna bağlı sınırlama ise, dir. İlgili problemin duali, Eşitlik 8 de verilmiştir. Eşitlikteki Eşitliklerde kullanılan TP, FP, TN, FN değerleri sırasıyla; TP (True Positive Rate): Pozitif olan aynı zamanda sınıflandırıcı tarafından da pozitif olarak sınıflandırılmış yorumların sayısını gösterir. FP (False Positive Rate): Pozitif olan ancak sınıflandırıcı tarafından pozitif olarak sınıflandırılmamış yorumların sayısını gösterir. September 7-8, 206 Malatya/TURKEY 239
7 TN (True Nagative Rate): Negatif olan aynı zamanda sınıflandırıcı tarafından da negatif olarak sınıflandırılmış yorumların sayısını gösterir. FN (False Nagative Rate): Negatif olan ancak sınıflandırıcı tarafından negatif olarak sınıflandırılmamış yorumların sayısını gösterir. III. SONUÇLARIN DEĞERLENDİRİLMESİ VE TARTIŞILMASI A. Deneysel Sonuçlar Çalışmada 2000 adet film yorumu içeren veri seti kullanılmıştır. Makine öğrenmesi yöntemleri kullanılarak MATLAB de Naive Bayes, Merkez Tabanlı Sınıflayıcı, Çok Katmanlı Yapay Sinir Ağları ve Destek Vektör Makineleri sınıflandırma algoritmalarından yararlanılmıştır. Veri setinin eğitimi ve sınıflandırma sürecinden önce ön işlem aşamaları uygulanmıştır. Ön işlem aşamasından sonra TF ve IDF değerlerinden oluşan vektör uzay modeli elde edilmiştir. Tüm sınıflama algoritmalarında eğitim için veri setinin %75 i ayrılmış, kalan %25 lik bölüm ise test amacıyla kullanılmıştır. Yapay sinir ağlarında 3 katmanlı MLP modeli tercih edilmiş, orta katmanda 0 gizli nöron, çıkış katmanında ise 2 nöron kullanılmıştır. Giriş katmanındaki nöron sayısı ise özellik sayısıyla aynıdır. Ağın eğitimde trainscg (Scaled conjugate gradient backpropagation) algoritması ve performans değerlendirmek içinse crossentropy kullanılmıştır. SVM algoritmasında ise kernel fonksiyonu olarak radyal fonksiyon kullanıldığında eğitim veri seti için %00 doğruluk oranı elde edilirken test veri seti için doğruluk oranı %50 oranında bulunmuştur. Aşırı eğitimden dolayı (overftting) dolayı uygulamada RBF yerine liner fonksiyon tercih edilmiştir. Tablo de kullanılan sınıflandırma yöntemlerine göre eğitim, test, ve tüm veri setine ilişkin TP, TN, FP ve FN değerlerini gösteren çapraz karmaşıklık matrisleri verilmiştir. P değeri pozitif, N ise negatif yorum sayılarını ifade etmektedir. Performans ölçütlerinden görüleceği gibi en iyi sınıflama performansı destek vektör makinelerinde elde edilmiştir. Şekil 3 te verilen ROC eğrilerinden de bu durum görülmektedir, ROC eğrilerinde sol üst köşeye en yakın grafik, performansı en yüksek sınıflayıcıya ait grafiktir. Tablo 2. Sonuç Değerleri Yöntem A P R F AUC Naive Centroid ANN SVM Naive Centroid ANN SVM Naive Centroid ANN SVM Eğitim Test Tümü Tablo. Sınıflama sonucunda elde edilen karmaşıklık matrisleri Eğitim Test Tümü Gözlenen Gözlenen Gözlenen N. Bayes Tahmin N P N P N P N P Centroid Tahmin N P N P N P N P ANN Tahmin N P N P N P N P SVM Tahmin N P N P N P N P Şekil 3. ROC Eğrisi a)test verisi b) Tüm veri September 7-8, 206 Malatya/TURKEY 240
8 IV. Sonuç Bu çalışmada IMDB de yer alan film yorumlarını içeren veri seti üzerinde çeşitli makine öğrenme teknikleri kullanılarak bir duygu analizi çalışması yapılmıştır. Makine öğrenmesinde sıkça kullanılan sınıflandırma algoritmalarından yapay sinir ağları, destek vektör makinaları, Naive Bayes ve merkez tabanlı sınıflayıcı algoritmaları kullanılmış; ilgili sınıflayıcıların performans karşılaştırması model başarım ölçütlerine göre yapılmıştır. Bu başarım ölçütleri incelendiğinde en yüksek değerler Yapay sinir ağları ve Destek vektör makinalarında elde edilmiştir. Eğitim veri setinde YSA %89.73 doğru sınıflandırma oranıyla SVM den (%84.07) daha iyi başarı sergilerken her iki sınıflayıcı da test veri seti için %75 civarında doğru sınıflama oranıyla hemen hemen aynı performansı göstermişlerdir. Beklendiği üzere basit birer sınıflayıcı olan Merkez tabanlı sınıflayıcı ve Naive bayes sınıflayıcı diğer iki sınıflayıcıya oranla daha düşük bir başarı göstermişlerdir. KAYNAKLAR [] Serrano-Guerrero, J., Olivas, J. A., Romero, F. P., & Herrera-Viedma, E.. "Sentiment analysis: a review and comparative analysis of web services," Information Sciences 3, 205,pp [2] Pang, Bo, Lillian Lee, and Shivakumar Vaithyanathan. "Thumbs up?: sentiment classification using machine learning techniques," Proceedings of the ACL-02 conference on Empirical methods in natural language processing-volume 0. Association for Computational Linguistics, [3] Pennacchiotti, Marco, and Ana-Maria Popescu. "A Machine Learning Approach to Twitter User Classification," ICWSM, 20,pp [4] Go, Alec, Richa Bhayani, and Lei Huang. "Twitter sentiment classification using distant supervision," CS224N Project Report, Stanford, 2009,pp.2. [5] Katz, Gilad, Nir Ofek, and Bracha Shapira. "ConSent: Context-based sentiment analysis," Knowledge-Based Systems 84,205,pp [6] Matsumoto, Shotaro, Hiroya Takamura, and Manabu Okumura. "Sentiment classification using word sub-sequences and dependency sub-trees," Pacific-Asia Conference on Knowledge Discovery and Data Mining. Springer Berlin Heidelberg, [7] Nikfarjam, A., Sarker, A., O Connor, K., Ginn, R., & Gonzalez, G. "Pharmacovigilance from social media: mining adverse drug reaction mentions using sequence labeling with word embedding cluster features," Journal of the American Medical Informatics Association,205, pp ocu04. [8] Nizam, Hatice, and Saliha Sıla Akın. "Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması," XIX. Türkiye'de İnternet Konferansı,204. [9] Türkmen, Ali Caner, and Ali Taylan Cemgil. "Political interest and tendency prediction from microblog data," nd Signal Processing and Communications Applications Conference (SIU), IEEE, 204. [0] Sevindi, B. İbrahim. "Türkçe Metinlerde Denetimli ve Sözlük Tabanlı Duygu Analizi Yaklaşımlarının Karşılaştırılması," Yüksek Lisans Tezi, 203. [] Tripathy, Abinash, Ankit Agrawal, and Santanu Kumar Rath. "Classification of sentiment reviews using n-gram machine learning approach," Expert Systems with Applications 57, 206, pp [2] Kartal, Elif, Enformatik Programı, and M. Erdal BALABAN. Sınıflandırmaya Dayalı Makine Öğrenmesi Teknikleri ve Kardiyolojik Risk Değerlendirmesine İlişkin Bir Uygulama, Doktora Tezi, Haziran 205, pp [3] Kaynar, O., Yıldız S. Elektronik Postaların Centroid Tabanlı Sınıflayıcı, Yapay Sinir Ağları ve Destek Vektör Makinaları Yardımıyla Tespit Edilmesi, 2.Ulusal Yönetim Bilişim Sistemleri Kongresi, 205 [4] Arslan, H., Kaynar, O., Yüksek, A.G. &; Gün, O. Kurumsal Kolektif Süreçler için E-Posta İletilerinden Görev Keşfi ve Gerçek Zamanlı Görev Yönetim Sisteminin Geliştirilmesi, Global Journal on Technology, Kasım 205. [5] Güran, Aysun, Mitat Uysal, and Özge Doğrusöz. "Destek vektör makineleri parametre optimizasyonunun duygu analizi üzerindeki etkisi," DEÜ Mühendislik Fakültesi Mühendislik Bilimleri Dergisi 48, 204,pp September 7-8, 206 Malatya/TURKEY 24
Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı
Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü haticenizam@outlook.com Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar
DetaylıSosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması
inet-tr 14 - XIX. Türkiye'de İnternet Konferansı Bildirileri 27-29 Kasım 2014 Yaşar Üniversitesi, İzmir Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının
DetaylıSosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması
Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması Hatice Nizam 1, Saliha Sıla Akın 2 1 İstanbul Üniversitesi Bilgisayar Mühendisliği
DetaylıTürkçe Dokümanlar Ġçin Yazar Tanıma
Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:
DetaylıVERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr
VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall
DetaylıBüyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)
Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data
DetaylıUzaktan Algılama Teknolojileri
Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan
DetaylıKaraciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması
Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması 1 Emre DANDIL Bilecik Ş. Edebali Üniversitesi emre.dandil@bilecik.edu.tr +90228 214 1613 Sunum İçeriği Özet Giriş
DetaylıVeri ve Metin Madenciliği
Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu
DetaylıEğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir
sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt
DetaylıTürkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi
Türkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi Aytuğ Onan 1 1 Celal Bayar Üniversitesi, Yazılım Mühendisliği Bölümü, Manisa aytug.onan@cbu.edu.tr Özet: Duygu analizi, görüş
DetaylıNaive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ
Naive Bayes Yöntemi ile Spam Mail Teşhisi 2 17574006-Kübra KURNAZ Yıldız Teknik Üniversitesi, Elektrik-Elektronik Fakültesi, Bilgisayar Mühendisliği Bölümü, Tezsiz Yüksek Lisans Bilgi Teknolojileri Özet
DetaylıVeri ve Metin Madenciliği. Zehra
Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği
DetaylıOtomatik Doküman Sınıflandırma
Otomatik Doküman Sınıflandırma Rumeysa YILMAZ, Rıfat AŞLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr, kgunel@aduedutr
DetaylıYapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven
Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu Sunan : Esra Nergis Güven İçerik Giriş Amaç ve Kapsam Sınıflandırma Geliştirilen Sistem
DetaylıOtomatik Doküman Sınıflandırma
Akademik Bilişim 12 - XIV Akademik Bilişim Konferansı Bildirileri Otomatik Doküman Sınıflandırma Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr,
DetaylıK En Yakın Komşu Methodu (KNearest Neighborhood)
K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre
DetaylıYÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ
YÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ http://dergipark.ulakbim.gov.tr/ybs Yayın Geliş Tarihi: 16.11.2017 Cilt:3, Sayı:2, Yıl:2017, Sayfa: 1-14 Yayına Kabul Tarihi: 23.11.2017 ISSN: 2148-3752 Online Yayın
DetaylıDEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014
DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014 DESTEK VEKTÖR MAKİNELERİ PARAMETRE OPTİMİZASYONUNUN DUYGU ANALİZİ ÜZERİNDEKİ ETKİSİ (EFFECTS OF SUPPORT VECTOR
DetaylıVERİ MADENCİLİĞİ Metin Madenciliği
VERİ MADENCİLİĞİ Metin Madenciliği Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Metin için Veri Madenciliği Metin Madenciliğinde Sorunlar Metin madenciliği: Veri madenciliği teknikleri ile yazılı belgeler arasındaki
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing
DetaylıKelime Gösterimleri (Word Representation Word Embeddings)
Kelime Gösterimleri (Word Representation Word Embeddings) Kelime, cümlede kullanımına göre farklı anlamlar kazanabilir Anlamsal bilginin çıkarılması metinlerin işlenmesinde önemlidir Kelimelerin işlenebilir
DetaylıK-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi
K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi
DetaylıBüyük Veri Analitiği (Big Data Analytics)
Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David
DetaylıVERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine
Detaylıİş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ
İş Zekası Hafta 6 Kestirimci Modelleme Teknikleri Business Intelligence and Analytics: Systems for Decision Support 10e isimli eserden adapte edilmiştir Bölüm Amaçları Yapay Sinir Ağları (YSA) kavramını
DetaylıKAHKAHA TANIMA İÇİN RASSAL ORMANLAR
KAHKAHA TANIMA İÇİN RASSAL ORMANLAR Heysem Kaya, A. Mehdi Erçetin, A. Ali Salah, S. Fikret Gürgen Bilgisayar Mühendisliği Bölümü Boğaziçi Üniversitesi / Istanbul Akademik Bilişim'14, Mersin, 05.02.2014
Detaylı2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir.
ÇELĐK YÜZEYLERĐN SINIFLANDIRILMASI * Cem ÜNSALAN ** Aytül ERÇĐL * Ayşın ERTÜZÜN *Boğaziçi Üniversitesi, Elektrik-Elektronik Mühendisliği Bölümü unsalan@boun.edu.tr **Boğaziçi Üniversitesi, Endüstri Mühendisliği
DetaylıDoküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım
Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım Yılmaz KAYA 1, Ömer Faruk ERTUĞRUL 2, Ramazan TEKİN 3 1 Siirt Üniversitesi, Bilgisayar Mühendisliği Bölümü 2 Batman Üniversitesi, Elektrik-Elektronik
DetaylıHafta 10 - Vektör Uzay Modelleri
BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler
DetaylıMetin Sınıflandırma. Akış
Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle
DetaylıTANI TESTLERINE GIRIŞ & ROC ANALİZİ
TANI TESTLERINE GIRIŞ & ROC ANALİZİ Yrd.Doç.Dr. Selçuk Korkmaz Trakya Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Turcosa Analitik Çözümlemeler selcukorkmaz@gmail.com ÇOCUK NEFROLOJİ DERNEĞİ
DetaylıKredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval
Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval İsmail Haberal Bilgisayar Mühendisliği Bölümü Başkent Üniversitesi ihaberal@baskent.edu.tr Umut
DetaylıSosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması
Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması Yağız Nalçakan 1,Şan Sıtkı Bayramoğlu 2, Samed Tuna 3 1, 2, 3 Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü, Edirne yagiznalcakan@gmail.com,
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Giriş Bilgi Erişiminde Temel Yaklaşımlar Bilgi Erişim Modelleri Boolean model Vector space
DetaylıYAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT
YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ Umut FIRAT ufirat@yahoo.com Öz: Depremler yeryüzünde en çok yıkıma neden olan doğal afetlerdir. Bu durum, depremlerin önceden tahmin edilmesi fikrini
DetaylıKaraciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı. In the Diagnosis of Liver Failure Using Machine Learning Algorithms
Karaciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı 1 Ekrem Alkuşak ve * 2 Murat Gök 1 Bilgisayar Mühendisliği Bölümü, Yalova Üniversitesi, Yalova, Türkiye 2 Bilgisayar Mühendisliği
DetaylıUzaktan Algılama Uygulamaları
Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ
DetaylıHafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti
Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr
Detaylı2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21
İçindekiler Önsöz İkinci Basım için Önsöz Türkçe Çeviri için Önsöz Gösterim xiii xv xvii xix 1 Giriş 1 1.1 Yapay Öğrenme Nedir?......................... 1 1.2 Yapay Öğrenme Uygulamalarına Örnekler...............
DetaylıEğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir
Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi
DetaylıDestekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines)
Destekçi Vektör Makineleri Destekçi Vektör Makineleri(Support Vector Machines) Değişkenler arasındaki örüntülerin bilinmediği veri setlerindeki sınıflama problemleri için önerilmiş bir makine öğrenmesi
DetaylıYZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR
YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest
DetaylıYapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI
Yapay Sinir Ağları (Artificial Neural Networks) J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Yapay Sinir Ağları Tarihçe Biyolojik
Detaylı2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım
2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı
DetaylıBüyük Veri ve Endüstri Mühendisliği
Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan
DetaylıGlobal Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey.
Global Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey. DETERMINATION OF TWITTER USERS SENTIMENT POLARITY TOWARD AIRLINE MARKET IN TURKEY: A CASE OF OPINION MINING DOI: 10.17261/Pressacademia.2016118690
DetaylıVeri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi
Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi YRD. DOÇ. DR. HÜSEYİN GÜRÜLER MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ, TEKNOLOJİ FAKÜLTESİ, BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ Meslek Seçimi Meslek Seçimi
DetaylıVERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI
BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik
DetaylıİÇİNDEKİLER ÖNSÖZ Bölüm 1 SAYILAR 11 Bölüm 2 KÜMELER 31 Bölüm 3 FONKSİYONLAR
İÇİNDEKİLER ÖNSÖZ III Bölüm 1 SAYILAR 11 1.1. Sayı Kümeleri 12 1.1.1.Doğal Sayılar Kümesi 12 1.1.2.Tam Sayılar Kümesi 13 1.1.3.Rasyonel Sayılar Kümesi 14 1.1.4. İrrasyonel Sayılar Kümesi 16 1.1.5. Gerçel
DetaylıVeri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov
Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi Hazırlayan: Nury Amanmadov Göğüs Kanseri Nedir? Gögüs Kanseri göğüs hücrelerinde başlayan
DetaylıAYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Değerlendirilmesi AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
DetaylıPARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara
PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama
DetaylıMakine Öğrenmesi 2. hafta
Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde
DetaylıGeriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı. Mehmet Ali Çavuşlu
Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı Mehmet Ali Çavuşlu Özet Yapay sinir ağlarının eğitiminde genellikle geriye
DetaylıBulanık Mantık Tabanlı Uçak Modeli Tespiti
Bulanık Mantık Tabanlı Uçak Modeli Tespiti Hüseyin Fidan, Vildan Çınarlı, Muhammed Uysal, Kadriye Filiz Balbal, Ali Özdemir 1, Ayşegül Alaybeyoğlu 2 1 Celal Bayar Üniversitesi, Matematik Bölümü, Manisa
DetaylıYÖNEYLEM ARAŞTIRMASI - III
YÖNEYLEM ARAŞTIRMASI - III Prof. Dr. Cemalettin KUBAT Yrd. Doç. Dr. Özer UYGUN İçerik Quadratic Programming Bir karesel programlama modeli aşağıdaki gibi tanımlanır. Amaç fonksiyonu: Maks.(veya Min.) z
DetaylıÖrnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.
.4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin
DetaylıYZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA
YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA Makine Öğrenmesi Çok büyük miktardaki verilerin elle işlenip analiz edilmesi mümkün değildir. Bu tür problemlere çözüm bulmak amacıyla makine öğrenmesi
Detaylı127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ
127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi
DetaylıKonular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri
Konular VERİ MADENCİLİĞİ Farklı Sınıflandırma Yöntemleri Yrd. Doç. Dr. Şule Gündüz Öğüdücü Örnek tabanlı yöntemler ken Yakın Komşu Yöntemi Genetik Algoritmalar Bulanık Küme Sınıflandırıcılar Öngörü Eğri
DetaylıİÇİNDEKİLER ÖN SÖZ...
İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN
DetaylıCBS ve Coğrafi Hesaplama
Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr
DetaylıMekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.
Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Makine Öğrenmesi Erhan AKDOĞAN, Ph.D. Bu ders notunun hazırlanmasında Dr. U.Orhan ve Banu Diri nin ders notlarından yararlanılmıştır. Makine öğrenmesi
DetaylıYrd. Doç. Dr. A. Burak İNNER
Yrd. Doç. Dr. A. Burak İNNER Kocaeli Üniversitesi Bilgisayar Mühendisliği Yapay Zeka ve Benzetim Sistemleri Ar-Ge Lab. http://yapbenzet.kocaeli.edu.tr Regresyon o EnKüçük Kareler Yöntemi Doğru Uydurma
DetaylıÇok katmanlı ileri sürümlü YSA da standart geri yayıyım ve momentum geri yayılım algoritmalarının karşılaştırılması. (Eğitim/Hata geri yayılım)
Çok katmanlı ileri sürümlü YSA da standart geri yayıyım ve momentum geri yayılım algoritmalarının karşılaştırılması (Eğitim/Hata geri yayılım) Özetçe Bu çalışmada çok katmanlı ve ileri sürümlü bir YSA
DetaylıVERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıEş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama
Eş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama Katira Soleymanzadeh1, Ufuk Hürriyetoğlu1, Bahar Karaoğlan1, Senem Kumova Metin2, Tarık Kışla3 1 Ege Üniversitesi, Uluslararası Bilgisayar Enstitüsü,
DetaylıAkış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ
Akış Makine Öğrenmesi nedir? Günlük Hayatımızdaki Uygulamaları Verilerin Sayısallaştırılması Özellik Belirleme Özellik Seçim Metotları Bilgi Kazancı (Informaiton Gain-IG) Sinyalin Gürültüye Oranı: (S2N
DetaylıZeki Optimizasyon Teknikleri
Zeki Optimizasyon Teknikleri Ara sınav - 25% Ödev (Haftalık) - 10% Ödev Sunumu (Haftalık) - 5% Final (Proje Sunumu) - 60% - Dönem sonuna kadar bir optimizasyon tekniğiyle uygulama geliştirilecek (Örn:
DetaylıEŞİTLİK KISITLI TÜREVLİ YÖNTEMLER
EŞİTLİK KISITLI TÜREVLİ YÖNTEMLER LAGRANGE YÖNTEMİ Bu metodu incelemek için Amaç fonksiyonu Min.z= f(x) Kısıtı g(x)=0 olan problemde değişkenler ve kısıtlar genel olarak şeklinde gösterilir. fonksiyonlarının
DetaylıDOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition
Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Örüntü Tanıma Dersin Orjinal Adı: Pattern Recognition Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora) Lisansüstü Dersin Kodu: CSE
DetaylıZaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması
Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Maltepe Üniversitesi, Yazılım Mühendisliği Bölümü, İstanbul zeynepguven@maltepe.edu.tr, turgaybilgin@maltepe.edu.tr Özet: Zaman serileri
DetaylıBAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY ZEKA İLE ZAMAN TAHMİNİ SONER ŞÜKRÜ ALTIN
BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY ZEKA İLE ZAMAN TAHMİNİ SONER ŞÜKRÜ ALTIN YÜKSEK LİSANS TEZİ 2011 BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY
DetaylıVeri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.
Veri Madenciliği Yrd. Doç. Dr. Mustafa Gökçe Baydoğan mustafa.baydogan@boun.edu.tr www.mustafabaydogan.com blog.mustafabaydogan.com İçerik p Veri Madenciliği nedir? n Bir örnek p Boğaziçi Üniversitesi
DetaylıDr. Ergün AKGÜN Kimdir?
Dr. Ergün AKGÜN Kimdir? Dr. Ergün AKGÜN 1985 yılında Bursa nın İnegöl İlçesinde doğmuştur. Lisans eğitimini Muğla Üniversitesi Sınıf Öğretmenliği bölümünde yapmıştır. Muğla Üniversitesinde Eğitim Programları
Detaylı28/04/2014 tarihli LYS-1 Matematik-Geometri Testi konu analizi SORU NO LYS 1 MATEMATİK TESTİ KAZANIM NO KAZANIMLAR 1 / 31
SORU NO LYS 1 MATEMATİK TESTİ A B KAZANIM NO KAZANIMLAR 1 1 / 31 11 32159 Rasyonel sayı kavramını açıklar. 2 12 32151 İki ya da daha çok doğal sayının en büyük ortak bölenini ve en küçük ortak katını bulur.
DetaylıYAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ
YAPAY SİNİR AĞLARI Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ İÇERİK Sinir Hücreleri Yapay Sinir Ağları Yapısı Elemanları Çalışması Modelleri Yapılarına Göre Öğrenme Algoritmalarına Göre Avantaj ve
DetaylıMAK 210 SAYISAL ANALİZ
MAK 210 SAYISAL ANALİZ BÖLÜM 6- İSTATİSTİK VE REGRESYON ANALİZİ Doç. Dr. Ali Rıza YILDIZ 1 İSTATİSTİK VE REGRESYON ANALİZİ Bütün noktalardan geçen bir denklem bulmak yerine noktaları temsil eden, yani
DetaylıVeri madenciliği yöntemleri
Sınıflandırma ve Kümeleme Kavramları Giriş Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemi sınıflandırma olarak adlandırılır, veri madenciliği tekniklerinden en çok bilinenidir; veri tabanlarındaki
DetaylıKonular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri
VERİ MADENCİLİĞİ Farklı Sınıflandırma Yöntemleri Yrd. Doç. Dr. Şule Gündüz Öğüdücü Örnek tabanlı yöntemler ken Yakın Komşu Yöntemi Genetik Algoritmalar Karar Destek Makinaları Bulanık Küme Sınıflandırıcılar
DetaylıORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH
ORTALAMA ÖLÇÜLERİ Ünite 6 Öğr. Gör. Ali Onur CERRAH Araştırma sonucunda elde edilen nitelik değişkenler hakkında tablo ve grafikle bilgi sahibi olunurken, sayısal değişkenler hakkında bilgi sahibi olmanın
DetaylıWEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ
WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ Doç.Dr Erhan Akyazı Marmara Üniversitesi Bilişim Bölümü eakyazi@marmara.edu.tr Şafak Kayıkçı Marmara Üniversitesi Bilişim Bölümü safak@safakkayikci.com
DetaylıZahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme
Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme Doç. Dr. Bilge Karaçalı Biyomedikal Veri İşleme Laboratuvarı Elektrik-Elektronik
DetaylıYAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI ARTIFICIAL NEURAL NETWORKS METHOD FOR MAP DIGITIZATION
YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI Y.ŞİŞMAN 1, H. DEMİRTAŞ 2 1 Ondokuz Mayıs Üniversitesi, Harita Mühendisliği Bölümü, 55139, Samsun/TÜRKİYE ysisman@omu.edu.tr 2 Sağlık Bakanlığı,
DetaylıBu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.
ÇOK ÖLÇÜTLÜ KARAR VERME TOPSIS (Technique For Order Preference By Similarity To Ideal Solution) PROF. DR. İBRAHİM ÇİL 1 Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.
DetaylıYAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI
YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI DR. ÖĞR. ÜYESİ GÖKHAN ALTAN BİLGİSAYAR MÜH. BÖL. İSKENDERUN TEKNİK ÜNİVERSİTESİ KONUŞMA İÇERİĞİ Bilgisayar Bilimi Makine Öğrenmesi nedir? Makine
DetaylıPARÇACIK SÜRÜ OPTİMİZASYONU BMÜ-579 METASEZGİSEL YÖNTEMLER YRD. DOÇ. DR. İLHAN AYDIN
PARÇACIK SÜRÜ OPTİMİZASYONU BMÜ-579 METASEZGİSEL YÖNTEMLER YRD. DOÇ. DR. İLHAN AYDIN 1995 yılında Dr.Eberhart ve Dr.Kennedy tarafından geliştirilmiş popülasyon temelli sezgisel bir optimizasyon tekniğidir.
DetaylıYrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü
Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu
DetaylıÇağrı Merkezi Metin Madenciliği Yazılım Çerçevesi. Call Center Text Mining Framework
Çağrı Merkezi Metin Madenciliği Yazılım Çerçevesi İbrahim Onuralp Yiğit Türk Telekom, İstanbul, Türkiye ibrahimonuralp.yigit@turktelekom.com.tr Özet. Çağrı merkezlerine gelen çağrıların sesten metne dönüştürülerek
DetaylıYZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ
YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ Algoritma Analizi Çerçevesi Algoritma Analizinde Göz Önünde Bulundurulması Gerekenler Neler? Algoritmanın Doğruluğu (Correctness) Zaman
DetaylıSİSMİK DARBELERİN SINIFLANDIRILARAK DEPREM TEHLİKESİNİN TAHMİN EDİLMESİ
SİSMİK DARBELERİN SINIFLANDIRILARAK DEPREM TEHLİKESİNİN TAHMİN EDİLMESİ Mehmet BİLEN 1, Ali Hakan IŞIK 2,Tuncay YİĞİT 3 1 Mehmet Akif Ersoy Üniversitesi, Çavdır Meslek Yüksek Okulu, Burdur 2 Mehmet Akif
DetaylıÖrüntü Tanıma (EE 448) Ders Detayları
Örüntü Tanıma (EE 448) Ders Detayları Ders Adı Ders Kodu Dönemi Ders Saati Uygulama Saati Laboratuar Saati Kredi AKTS Örüntü Tanıma EE 448 Bahar 3 0 0 3 5 Ön Koşul Ders(ler)i Dersin Dili Dersin Türü Dersin
DetaylıYıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Şekil Tanıma Final Projesi. Selçuk BAŞAK 08501008
Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü Şekil Tanıma Final Projesi Selçuk BAŞAK 08501008 Not: Ödevi hazırlamak için geliştirdiğim uygulama ve kaynak kodları ektedir.
DetaylıİÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR
İÇİNDEKİLER ÖNSÖZ III Bölüm 1 KÜMELER 11 1.1. Küme 12 1.2. Kümelerin Gösterimi 13 1.3. Boş Küme 13 1.4. Denk Küme 13 1.5. Eşit Kümeler 13 1.6. Alt Küme 13 1.7. Alt Küme Sayısı 14 1.8. Öz Alt Küme 16 1.9.
DetaylıSıralama Öğrenme ile Sağkalım Tahminleme
Boğazda Yapay Öğrenme İsmail Arı Yaz Okulu 08 Sıralama Öğrenme ile Sağkalım Tahminleme Öznur Taştan Mühendislik ve Doğa Bilimleri Fakültesi Bilgisayar Bilimi ve Mühendisliği Moleküler Biyoloji, Genetik
DetaylıEsnek Hesaplamaya Giriş
Esnek Hesaplamaya Giriş J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Esnek Hesaplama Nedir? Esnek hesaplamanın temelinde yatan
Detaylı