Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması"

Transkript

1 Sosyal Medya Verileri Üzerinde Yapay Öğrenme ile Duygu AnaliziÇalışması Yağız Nalçakan 1,Şan Sıtkı Bayramoğlu 2, Samed Tuna 3 1, 2, 3 Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü, Edirne yagiznalcakan@gmail.com, sansitkibayramoglu@gmail.com, samedtuna@gmail.com Özet: Çalışmamızdaki hedef twitter üzerinden belirli markalar için yazılanların, o marka için iyi mi, kötü mü veya duygu belirtmeyen bir cümle mi sorularından, makine öğrenmesi yöntemiyle, geribildirim elde etme üzerinedir. Duygu analizi yapacağımız markalar Samsung, Apple, LG olarak kararlaştırılmıştır. Öğretim seti için ilk aşamada toplam 500 adet tweet toplanmıştır. Tweetler tek tek pozitif, negatif ve nötr olarak işaretlenmiştir. PGS NGS + PGS NTGS + NGS NTGS [PGS + NGS + NTGS] PGS : kelimenin pozitif tweetlerde geçme sayısı NGS : kelimenin negatif tweetlerde geçme sayısı NTGS : kelimenin nötr tweetlerde geçme sayısı olmak üzere nformasyon formülü belirlenmiştir. 500 tweet ile alınan sonuçlar ikna edici olmayınca, proje hocamıza danışarak öğretim seti miktarı artırımı yoluna gidilmiştir. Böylece marka başı 500 olmak üzere 1500 tweet toplanıp, işaretlenmiştir. Tweetler içerisinden enformasyon katsayısı olarak gibi kelimesi seçilmiştir. Bu sayının üzerinde kalanlar belirleyici kelimeler olarak seçilip twetlerde geçip geçmemesine göre bit tabanında işaretleme yapılmıştır. Alınan sonuçlar incelendiğinde istenilen standartların altında çıktığı için kelime düzeltme yöntemine başvurularak baştan incelenmesi kararlaştırılmıştır. Kelime düzeltici programı python dili ile Türkçe sözlük kütüphanesinden karşılaştırdığı kelimeleri büyük oranda düzelttiği gözlemlenmiştir. Bunun sonucunda veriler tekrar teste tabi tutulduğunda verimlilik oranının arttığı sayısal veri ve grafiklerle ortaya konulmuştur. Anahtar Kelimeler:Duygu Analizi, Metin Sınıflandırma, Makine Öğrenmesi, Danışmanlı Öğrenme Yaklaşımı, Büyük Veri, Sosyal Medya, Sınıflandırma Algoritmaları 1.GİRİŞ Markalar, siyasiler, ünlüler, yapımcılar vb. birçok oluşum için isimlerinin ve olayların insanlarda hangi duyguyu oluşturduğu her zaman önemli bir konudur. Daha önceleri bu bilgiyi edinmekte anket gibi masraflı ve zaman alan yöntemler kullanılmış olsa da internetin gelişimiyle birlikte bu yöntemlerin yerini daha iyilerinin alması kaçınılmaz olmuştur. İnsanlar düşüncelerini internet üzerinden herkesçe erişilebilen bir şekilde paylaşılmasıyla, sosyal medya, markalar için çok önemli bir bilgi kaynağı haline gelmiştir. Artık gerekli olan bilgi, insanların paylaşımlarında duygu madenciliği yapmaya kalmıştır. Bu bilgileri edinmedeki hız ve masrafının az olması, onu piyasa için oldukça değerli kılmıştır. Duygu analizi belirli bir konu hakkında olan metni inceleyerek olumlu, olumsuz veya tarafsız içeriğe sahip olup olmadığını inceler. Bu analizle yazarın görüşünü tespit etmek amaçlanır. Duygu analizi çalışmasında doğal dil işleme, makine öğrenmesi, hesaplamalı bilim gibi yaklaşımlar kullanılır.

2 azalttığından sonuçların iyileşmesine ve işin azalmasına katkı sağlar. Popülerliği: Saniyede atılan ortalama 5 bin tweet sayısıyla aradığınız başlık için veri kaynağı bulmanızı oldukça kolaylaştırır. Duygu analizinin evrimi Yapay zekanın bir alt dalı olan makine öğrenmesi, problemi öğrendiği bilgiye, belirlendiği kurallara göre sınıflandıran ve istatistiksel sonuçlara döken programdır. Makine öğrenmesi denetimli ve denetimsiz olarak iki başlığa ayrılmaktadır. Denetimli öğrenmede kullanılan yöntemde öğretici için örnek bir girdi ve hedefe ulaşılması için belli kurallarla haritalanmış istenilen çıktı oluşturulur. Denetimsiz öğrenmede ise öğrenme algoritmasına hiçbir etiket verilmeden, metinde kendiliğinden bir düzen bulup ilişkilendirilmesi istenmektedir. Projemizde duygu analizini belirli bir konu üzerinde yapılması istenmiştir. En uygun kaynak olarak twitter seçilmiştir. Twitter ın seçilmesinin sebepleri: Veri uzunluğu: Twitter maksimum 140 karakter mesaj uzunluğu sunar. Bizim seçtiğimiz konu başlığında ortalama olarak bir tweette 13 kelime geçmektedir. Bu şekilde kısa olması duygunun aranacağı metni kısalttığı için yarar sağladığı savunulabilir. Veri erişim kolaylığı: Twitter ın saniyede çekilebilecek tweet sayısı dışında başka bir kısıtı olmaması bilgi kaynağı edinimi açısından oldukça önemlidir. Dil kümelemesi: Tek bir dil için hazırlanacak projede bir marka veya oluşum için yabancı dillerde aynı isim ile atılan tweetleri otomatik elemesi bir artıdır. Başlık referanslaması: Özelleştirilmiş aramalar için o konuyla alakalı sonuç döndürmesi kirli veri sayısını Duygu analizinin sonucu olumlu, olumsuz ve nötr sonuçlar olarak elde edileceği kararlaştırılmıştır. Analiz için hedeflediğimiz markalar Samsung, Apple, LG dir. Tweet incelememizde hangi algoritmalarda daha iyi sonuç alınıyor ve neden, kappa değeri tatmin edici bir sayıya ulaştı mı, verimi arttırmak için neler yapılması gerekiyor, kelimerin yanlış yazılması başarımı ne kadar etkiliyor mu gibi sorulara cevap aranarak ilerlenmiştir. 2.LİTERATÜR Bu konuda ilk araştırmalar 2000 li yılların hemen öncesinde başlamış olsa da asıl sonuç alınan çalışmalar bu milenyumdan sonra elde edilmiştir. Duygu analizi alanında yapılan ilk çalışmalardan biri olarak kabul edilen Thumbs up?, Bo Pang, Lillian Lee ve Shivakumar Vaithyanathan tarafından 2002 de yayınlanmıştır. Film yorumlarını kendilerine metin olarak almışlardır ve bunları unigram, bigram, unigram+bigram, part of speach gibi makine öğrenmesi yöntemleriyle pozitif, negatif olarak ayırmışlardır. Daha karışık yapıda olan cümleleri, (örn: Bir insan 2 saat boyunca nasıl bu filmi izleyebilir gibi) hiçbir negatif, pozitif belirleyici kelime olmamasına rağmen cümlenin hangi duyguyu taşıdığı sonucuna ulaşmak istenmiştir. Makine öğrenmesi metotlarından naive bayes, maximum entropi ve vector machine algoritmalarında başarı elde etmişlerdir. En iyi sonucu ise unigram özelliğine göre makine öğrenmesi ayarlandığında alınmıştır. Svm algoritmasının performansı %82 lere ulaşmıştır da duygu analizini Twitter için uyarlayan Alec Go, Lei Huang, Richa Bhayani mesajları sınıflandırma üzerine uğraşmışlardır. Uzaktan denetimli öğrenme algoritmasını kullanarak 1.6 milyon tweeti incelemeye almışlardır. Pang ve grubunun yaptığı Thumbs up? projesini kendilerine kısmi olarak bir kaynak almışlardır. Bu çalışmayı unigram, bigram, unigram+bigram olarak analizini gerçekleştirmişlerdir. Şu şekilde bir sonuç elde etmişlerdir.

3 ve karar ağacı sınıflandırıcıları kullanılmıştır. Seçilen n-gram uzunlukları 1,2,3 dür. Makine öğrenmesinde nötr kelimeler elenerek, unigram ve svm sınıflandırıcıları kullanımıyla birlikte en iyi sonuç F-skor değerinde 0,82 elde edilerek alınmıştır. Diğer yandan sözlük tabanlı yaklaşımda alınan sonuç ise 0,59 F-skor değerine sahiptir. Buda çalışmanın hedef sorusu olan hangi yaklaşım daha iyi sonuç verir sorusuna makine öğrenmesi cevabını vermiş olmaktadır. Burada genel olarak en yüksek sonucu naive bayes algoritmasının unigramın karşılıklı bilgi biçiminde kullanılmasıyla elde edilmiştir. Ancak grafikte gösterilmeyen unigramın support vector machine algoritmasıyla kullanılması %82 lerde bir doğruluk sonucu doğurmuştur. Türkçe için F. Çetin ve M. Amasyalı Twitter üzerinde birçok çalışma yapmışlardır. Eğiticili yöntemler ve geleneksel yöntemler kullanarak gerçekleştirilen bu deneylerde naive bayes, random forest, sequential minimal optimization, J48, Instance Based1 algoritmaları kullanılmıştır. İki farklı şirketi, farklı veri kümelerinde inceleyerek; bu şirketler hakkında 6000 adet tweet bulmuşlardır. Bu tweetler el yordamıyla pozitif, negatif ve nötr olarak ayrılmış ve eşit sayıda tutulmaya çalışılmıştır. Unigram, bigram, trigram, four-gram kullanılarak yapılan denemelerde eğiticili yöntemlerin, eğiticisiz yöntemlere göre daha başarılı sonuçlar aldığını ortaya koymuşlardır. Ortalama başarıları %60 civarındadır. Bu başarıyı smo algoritmasıyla yakalamışlardır. Daha sonra aynı ikili veri kümesini yarı yarıya azaltıp naive bayes algoritmasıyla aktif öğrenme uyguladığında başarımı arttırıp %64 leri yakalamışlardır. Çetin ve Amasyalı [41] yaptıkları çalışmada Türkçe Twitter verisi üzerinde birçok deney gerçekleştirmiş ve deney sonuçlarını karşılaştırmışlardır. Sonuç olarak eğiticili yöntemlerin daha başarılı olduğunu tespit etmişlerdir. Ortalama %60 civarı başarı elde etmişlerdir. Çetin ve Amasyalı [42] yine başka bir çalışmalarında ise makine öğrenimi yöntemlerinden NB ile sınıflama esnasında eğitim kümesinin sayısını %50 azaltıp aktif öğrenme algoritmaları uygulamıştır. Tüm eğitim kümesine göre daha başarılı olmuşlar ve %64 başarı elde etmişlerdir. Diğer bir Türkçe duygu analizi çalışması Burak İbrahim Sevindi tarafından film yorumları üzerine yapılmıştır. Sözlük tabanlı yaklaşımlar ve makine öğrenmesinin karşılaştırıldığı çalışmada C4.5, naive bayes, k-nearest neighbor, support vector machine 3. VERİ SETİ ve WEKA 3.1.Veri Seti Bu bölümde teknoloji sektöründeki farklı üç firma hakkında paylaşılan tweetlerden oluşturulan her firma için ayrı birveri seti olmak üzere üç veri setikullanılmıştır. Veri setlerinde bulunan tweetler el yordamı ile pozitif, negatif ve nötr olmak üzere üç sınıfa ayrılarak veri seti eğitim setine dönüştürülmüştür. Her firmanın eğitim seti için 500 er tweet toplanmıştır ve alınacak sonuçların daha anlamlı olabilmesi için veri setlerindeki pozitif, negatif ve nötr tweetlerinin sayısının birbirine yakın olmasına dikkat edilmiştir. 3.2.Eğitim Setinin Özellikleri Her eğitim setinin düzenli hale getirilebilmesi için çalışmalar yapılmıştır. Bu çalışmalar, tüm kelimelerdeki Türkçe karakterlerin latin alfabesindeki harflere dönüştürülmesi ve basit yazım hatalarının el yordamıyla düzeltilmesi olarak sıralanabilir. Türkçe karakterlerin tweetlerlerde değiştirilmesinin nedeni olarak, sosyal medya evrensel bir bütünlük ifade ettiği için firmalar hakkında atılan tweetlerde hiç bir zaman tam olarak Türkçe alfabeyi doğru kullanılmadığı görülmüş ve buna engel olunabilmesi için bu yöntem kullanılmıştır. 3.3.Deneylerde Kullanılan Sınıflandırma Algoritmaları Bütün deneyler 10-katlamalı çapraz geçerleme stratejisi Weka (versiyon 3.6) yazılımı kullanılarak yapılmıştır[17].veri setleri üzerinde NB, RF,LibSVM, J48 ve KStar sınıflandırma algoritmaları uygulanmıştır Sınıflandırma Algoritması

4 sınıflandırıcı, olasılı sınıflandırma tekniklerinin en kısıtlayıcı uç yelpazesinde temsil edilir [1]. Sınıflandırılması gereken sınıflar (kümeler) ve örnek verilerin hangi sınıflara ait olduğu bellidir. Metin kategorizasyonu için çok etkili olduğu kanıtlanmıştır[2]. Bir Bayes yaklaşımı olarak, n boyutlu uzayda tanımlı olan X vektörü (x 1,..,x 2 ), m adet sınıf bulunan C k (C 1,.,C n ) veri kümesinde son olasılığı maksimize eden bir sınıf etiketi C arar. P( C X) P( X C ) P( C ) i i i Forest Sınıflandırma Algoritması (1) Breiman tek bir karar ağacı üretmek yerine çok sayıda ve çok değişkenli ağaçların her birinin farklı eğitim kümeleriyle eğitilmesi sonucu ortaya çıkan kararların birleştirilmesini önerir. Bir sınıflandırıcı yerine birden çok sınıflandırıcı üreten ve sonrasında onların tahminlerinden alınan oylar ile yeni veriyi sınıflandıran öğrenme algoritmasıdır. Büyük veri tabanlarında eşsiz olarak çalışır ve dengesiz veri seti sınıfında hata dengeleme yöntemlerine sahiptir. Kaybolan verilerin büyük olasılığında doğruluk korunur ve kaybolan verilerin tahmin edilmesinde etkili bir metottur [3][4]. veri setinde belirlenen K* noktasına en yakın olan verileri sınıflandırır, daha sonra bu K* noktasını kendine yakın verilerin merkezine taşıyarak sınıflandırmayı tamamlamış olur. 3.4.Sınıflandırma Algoritmalarının Karşılaştırılmasında Kullanılan Kriterler Model Başarım Ölçütleri Doğruluk Hata Oranı (Accuracy-Error Rate) Model başarımının ölçülmesinde kullanılan en popüler ve basit yöntem, modele ait doğruluk oranıdır. Doğru sınıflandırılmış örnek sayısının (TP +TN), toplam örnek sayısına (TP+TN+FP+FN) oranıdır. Hata oranı ise bu değerin 1 e tamlayanıdır. Diğer bir ifadeyle yanlış sınıflandırılmış örnek sayısının (FP+FN), toplam örnek sayısına (TP+TN+FP+FN) oranıdır. ( TP TN ) Doğruluk= ( TP FP FN TN ) ( FP FN) Hata Oranı= (4) ( TP FP FN TN ) (3) LibSVM Sınıflandırma Algoritması LIBSVM, (C-SVC, nu-svc), regresyon (epsilon- SVR, nu-svr) ve dağıtım tahmini (tek sınıf SVM) algoritmalarıyla destek vektör sınıflandırması için entegre bir yazılımdır. Bu uygulama global olarak bütün kayıp değerleri yenisiyle değiştirir ve nominal öznitelikleri ikili olanlara dönüştürür. Ayrıca bütün öznitelikleri (attributes) önceden tanımlanmış değerlerle (default) normalize eder. [5] J48 Sınıflandırma Algoritması J48, J. Ross Quinlan tarafından geliştirilen çok popüler C4.5 algoritması temeline dayanan bir karar ağacı algoritmasıdır. Karar ağaçları bir makine öğrenmesi algoritmasından bilgi temsil etmede klasik bir yoldur ve veri yapılarını ifade etmekte güçlü ve hızlı bir yol sunar. Bu algoritma verileri özyinelemeli olarak sınıflandırır. Bu işlem eğitim verilerinin maksimum doğruluğunu sağlar ama verilerin sadece belirli davranış özelliklerini tanımlayan aşırı kurallar oluşturabilir [7] KStar Sınıflandırma Algoritması K* sınıflandırma algoritmaları içinde her zaman yakınlığı ifade etmek için kullanılmıştır. Bu yüzden K* algoritmalarına uzaklık-tabanlı sınıflandırma algoritmaları denir. KStar algoritması, işlem yaptığı Kesinlik (Precision) Kesinlik, sınıfı 1 olarak tahmin edilmiş True Pozitif (TP) örnek sayısının, sınıfı 1 olarak tahmin edilmiş tüm örnek sayısına (TP+FP) oranıdır. Kesinlik= TP (5) ( TP FP) Duyarlılık (Recall) Doğru sınıflandırılmış pozitif örnek (TP) sayısının, toplam pozitif örnek sayısına (TP+FN) oranıdır. Duyarlılık= TP (6) ( TP FN) F-Ölçütü (F-Measure) Kesinlik ve duyarlılık ölçütleri tek başına anlamlı bir karşılaştırma sonucu çıkarmamıza yeterli değildir. Her iki ölçütü beraber değerlendirmek daha doğru sonuçlar verir. Bunun için f-ölçütü (F) tanımlanmıştır. F-ölçütü, kesinlik (K) ve duyarlılığın (D)harmonik ortalamasıdır.

5 F 2DK ( D K) (7) Kappa İstatistiği Gözlemciler arası varyasyon, iki veya daha fazla bağımsız gözlemciler tarafından aynı şeyi değerlendiriyor olduğu her durumda ölçülebilir [9].Kappa katsayısı -1 ile +1 arasında değişir.tam uyum söz konusu olduğunda K=1 olur. Gözlenen uyumun şansa bağlı uyuma eşit ya da ondan büyük olması durumunda K 0 iken, gözlenen uyumun şansa bağlı uyumundan küçük olması durumunda K<0 olur.kappa katsayısının yorumlanabilir aralığı 0 ile +1 arasında olup, negatif (K<0) değerlerinin güvenirlik açısından bir anlamı yoktur. 0.4 üzerinde bir kappa skoru makul bir anlaşmayı ifade eder [11]. Kappa değeri şu şekilde hesaplanır: ( Po Pc ) K (8) (1 P ) c (P o kabul edilen oran, P c kabul edilmesi beklenen oran) 3.5.Eğitim Setinin WEKA için Uygun Formata Dönüştürülmesi WEKA uygulamasının, veri seti üzerinde işlem yapabilmesi için hazırlanan eğitim setlerinin.arff uzantılı dosyalar haline getirilmesi gerektiğinden, tüm tweetler ayrı ayrı düzenlendi. Hazırlanan ARFF dosyasının başında bulunması gereken öğrenme özelliklerinin belirlenmesi aşamasında ise; PGS NGS + PGS NTGS + NGS NTGS [PGS + NGS + NTGS] formülü, PGS : kelimenin pozitif tweetlerde geçme sayısı NGS : kelimenin negatif tweetlerde geçme sayısı NTGS : kelimenin nötr tweetlerde geçme sayısı olmak üzere kullanılarak, tweetlerde geçen kelimelerin bilgi sağlama kapasiteleri değerlendirildi. Formüle göre 0.71 oranında bilgi sağlayan ama kelimesi sınır alındı ve kelimelerin tweetlerde en az 3 kez geçmesi şartı ile bağlama duyarlı şekilde öğrenme özellikleri belirlenerek, arff dosyası her firma için ayrı ayrı oluşturuldu. Veri setinde kullanılacak olan tweetler makine öğrenmesi yönteminin danışmanlı öğrenme yaklaşımı kullanılarak Weka kütüphanesinde yer alan NB, RF, LibSVM, J48 ve KStar sınıflandırma algoritmalarıyla model oluşturulmuştur. Her firma için test setinin içerdiği tweetler beş sınıflandırma algoritmasında da teste tabii tutulmuştur ve karşılaştırılmasında kullanılan model başarım ölçütleri ve kappa istatistiği sonuçlarına göre sınıflandırma algoritmalarının başarımları ölçülmüştür. Teknoloji firmaları arasından seçtiğimiz Apple, Samsung ve LG için alınan sonuçlar Tablo 1,2 ve3 de görülmektedir: Tablo 1: Apple için düzenlenen veri seti için : A (Accuracy), P (Precision), R (Recall), F (F-Measure), K (Kappa Statistic) değerlerini temsil etmektedir Bayes algoritması göstermiş olup diğer algoritmalar bu ölçüte göre sırasıyla RF,LibSVM, J48 ve KStar şeklinde sıralanabilir. bu ölçüte göre sırasıyla RF, LibSVM, Kstar ve Bu firma için deneysel sonuçlardaki başarının düşük çıkmasının nedeni seçilen belirleyici kelimelerin hazırlanan test veri seti için yetersiz kalıyor olmasıdır. Çözüm olarak kelime düzeltici tasarlanarak, tweetler üzerinde kelimelerin tümümün düzeltilmesi ve belirleyici kelimelerin belirlenen formüle göre tekrar seçilerek testlerin yerine getirilmesine karar verilmiştir. 4. İlk Sonuçların Değerlendirilmesi 4.1 Deneysel Sonuçlar

6 Tablo 2: Samsungiçin düzenlenen veri seti için : A (Accuracy), P (Precision), R (Recall), F (F-Measure), K (Kappa Statistic) değerlerini temsil etmektedir Bayes algoritması göstermiş olup diğer algoritmalar bu ölçüte göre sırasıyla LibSVM, RF, KStar ve J48 şeklinde sıralanabilir. bu ölçüte göre sırasıyla LibSVM, RF, Kstar ve Bu firma için de deneysel sonuçlardaki başarının düşük çıkmasının nedenininseçilen belirleyici kelimelerin hazırlanan test veri seti için yetersiz kalıyor olduğu görülmüştür. Çözüm olarak kelime düzeltici tasarlanarak, tweetler üzerinde kelimelerin tümümün düzeltilmesi ve belirleyici kelimelerin belirlenen formüle göre tekrar seçilerek testlerin yerine getirilmesine karar verilmiştir. Tablo 3: LGiçin düzenlenen veri seti için : A (Accuracy), P (Precision), R (Recall), F (F-Measure), K (Kappa Statistic) değerlerini temsil etmektedir Bayes algoritması göstermiş olup diğer algoritmalar bu ölçüte göre sırasıyla RF, KStar, LibSVM ve J48 şeklinde sıralanabilir. bu ölçüte göre sırasıyla RF, LibSVM, Kstar ve Bu firma için deneysel sonuçlardaki başarı yüksek çıkmasına rağman Kappa değerinin düşük çıkmasının nedeni düzenlenen test veri setindeki örnek sayısının yetersiz olduğu anlaşılmıştır. Firma için daha fazla örnek toplanarak test işleminin tekrar yapılmasına karar verilmiştir. 5. Yazım Düzeltici 4. bölümden sonra alınan sonuçların geliştirilmesi için gelen kirli datanın düzeltilmesi gerektiğine kara verildi. Bu işlemleri gerçekleştirebilmek için python dilinde bir uyulama geliştirildi. Yazım düzeltici programı python da geliştirilmesinin sebebi metin işleme konularında diğer programlama dillerine göre oldukça hızlı olmasından dolayıdır. Google ın kullandığı yazım düzeltici kadar karmaşık olmasa da doğruluk oranında ona yaklaşabilecek bir düzeltici yazamaya çalıştık. 5.1.Yazım Düzeltici Çalışma Prensibi Kelimeleri düzeltebilmek için öncelikle tüm kelimelerin doğru yazım şekillerini içinde bulunduğu bir metin dosyası oluştruyoruz. Bu kütüphaneyi oluşturmak için birçok metin dosyası haline geletirilmiş kitaptan faydalandık ve konuya özel kelimeleri de ekledik(örneğin: Apple, Samsung, İphone, gibi). Bu metin dosyasını kullanarak her bir kelime için toplam geçme sayısı baz alınarak bir ağrılık değeri elde edilerek, bu ağırlık değeri kelimler düzeltilirken en az değişiklik uygulanıp elde edilecek olası birçok sonuç için karar vermeyi sağlamaktadır. Yani örneğin sadece bir harf değiştirilerek oluşabilecek iki sonuç için hengisinin seçileceği belirleniyor[24]. Kelimelerin düzeltilmesi için temel olarak beş yöntem kullanılmaktadır. Bunlar(bölme, silme, yer değiştirme, yerine yazma ve ekleme) işlemleridir[24]. Uygulamanın çalışma sürecinde Twitter dan gelen kelimeler dizilere aktarılarak tek tek metin kütüphanesinde olup oladığı incelenmektedir, ardından eğer kelime kütüphanede yoksa yukarıda belirtilen 5 yöntemden en az değişiklik yapmak suretiyle kütüphanede eşleşeceği sonuçlar elde edilir bu sonuçlardan da ağırlık değeri en çok olan kelime seçilerek Twitte yerine yazılır[24].

7 5.2.Değerlendirme Sonuçlar incelendiğinde eğer kütüphane gelen veriye uygun bir şekilde düzenlendiyse %72 oranında doğru sonucu elde ettiği dörülmüştür. Bu değer oldukça düşüktür, bunun sebebi düzeltilecek kelimelerin Weka programına uygun hale getirmek için Türkçe - ç, ğ, ı, ö, ş, ü - karakterleri - c, g, i, o, s, u - karakterlerine dönüştürülmüştür. Bu durumda düzeltme işlemindeki seçiciliği oldukça bozmuştur. Bir diğer sebepse Twitlerde konu alınan özellikle ticari ürün isimlerinin İnglizce olmasından dolayı birçok Twitter kullanıcısı kendi yazım şeklini geliştirmiştir. Örneğin İphone kelimesinin 6 farklı yazım şekli olduğu görülmüştür bu sonuçta yazım düzeltici uygulamasının hatalı düzeltme yapmasına sebep olmaktadır. Düzeltme işlemlerinde örneğin gelcem, görüyoz şeklindeki hatalı yazımların, yazım düzelticinin hemen hemen hepsinde hatalı düzeltme yapmasından dolayı bu durumlar için istisna durum kodları yazılmıştır ve bu şekilde gelen kelimlerin düzeltilmesinde %95 başarı sağlanmıştır. Bu tüm düzeltmelerden sonra Weka için.arff dosyaları hazırlanmıştır ve 4. Bölümdeki testler tekrar yapılmıştır. Teknoloji firmaları arasından seçtiğimiz Apple, Samsung ve LG için yazım düzeltici çalışmasından sonra alınan sonuçlar Tablo 1,2 ve3 de görülmektedir: Tablo 1: Apple için düzenlenen veri seti için : A (Accuracy), P (Precision), R (Recall), F (F-Measure), K (Kappa Statistic) değerlerini temsil etmektedir Bayes algoritması göstermiş olup diğer algoritmalar bu ölçüte göre sırasıyla LibSVM,RF, J48 ve KStar şeklinde sıralanabilir. bu ölçüte göre sırasıyla LibSVM,RF, Kstar ve Tablo 2: Samsungiçin düzenlenen veri seti için : A (Accuracy), P (Precision), R (Recall), F (F-Measure), K (Kappa Statistic) değerlerini temsil etmektedir Bayes algoritması göstermiş olup diğer algoritmalar bu ölçüte göre sırasıyla RF, LibSVM, J48 ve KStar şeklinde sıralanabilir. bu ölçüte göre sırasıyla RF, LibSVM, J48 ve KStar şeklinde sıralanabilir. Tablo 3: LGiçin düzenlenen veri seti için : A (Accuracy), P (Precision), R (Recall), F (F-Measure), K (Kappa Statistic) değerlerini temsil etmektedir Bayes algoritması göstermiş olup diğer

8 algoritmalar bu ölçüte göre sırasıyla RF, KStar, LibSVM ve J48 şeklinde sıralanabilir. bu ölçüte göre sırasıyla RF, LibSVM, Kstar ve 6.Sonuç belirleyici kelimelerin bulunmasıyla oluşturulan eğitim setleri ile alınan sonuçlar arasında bariz farkların olmadığı görüşmüştür. Bunun nedeni olarak da düzenlenen eğitim setlerindeki verilerin yetersiz olduğu, bu çalışmanın bir büyük veri üzerinde yürütülmesi gerektiğine karar verilmiştir. Yinede alınan sonuçları değerlendirmek gerekirse, her iki çalışmada da en iyi sonucu 3 firma içinde algoritmasının verdiği görülmektedir. Tüm sonuçlar değerlendirildiğinde ilk düzenlenen eğitim setlerindeki verilerden alınan sınıflandırma sonuçları ile yazım düzelticiden geçirilerek %75 oranında tüm kelimelerin düzeltilmesiyle ve tekrar

9 7.Kaynakça [1] Mehran Sahami(1996),Learning Limited Dependence Bayesian Classifiers. [2] Dai, Wenyuan, et al. Transfering naive bayes classifiers for text classification. Proceedings of the national conference on artificial intelligence. London; AAAI Press; MIT Press;1999,2007. [3] Leo Breiman and Adele Cutler, Forests,2005. [4] Leo Breiman,Machine Learning, 45, 5 32, 2001, Forests. [5] Chih-Chung Chang and Chih-Jen Lin, LIBSVM A Library for [6] J.R, QUINLAN, Machine Learning 1: , 1986, Induction of Trees. [7] Laveena Sehgal, Neeraj Mohan, and Dr. Parvinder S. Sandhu (2012), Prediction of Function Based Software Using Tree Approach. [8] Aha, D. ve Kibler, D. (1991), Instance-based learning algorithms, Machine Learning, vol. 6, Issue no. 1, January [9] Anthony J. Viera, MD; Joanne M. Garrett, PhD (2005),Understanding Interobserver Agreement:The Kappa Statistic. [10] Schrauwen, Sarah. "Machine learning approaches to sentiment analysis using the dutch netlog corpus." Machine Learning Approaches to Sentiment Analysis Using the Dutch Netlog Corpus (Antwerp, Belgium, 2010), CLiPS Technical Report Series, Computational Linguistics & Psycholinguistics (2010). [11] Landis, J. Richard, and Gary G. Koch. "The measurement of observer agreement for categorical data." biometrics 33.1 (1977): [12] Cetin, M., and M. F. Amasyali. "Supervised and traditional term weighting methods for sentiment analysis." Signal Processing and Communications Applications Conference (SIU), st. IEEE, [14] Pang, Bo, Lillian Lee, and Shivakumar Vaithyanathan. "Thumbs up?: sentiment classification using machine learning techniques." Proceedings of the ACL-02 conference on Empirical methods in natural language processing-volume 10. Association for Computational Linguistics, [15] Go, Alec, Richa Bhayani, and Lei Huang. "Twitter sentiment classification using distant supervision." CS224N Project Report, Stanford (2009): [16] B.İbrahim Sevindi, "Türkçe Metinlerde Denetimli ve Sözlük Tabanlı Duygu Analizi Yaklaşımlarının Karşılaştırılması"Yüksek Lisans Tezi, [17] [18]Hidayet Takçı. Duygu analizi(sentiment analysis) Doktora Tezi, 2013http://verimadencisi.blogspot.com.tr/2013/08/d uygu-analizi-sentiment-analysis.html [19] [20]ftp://docentes.puccampinas.edu.br/pub/professores/ceatec/juan/Projet ofinal/bibliografia/go,%20bhayani,%20huang,% 20%20(2009).%20Twitter%20sentiment%20classif ication%20using%20distant%20supervision.%20c S224N%20Project%20Report,%20Stanford.pdf [21]Alaettin Uçan. Otomatik duygu sözlüğü çevirimi ve duygu analizinde kullanımı Yüksek Lisans Tezi, nmaster.pdf [22] timent.pdf [23] orking/twitter%20sentiment%20analysis.pdf [24] Peter Norvig, [13] Kılıçaslan, Yılmaz, Edip Serdar Güner, and Savaş Yıldırım. "Learning-based pronoun resolution for Turkish with a comparative evaluation." Computer Speech & Language 23.3 (2009):

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması Hatice Nizam 1, Saliha Sıla Akın 2 1 İstanbul Üniversitesi Bilgisayar Mühendisliği

Detaylı

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması

Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının Karşılaştırılması inet-tr 14 - XIX. Türkiye'de İnternet Konferansı Bildirileri 27-29 Kasım 2014 Yaşar Üniversitesi, İzmir Sosyal Medyada Makine Öğrenmesi ile Duygu Analizinde Dengeli ve Dengesiz Veri Setlerinin Performanslarının

Detaylı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü haticenizam@outlook.com Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

Veri ve Metin Madenciliği. Zehra

Veri ve Metin Madenciliği. Zehra Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği

Detaylı

Türkçe Dokümanlar Ġçin Yazar Tanıma

Türkçe Dokümanlar Ġçin Yazar Tanıma Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:

Detaylı

Türkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi

Türkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi Türkçe Twitter Mesajlarında Gizli Dirichlet Tahsisine Dayalı Duygu Analizi Aytuğ Onan 1 1 Celal Bayar Üniversitesi, Yazılım Mühendisliği Bölümü, Manisa aytug.onan@cbu.edu.tr Özet: Duygu analizi, görüş

Detaylı

Global Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey.

Global Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey. Global Business Research Congress (GBRC), May 26-27, 2016, Istanbul, Turkey. DETERMINATION OF TWITTER USERS SENTIMENT POLARITY TOWARD AIRLINE MARKET IN TURKEY: A CASE OF OPINION MINING DOI: 10.17261/Pressacademia.2016118690

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

YÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ

YÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ YÖNETİM BİLİŞİM SİSTEMLERİ DERGİSİ http://dergipark.ulakbim.gov.tr/ybs Yayın Geliş Tarihi: 16.11.2017 Cilt:3, Sayı:2, Yıl:2017, Sayfa: 1-14 Yayına Kabul Tarihi: 23.11.2017 ISSN: 2148-3752 Online Yayın

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması 1 Emre DANDIL Bilecik Ş. Edebali Üniversitesi emre.dandil@bilecik.edu.tr +90228 214 1613 Sunum İçeriği Özet Giriş

Detaylı

Naive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ

Naive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ Naive Bayes Yöntemi ile Spam Mail Teşhisi 2 17574006-Kübra KURNAZ Yıldız Teknik Üniversitesi, Elektrik-Elektronik Fakültesi, Bilgisayar Mühendisliği Bölümü, Tezsiz Yüksek Lisans Bilgi Teknolojileri Özet

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Uzaktan Algılama Uygulamaları

Uzaktan Algılama Uygulamaları Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR KAHKAHA TANIMA İÇİN RASSAL ORMANLAR Heysem Kaya, A. Mehdi Erçetin, A. Ali Salah, S. Fikret Gürgen Bilgisayar Mühendisliği Bölümü Boğaziçi Üniversitesi / Istanbul Akademik Bilişim'14, Mersin, 05.02.2014

Detaylı

AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Değerlendirilmesi AYTUĞ ONAN CELAL BAYAR ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SERDAR KORUKOĞLU EGE ÜNİVERSİTESİ, BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Detaylı

Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques

Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques Makine Öğrenmesi Yöntemleri ile Duygu Analizi Sentiment Analysis with Machine Learning Techniques Oğuz Kaynar Management Information System Cumhuriyet University Sivas, Turkey Okaynar@cumhuriyet.edu.tr

Detaylı

Metin Sınıflandırma. Akış

Metin Sınıflandırma. Akış Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım

Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım Yılmaz KAYA 1, Ömer Faruk ERTUĞRUL 2, Ramazan TEKİN 3 1 Siirt Üniversitesi, Bilgisayar Mühendisliği Bölümü 2 Batman Üniversitesi, Elektrik-Elektronik

Detaylı

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi

Detaylı

Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval

Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval İsmail Haberal Bilgisayar Mühendisliği Bölümü Başkent Üniversitesi ihaberal@baskent.edu.tr Umut

Detaylı

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest

Detaylı

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Maltepe Üniversitesi, Yazılım Mühendisliği Bölümü, İstanbul zeynepguven@maltepe.edu.tr, turgaybilgin@maltepe.edu.tr Özet: Zaman serileri

Detaylı

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir.

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir. ÇELĐK YÜZEYLERĐN SINIFLANDIRILMASI * Cem ÜNSALAN ** Aytül ERÇĐL * Ayşın ERTÜZÜN *Boğaziçi Üniversitesi, Elektrik-Elektronik Mühendisliği Bölümü unsalan@boun.edu.tr **Boğaziçi Üniversitesi, Endüstri Mühendisliği

Detaylı

Kelime Gösterimleri (Word Representation Word Embeddings)

Kelime Gösterimleri (Word Representation Word Embeddings) Kelime Gösterimleri (Word Representation Word Embeddings) Kelime, cümlede kullanımına göre farklı anlamlar kazanabilir Anlamsal bilginin çıkarılması metinlerin işlenmesinde önemlidir Kelimelerin işlenebilir

Detaylı

Sözlük Kullanarak Türkçe El yazısı Tanıma

Sözlük Kullanarak Türkçe El yazısı Tanıma Sözlük Kullanarak Türkçe El yazısı Tanıma Murat Şekerci 1 Rembiye Kandemir 2 1,2 Bilgisayar Mühendisliği Bölümü Mühendislik-Mimarlık Fakültesi Trakya Üniversitesi, 2250, Edirne 1 e-posta: muratsekerci@hotmail.com

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Ara sınav - 25% Ödev (Haftalık) - 10% Ödev Sunumu (Haftalık) - 5% Final (Proje Sunumu) - 60% - Dönem sonuna kadar bir optimizasyon tekniğiyle uygulama geliştirilecek (Örn:

Detaylı

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Zeynep Behrin Güven 1, Turgay Tugay Bilgin 1 1 Maltepe Üniversitesi, Yazılım Mühendisliği Bölümü, İstanbul zeynepguven@maltepe.edu.tr,

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

Büyük Veri ve Endüstri Mühendisliği

Büyük Veri ve Endüstri Mühendisliği Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan

Detaylı

Farklı Özellik Vektörleri ile Türkçe Dokümanların Yazarlarının Belirlenmesi

Farklı Özellik Vektörleri ile Türkçe Dokümanların Yazarlarının Belirlenmesi Farklı Özellik Vektörleri ile Türkçe Dokümanların Yazarlarının Belirlenmesi M. Fatih Amasyalı 1, Banu Diri 1, Filiz Türkoğlu 2 Yıldız Teknik Üniversitesi, Bilgisayar Mühendisliği 34349 İstanbul-Türkiye

Detaylı

DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014

DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014 DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh. 86-93 Eylül 2014 DESTEK VEKTÖR MAKİNELERİ PARAMETRE OPTİMİZASYONUNUN DUYGU ANALİZİ ÜZERİNDEKİ ETKİSİ (EFFECTS OF SUPPORT VECTOR

Detaylı

Yazılım Hata Kestiriminde Kolektif Sınıflandırma Modellerinin Etkisi

Yazılım Hata Kestiriminde Kolektif Sınıflandırma Modellerinin Etkisi Yazılım Hata Kestiriminde Kolektif Sınıflandırma Modellerinin Etkisi Deniz Kılınç 1, Emin Borandağ 1, Fatih Yücalar 1, Akın Özçift 1, Fatma Bozyiğit 1 1 Celal Bayar Üniversitesi Hasan Ferdi Turgutlu Teknoloji

Detaylı

Kolektif Öğrenme Metotları

Kolektif Öğrenme Metotları Kolektif Öğrenme Metotları Kolektif öğrenme algoritmalarına genel bakış 1-Bagging 2-Ardışık Topluluklarla Öğrenme (Boosting) 3-Rastsal Altuzaylar 4-Rastsal Ormanlar 5-Aşırı Rastsal Ormanlar 6-Rotasyon

Detaylı

Karar Ağacı Öğrenmesi(Decision Tree Learning)

Karar Ağacı Öğrenmesi(Decision Tree Learning) Karar Ağacı Öğrenmesi(Decision Tree Learning) Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt

Detaylı

YAPAY ÖĞRENME İLE TÜRKİYE NİN KURULU GÜCÜNÜN 2023 YILINA KADAR TAHMİNİ

YAPAY ÖĞRENME İLE TÜRKİYE NİN KURULU GÜCÜNÜN 2023 YILINA KADAR TAHMİNİ YAPAY ÖĞRENME İLE TÜRKİYE NİN KURULU GÜCÜNÜN 2023 YILINA KADAR TAHMİNİ Cihan DEMİR 1, Fatih AYDIN 2 1Kırklareli Üniversitesi, Teknik Bilimler M.Y.O, 39100, KIRKLARELİ 2 Kırklareli Üniversitesi, Teknik

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü. Bilgisayar Mühendisliği

Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü. Bilgisayar Mühendisliği Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü Bilgisayar Mühendisliği Bilgisayar Mühendisliği Günümüzde, finans, tıp, sanat, güvenlik, enerji gibi bir çok sektör, bilgisayar mühendisliğindeki gelişimlerden

Detaylı

Kablosuz Sensör Ağlar ve Eniyileme. Tahir Emre KALAYCI. 21 Mart 2008

Kablosuz Sensör Ağlar ve Eniyileme. Tahir Emre KALAYCI. 21 Mart 2008 Kablosuz Sensör Ağlar ve Eniyileme Tahir Emre KALAYCI 21 Mart 2008 Gündem Genel Bilgi Alınan Dersler Üretilen Yayınlar Yapılması Planlanan Doktora Çalışması Kablosuz Sensör Ağlar Yapay Zeka Teknikleri

Detaylı

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ - 150110046 İÇERİK Uygulama ve uygulamaya ilişkin temel kavramların tanıtımı Uygulamanın yapısı Ön yüz Veritabanı Web Servisler K-Means Algoritması ile kategori

Detaylı

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6003

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6003 Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Makina Öğrenmesi ve Akıl Yürütme Dersin Orjinal Adı: Machine Learning and Reasoning Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora)

Detaylı

Türkçe Dokümanlar İçin N-gram Tabanlı Yeni Bir Sınıflandırma(Ng-ind): Yazar, Tür ve Cinsiyet

Türkçe Dokümanlar İçin N-gram Tabanlı Yeni Bir Sınıflandırma(Ng-ind): Yazar, Tür ve Cinsiyet Türkçe Dokümanlar İçin N-gram Tabanlı Yeni Bir Sınıflandırma(Ng-ind): Yazar, Tür ve Cinsiyet Sibel Doğan 1, Banu Diri 2 1,2 Yıldız Teknik Üniversitesi, Bilgisayar Mühendisliği, 34349 İstanbul-Türkiye 1

Detaylı

Makine Öğrenmesi 3. hafta

Makine Öğrenmesi 3. hafta Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla

Detaylı

Çağrı Merkezi Metin Madenciliği Yazılım Çerçevesi. Call Center Text Mining Framework

Çağrı Merkezi Metin Madenciliği Yazılım Çerçevesi. Call Center Text Mining Framework Çağrı Merkezi Metin Madenciliği Yazılım Çerçevesi İbrahim Onuralp Yiğit Türk Telekom, İstanbul, Türkiye ibrahimonuralp.yigit@turktelekom.com.tr Özet. Çağrı merkezlerine gelen çağrıların sesten metne dönüştürülerek

Detaylı

Örüntü Tanıma (EE 448) Ders Detayları

Örüntü Tanıma (EE 448) Ders Detayları Örüntü Tanıma (EE 448) Ders Detayları Ders Adı Ders Kodu Dönemi Ders Saati Uygulama Saati Laboratuar Saati Kredi AKTS Örüntü Tanıma EE 448 Bahar 3 0 0 3 5 Ön Koşul Ders(ler)i Dersin Dili Dersin Türü Dersin

Detaylı

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek, İSTATİSTİK 8.Hafta Değişkenlik Ölçüleri Hedefler Bu üniteyi çalıştıktan sonra; Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek, Serilerin birbirlerine değişkenliklerini yorumlayabileceksiniz. 2

Detaylı

Mühendislik ve Fen Bilimleri Dergisi Journal of Engineering and Natural Sciences

Mühendislik ve Fen Bilimleri Dergisi Journal of Engineering and Natural Sciences Mühendislik ve Fen Bilimleri Dergisi Journal of Engineering and Natural Sciences Sigma 5 8-14, 2013 Araştırma Makalesi / Research Article METİNLERİN ANLAMSAL UZAYDAKİ TEMSİL YÖNTEMLERİNİN SINIFLANDIRMA

Detaylı

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan.   blog.mustafabaydogan. Veri Madenciliği Yrd. Doç. Dr. Mustafa Gökçe Baydoğan mustafa.baydogan@boun.edu.tr www.mustafabaydogan.com blog.mustafabaydogan.com İçerik p Veri Madenciliği nedir? n Bir örnek p Boğaziçi Üniversitesi

Detaylı

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Akış Makine Öğrenmesi nedir? Günlük Hayatımızdaki Uygulamaları Verilerin Sayısallaştırılması Özellik Belirleme Özellik Seçim Metotları Bilgi Kazancı (Informaiton Gain-IG) Sinyalin Gürültüye Oranı: (S2N

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Makine Öğrenmesi Erhan AKDOĞAN, Ph.D. Bu ders notunun hazırlanmasında Dr. U.Orhan ve Banu Diri nin ders notlarından yararlanılmıştır. Makine öğrenmesi

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Otomatik Doküman Sınıflandırma Rumeysa YILMAZ, Rıfat AŞLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr, kgunel@aduedutr

Detaylı

Karar Ağaçları Destekli Vadeli Mevduat Analizi. Bank Deposit Analysis Based on Decision Tree

Karar Ağaçları Destekli Vadeli Mevduat Analizi. Bank Deposit Analysis Based on Decision Tree Karar Ağaçları Destekli Vadeli Mevduat Analizi Hakan Dalkılıç1, Feriştah Dalkılıç1 1 Dokuz Eylül Üniversitesi, Bilgisayar Mühendisliği Bölümü, İzmir hakand@hotmail.com, feristah@cs.deu.edu.tr Özet: C4.5

Detaylı

Destekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines)

Destekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines) Destekçi Vektör Makineleri Destekçi Vektör Makineleri(Support Vector Machines) Değişkenler arasındaki örüntülerin bilinmediği veri setlerindeki sınıflama problemleri için önerilmiş bir makine öğrenmesi

Detaylı

BCA605 Bilgisayar Oyunlarında Yapay Zeka

BCA605 Bilgisayar Oyunlarında Yapay Zeka BCA605 Bilgisayar Oyunlarında Yapay Zeka Ders 1 : Genel Tanıtım Zümra Kavafoğlu Hakkımda Araştırma Alanları Bilgisayar Grafiği ve Animasyonu Fizik-tabanlı Animasyon Karakter Animasyonu Bilgisayar Animasyonu

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Akademik Bilişim 12 - XIV Akademik Bilişim Konferansı Bildirileri Otomatik Doküman Sınıflandırma Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr,

Detaylı

Demografik Özelliklerin Koroner Arter Hastalığına Etkisinin Analizi

Demografik Özelliklerin Koroner Arter Hastalığına Etkisinin Analizi Demografik Özelliklerin Koroner Arter Hastalığına Etkisinin Analizi İçindekiler Giriş Bilgi Keşfi Sınıflandırma Uygulama Sonuç ve Öneriler Giriş Koroner Arter Hastalığı(KAH) : Koroner arterler kalbi besleyen

Detaylı

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ Algoritma Analizi Çerçevesi Algoritma Analizinde Göz Önünde Bulundurulması Gerekenler Neler? Algoritmanın Doğruluğu (Correctness) Zaman

Detaylı

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri Konular VERİ MADENCİLİĞİ Farklı Sınıflandırma Yöntemleri Yrd. Doç. Dr. Şule Gündüz Öğüdücü Örnek tabanlı yöntemler ken Yakın Komşu Yöntemi Genetik Algoritmalar Bulanık Küme Sınıflandırıcılar Öngörü Eğri

Detaylı

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA Makine Öğrenmesi Çok büyük miktardaki verilerin elle işlenip analiz edilmesi mümkün değildir. Bu tür problemlere çözüm bulmak amacıyla makine öğrenmesi

Detaylı

CBS ve Coğrafi Hesaplama

CBS ve Coğrafi Hesaplama Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr

Detaylı

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri

Konular VERİ MADENCİLİĞİ. Örnek Tabanlı Yöntemler. En Yakın Komşu Sınıflandırıcı. En Yakın Komşu Yöntemi. Farklı Sınıflandırma Yöntemleri VERİ MADENCİLİĞİ Farklı Sınıflandırma Yöntemleri Yrd. Doç. Dr. Şule Gündüz Öğüdücü Örnek tabanlı yöntemler ken Yakın Komşu Yöntemi Genetik Algoritmalar Karar Destek Makinaları Bulanık Küme Sınıflandırıcılar

Detaylı

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : 15.05.1976. 3. Unvanı : Doç. Dr. 4. Öğrenim Durumu :

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : 15.05.1976. 3. Unvanı : Doç. Dr. 4. Öğrenim Durumu : ÖZGEÇMİŞ 1. Adı Soyadı : Olcay Taner Yıldız 2. Doğum Tarihi : 15.05.1976 3. Unvanı : Doç. Dr. 4. Öğrenim Durumu : Derece Alan Üniversite Yıl Lisans Bilgisayar Mühendisliği Boğaziçi Üniversitesi 1997 Y.

Detaylı

Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Değerlendirilmesi

Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Değerlendirilmesi Metin Sınıflandırmada Öznitelik Seçim Yöntemlerinin Değerlendirilmesi Aytuğ Onan 1, Serdar Korukoğlu 2 1 Celal Bayar Üniversitesi, Bilgisayar Mühendisliği Bölümü, Manisa 2 Ege Üniversitesi, Bilgisayar

Detaylı

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi YRD. DOÇ. DR. HÜSEYİN GÜRÜLER MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ, TEKNOLOJİ FAKÜLTESİ, BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ Meslek Seçimi Meslek Seçimi

Detaylı

Adım Adım SPSS. 1- Data Girişi ve Düzenlemesi 2- Hızlı Menü. Y. Doç. Dr. İbrahim Turan Nisan 2011

Adım Adım SPSS. 1- Data Girişi ve Düzenlemesi 2- Hızlı Menü. Y. Doç. Dr. İbrahim Turan Nisan 2011 Adım Adım SPSS 1- Data Girişi ve Düzenlemesi 2- Hızlı Menü Y. Doç. Dr. İbrahim Turan Nisan 2011 File (Dosya) Menüsü Excel dosyalarını SPSS e aktarma Variable View (Değişken Görünümü 1- Name (İsim - Kod)

Detaylı

Metin Madenciliğinde Yazar Tanıma (Author Recognition in Text Mining)

Metin Madenciliğinde Yazar Tanıma (Author Recognition in Text Mining) YBS Ansiklopedi www.ybsansiklopedi.com Cilt 5, Sayı 1, Mayıs 2018 Metin Madenciliğinde Yazar Tanıma (Author Recognition in Text Mining) Deniz İrem ÜNAL 1, Şadi Evren ŞEKER 2 1. Yıldız Teknik Üniversitesi,Matematik

Detaylı

BĠYOLOJĠ EĞĠTĠMĠ LĠSANSÜSTÜ ÖĞRENCĠLERĠNĠN LĠSANSÜSTÜ YETERLĠKLERĠNE ĠLĠġKĠN GÖRÜġLERĠ

BĠYOLOJĠ EĞĠTĠMĠ LĠSANSÜSTÜ ÖĞRENCĠLERĠNĠN LĠSANSÜSTÜ YETERLĠKLERĠNE ĠLĠġKĠN GÖRÜġLERĠ 359 BĠYOLOJĠ EĞĠTĠMĠ LĠSANSÜSTÜ ÖĞRENCĠLERĠNĠN LĠSANSÜSTÜ YETERLĠKLERĠNE ĠLĠġKĠN GÖRÜġLERĠ Osman ÇİMEN, Gazi Üniversitesi, Biyoloji Eğitimi Anabilim Dalı, Ankara, osman.cimen@gmail.com Gonca ÇİMEN, Milli

Detaylı

Karar ağaçları overfitting e karşı çok hassastır. Birkaç alternatif karar ağacı oluşturulur ve sonuçta oylama yapılarak karar verilir.

Karar ağaçları overfitting e karşı çok hassastır. Birkaç alternatif karar ağacı oluşturulur ve sonuçta oylama yapılarak karar verilir. Entropy Bir veri setindeki bozukluğu ifade eder. pi her sınıf için etiketlenen verilerin oranını gösterir. karar ağaçlarında kullanılır. Karar ağaçları (Decision Tree) Makine öğrenmesi kullanılarak, sınıflamaya

Detaylı

SAYI VE KODLAMA SİSTEMLERİ. Teknoloji Fakültesi/Bilgisayar Mühendisliği

SAYI VE KODLAMA SİSTEMLERİ. Teknoloji Fakültesi/Bilgisayar Mühendisliği SAYI VE KODLAMA SİSTEMLERİ Teknoloji Fakültesi/Bilgisayar Mühendisliği Neler Var? Sayısal Kodlar BCD Kodu (Binary Coded Decimal Code) - 8421 Kodu Gray Kodu Artı 3 (Excess 3) Kodu 5 de 2 Kodu Eşitlik (Parity)

Detaylı

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme 1 Cem Rıfkı Aydın, 1 Ali Erkan, 1 Tunga Güngör, 2 Hidayet Takçı 1 Boğaziçi Üniversitesi, 2 Cumhuriyet Üniversitesi Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme AB 14 7 Şubat 2014

Detaylı

ÖZGEÇMİŞ. Dr. Aytuğ ONAN

ÖZGEÇMİŞ. Dr. Aytuğ ONAN ÖZGEÇMİŞ İletişim Bilgileri Dr. Aytuğ ONAN Çalıştığı Kurum: Doktor Öğretim Üyesi, Manisa Celal Bayar Üniversitesi, Hasan Ferdi Turgutlu Teknoloji Fakültesi, Yazılım Mühendisliği Bölümü, Turgutlu-MANİSA.

Detaylı

Veri Madenciliği Karar Ağacı Oluşturma

Veri Madenciliği Karar Ağacı Oluşturma C4.5 Algoritması Veri Madenciliği Karar Ağacı Oluşturma Murat TEZGİDER 1 C4.5 Algoritması ID3 algoritmasını geliştiren Quinlan ın geliştirdiği C4.5 karar ağacı oluşturma algoritmasıdır. ID3 algoritmasında

Detaylı

Veri Madenciliğinde Sınıflandırma Algoritmalarının Bir Örnek Üzerinde Karşılaştırılması

Veri Madenciliğinde Sınıflandırma Algoritmalarının Bir Örnek Üzerinde Karşılaştırılması Akademik Bilişim 11 - XIII. Akademik Bilişim Konferansı Bildirileri 2-4 Şubat 2011 İnönü Üniversitesi, Malatya Veri Madenciliğinde Sınıflandırma Algoritmalarının Bir Örnek Üzerinde Karşılaştırılması Cengiz

Detaylı

Eş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama

Eş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama Eş-Talim Yöntemi ile Metin Sınıflandırma İçin Bir Uygulama Katira Soleymanzadeh1, Ufuk Hürriyetoğlu1, Bahar Karaoğlan1, Senem Kumova Metin2, Tarık Kışla3 1 Ege Üniversitesi, Uluslararası Bilgisayar Enstitüsü,

Detaylı

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Akış Makine Öğrenmesi nedir? Günlük Hayatımızdaki Uygulamaları Verilerin Sayısallaştırılması Özellik Belirleme Özellik Seçim Metotları Bilgi Kazancı (Informaiton Gain-IG) Sinyalin Gürültüye Oranı: (S2N

Detaylı

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu Sunan : Esra Nergis Güven İçerik Giriş Amaç ve Kapsam Sınıflandırma Geliştirilen Sistem

Detaylı

Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov

Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi Hazırlayan: Nury Amanmadov Göğüs Kanseri Nedir? Gögüs Kanseri göğüs hücrelerinde başlayan

Detaylı

Karar Ağacı Öğrenmesi(Decision Tree Learning)

Karar Ağacı Öğrenmesi(Decision Tree Learning) Karar Ağacı Öğrenmesi(Decision Tree Learning) Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt

Detaylı

Karar Ağaçları Destekli Vadeli Mevduat Analizi

Karar Ağaçları Destekli Vadeli Mevduat Analizi Karar Ağaçları Destekli Vadeli Mevduat Analizi Hakan Dalkılıç 1, Feriştah Dalkılıç 1 1 Dokuz Eylül Üniversitesi, Bilgisayar Mühendisliği Bölümü, İzmir hakand@hotmail.com, feristah@cs.deu.edu.tr Özet: C4.5

Detaylı

Evrimsel Çok amaçlı eniyileme. Tahir Emre Kalaycı Ege Üniversitesi Bilgisayar Mühendisliği Bölümü 25 Mart 2010

Evrimsel Çok amaçlı eniyileme. Tahir Emre Kalaycı Ege Üniversitesi Bilgisayar Mühendisliği Bölümü 25 Mart 2010 Evrimsel Çok amaçlı eniyileme Tahir Emre Kalaycı Ege Üniversitesi Bilgisayar Mühendisliği Bölümü 25 Mart 2010 Gündem Çok amaçlı eniyileme Giriş Evrimsel çok amaçlı eniyileme Sonuç Giriş Gerçek dünya problemleri

Detaylı

Gevşek Hesaplama (COMPE 474) Ders Detayları

Gevşek Hesaplama (COMPE 474) Ders Detayları Gevşek Hesaplama (COMPE 474) Ders Detayları Ders Adı Gevşek Hesaplama Ders Kodu COMPE 474 Dönemi Ders Uygulama Laboratuar Kredi AKTS Saati Saati Saati Bahar 3 0 0 3 5 Ön Koşul Ders(ler)i Dersin Dili Dersin

Detaylı

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi

Detaylı

Veri Madenciliği - Giriş. Erdem Alparslan

Veri Madenciliği - Giriş. Erdem Alparslan Veri Madenciliği - Giriş Erdem Alparslan Amaçlar İş zekasının önemli bir parçası olan veri madenciliğinin tanımı İş analizi ve veri madenciliğinin amaçlarının anlaşılması Veri madenciliğini kullanan çok

Detaylı

Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama

Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama Mehmet Yavuz ONAT Yrd.Doç.Dr.Engin YILDIZTEPE Dokuz Eylül Üniversitesi, İstatistik Bölümü Akademik Bilişim 2015, Anadolu Üniversitesi, Eskişehir

Detaylı

ALTIN ORAN ARAMA (GOLDEN SECTION SEARCH) METODU

ALTIN ORAN ARAMA (GOLDEN SECTION SEARCH) METODU ALTIN ORAN ARAMA (GOLDEN SECTION SEARCH) METODU Tek değişkenli bir f(x) fonksiyonunu ele alalım. [Bazı x ler için f (x) bulunamayabilir.] Aşağıdaki DOP modelini çözmek istediğimizi var sayalım. Max f(x)

Detaylı

ALP OĞUZ ANADOLU LİSESİ EĞİTİM ÖĞRETİM YILI BİLGİSAYAR BİLİMİ DERSİ 2.DÖNEM 2.SINAV ÖNCESİ ÇALIŞMA SORULARI VE YANITLARI

ALP OĞUZ ANADOLU LİSESİ EĞİTİM ÖĞRETİM YILI BİLGİSAYAR BİLİMİ DERSİ 2.DÖNEM 2.SINAV ÖNCESİ ÇALIŞMA SORULARI VE YANITLARI ALP OĞUZ ANADOLU LİSESİ 2017-2018 EĞİTİM ÖĞRETİM YILI BİLGİSAYAR BİLİMİ DERSİ 2.DÖNEM 2.SINAV ÖNCESİ ÇALIŞMA SORULARI VE YANITLARI Doğru yanıtlar kırmızı renkte verilmiştir. 1. Problemlerin her zaman sıradan

Detaylı

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması Özet: Kelime anlamı belirginleştirme (KAB), bir kelimenin bulunduğu bağlamda hangi anlamı ile kullanıldığının otomatik olarak belirlenebilmesidir.

Detaylı

Güz Dönemi Zorunlu Dersleri

Güz Dönemi Zorunlu Dersleri T.C. AKSARAY ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ELEKTRİK-ELEKTRONİK ve BİLGİSAYAR MÜHENDİSLİĞİ ANABİLİM DALI TEZLİ YÜKSEK LİSANS PROGRAMI Güz Dönemi Zorunlu Dersleri EEBM 501 İleri Mühendislik Matematiği

Detaylı

BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR

BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR İÇİNDEKİLER BÖLÜM 1 ÖLÇME VE DEĞERLENDİRMEDE TEMEL KAVRAMLAR I. Öğretimde Ölçme ve Değerlendirmenin Gerekliliği... 2 II. Ölçme Kavramı... 3 1. Tanımı ve Unsurları... 3 2. Aşamaları... 3 2.1. Ölçülecek

Detaylı

Sahne Geçişlerinin Geometrik Tabanlı olarak Saptanması

Sahne Geçişlerinin Geometrik Tabanlı olarak Saptanması Sahne Geçişlerinin Geometrik Tabanlı olarak Saptanması 1 Giriş Binnur Kurt, H. Tahsin Demiral, Muhittin Gökmen İstanbul Teknik Üniversitesi, Bilgisayar Mühendisliği Bölümü, Maslak, 80626 İstanbul {kurt,demiral,gokmen}@cs.itu.edu.tr

Detaylı

İçerik Tabanlı İstenmeyen SMS Filtreleme için Mobil Uygulama Geliştirilmesi ve Sınıflandırma Algoritmalarının Karşılaştırılması

İçerik Tabanlı İstenmeyen SMS Filtreleme için Mobil Uygulama Geliştirilmesi ve Sınıflandırma Algoritmalarının Karşılaştırılması İçerik Tabanlı İstenmeyen SMS Filtreleme için Mobil Uygulama Geliştirilmesi ve Sınıflandırma Algoritmalarının Karşılaştırılması Onur KARASOY Muğla Sıtkı Koçman Üniversitesi Bilgi İşlem Dairesi Başkanlığı

Detaylı