Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi"

Transkript

1 Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi Nurmyrat AMANMADOV Yıldız Teknik Üniversitesi Elektrik-Elektronil Fakültesi Bilgisayar Mühendisliği Bölümü, Telefon: (507) , ÖZET Bu çalışmada Wisconsin Diagnostic Breast Cancer(WDBC) veriseti üzerindeki verilerden, tümor tiplerinden olan iyi huylu(benign) ve kötü huylu(malign) hücrelerin, Weka aracı yardımıyla veri madenciliği sınıflandırma ve kümeleme teknikleri uygulanarak birbirinden ayrılması ve sınıflandırılması amaçlanmıştır. Bununla beraber veri madenciliğinde kullanılan çeşitli algoritma ve teknikler başarı yüzdeleriyle ölçülmüş ve veriseti üzerinde en başarılı olanlar tespit edilip birbiriyle karşılaştırılmıştır. Anahtar Kelimeler: Naive-Bayes, WDBC, Weka, malign, benign, meme kanseri teşhisi, meme kanseri sınıflandırılması, tümor sınıflandırılması, makine öğrenmesi, veri madenciliği, k-fold cross validation, VDM, yapay sinir ağları, karar ağaçları. ABSTRACT In this study, malignant tumor cells which has bad attitude that causes cancer and benign tumor cells which have no those properties are seperated and classified with the help of Weka tool on the dataset of Wisconsin Diagnostic Breast Cancer(WDBC), using various data mining and machine learning classification and clustering techniques. The success percentage of several algorithms and techniques used in data mining are tested on this dataset and those with the highest success rate are also identified as the main purpose of the study. Keywords: Naive-Bayes, WDBC, Weka, malign, benign, breast cancer diagnosis, breast cancer classification, tumor classification, machine learning, data mining, SVM, Decision tree, k-fold cross validation, artificial neural network. 1. GİRİŞ Son yıllarda ölçüm cihazlarının artmasına paralel olarak veri sayısı ve türleri artmaktadır. Veri toplama araçları ve veri tabanı teknolojilerindeki gelişmeler, bilgi depolarında çok miktarda bilginin depolanmasını ve çözümlenmesini gerektirmektedir. Birçok kaynaktan elde edilen veriler içerisinde saklı bulunan bilgiyi bulma işlemine veri madenciliği denilmektedir (Kudyba, 2004). Bu işlemleri yapmak için açık kaynak kodlu ve ticari amaçlı birçok program kullanılmaktadır (Dener vd., 2009). Açık kaynak kodlu programlar arasında WEKA, ARTool, RapidMiner, C4.5, Orange, KNIME ve R, ticari programlar arasında ise SPSS Clementine, SPSS, SAS, Angoss, KXEN, SQL Server ve MATLAB sayılabilir (Danacı vd., 2010). Literatürde açık kaynak kodlu veri madenciliği programı olan WEKA ile yapılmış birçok çalışma bulunmaktadır. Meme kanseri hücrelerinin teşhis ve tahmini (Danacı vd., 2010), göğüs kanserinin teşhis ve tahmini (Coşkun ve Baykal, 2011), Parkinson hastalığının teşhisi ve tahmini (Özçift, 2011) gibi çalışmalar bulunmaktadır. Sadece IEEE Xplore ve ScienceDirect veri tabanlarında WEKA anahtar kelimesiyle yapılan aramalarda, ilki için 144 akademik çalışma ve diğeri için 1415 makale, 88 kitap ve 6 tane referans çalışması bulunmaktadır. 1 Bu çalışmada hedeflenen amaç, WEKA yı kullanarak akciğer kanserinden sonra, dünyada görülme sıklığı en yüksek olan meme kanserinin 1 bu hastalık teşhisi konan kişilerden elde edilen veriler üzerinde çeşitli veri madenciliği ve makine öğrenmesi teknikleri uygulanarak teşhis edilmesidir. 2. GÖĞÜS KANSERİ Vücudumuzdaki sağlıklı hücreler bölünebilme yeteneğine sahiptirler. Yaşamın ilk yıllarında hücreler daha hızlı bölünürken, erişkin yaşlarda bu hız yavaşlar. Fakat hücrelerin bu yetenekleri sınırlıdır, sonsuz bölünemezler. Her hücrenin hayatı boyunca belli bir bölünebilme sayısı vardır. Sağlıklı 1

2 bir hücre ne kadar bölüneceğini bilir ve gerektiğinde ölmesini de bilir. Normalde vücudun sağlıklı ve düzgün çalışması için hücrelerin büyümesi, bölünmesi ve daha çok hücre üretmesine gereksinim vardır. Bazen buna rağmen süreç doğru yoldan sapar, yeni hücrelere gerek olmadan hücreler bölünmeye devam eder. Bilincini kaybetmiş kanser hücreleri, kontrolsüz bölünmeye başlar ve çoğalırlar. Fazla hücrelerin kütleleri bir büyüklük veya tümör oluştururlar. Kanser hücreleri birikerek tümörleri oluştururlar. Tümörler iyi huylu veya kötü huylu olabilirler. İyi huylu tümörler kanser değildir. Bunlar sıklıkla alınırlar ve çoğu zaman tekrarlamazlar. İyi huylu tümörlerdeki hücreler vücudun diğer taraflarına yayılmazlar. En önemlisi iyi huylu tümörler nadiren hayatı tehdit ederler. Kötü huylu tümörler kanserdir. Kötü huylu tümörlerdeki hücreler anormaldirler ve kontrolsüz ve düzensiz bölünürler. Bu tümörler normal dokuları sıkıştırabilirler, içine sızabilirler ya da tahrip edebilirler. Eğer kanser hücreleri oluştukları tümörden ayrılırsa, kan ya da lenf dolaşımı aracılığı ile vücudun diğer bölgelerine gidebilirler. Gittikleri yerlerde tümör kolonileri oluşturur ve büyümeye devam ederler. Kanserin bu şekilde vücudun diğer bölgelerine yayılması olayına metastaz adı verilir. 2 Bir tümörün iyi huylu yada kötü huylu olduğu patolojik tetkiki sonucu anlaşılır. İyi huylu tümörler cerrahi olarak alınabilirler ve tekrar ortaya çıkmazlar. En önemlisi, yukarıda da bahsettiğimiz gibi, iyi huylu tümör hücreleri diğer dokuları istila etmez ve vücudun başka yerlerine doğru yayılmazlar. Yani bu tümörler yaşamı tehdit etmezler. Malign tümörler kanserdirler. Kanser hücreleri de kontrol dışı büyür ve bölünürler. Ancak iyi huylu tümörlerden çok daha hızlı çoğalıp büyürler. Yakınındaki doku ve organlarıda istila edip harap ederler. Ayrıca, kanser hücreleri malign tümörden kopup kan dolaşımına veya lenfatik dolaşıma dökülebilir. Meme kanserinde ve vücudun başka yerlerinde tümör hücreleri bu şekilde gelişir. Meme kanseri meme hücrelerinde başlayan kanser türüdür. Akciğer kanserinden sonra, dünyada görülme sıklığı en yüksek olan kanser türüdür. Her 8 kadından birinin hayatının belirli bir zamanında meme kanserine yakalanacağı bildirilmektedir. Erkeklerde de görülmekle beraber, kadın vakaları erkek vakalarından 100 kat fazladır. 1970'lerden bu yana meme kanserinin görülme sıklığında artış yaşanmaktadır ve bu artışa modern, Batılı yaşam tarzı sebep olarak gösterilmektedir. Kuzey Amerika ve Avrupa ülkelerinde görülme sıklığı, dünyanın diğer bölgelerinde görülme sıklığından daha fazladır. Meme kanseri, yayılmadan önce, erken tespit edilirse,hasta %96 yaşam şansına sahiptir. Her yıl 44000'de bir kadın meme kanserinden ölmektedir. Meme kanserine karşı en iyi koruyucu yöntem erken teşhistir. Memedeki kitlenin iyi huylu (benign) veya kötü huylu (malign) olduğunu kesin anlamanın tek bir yolu vardır. Biopsi ile mikroskopik tetkik sonucu tanı koymak. Ama bazı özellikler varki, o kitlenin daha çok neye benzediği konusunda muayene eden hekime ortalama bir fikir verebilir DENEYSEL ÇALIŞMA Bilgisayar teknolojilerindeki ilerleme ve biyoenformatik gibi bilgisayar bilimleri alanının bilgi teknolojilerindeki gelişmeleri tıp dünyasına taşımasıyla birtakım tekniklerin tıbbi çalışmalara uygulamasına verilebilecek en iyi örneklerden birisi de kanser ve çeşitli hastalıkların teşhisidir. Bu konudaki çalışmalar doğrultusunda biz de projemizde veri madenciliği yöntemleriyle meme hücrelerindeki veriler üzerinde çalışarak meme kanserini belirlemeye çalıştık. Bu noktada veriseti olarak University of Wisconsin ve Madison Clinical Sciences Center işbirliğiyle oluşturulan Wisconsin Diagnostic Breast Cancer(WDBC) verisetini ve sınıflandırma ve kümeleme aracı olarak da University of Waikado tarafından geliştirilen Waikato Environement for Knowledge Analysis (Weka) aracı kullanılmıştır. 3.1 Kullanılan Verisetinin özellikleri Wisconsin Hospital çalışanı olan Dr.William Wolberg tarafından iğne ucu genişliğindeki bir meme kitlesinin biyosiple alınarak görüntülenmesi ve bu görüntülerin University of Wisconsin Bilgisayar Bilimleri bölümü araştırmacılarından William Nick Street tarafından Kasım 1995 tarihinde dijitalleştirilmesiyle verisetimiz elde edilmiştir. Şekil 1 ve Şekil 2 de verisetimizi oluşturan görüntüler aslı bulunmaktadır

3 Şekil 1: İyi huylu bir tümör hücresine ait görüntü Radius: Tüm hücrelerin yarıçapları Texture: İç yüzeylerin gri skaladaki değişimoranlarının ortalaması, standart sapması ve en kötü Şekil 2: Kötü huylu bir tümör hücresine ait görüntü Perimeter: Hücrelerin çevre uzunlukları : Hücrelerin yüzey alanları Smoothness: Komşu hücrelerin yarıçap uzunluklarının ortalaması, standart sapması ve en kötü Compactness: Çevre²/Alan = Yoğunluk Verisetimiz toplam 569 örnekten oluşmaktadır. Örneklerimizi nitelendiren toplam 32 özellik bulunmakta olup bunlardan ilki örneğin ID si ikincisi sınıfı ve geriye kalan 30 u hücrelerle ilgili çeşitli bilgileri barındıran özelliklerdir. Örneklerimizin sınıf etiketi malignant (M) veya benign (B) olabilir. Bunlar daha önce bahsettiğimiz iyi huylu ve kötü huyly tümor hücrelerine karşılık gelen tıbbi terimlerdir. Özelliklere ait eksik değer bulunmamaktadır. Örneklerimizin 357 benign ve 212 malignant olacak şekilde dağılmıştır. Veristemizi üzerinde doğru bir şekilde oluşturulan 10-fold crossvalidation sınıflandırıcısı sayesinde sınıflandırma başarısı %97.5 gibi bir değere çıkmış ve 1995 Kasımına ait peşinsıra gelen 176 hastayı doğru sınıflandırabilmiştir. Tablo 1 de veristemize ait çeşitli özellikler orijinal haliyle birlikte verilmiştir. Özellik Adı Tablo 1: Örneklere Ait Özellikler Açıklama 1 radius mean of distances from center to points on the perimeter 2 texture standard deviation of gray-scale values 3 perimeter Perimeter of the cell 4 area of the cell 5 smoothness local variation in radius lengths 6 compactness Perimeter 2 / area concavity severity of concave portions of the contour 8 Concave points number of concave portions of the contour 9 symmetry Symmetry of the cells 10 Fractl dimension "coastline approximation" - 1 Concavity: Hücre çevresindeki girinti ve çıkıntıların büyüklükleri ortalaması, standart sapması ve en kötü Concave Points: Hücre çevresindeki girinti ve çıkıntı nokta sayısının Symmetry: Hücrelerin elips şekil değişikliği ortalaması, standart sapması ve en kötü Fractal Dimension: İç içe geçmiş düzensiz hücrelerin tüm normal hücrelere oranının ortalaması, standart sapması ve en kötü dir. 3.2 Deneyde Kullanılan teknikler ve sınıflandırıcılar Bu çalışmadaki esas problem bilinmeyen bir doku örneğini verilen kanser kategorilerinden biriyle eşleştirebilmek veya kansersiz doku olduğunu belirleyebilmektir. Literatürde çok kategorili sınıflandırma için birçok makine öğrenme algoritması bulunmaktadır. Biyolojik bilimlerdeki çalışmalarda çok kullanılmaları ve diğer alanlarda da kayıt altına alınmış başarıları göz önünde bulundurularak bu algoritmalardan beş tanesi seçilerek ilgili veri seti üzerinde sınıflandırma performansları değerlendirilmiştir. Bu algoritmalar; C4.5 Decision Tree (DT), Artifical Neural Networks (ANN), Support Vector Machines

4 (SVM), Naïve Bayes multinomial sınıflandırıcı (NBM), and K-Nearest Neighbors (KNN) şeklindedir. Bu algoritmalar ile ilgili özet bilgi ve karşılaştırma sonuçlarına Caruana ve Niculescu- Mizil yayınından ulaşılabilir. Daha detaylı anlatımlar için ise Bishop yayını önemli bir kaynaktır Bayes Sınıflandırıcı Bir sınıflandırma probleminde tüm özniteliklerin sınıflandırmadaki katkısının eşit ve birbirinden bağımsız olduğu varsayımıyla koşullu olasılık temeline dayanan Naive Bayes adı verilen basit bir sınıflandırma şekli ortaya çıkmıştır. Buna göre her bağımsız özniteliğin sonuca katkısının analizi ile bir koşullu olasılık belirlenir. Farklı özniteliklerin, sonuç üzerindeki etkilerinin birleşimi ile sınıflandırma işlemi gerçekleştirilir. Bu metoda naive yani saf denmesinin sebebi farklı özniteliklerin birbirinden bağımsız olduğu varsayımıdır. Verilen bir veri xi ile ilişkili ti kaydının Cj sınıfında bulunma olasılığı P(Cj xi) şeklinde gösterilir. Eğitim verisi P(xi), P(xi Cj) ve P(Cj) olasılıklarının hesaplanmasında kullanılabilir. Bu değerlerden ise Bayes teoremi sayesinde önce P(Cj xi) ve daha sonra da P(Cj ti) sonsal olasılıkları hesaplanır. Bir kaydın sınıflandırılmasında eğitim veri setinden hesaplanmış koşullu olasılıklar ve önsel olasılıklar kullanılmaktadır. Bu sayede bu kayda ait farklı öznitelik değerlerinin etkisinin birleşimi hesaplanabilir. Naive Bayes algoritmasının birçok avantajı bulunur. Öncelikle kullanımı çok kolaydır. İkinci olarak ise diğer sınıflandırma algoritmalarının büyük çoğunluğunun aksine eğitim verisinin sadece bir kez taranması yeterlidir. Ayrıca kayıp (boş) değerler de olasılık hesaplarında yok sayılarak kolaylıkla ele alınabilmektedir. Basit ilişkilerin bulunduğu durumlarda çoğunlukla çok iyi sonuç veren bir tekniktir. Basit kullanımına karşın Naive Bayes bazı durumlarda tatmin edici sonuçlar vermeyebilir. Öncelikle öznitelikler bağımsız olmayabilir. Bu durumda öznitelik alt kümeleri kullanılabilir. İkinci olarak ise bu teknik, sürekli değerleri ele alamaz. Bu durumda da sürekli değerleri aralıklara bölmek gerekir. Bu tip sorunlarının yanı sıra ilişkili çözümleri olsa da bu çözümlerin uygulanması kolay olmamakla beraber bu çözümleri uygulama şekli de sonuçları ciddi ölçüde etkiler. 2 Aşağıda verisetimize en çok kullanılan k-fold cross validation olan 10 seçili halde Naive-Bayes tekniği uygulanarak oluşturulan sınıflandırma çalışması verileri gösterilmiştir. Buna göre tekniğin başarı oranı ve karmaşıklık matrisi şu şekilde çıkmıştır: Tablo 2: Naive Bayes Tekniğine Ait Veriler Correctly ified Instances % Incorrectly ified Instances % Kappa statistic Mean absolute error Root mean squared error Relative absolute error % Root relative squared error % Total Number of Instances 569 Burada bizim için en çok anlam ifade eden değerler ilk iki değerdir. Yani sınıflandırıcının doğru sınıflandırdığı ve yanlış sınıflandırdığı örneklerin sayıları ve bunların yüzdeleri.tablo 2 de görüldüğü üzere bu yönteme ait başarı yüzdesi 92.97% olup toplam 569 örnekten 529 adedi doğru sınıflandırılmıştır. Bununla beraber karmaşıklık matrisi de sistemin başarısının ölçülmesi açısından çok önemli bilgiler içermektedir. Aşağıda Naive- Bayes tekniğininin bu veriseti üzerinde oluşturduğu karmaşıklık matrisi verilmiştir: Tablo 3: Naive Bayes Tekniğine Ait Aynı şekilde,, gibi anlamlı bilgiler de şu şekilde oluşmuştur: Tablo 4: Naive Bayes Tekniğine Ait M B W.Avg Uygulanan yöntemin başarı yüzdesi her zaman o yöntem hakkında kesin bilgi vermez. Başarı yüzdesinin yanında doğruluk oranı ( rate) ve yanlış sınıflandırma oranı ( ) gibi ölçümler de sistemin başarısı açısından çok önemli bilgiler arz etmektedirler. Çünkü kanser teşhisi çok ciddi durumların söz konusu olduğu işlemlerde bu sayısal değerlerin anlamı çok büyüktür.

5 3.2.2 Yapay sinir ağları tabanlı sınıflandırıcılar Yapay sinir ağları sınıflandırıcı olarak kullanıldıklarında verilen bir örneğin mevcut sınıflarda olma olasılıklarını çıktı olarak verecek şekilde bir model oluşturulur. Bu model uygulandığında sonuç olarak en yüksek veren çıkış, sonuç sınıfı olarak kabul edilir. Eğitim aşamasında ise her veri yapay sinir ağı içerisine verildiğinde çıkan sonuç ile beklenen sonucun karşılaştırılmasına dayanarak ağ içerisindeki ağırlık değerleri değişir. Yapay sinir ağı ile sınıflandırma problemi aşağıdaki adımlardan oluşur: 1.Girdi için kullanılacak öznitelikler ve çıktı sayılarının belirlenmesi. 2.Gizli katman sayılarının ve gizli katmanlardaki gizli düğüm sayılarının ilgili problem alanına bağlı olarak belirlenmesi. 3.Ağda kullanılacak ağırlıkların ve fonksiyonların belirlenmesi. 4.Eğitim veri setinin belirlenmesi. Gereğinden fazla eğitim verisi overfitting, az sayıda eğitim verisi ise underfitting problemine yol açabilir. 5.Öğrenme tekniğinin belirlenmesi. Bu teknik ağırlıkların nasıl düzenleneceğini belirler. Çoğunlukla geri yayılım (backpropagation) formunda bir yaklaşım izlenir. 6.Durma koşulunun belirlenmesi. Tüm eğitim verisi ağ üzerinde değerlendirildiğinde veya istenilen bir hata oranı ya da belirlenen bir zaman kriterine ulaşıldığında öğrenme işlemi sonlandırılabilir. 7.Durma koşulu sağlanana kadar her eğitim verisinin ağda değerlendirilmesi ile bulunan sonucun istenilen sonuç ile karşılaştırılması. Eğer sonuç istenen şekildeyse benzer bir veri geldiğinde de aynı sonucun verilme olasılığını arttıracak şekilde ağırlıkların düzenlenmesi. Sonuç istenenden farklıysa bu sonucun tekrar verilme olasılığını azaltacak ağırlık değişiklikleri yapılması. 8.Test edilecek verilerin eğitilmiş ağda değerlendirilmesi sonucu sınıflandırılmaları. 2 Verisetimiz bu sefer yapay sinir ağlarına ait çok katmanlı perceptron sınıflandırıcısıyla sınıflandırılacak ve çıkan sonuçlar bu yönteme göre değerlendirileccektir. Weka aracında bu yöntem MultilayerPerceptron ismi altında bulunmaktadır. Tablo 5: MultilayerPerceptron Tekniğine Ait Tablo 6: MultilayerPerceptron Tekniğine Ait Tablo 7: MultilayerPerceptron Tekniğine Ait M B W.Avg MultilayerPerceptron tekniği Naive Bayes tekniğine nazaran hem benign hücrelerin hem de malignant hücrelerin doğru sınıflandırılmasında daha yüksek sonuçlar elde etmiş ve dolayısıyla Naive Bayes sınıflandırıcısına göre bu verisetinde daha başarılıdır Destek Vektör Makineler(SMO) SVM problem uzayını çeşitli parçalara ayıran hiper düzlemlerle tanımlanan ayrıcalıklı bir sınıflandırıcıdır. Diğer bir deyişle verilen bir eğitim veri seti ile gözetimli öğrenme sonucu ilgili verileri ayıran optimum hiper düzlemleri bulmaya yarayan bir algoritmadır. Optimum hiper düzlemin ne olduğu SVM in ayrıcalığını oluşturan ve sınıflandırma performansını belirleyen temel unsurdur. 2 Weka aracında bu yöntem SMO tekniği diye geçmektedir. Bu tekniğin oluşturduğu çıkış bilgileri de şu şekildedir. Tablo 8: SVM Tekniğine Ait Correctly ified Instances % Incorrectly ified Instances % Tablo 9: SVM Tekniğine Ait Correctly ified Instances % Incorrectly ified Instances %

6 0.948 Tablo 10: SVM Tekniğine Ait M B W.Avg Burada dikkat çeken husus şudur ki tekniğin doğru sınıflandırdığı örnek sayısı malignanat hücreler için Bir önceki MultilayerPerceptron tekniğiyle aynı ama benign hücreleri sınıflandırma başarısı MultilayerPerceptron tekniğinden daha başarılıdır. Dolayısıyla doğru sınıflandırdığı örneklerin sayısı ve yüzdesi bir önceki yöntemden daha başarılıdır Karar ağacı sınıflandırıcı (J48) Karar ağaçları yaklaşımı ile sınıflandırmanın temeli arama uzayını dikdörtgensel bölgelere ayırmaktır. lendirilecek kayıt içinde bulunduğu bölgeye göre sınıflandırılacaktır. Farklı bazı yaklaşımlar olsa da bir karar ağacı aşağıdaki gibi tanımlanabilir: D={t 1,..,t n } şeklinde verilen bir veri setinde, kayıt t i =<ti 1,, t ih > olsun ve kayıtlar {A 1,., A h } özniteliklerinden oluşsun. İlgili kayıtlara ait sınıflar da C = {C 1,., C m } şeklinde olsun. Bu durumda D ile ilişkili bir karar ağacı şu özelliklere sahip olmalıdır: Kök düğüm ve her ara düğüm bir özniteliği ile tanımlanmalı, Her dal kendi başlangıç noktasındaki özniteliğe ait bir değer veya değer aralığını temsil etmeli, Her yaprak düğümü bir Cj sınıfı şeklinde gösterilmelidir. Bu durumda kök düğümden başlayarak bir yaprak düğüme kadar giden her farklı yol VE işlemlerinden oluşan bir kuralı tanımlamış olur. Bu kurallar herhangi bir veriye uygulandığında kurallardan sadece ve mutlaka bir tanesi başarılı bir şekilde sonlanır. Bu kuralı oluşturan yoldaki yaprak düğüm sınıflandırma sonucudur. Kök ve ara düğümlerde kullanılacak özniteliklerin bulunması ve bu özniteliklere ait hangi değer aralıklarının kullanılacağı gibi karar ağaçlarında belirlenmesi gereken önemli noktalar bulunmaktadır. Karar ağaçlarında genel prensip eğitim verisini sırayla en iyi şekilde farklı sınıflara bölen öznitelikleri ve bu özniteliklerin veri setine uygulanacakları düğümlerdeki değer aralıklarını bulmaktır. Seçilen bu özniteliklere ayırıcı öznitelikler denilebilir. Karar ağaçları Weka aracında birsürü farklı yöntemle beraber bulunmaktadır. Bunlardan en çok kullanılanları ID3 algoritması ve J48 tekniğidir. Bizim verisetimiz için ID3 algoritması Weka da kapalı durumdadır. Dolayısıyla J48 tekniğini uyguluyoruz ve sonuçları aşağıdaki buluyoruz. Tablo 11: J48 Tekniğine Ait Correctly ified Instances % Incorrectly ified Instances % Tablo 12: J48 Tekniğine Ait Tablo 13: J48 Tekniğine Ait M B W.Avg Sonuçlardan da görüldüğü gibi J48 tekniği Naive- Bayes sınıflandırıcısı hariç diğer tüm yöntemlere kıyasla daha başarısız bir yöntemdir K-En Yakın Komşu (IBK) K En Yakın Komşu yöntemi, sınıflandırma problemini çözen denetimli öğrenme yöntemleri arasında yer alır. Yöntemde sınıflandırma yapılacak verilerin öğrenme kümesindeki normal davranış verilerine benzerlikleri hesaplanarak; en yakın olduğu düşünülen k verinin ortalamasıyla, belirlenen eşik değere göre sınıflara atamaları yapılır. Önemli olan, her bir sınıfın özelliklerinin önceden net bir şekilde belirlenmiş olmasıdır. Yöntemin performansını k en yakın komşu saysı, eşik değer, benzerlik ölçümü ve öğrenme kümesindeki normal davranışların yeterli sayıda olması kriterleri etkilemektedir. Weka üzerinde K En yakın komşu yöntemi Ibk ismi altında bulunmaktadır. IBk yöntemiyle sınıflandırma sonucu aşağıdaki gibi bulunmuştur. Tablo 14: IBk Tekniğine Ait Correctly ified Instances % Incorrectly ified Instances %

7 Tablo 15: IBk Tekniğine Ait Tablo 18: K-Means Tekniğine Ait Tablo 16: IBk Tekniğine Ait M B W.Avg Deneyde Kullanılan Kümeleme yöntemleri Kümeleme bir veri kümesindeki bilgileri belirli yakınlık kriterlerine göre gruplara ayırma işlemidir. Bu grupların her birine küme adı verilir. Kümeleme analizine kısaca kümeleme adı verilir. Kümeleme işleminde küme içindeki elemanların benzerliği fazla, kümeler arası benzerlik ise az olmalıdır. Kümeleme veri madenciliği tekniklerinden tanımlayıcı modellere yani gözetimsiz sınıflandırmaya girer. Gözetimsiz sınıflamada amaç, başlangıçta verilen ve henüz sınıflandırılmamış bir küme, veriyi anlamlı alt kümeler oluşturacak şekilde öbeklemektir. Verisetimizde 2 tür kümeleme yöntemi uygulanmıştır. Bunlar K-Means ve Hiyerarşik Kümeleme yöntemleridir Hiyerarşik Kümeleme Hiyerarşik kümeleme yönteminde özellikle işleyişin daha kolay anlaşılabilmesi için dendogram (ağaç grafiği)dan yararlanılır. Hiyerarşik kümeleme yönteminde anlatılan işlemlere dayalı olarak kullanılan hiyerarşik metotlardan en çok kullanılanları; Tek bağlantılı, Tam bağlantılı, Ortalama bağlantı, Merkezi ve Ward metotlarıdır. Hiyerarşik olmayan kümeleme yöntemi ise küme sayısı hakkında bir ön bilginin olması ya da araştırmacının anlamlı olacak küme sayısına karar vermiş olması durumunda tercih edilmektedir. Bu yöntemin sonuçları aşağıda verilmiştir. Tablo 19: Hiyerarşik kümeleme Tekniğine Ait Correctly ified Instances % Incorrectly ified Instances % Tablo 18: Hiyerarşik kümeleme Tekniğine Ait K-Means Kümeleme Hiyerarşik olmayan kümeleme yönteminde en çok tercih edilen iki yöntem Mac Queen tarafından geliştirilen k-ortalama tekniği ve en çok olabilirlik tekniğidir. Bu çalışmada ise hiyerarşik olmayan kümeleme algoritmaları üzerine bir uygulama geliştirilmiştir. Bu yönteme ait sonuçlar aşağıda verilmiştir. Tablo 17: K-Means Tekniğine Ait Correctly ified Instances % Incorrectly ified Instances % SONUÇ Sonuç olarak verisetimiz üzerinde en çok kullanılan 5 sınıflandırıcı tekniği olan Naive Bayes, Karar Destek Makineleri (SVM), Çok Katmanlı Perceptron (MLP) ve Karar ağacı yöntemlerinden J48 ve K En Yakın Komşu(IBk) uygulanmış ve en çok başarı yüzdesi 97.7 %-lik yüzdesiyle Karar Destek Makineleri yöntemine ait çıkmıştır. Bu yöntemi sırasıyla MultilayerPerceptron, IBk, J48 Karar Ağacı ve Naive Bayes takip etmiştir. Bu sonuçlardan anlıyoruz ki verisetimizi sınıflandırıken SVM tekniği kullanmamız tümor hücrelerini doğru sınıflandırmada daha başarılı sonuçlar elde edecektir.

8 Aşağıda bu yöntemlere ait yüzdelerin ve doğruluk oranlarının grafiksel olarak gösterimi verilmiştir. Tablo 17: Sınıflandırıcıların Karşılaştırılması Referanslar: 1. WEKA YAZILIMINDA k-ortalama ALGORİTMASI KULLANILARAK KONJESTİF KALP YETMEZLİĞİ HASTALARININ TEŞHİSİ, Yalçın İşler, Ali Narin, Zonguldak Karaelmas Üniversitesi, Elektrik ve Elektronik Mühendisliği Bölümü. 2. KANSER SINIFLANDIRMADA mikrorna VE mrna ANLATIM BİLGİLERİNİN ENTEGRASYONU Onur Altındağ, Yüksek Lisans Tezi, BREAST CANCER DİAGNOSİS ON THREE DİFFERENT DATASETS USİNG MULTİ-CLASSİFİERS, Gouda I. Salama, M.B.Abdelhalim, Magdy Abd-elghany Zeid, Arab Academy for Science Technology & Maritime Transport, Cairo, Egypt 4. VERİ MADENCİLİĞİ YÖNTEMLERİ KULLANILARAK MEME KANSERİ HÜCRELERİNİN TAHMİN VE TEŞHİSİ, Mustafa Danacı, Mete Çelik, A. Erhan Akkaya, Erciyes Üniversitesi Bilgisayar Mühendisliği Bölümü

Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov

Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi Hazırlayan: Nury Amanmadov Göğüs Kanseri Nedir? Gögüs Kanseri göğüs hücrelerinde başlayan

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Electronic Letters on Science & Engineering 3 (2) (2007) Available online at www.e-lse.org

Electronic Letters on Science & Engineering 3 (2) (2007) Available online at www.e-lse.org Electronic Letters on Science & Engineering 3 (2) (2007) Available online at www.e-lse.org Determination Of Breast Cancer Using ANN Armağan Ebru Temiz 1 1 Sakarya Üniversity Elektronic-Computer Education

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması 1 Emre DANDIL Bilecik Ş. Edebali Üniversitesi emre.dandil@bilecik.edu.tr +90228 214 1613 Sunum İçeriği Özet Giriş

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi

Detaylı

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama

Detaylı

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş

Detaylı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı Hatice NİZAM İstanbul Üniversitesi Bilgisayar Mühendisliği Bölümü haticenizam@outlook.com Saliha Sıla AKIN ERS Turizm Yazılım Şirketi, Bilgisayar

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu

Detaylı

Veri ve Metin Madenciliği. Zehra

Veri ve Metin Madenciliği. Zehra Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Akış Makine Öğrenmesi nedir? Günlük Hayatımızdaki Uygulamaları Verilerin Sayısallaştırılması Özellik Belirleme Özellik Seçim Metotları Bilgi Kazancı (Informaiton Gain-IG) Sinyalin Gürültüye Oranı: (S2N

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir.

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir. ÇELĐK YÜZEYLERĐN SINIFLANDIRILMASI * Cem ÜNSALAN ** Aytül ERÇĐL * Ayşın ERTÜZÜN *Boğaziçi Üniversitesi, Elektrik-Elektronik Mühendisliği Bölümü unsalan@boun.edu.tr **Boğaziçi Üniversitesi, Endüstri Mühendisliği

Detaylı

Makine Öğrenmesi 3. hafta

Makine Öğrenmesi 3. hafta Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla

Detaylı

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21 İçindekiler Önsöz İkinci Basım için Önsöz Türkçe Çeviri için Önsöz Gösterim xiii xv xvii xix 1 Giriş 1 1.1 Yapay Öğrenme Nedir?......................... 1 1.2 Yapay Öğrenme Uygulamalarına Örnekler...............

Detaylı

BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ. KANSER SINIFLANDIRMADA mikrorna VE mrna ANLATIM BİLGİLERİNİN ENTEGRASYONU ONUR ALTINDAĞ

BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ. KANSER SINIFLANDIRMADA mikrorna VE mrna ANLATIM BİLGİLERİNİN ENTEGRASYONU ONUR ALTINDAĞ BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ KANSER SINIFLANDIRMADA mikrorna VE mrna ANLATIM BİLGİLERİNİN ENTEGRASYONU ONUR ALTINDAĞ YÜKSEK LİSANS TEZİ 2013 KANSER SINIFLANDIRMADA mikrorna VE mrna ANLATIM

Detaylı

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi

Detaylı

Uzaktan Algılama Uygulamaları

Uzaktan Algılama Uygulamaları Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ

Detaylı

Naive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ

Naive Bayes Yöntemi ile Spam Mail Teşhisi Kübra KURNAZ Naive Bayes Yöntemi ile Spam Mail Teşhisi 2 17574006-Kübra KURNAZ Yıldız Teknik Üniversitesi, Elektrik-Elektronik Fakültesi, Bilgisayar Mühendisliği Bölümü, Tezsiz Yüksek Lisans Bilgi Teknolojileri Özet

Detaylı

Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme

Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme Doç. Dr. Bilge Karaçalı Biyomedikal Veri İşleme Laboratuvarı Elektrik-Elektronik

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme BAYES ÖĞRENMESİ Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ Yapay Zeka-Bayes Öğrenme 1 İÇERİK Bayes Teoremi Bayes Sınıflandırma Örnek Kullanım Alanları Avantajları Dezavantajları Yapay Zeka-Bayes Öğrenme

Detaylı

Bireysel Emeklilik Sisteminde Katılımcı Memnuniyetinin Artırılması. Mert C. Demir, Ph.D. Emeklilik Gözetim Merkezi

Bireysel Emeklilik Sisteminde Katılımcı Memnuniyetinin Artırılması. Mert C. Demir, Ph.D. Emeklilik Gözetim Merkezi Bireysel Emeklilik Sisteminde Katılımcı Memnuniyetinin Artırılması Mert C. Demir, Ph.D. Emeklilik Gözetim Merkezi Anahat Bireysel Emeklilik Sistemi, tanımı Bireysel Emeklilik Sistemi, bugünü Emeklilik

Detaylı

Veri Madenciliği Karar Ağacı Oluşturma

Veri Madenciliği Karar Ağacı Oluşturma C4.5 Algoritması Veri Madenciliği Karar Ağacı Oluşturma Murat TEZGİDER 1 C4.5 Algoritması ID3 algoritmasını geliştiren Quinlan ın geliştirdiği C4.5 karar ağacı oluşturma algoritmasıdır. ID3 algoritmasında

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5

Detaylı

Türkçe Dokümanlar Ġçin Yazar Tanıma

Türkçe Dokümanlar Ġçin Yazar Tanıma Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:

Detaylı

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ Akış Makine Öğrenmesi nedir? Günlük Hayatımızdaki Uygulamaları Verilerin Sayısallaştırılması Özellik Belirleme Özellik Seçim Metotları Bilgi Kazancı (Informaiton Gain-IG) Sinyalin Gürültüye Oranı: (S2N

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Otomatik Doküman Sınıflandırma Rumeysa YILMAZ, Rıfat AŞLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr, kgunel@aduedutr

Detaylı

Veri Madenciliği Süreci

Veri Madenciliği Süreci Veri Madenciliği Eda Coşlu Mehmet Akif Ersoy Üniversitesi, Yönetim Bilişim Sistemleri Bölümü, BURDUR edacoslu@hotmail.com Büyük miktardaki veriler içerisinden önemli olanlarını bulup çıkarmaya Veri Madenciliği

Detaylı

T.C. KIRIKKALE ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ YAPAY SİNİR AĞLARI. Doç.Dr. Necaattin BARIŞÇI FİNAL PROJESİ

T.C. KIRIKKALE ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ YAPAY SİNİR AĞLARI. Doç.Dr. Necaattin BARIŞÇI FİNAL PROJESİ T.C. KIRIKKALE ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ YAPAY SİNİR AĞLARI Doç.Dr. Necaattin BARIŞÇI YAPAY SİNİR AĞLARI İLE KORONER ARTER HASTALIĞI RİSK Öğrenci : SİNEM ÖZDER Numarası : 118229001004

Detaylı

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL VERİ MADENCİLİĞİ Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL SPRINT Algoritması ID3,CART, ve C4.5 gibi algoritmalar önce derinlik ilkesine göre çalışırlar ve en iyi dallara ayırma kriterine

Detaylı

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu Sunan : Esra Nergis Güven İçerik Giriş Amaç ve Kapsam Sınıflandırma Geliştirilen Sistem

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması Akademik Bilişim 14 - XVI. Akademik Bilişim Konferansı Bildirileri Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması Mümine Kaya 1, Selma Ayşe Özel 2 1 Adana Bilim ve Teknoloji Üniversitesi,

Detaylı

Esnek Hesaplamaya Giriş

Esnek Hesaplamaya Giriş Esnek Hesaplamaya Giriş J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Esnek Hesaplama Nedir? Esnek hesaplamanın temelinde yatan

Detaylı

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır. AED 310 İSTATİSTİK YANLILIK Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır. YANLILIK Yanlı bir araştırma tasarımı uygulandığında,

Detaylı

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Bir Veri Seti Üzerinden Karşılaştırılması

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Bir Veri Seti Üzerinden Karşılaştırılması Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Bir Veri Seti Üzerinden Karşılaştırılması Yrd.Doç.Dr.Abdullah BAYKAL Dicle Üniversitesi Fen Fakültesi Matematik Bölümü baykal.abdullah@gmail.com Özet:

Detaylı

CENTROID SINIFLAYICILAR YARDIMIYLA MEME KANSERİ TEŞHİSİ

CENTROID SINIFLAYICILAR YARDIMIYLA MEME KANSERİ TEŞHİSİ Gazi Üniv. Müh. Mim. Fak. Der. Journal of the Faculty of Engineering and Architecture of Gazi University Cilt 31, No 2, 323-330, 2016 Vol 31, No 2, 323-330, 2016 CENTROID SINIFLAYICILAR YARDIMIYLA MEME

Detaylı

Makine Öğrenmesi 2. hafta

Makine Öğrenmesi 2. hafta Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde

Detaylı

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Şekil Tanıma Final Projesi. Selçuk BAŞAK 08501008

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Şekil Tanıma Final Projesi. Selçuk BAŞAK 08501008 Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü Şekil Tanıma Final Projesi Selçuk BAŞAK 08501008 Not: Ödevi hazırlamak için geliştirdiğim uygulama ve kaynak kodları ektedir.

Detaylı

Veri madenciliği yöntemleri

Veri madenciliği yöntemleri Sınıflandırma ve Kümeleme Kavramları Giriş Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemi sınıflandırma olarak adlandırılır, veri madenciliği tekniklerinden en çok bilinenidir; veri tabanlarındaki

Detaylı

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça.

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça. Apriori Algoritması Konu İçeriği Giriş Tarihçesi Apriori Nedir? Örnekler Algoritma Açıklama Weka İle Kullanımı Kaynakça Giriş Veri madenciliğinde kullanılan ve veri kümeleri veya veriler arasındaki ilişkiyi

Detaylı

tree) nedir? Karar Ağacı (Decision Decisiontree

tree) nedir? Karar Ağacı (Decision Decisiontree Karar Ağacı (Decision Decisiontree tree) nedir? Bir işletme yönetimi tarafından tercihlerin, risklerin, kazançların, hedeflerin tanımlanmasında yardımcı olabilen ve birçok önemli yatırım alanlarında uygulanabilen,

Detaylı

Karaciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı. In the Diagnosis of Liver Failure Using Machine Learning Algorithms

Karaciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı. In the Diagnosis of Liver Failure Using Machine Learning Algorithms Karaciğer Yetmezliğinin Teşhisinde Makine Öğrenmesi Algoritmalarının Kullanımı 1 Ekrem Alkuşak ve * 2 Murat Gök 1 Bilgisayar Mühendisliği Bölümü, Yalova Üniversitesi, Yalova, Türkiye 2 Bilgisayar Mühendisliği

Detaylı

(AYIRIM) DENLİ. Emre KUZUGÜDENL. Doç.Dr.Serdar CARUS

(AYIRIM) DENLİ. Emre KUZUGÜDENL. Doç.Dr.Serdar CARUS DİSKRİMİNANT ANALİZİ (AYIRIM) Emre KUZUGÜDENL DENLİ Doç.Dr.Serdar CARUS Bu analiz ile; Bir bireyin hangi gruptan geldiği (p değişkeni kullanarak, bireyi uygun bir gruba atar ) Her bir değişkenin atama

Detaylı

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Akademik Bilişim 12 - XIV Akademik Bilişim Konferansı Bildirileri Otomatik Doküman Sınıflandırma Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr,

Detaylı

Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval

Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval İsmail Haberal Bilgisayar Mühendisliği Bölümü Başkent Üniversitesi ihaberal@baskent.edu.tr Umut

Detaylı

Markov Zinciri Monte Carlo Yaklaşımı. Aktüeryal Uygulamaları

Markov Zinciri Monte Carlo Yaklaşımı. Aktüeryal Uygulamaları Markov Zinciri Monte Carlo Yaklaşımı ve Aktüeryal Uygulamaları ŞİRZAT ÇETİNKAYA Aktüer Sistem Araştırma Geliştirme Bölümü AKTÜERLER DERNEĞİ 2.0.20080 2008 - İSTANBUL Sunum Planı. Giriş 2. Bayesci Metodun

Detaylı

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ Doç.Dr Erhan Akyazı Marmara Üniversitesi Bilişim Bölümü eakyazi@marmara.edu.tr Şafak Kayıkçı Marmara Üniversitesi Bilişim Bölümü safak@safakkayikci.com

Detaylı

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Tek değişken için çizilen

Detaylı

Metin Sınıflandırma. Akış

Metin Sınıflandırma. Akış Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle

Detaylı

CBS ve Coğrafi Hesaplama

CBS ve Coğrafi Hesaplama Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr

Detaylı

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6003

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6003 Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Makina Öğrenmesi ve Akıl Yürütme Dersin Orjinal Adı: Machine Learning and Reasoning Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora)

Detaylı

YAPAY AÇIKLIKLI RADAR GÖRÜNTÜLERİNDE YAPAY SİNİR AĞLARI İLE HEDEF TANIMLAMA

YAPAY AÇIKLIKLI RADAR GÖRÜNTÜLERİNDE YAPAY SİNİR AĞLARI İLE HEDEF TANIMLAMA HAVACILIK VE UZAY TEKNOLOJİLERİ DERGİSİ TEMMUZ 2004 CİLT 1 SAYI 4 (55-60) YAPAY AÇIKLIKLI RADAR GÖRÜNTÜLERİNDE YAPAY SİNİR AĞLARI İLE HEDEF TANIMLAMA Okyay KAYNAK Boğaziçi Üniversitesi Mühendislik Fakültesi

Detaylı

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI Yapay Sinir Ağları (Artificial Neural Networks) J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Yapay Sinir Ağları Tarihçe Biyolojik

Detaylı

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir. 4.SUNUM Genel olarak test istatistikleri Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri olmak üzere 2 grupta incelenebilir. 2 Ranj Çeyrek Kayma Çeyrekler Arası Açıklık Standart Sapma Varyans

Detaylı

BÖLÜM 14 BİLGİSAYAR UYGULAMALARI - 3 (ORTALAMALARIN KARŞILAŞTIRILMASI)

BÖLÜM 14 BİLGİSAYAR UYGULAMALARI - 3 (ORTALAMALARIN KARŞILAŞTIRILMASI) 1 BÖLÜM 14 BİLGİSAYAR UYGULAMALARI - 3 (ORTALAMALARIN KARŞILAŞTIRILMASI) Hipotez testi konusunda görüldüğü üzere temel betimleme, sayma ve sınıflama işlemlerine dayalı yöntemlerin ötesinde normal dağılım

Detaylı

BİYOİSTATİSTİK Örnekleme ve Örnekleme Yöntemleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Örnekleme ve Örnekleme Yöntemleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Örnekleme ve Örnekleme Yöntemleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 Araştırmalarda

Detaylı

YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI ARTIFICIAL NEURAL NETWORKS METHOD FOR MAP DIGITIZATION

YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI ARTIFICIAL NEURAL NETWORKS METHOD FOR MAP DIGITIZATION YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI Y.ŞİŞMAN 1, H. DEMİRTAŞ 2 1 Ondokuz Mayıs Üniversitesi, Harita Mühendisliği Bölümü, 55139, Samsun/TÜRKİYE ysisman@omu.edu.tr 2 Sağlık Bakanlığı,

Detaylı

TÜRKİYE CUMHURİYETİ DEVLETİNİN temellerinin atıldığı Çanakkale zaferinin 100. yılı kutlu olsun.

TÜRKİYE CUMHURİYETİ DEVLETİNİN temellerinin atıldığı Çanakkale zaferinin 100. yılı kutlu olsun. Doç.Dr.Mehmet MISIR-2013 TÜRKİYE CUMHURİYETİ DEVLETİNİN temellerinin atıldığı Çanakkale zaferinin 100. yılı kutlu olsun. Son yıllarda teknolojinin gelişmesi ile birlikte; geniş alanlarda, kısa zaman aralıklarında

Detaylı

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız. .4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin

Detaylı

YAPAY SĠNĠR AĞLARININ EKONOMĠK TAHMĠNLERDE KULLANILMASI

YAPAY SĠNĠR AĞLARININ EKONOMĠK TAHMĠNLERDE KULLANILMASI P A M U K K A L E Ü N İ V E R S İ T E S İ M Ü H E N D İ S L İ K F A K Ü L T E S İ P A M U K K A L E U N I V E R S I T Y E N G I N E E R I N G C O L L E G E M Ü H E N D ĠS L ĠK B ĠL ĠM L E R ĠD E R G ĠS

Detaylı

Görüntü Sınıflandırma

Görüntü Sınıflandırma Görüntü Sınıflandırma Chapter 12 https://www.google.com.tr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0 CBwQFjAA&url=http%3A%2F%2Ffaculty.une.edu%2Fcas%2Fszeeman%2Frs%2Flect%2FCh%2 52012%2520Image%2520Classification.ppt&ei=0IA7Vd36GYX4Uu2UhNgP&usg=AFQjCNE2wG

Detaylı

MEH535 Örüntü Tanıma. Karar Teorisi

MEH535 Örüntü Tanıma. Karar Teorisi MEH535 Örüntü Tanıma 2. Karar Teorisi Doç.Dr. M. Kemal GÜLLÜ Elektronik ve Haberleşme Mühendisliği Bölümü web: http://akademikpersonel.kocaeli.edu.tr/kemalg/ E-posta: kemalg@kocaeli.edu.tr Karar Teorisi

Detaylı

KNN, NN, BAYES, DT ve SVM Kullanılarak EKG Vurularının Sınıflandırılması

KNN, NN, BAYES, DT ve SVM Kullanılarak EKG Vurularının Sınıflandırılması KNN, NN, BAYES, DT ve SVM Kullanılarak EKG Vurularının Sınıflandırılması * 1 Yasin Kaya ve 2 Hüseyin Pehlivan * 1 Karadeniz Teknik Üniversitesi, Enformatik Bölümü, Trabzon, Türkiye 2 Karadeniz Teknik Üniversitesi,

Detaylı

ESTIMATION OF EFFLUENT PARAMETERS AND EFFICIENCY FOR ADAPAZARI URBAN WASTEWATER TREATMENT PLANT BY ARTIFICIAL NEURAL NETWORK

ESTIMATION OF EFFLUENT PARAMETERS AND EFFICIENCY FOR ADAPAZARI URBAN WASTEWATER TREATMENT PLANT BY ARTIFICIAL NEURAL NETWORK ESTIMATION OF EFFLUENT PARAMETERS AND EFFICIENCY FOR ADAPAZARI URBAN WASTEWATER TREATMENT PLANT BY ARTIFICIAL NEURAL NETWORK ADAPAZARI KENTSEL ATIKSU ARITMA TESĐSĐ ÇIKIŞ SUYU PARAMETRELERĐ VE VERĐM DEĞERLERĐNĐN

Detaylı

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

Bilgi Güvenliği Risk Değerlendirme Yaklaşımları www.sisbel.biz

Bilgi Güvenliği Risk Değerlendirme Yaklaşımları www.sisbel.biz ISO/IEC 20000-1 BİLGİ TEKNOLOJİSİ - HİZMET YÖNETİMİ BAŞ DENETÇİ EĞİTİMİ Bilgi Güvenliği Risk Değerlendirme Yaklaşımları E1-yüksek seviye bilgi güvenliği risk değerlendirmesi Yüksek seviye değerlendirme,

Detaylı

Okut. Yüksel YURTAY. İletişim : (264) Sayısal Analiz. Giriş.

Okut. Yüksel YURTAY. İletişim :  (264) Sayısal Analiz. Giriş. Okut. Yüksel YURTAY İletişim : Sayısal Analiz yyurtay@sakarya.edu.tr www.cs.sakarya.edu.tr/yyurtay (264) 295 58 99 Giriş 1 Amaç : Mühendislik problemlerinin bilgisayar ortamında çözümünü mümkün kılacak

Detaylı

MARMARA ÜNİVERSİTESİ TEKNOLOJİ FAKÜLTESİ MEKATRONİK MÜHENDİSLİĞİ BÖLÜMÜ ESNEK İMALAT SİSTEMLERİ DERS NOTLARI 2 Arş. Gör.

MARMARA ÜNİVERSİTESİ TEKNOLOJİ FAKÜLTESİ MEKATRONİK MÜHENDİSLİĞİ BÖLÜMÜ ESNEK İMALAT SİSTEMLERİ DERS NOTLARI 2 Arş. Gör. Bir üretim hattında genel anlamda şu görevler (task) yürütülür: İş parçaları depo alanlarından alınarak işleme makine araçlarına gönderilir. Robotlar konveyör hattından iş parçalarını alarak istasyonda

Detaylı

Fonksiyon Optimizasyonunda Genetik Algoritmalar

Fonksiyon Optimizasyonunda Genetik Algoritmalar 01-12-06 Ümit Akıncı Fonksiyon Optimizasyonunda Genetik Algoritmalar 1 Fonksiyon Optimizasyonu Fonksiyon optimizasyonu fizikte karşımıza sık çıkan bir problemdir. Örneğin incelenen sistemin kararlı durumu

Detaylı

VERI TABANLARıNDA BILGI KEŞFI

VERI TABANLARıNDA BILGI KEŞFI 1 VERİ MADENCİLİĞİ VERI TABANLARıNDA BILGI KEŞFI Veri Tabanlarında Bilgi Keşfi, veriden faydalı bilginin keşfedilmesi sürecinin tamamına atıfta bulunmakta ve veri madenciliği bu sürecin bir adımına karşılık

Detaylı

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması

Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Maltepe Üniversitesi, Yazılım Mühendisliği Bölümü, İstanbul zeynepguven@maltepe.edu.tr, turgaybilgin@maltepe.edu.tr Özet: Zaman serileri

Detaylı

COĞRAFİ BİLGİ SİSTEMLERİ 3D&Spatial Analyst ve ModelBuilder Eğitimi

COĞRAFİ BİLGİ SİSTEMLERİ 3D&Spatial Analyst ve ModelBuilder Eğitimi COĞRAFİ BİLGİ SİSTEMLERİ 3D&Spatial Analyst ve ModelBuilder Eğitimi http://facebook.com/esriturkey https://twitter.com/esriturkiye egitim@esriturkey.com.tr Kursun Süresi: 5 Gün 40 Saat COĞRAFİ BİLGİ SİSTEMLERİ

Detaylı

SAYISAL ÇÖZÜMLEME. Yrd.Doç.Dr.Esra Tunç Görmüş. 1.Hafta

SAYISAL ÇÖZÜMLEME. Yrd.Doç.Dr.Esra Tunç Görmüş. 1.Hafta SAYISAL ÇÖZÜMLEME Yrd.Doç.Dr.Esra Tunç Görmüş 1.Hafta Sayısal çözümleme nümerik analiz nümerik çözümleme, approximate computation mühendislikte sayısal yöntemler Computational mathematics Numerical analysis

Detaylı

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ - 150110046 İÇERİK Uygulama ve uygulamaya ilişkin temel kavramların tanıtımı Uygulamanın yapısı Ön yüz Veritabanı Web Servisler K-Means Algoritması ile kategori

Detaylı

Copyright 2004 Pearson Education, Inc. Slide 1

Copyright 2004 Pearson Education, Inc. Slide 1 Slide 1 Bölüm 2 Verileri Betimleme, Keşfetme, ve Karşılaştırma 2-1 Genel Bakış 2-2 Sıklık Dağılımları 2-3 Verilerin Görselleştirilmesi 2-4 Merkezi Eğilim Ölçüleri 2-5 Değişimin Ölçülmesi 2-6 Nispi Sabitlerin

Detaylı

İstatistik ve Olasılığa Giriş. İstatistik ve Olasılığa Giriş. Ders 3 Verileri Sayısal Ölçütlerle İfade Etme. Verileri Sayısal Ölçütlerle İfade Etme

İstatistik ve Olasılığa Giriş. İstatistik ve Olasılığa Giriş. Ders 3 Verileri Sayısal Ölçütlerle İfade Etme. Verileri Sayısal Ölçütlerle İfade Etme İstatistik ve Olasılığa Giriş Robert J. Beaver Barbara M. Beaver William Mendenhall Presentation designed and written by: Barbara M. Beaver İstatistik ve Olasılığa Giriş Ders 3 Verileri Sayısal Ölçütlerle

Detaylı

Over Kanseri Taraması ve İngiliz Grubu Over Kanseri Tarama Çalışması

Over Kanseri Taraması ve İngiliz Grubu Over Kanseri Tarama Çalışması Over Kanseri Taraması ve İngiliz Grubu Over Kanseri Tarama Çalışması Ovarian cancer screening and mortality in the UK Collaborative Trial of Ovarian Cancer Screening (UKCTOCS): a randomised controlled

Detaylı

İçerik. Giriş 1/23/13. Giriş Problem Tanımı Tez Çalışmasının Amacı Metodoloji Zaman Çizelgesi. Doktora Tez Önerisi

İçerik. Giriş 1/23/13. Giriş Problem Tanımı Tez Çalışmasının Amacı Metodoloji Zaman Çizelgesi. Doktora Tez Önerisi İsmail ÇÖLKESEN 501102602 Doktora Tez Önerisi Tez Danışmanı : Prof.Dr. Tahsin YOMRALIOĞLU İTÜ Geoma*k Mühendisliği İçerik Giriş Tez Çalışmasının Amacı Zaman Çizelgesi 1 of 25 Giriş Yeryüzü ile ilgili yapılan

Detaylı

Bulanık Mantık Tabanlı Uçak Modeli Tespiti

Bulanık Mantık Tabanlı Uçak Modeli Tespiti Bulanık Mantık Tabanlı Uçak Modeli Tespiti Hüseyin Fidan, Vildan Çınarlı, Muhammed Uysal, Kadriye Filiz Balbal, Ali Özdemir 1, Ayşegül Alaybeyoğlu 2 1 Celal Bayar Üniversitesi, Matematik Bölümü, Manisa

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Rastgele Değişkenlerin Dağılımları I Prof. Dr. İrfan KAYMAZ Ders konusu Bu derste; Rastgele değişkenlerin tanımı ve sınıflandırılması Olasılık kütle fonksiyonu Olasılık yoğunluk

Detaylı

Görüntü Segmentasyonu (Bölütleme)

Görüntü Segmentasyonu (Bölütleme) Görüntü Segmentasyonu (Bölütleme) Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. 20 Aralık 2014 Cumartesi 1 Görüntü Segmentasyonu 20 Aralık 2014 Cumartesi 2 Gestalt kanunları Görüntü

Detaylı

Kanserin sebebi, belirtileri, tedavi ve korunma yöntemleri...

Kanserin sebebi, belirtileri, tedavi ve korunma yöntemleri... Kanser Nedir? Kanserin sebebi, belirtileri, tedavi ve korunma yöntemleri... Kanser, günümüzün en önemli sağlık sorunlarından birisi. Sık görülmesi ve öldürücülüğünün yüksek olması nedeniyle de bir halk

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Makine Öğrenmesi Erhan AKDOĞAN, Ph.D. Bu ders notunun hazırlanmasında Dr. U.Orhan ve Banu Diri nin ders notlarından yararlanılmıştır. Makine öğrenmesi

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Yapay Sinir Ağları (Artificial Neural Network) Doç.Dr. M. Ali Akcayol Yapay Sinir Ağları Biyolojik sinir sisteminden esinlenerek ortaya çıkmıştır. İnsan beyninin öğrenme, eski

Detaylı

KANITA DAYALI LABORATUVAR TIBBI İLE İLİŞKİLİ HESAPLAMALAR. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

KANITA DAYALI LABORATUVAR TIBBI İLE İLİŞKİLİ HESAPLAMALAR. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 KANITA DAYALI LABORATUVAR TIBBI İLE İLİŞKİLİ HESAPLAMALAR Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 1 Kanıta dayalı tıp Kanıta dayalı tıp, hekimlerin günlük kararlarını, mevcut en iyi kanıtın ışığında,

Detaylı

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH ORTALAMA ÖLÇÜLERİ Ünite 6 Öğr. Gör. Ali Onur CERRAH Araştırma sonucunda elde edilen nitelik değişkenler hakkında tablo ve grafikle bilgi sahibi olunurken, sayısal değişkenler hakkında bilgi sahibi olmanın

Detaylı

ÇİMENTO BASMA DAYANIMI TAHMİNİ İÇİN YAPAY SİNİR AĞI MODELİ

ÇİMENTO BASMA DAYANIMI TAHMİNİ İÇİN YAPAY SİNİR AĞI MODELİ ÇİMENTO BASMA DAYANIMI TAHMİNİ İÇİN YAPAY SİNİR AĞI MODELİ Ezgi Özkara a, Hatice Yanıkoğlu a, Mehmet Yüceer a, * a* İnönü Üniversitesi Mühendislik Fakültesi Kimya Mühendisliği Bölümü, Malatya, 44280 myuceer@inonu.edu.tr

Detaylı

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ Umut FIRAT ufirat@yahoo.com Öz: Depremler yeryüzünde en çok yıkıma neden olan doğal afetlerdir. Bu durum, depremlerin önceden tahmin edilmesi fikrini

Detaylı

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal Taşcı 1, Aytuğ Onan 2 1 Ege Üniversitesi, Bilgisayar Mühendisliği Bölümü, İzmir 2 Celal Bayar

Detaylı