k-en Yakın Komşu Algoritması ve Bir Uygulama (Kredi Riskini Sınıflandırma)
|
|
- Canan Denkel
- 8 yıl önce
- İzleme sayısı:
Transkript
1 k-en Yakın Komşu Algoritması ve Bir Uygulama (Kredi Riskini Sınıflandırma) M. ERDAL BALABAN Türkiye Toplum Hizmetleri Vakfı R Programlama Dili ile Veri Madenciliği Seminerleri SEMİNER 1 21 Ocak 2016, Titanic City Hotel / Taksim
2 Sunumun İçeriği k-en Yakın Komşu Algoritması R ile Örnek Uygulama 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 2/45
3 En Yakın k Komşu Bana Arkadaşını söyle, sana kim olduğunu söyleyeyim. En yakın 1 komşu En yakın 3 komşu 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 3/45
4 k-en Yakın Komşu Algoritması 1. Sınıf değeri bulunmak istenen yeni örneğin veri setinde bulunan tüm örneklere uzaklığı hesaplanır. 2. Uzaklıklar büyükten küçüğe sıralanır. 3. k en küçük uzaklık değerine sahip gözlemler alınır. 4. k gözlemin içinde en sık tekrar eden sınıf tahmini sınıf değeri olarak bulunur (çoğunluk oylaması - majority voting (Bridge, 2013)). (Harrington, 2012) 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 4/45
5 Uzaklıkların Ağırlıklandırılması ve k nın Seçimi Sınıf tahmini için bazen en sık tekrar eden sınıfı seçmek yerine ağırlıklı oylama (weighted voting) kullanılmaktadır. Bu yöntemde, yeni örneğin, veri setindeki diğer örneklere olan uzaklığı ( dd) bulunduktan sonra 1/dd ya da 1/dd^2 hesaplanarak kk komşu içinde aynı sınıfa sahip olanların değerleri toplanır. Hangi sınıfa ait ağırlık değeri yüksek ise o sınıf yeni örneğin sınıfı olarak atanır. kk komşu sayısının çift seçilmesi durumunda, sınıflara ait frekansların eşit olması mümkün olduğundan kk nın tek sayı seçilmesi tercih edilir. kk nın seçimi için geliştirilmiş mutlak bir yöntem mevcut olmayıp, bu konuda literatürde yapılmış farklı çalışmalara rastlamak mümkündür. Uygulaması kolay ancak hesaplama süresi yüksektir (lazy learning), nümerik olmayan nitelikler olduğunda uzaklık ölçüsünün seçimi önemlidir. 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 5/45
6 Uzaklık Hesabı Tüm nitelikler nümerik olduğunda gözlemlerin arasındaki uzaklığı hesaplamak için en sık kullanılan uzaklık ölçüsü Öklid Uzaklığıdır (Denklem (2.8) (Dekhtyar, 2009). dd xx, yy = NN (xx jj yy jj ) 2 jj=1 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 6/45
7 Uzaklık Hesabı Tüm niteliklerin 0 ve 1 lerden oluşma durumunda gözlemler arasındaki uzaklıkları hesaplamak için çok çeşitli benzerlik ve uzaklık ölçüleri geliştirilmiştir (Choi ve diğ., 2010). xx ii = 1 xx ii = 0 yy ii = 1 A B yy ii = 0 C D simetrik nitelik Simple Matching Distance (Dekhtyar, 2009) BB + CC dd ss xx, yy = AA + BB + CC + DD asimetrik nitelik Jaccard Distance (Dekhtyar, 2009) BB + CC dd ss xx, yy = AA + BB + CC 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 7/45
8 Uzaklık Hesabı Gözlemlerde hem kategorik hem de nümerik değer içeren niteliklerin bir arada bulunması durumunda Gower (1971) tarafından önerilen Gower benzerlik ölçüsü iki gözlem arasındaki benzerliğin bulunabilmesi için geliştirilmiştir (Gan, 2011). Bu benzerlik ölçüsü 1 den çıkarılarak uzaklık ölçüsü olarak kullanılabilmektedir (Kaufman ve Rousseeuw, 1990): dd gggggg xx, yy = 1 SS gggggg xx, yy Benzerlik ölçüsünün hesabı şu şekilde yapılmaktadır (Denklem (2.12) (Cichosz, 2015; Dunn ve Everitt, 2012; Gan, 2011): SS gggggg xx, yy = dd jj=1 1 dd ww(xx jj, yy jj ) jj=1 ww xx jj, yy jj ss(xx jj, yy jj ) 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 8/45
9 Uzaklık Hesabı (d gggggg ) Eğer jj.nitelik sürekliyse: RR(aralık) jj, jj. niteliğin değişim aralığı olmak üzere Eğer jj.nitelik ikiliyse: ss xx jj, yy jj = 1 xx jj yy jj RR(aralık) jj ww xx jj, yy jj = 0, eeğeeee xx jj yyyy dddd yy jj kkyyyyıkkkkkk 1, aaaaaaaa haaaaaaaa ss xx jj, yy jj ww xx jj, y jj Eğer jj.nitelik isimsel ya da kategorikse: = 1, eeğeeee xx jj ve yy jj "var"ssss 0, aaaaaaaa haaaaaaaa = 0, eeğeeee xx jj ve yy jj "yok"ssss 1, aaaasii haaaaaaaa ss xx jj, yy jj = 1, eeğeeee xx jj = yy jj 0, aaaaaaaa haaaaaaaa ww xx jj, yy jj = 0, eeğeeee xx jj ya da yy jj kayıpsaa 1, aaaaaaaa haaaaaaaa 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 9/45
10 Uygulama Veri Seti Bankacılık uygulamalarında risk yönetimi kapsamında bir müşterinin riskini öngörebilmek için knn öğrenme algoritmasının uygulamasında; Evans ın Business Analitics kitabından yararlanılmıştır. «CreditRiskData» veriseti türkçeleştirilmiş olarak analizlerimizde veri madenciliği uygulamasında kullanılmıştır. Değişkenler (İngilizce) Değişkenler (Türkçe) Değişken Türü Loan Purpose KrediAmaci Kategorik Checking VadesizMevduat Sürekli Savings VadeliMevduat Sürekli Months Employed CalisilanAy Sürekli Months Customer MusteriSureAy Sürekli Gender Cinsiyet Kategorik Marital Status MedeniHali Kategorik Age Yas Sürekli Housing KonutSahipligi Kategorik Years KonutSuresiYıl Sürekli Job MeslekiDuzey Kategorik Credit Risk KrediRiski Kategorik 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 10/45
11 Kredi Riski Veri Seti 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 11/45
12 Kredi Riski Tahmini R Programlama dilinde k-en Yakın Komşu Algoritması uygulaması. Bankaya başvuran bir müşteriye kredi verilip verilmeyeceği öngörüsü. Kredi Riski Veri Seti k- En Yakın Komşu Algoritması Veri Seti: Credit Approval Decisions 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 12/45
13 Veri Setinin Okunması Uygulamanın yapılacağı çalışma klasörü belirlenir. setwd("c:/users/balaban/desktop/seminer1") xlsx paketi yüklenir ve çalışmaya eklenir. install.packages("xlsx") library(xlsx) read.xlsx fonksiyonu çalıştırılarak krediriskiveriseti.xlsx dosyası okunur. Veri setinin excel dosyasının hangi sayfasında olduğu «sheetindex» ile belirlenirken, veri setinde sütun adları ilk satırda bulunduğu için «header = TRUE» denir. Veri setini okurken Türkçe karakterlerde problem yaşanmaması için «encoding="utf-8"» parametresi kullanılır. kredivs <- read.xlsx(file = "krediriski.xlsx", sheetindex = 1, header = TRUE, encoding="utf-8") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 13/45
14 Kredi Riski Veri Seti Factor=Kategorik num=nümerik Hedef Nitelik 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 14/45
15 Veri Seti Özeti Veri setinin özeti «summary» fonksiyonu yardımı ile elde edilir. Özette, kategorik niteliklerin kategorilerine ait frekansları verilirken, nümerik değişkenlere ait minimum maksimum, ortanca ve ortalama değerler ile 1., 3. kartil değerlerine yer verilmektedir. 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 15/45
16 Hedef Niteliğin İncelenmesi Hedef niteliğin kategorilerine ait frekans değerleri «table» fonksiyonu ile kontrol edilmektedir. table(kredivs$krediriski) Kredi Risk durumu «Düşük» olan müşteriler referans kategori olarak ele alınmıştır. Bu da performans değerlendirmesinde pozitif sınıf olarak «Düşük» kategorisinin ele alınacağını göstermektedir. Eğer risk durumu «Yüksek» olan müşterilerin pozitif sınıf olarak alınması istenirse yapılması gereken, «Yüksek» kategorisini «relevel» fonksiyonu yardımıyla referans kategori olarak değiştirmektir. kredivs$krediriski <- relevel(kredivs$krediriski, ref=«yüksek") table(kredivs$krediriski) 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 16/45
17 Kutu Grafiği Çizimi boxplot(yas~meslekiduzey, data=kredivs, xlab="mesleki Düzey", ylab="yaş", main="mesleki Düzeye göre Yaş Dağılımı") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 17/45
18 Kutu Grafiği Çizimi boxplot(vadelimevduat~krediamaci, data=kredivs, xlab="kredi Amacı", ylab="vadelimevduat", main="vadeli Mevduat ile Kredi Amacı İlişkisi") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 18/45
19 Kutu Grafiği Çizimi boxplot(yas~krediriski, data=kredivs, xlab="krediriski", ylab="yas", main="kredi Riski ile Yaş arasındaki İlişkisi") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 19/45
20 Histogram Çizimi hist(kredivs$yas, col="blue", main="yaş", xlab = "Yaş", ylab = "Frekans") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 20/45
21 Sütun Grafiği Çizimi frekanslar <- table(kredivs$konutsahipligi) barplot(frekanslar, main="müşterilerin Konut Durumu", xlab="konut Durumu", ylab="müşteri Sayısı") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 21/45
22 Hedef Niteliğin Pasta Grafiği ile İncelenmesi frekanslar2 <- table(kredivs$krediriski) etiketler <- paste(names(frekanslar2), frekanslar2, sep=" ") pie(frekanslar2, labels = etiketler, main="müşteri Kredi Risk Durumu Değerlendirmesi") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 22/45
23 Nitelikler Arasındaki İlişkilerin İncelenmesi pairs(~vadesizmevduat+vadelimevduat+calisilanay+musterisureay+yas+konutsuresiyil,data=kredivs) 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 23/45
24 Nitelikler Arasındaki İlişkilerin İncelenmesi install.packages("hmisc") library(hmisc) rcorr(as.matrix(kredivs[,c(2,3,4,5,8,10)]), type="pearson") 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 24/45
25 Normalizasyon Normalizasyon için kullanılan paketlerden biri «clustersim»dir. Normalizasyon veri setindeki nümerik niteliklere uygulanır. Bu örnekte min-max normalizasyon yöntemi kullanıldığı için «type="n4"» olarak seçilmiştir. Fonksiyon buyöntemin dışındaki birçok normalizasyon yönteminin kullanılmasına imkan vermektedir. install.packages("clustersim") library(clustersim) kredivs[,c(2,3,4,5,8,10)] <- lapply(1,function(x) data.normalization(kredivs[,c(2,3,4,5,8,10)],type="n4",normalization="column"))[[1]] 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 25/45
26 Veri Setinin Eğitim ve Test Olarak İkiye Ayrılması Veri setini parçalamak için «caret» paketinden «createdatapartition» fonksiyonu kullanılabilir. install.packages("caret") library(caret) set.seed(1) egitimindisleri <- createdatapartition(y = numerik_kredivs$krediriski, p =.80, list = FALSE) egitim <- numerik_kredivs[egitimindisleri,] test <- numerik_kredivs[-egitimindisleri,] table(egitim$krediriski) table(test$krediriski) createdatapartition fonksiyonu örnekleri veri setinden rastgele biçimde seçmektedir. Bu fonksiyondan önce «set.seed(1)» ifadesinin kullanılma sebebi her seferinde aynı indis değerlerine, dolayısıyla örneklere ulaşabilmektir. 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 26/45
27 Algoritma için Ön Hazırlık Eğitim ve Test veri setlerinde tahminde kullanılacak nitelikler ve hedef nitelik ayrı nesnelere atanır. testnitelikleri <- test[, -7] testhedefnitelik <- test[[7]] egitimnitelikleri <- egitim[, -7] egitimhedefnitelik <- egitim[[7]] k-en Yakın komşu Algoritmasında yeni örneğin sınıfı belirlenirken bakılacak komşu sayısı belirlenir. k_degeri=3 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 27/45
28 k-en Yakın Komşu Algoritmasını İçeren Fonksiyonunun Kullanımı 1 class{knn} k-en Yakın Komşu Algoritmasının uygulanabilmesi için ihtiyaç duyulan «class» paketi yüklenerek çalışmaya eklenir. install.packages("class") library(class) set.seed(1) (tahminisiniflar <- knn(egitimnitelikleri, testnitelikleri, egitimhedefnitelik, k = k_degeri)) 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 28/45
29 Algoritma Tahminleri ile Gerçek Sınıf Değerlerine Genel Bakış 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 29/45
30 Modelin Performansının Değerlendirmesi Yapılan sınıflandırmaya ait performans ölçütlerinin hesaplanabilmesi için öncelikle Kontenjans Tablosu (Confusion Matrix) oluşturulur. (tablom <- table(tahminisiniflar, testhedefnitelik, dnn = c("tahmini Siniflar", "Gercek Siniflar"))) Pozitif Negatif 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 30/45
31 Modelin Performansının Değerlendirmesi Tablo çizdirilir. fourfoldplot(tablom, color = rainbow(2)) Pozitif Negatif 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 31/45
32 Modelin Performansının Değerlendirmesi 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 32/45
33 Alternatif Performans Değerlendirme Yolu k=3 için 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 33/45
34 k nın Farklı Değerlerinde Algoritma Performansı k nın 1 ile 20 arasında aldığı değerler için algoritmaya ait performans değerlendirmesi aşağıdaki gibi elde edilebilir. for(i in 1:20) { set.seed(1) (tahminisiniflar = knn(egitimnitelikleri, testnitelikleri, egitimhedefnitelik, k = i)) dogruluk[i] <- mean(tahminisiniflar == testhedefnitelik) } dogruluk 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 34/45
35 Performansın Grafikle Gösterimi Elde edilen doğruluk değerleri dizisi grafik biçiminde aşağıdaki gibi gösterilir. plot(seq(1:20), dogruluk, type="o", xlab="k", ylab="doğruluk") text(x = dogruluk, labels=round(dogruluk,2)) 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 35/45
36 En İyi k Değerini Bulma k nın 1 den 20 ye kadar aldığı değerler için doğruluk dizisi elemanlarına isim atanır. Bunun için seq fonksiyonu yardımı ile 1 den 20 ye kadar 1 er 1 er artan bir dizi tanımlanabilir. names(dogruluk)<-seq(1,20,1) max(dogruluk) eniyi_k <- names(dogruluk)[dogruluk==max(dogruluk)] 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 36/45
37 Yeni Bir Müşteri için Tahmin yeniornek<-null yeniornek<-data.frame(vadesizmevduat= 300, VadeliMevduat= 250, CalisilanAy =60, MusteriSureAy=100, Yas=28, KonutSuresiYil= 2, KrediRiski=NA) Normalizasyon işleminden sonra yeniornek: 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 37/45
38 k=9 için Yeni Müşterinin Risk Tahmini set.seed(1) (yeniornek_sinif <- knn(egitimnitelikleri, yeniornek[,-7], egitimhedefnitelik, k = 9)) yeniornek$krediriski <- yeniornek_sinif 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 38/45
39 k-en Yakın Komşu Algoritmasını İçeren Fonksiyonunun Kullanımı 2 dprep{knngow} # Veri setini okuma install.packages("xlsx") library(xlsx) kredivs <- read.xlsx(file = "krediriski.xlsx", sheetindex = 1, header = TRUE, encoding="utf-8") # Veri setinin rastgele bicimde egitim ve test veri seti olarak ikiye ayrilmasi install.packages("caret") library(caret) set.seed(1) egitimindisleri <- createdatapartition(y = kredivs$krediriski, p =.80, list = FALSE) egitim <- kredivs[egitimindisleri,] test <- kredivs[-egitimindisleri,] Veri setindeki tüm nitelikler analize dahil edilir # k degeri secimi k_degeri=3 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 39/45
40 k-en Yakın Komşu Algoritmasını İçeren Fonksiyonunun Kullanımı 2 dprep{knngow} k-en Yakın Komşu Algoritmasını Gower uzaklığını hesaplayarak kullanabilmek için dprep paketi yüklenir ve çalışmaya eklenir. knngow fonksiyonu aşağıdaki biçimde kullanılır: install.packages("dprep") library(dprep) (tahminisiniflar <- knngow(egitim, test,k = k_degeri)) 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 40/45
41 Algoritma Tahminleri ile Gerçek Sınıf Değerlerine Genel Bakış 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 41/45
42 Modelin Performans Değerlendirmesi 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 42/45
43 Kullanılan Paketler dprep: Acuna, E., & the CASTLE research group at The University of Puerto Rico-Mayaguez. (2015). dprep: Data Pre-Processing and Visualization Functions for Classification. Retrieved from xlsx: Dragulescu, A. A. (2014). xlsx: Read, write, format Excel 2007 and Excel 97/2000/XP/2003 files. Retrieved May 28, 2015, from Hmisc: Harrel, F. E., & contributions from Charles Dupont and many others. (2015). Hmisc: Harrell Miscellaneous. Retrieved from caret: Kuhn, M., Wing, M. K. C. from J., Weston, S., Williams, A., Keefer, C., Engelhardt, A., Candan, C. (2015). caret: Classification and Regression Training. Retrieved from class: Venables, W. N., & Ripley, B. D. (2002). Modern Applied Statistics with S (Fourth). New York: Springer. Retrieved from clustersim: Walesiak, M., & Dudek, A. (2014). clustersim: Searching for optimal clustering procedure for a data set. Retrieved from 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 43/45
44 Kaynaklar Balaban, M. E., Kartal, E. (2015). R ile Veri Madenciliği Yaz Okulu Ders Notları, Muğla, 7-13 Eylül Balaban, M. E. (2015). Project Management in Data Mining, Proje Yönetim Zirvesi (PM Summit) 2015, Boğaziçi Üniversitesi, İstanbul, 2-3 Ekim Balaban, M. E., & Kartal, E. (2015). Veri Madenciliği ve Makine Öğrenmesi Temel Algoritmaları ve R Dili ile Uygulamaları. İstanbul, Çağlayan Kitabevi, ISBN: Bridge, D. (2013). Classification: k Nearest Neighbours. Retrieved April 26, 2015, from Choi, S.-S., Cha, S.-H., & Tappert, C. C. (2010). A survey of binary similarity and distance measures. Journal of Systemics, Cybernetics and Informatics, 8(1), Cichosz, P. (2015). Data Mining Algorithms: Explained Using R. John Wiley & Sons. Dekhtyar, A. (2009). CSC 466: Knowledge Discovery from Data - Distance/Similarity Measures. Retrieved May 20, 2015, from Dunn, G., & Everitt, B. S. (2012). An Introduction to Mathematical Taxonomy. Courier Corporation. Gan, G. (2011). Data Clustering in C++: An Object-Oriented Approach. CRC Press. Harrington, P. (2012). Machine Learning in Action (1st Edition). Shelter Island, NY: Manning Publications. Kartal, E. (2015). Sınıflandırmaya Dayalı Makine Öğrenmesi Teknikleri Ve Kardiyolojik Risk Değerlendirmesine İlişkin Bir Uygulama (Doktora). İstanbul Üniversitesi, İstanbul, Türkiye. Kaufman, L., & Rousseeuw, P. J. (1990). Finding Groups in Data: An Introduction to Cluster Analysis. Hoboken, New Jersey: John Wiley & Sons, Inc. 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 44/45
45 Teşekkürler 21 Ocak 2016 VERİ MADENCİLİĞİNDE K-EN YAKIN KOMŞU ALGORİTMASI 45/45
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5
DetaylıK En Yakın Komşu Methodu (KNearest Neighborhood)
K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre
DetaylıK-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi
K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi
DetaylıYZM 3217 YAPAY ZEKA DERS#10: KÜMELEME
YZM 317 YAPAY ZEKA DERS#10: KÜMELEME Sınıflandırma (Classification) Eğiticili (supervised) sınıflandırma: Sınıflandırma: Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz (unsupervised)
DetaylıVERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr
VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan
DetaylıEğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir
sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt
Detaylı3.2. DP Modellerinin Simpleks Yöntem ile Çözümü Primal Simpleks Yöntem
3.2. DP Modellerinin Simpleks Yöntem ile Çözümü 3.2.1. Primal Simpleks Yöntem Grafik çözüm yönteminde gördüğümüz gibi optimal çözüm noktası, her zaman uygun çözüm alanının bir köşe noktası ya da uç noktası
DetaylıZeki Optimizasyon Teknikleri
Zeki Optimizasyon Teknikleri Ara sınav - 25% Ödev (Haftalık) - 10% Ödev Sunumu (Haftalık) - 5% Final (Proje Sunumu) - 60% - Dönem sonuna kadar bir optimizasyon tekniğiyle uygulama geliştirilecek (Örn:
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing
DetaylıKABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN
KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN Giriş Bilgi teknolojisindeki gelişmeler ve verilerin dijital ortamda saklanmaya başlanması ile yeryüzündeki bilgi miktarı her 20 ayda iki katına
DetaylıVeri Madenciliği ve R Programlama Dili. R Programlama Dili ile Veri Madenciliği Seminerleri SEMİNER 1 21 Ocak 2016, Titanic City Hotel / Taksim
Veri Madenciliği ve R Programlama Dili M. ERDAL BALABAN (mebalaban@gmail.com) Tü r k i ye To p l u m H i z m e t l e r i Va k f ı R Programlama Dili ile Veri Madenciliği Seminerleri SEMİNER 1 21 Ocak 2016,
DetaylıZamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama
Zamansal Veri Madenciliği ve Anomali Tespiti için Bir Uygulama Mehmet Yavuz ONAT Yrd.Doç.Dr.Engin YILDIZTEPE Dokuz Eylül Üniversitesi, İstatistik Bölümü Akademik Bilişim 2015, Anadolu Üniversitesi, Eskişehir
DetaylıK-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi
K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal Taşcı 1, Aytuğ Onan 2 1 Ege Üniversitesi, Bilgisayar Mühendisliği Bölümü, İzmir 2 Celal Bayar
DetaylıTemel Excel Kullanım Bilgisi
Temel Excel Kullanım Bilgisi Excel Fonksiyonları Başlangıç Microsoft Excel in en zevkli olan formül kısmı hakkında kısa kısa bilgileri ve bazı formüllerin nasıl yazıldığını burada bulacaksınız.
DetaylıVeri Madenciliği Karar Ağacı Oluşturma
C4.5 Algoritması Veri Madenciliği Karar Ağacı Oluşturma Murat TEZGİDER 1 C4.5 Algoritması ID3 algoritmasını geliştiren Quinlan ın geliştirdiği C4.5 karar ağacı oluşturma algoritmasıdır. ID3 algoritmasında
DetaylıAlgoritma ve Akış Diyagramları
Algoritma ve Akış Diyagramları Bir problemin çözümüne ulaşabilmek için izlenecek ardışık mantık ve işlem dizisine ALGORİTMA, algoritmanın çizimsel gösterimine ise AKIŞ DİYAGRAMI adı verilir 1 Akış diyagramları
DetaylıSİMPLEKS ALGORİTMASI Yapay değişken kullanımı
Fen Bilimleri Enstitüsü Endüstri Mühendisliği Anabilim Dalı ENM53 Doğrusal Programlamada İleri Teknikler SİMPLEKS ALGORİTMASI Yapay değişken kullanımı Hazırlayan: Doç. Dr. Nil ARAS, 6 AÇIKLAMA Bu sununun
DetaylıHafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları
Hafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr
DetaylıK-MEANS, K-MEDOIDS VE BULANIK C-MEANS ALGORİTMALARININ UYGULAMALI OLARAK PERFORMANSLARININ TESPİTİ
İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi Yıl: 6 Sayı:11Bahar 2007/1 s. 31-45 K-MEANS, K-MEDOIDS VE BULANIK C-MEANS ALGORİTMALARININ UYGULAMALI OLARAK PERFORMANSLARININ TESPİTİ Meltem IŞIK *,
DetaylıYönetim Bilişim Sistemleri (Karma) - 1. yarıyıl. 380000000001101 Hukukun Temelleri Fundamentals of Law 2 0 0 2 2 5 TR
- - - - - Bölüm Seçin - - - - - Gönder Yönetim Bilişim Sistemleri (Karma) - 1. yarıyıl 141000000001101 Akademik ve Sosyal Oryantasyon Academic and Social Orientation 1 0 0 1 0 1 TR 380000000001101 Hukukun
DetaylıBLM401 Mobil Cihazlar için ANDROİD İşletim Sistemi İNTENT VE İNTENT. BLM401 Dr.Refik SAMET
BLM401 Mobil Cihazlar için ANDROİD İşletim Sistemi İNTENT VE İNTENT FİLTRELERİ BLM401 Dr.Refik SAMET 1 GİRİŞ (1/3) Yazılım bileşenleri arasındaki haberleşmede İNTENT kullanılmaktadır. Bir yazılımın bileşenini
DetaylıBÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko
1 BÜYÜK VERI UYGULAMALARı DERS 7 Doç. Dr. Yuriy Mishchenko PLAN Azure ML hizmeti kullanılmasına bir pratik giriş 2 3 MS AZURE ML 4 MS AZURE ML Azure Microsoft tarafından sağlanan bulut hesaplama hizmetleri
DetaylıMakine Öğrenmesi 2. hafta
Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde
DetaylıMakine Öğrenmesi 3. hafta
Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla
DetaylıDers 1 Minitab da Grafiksel Analiz-I
ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI Ders 1 Minitab da Grafiksel Analiz-I İstatistik Nedir? İstatistik kelimesi ilk olarak Almanyada devlet anlamına gelen status kelimesine dayanılarak kullanılmaya
DetaylıVERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine
DetaylıSÜREKLĠ OLASILIK DAĞILIMLARI
SÜREKLĠ OLASILIK DAĞILIMLARI Sayı ekseni üzerindeki tüm noktalarda değer alabilen değişkenler, sürekli değişkenler olarak tanımlanmaktadır. Bu bölümde, sürekli değişkenlere uygun olasılık dağılımları üzerinde
DetaylıVERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıYöneylem Araştırması II
Yöneylem Araştırması II Öğr. Gör. Dr. Hakan ÇERÇİOĞLU cercioglu@gazi.edu.tr BÖLÜM I: Doğrusal Programlama Tekrarı Doğrusal Programlama Tanımı Doğrusal Programlama Varsayımları Grafik Çözüm Metodu Simpleks
DetaylıMETASEZGİSEL YÖNTEMLER
METASEZGİSEL YÖNTEMLER Ara sınav - 30% Ödev (Haftalık) - 20% Final (Proje Sunumu) - 50% - Dönem sonuna kadar bir optimizasyon tekniğiyle uygulama geliştirilecek (Örn: Zaman çizelgeleme, en kısa yol bulunması,
DetaylıUzaktan Algılama Teknolojileri
Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve
DetaylıTemel Bilgisayar Programlama
BÖLÜM 11: : Birçok programda, bazı verilerin disk üzerinde saklanmasına gerek duyulur. Bütün programlama dillerinde, sabit disk sürücüsü (Hard Disk Drive, HDD) üzerindeki verileri okumak veya diske veri
DetaylıBüyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)
Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data
DetaylıVERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL
VERİ MADENCİLİĞİ Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL SPRINT Algoritması ID3,CART, ve C4.5 gibi algoritmalar önce derinlik ilkesine göre çalışırlar ve en iyi dallara ayırma kriterine
DetaylıT.C. KIRIKKALE ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ YAPAY SİNİR AĞLARI. Doç.Dr. Necaattin BARIŞÇI FİNAL PROJESİ
T.C. KIRIKKALE ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ YAPAY SİNİR AĞLARI Doç.Dr. Necaattin BARIŞÇI YAPAY SİNİR AĞLARI İLE KORONER ARTER HASTALIĞI RİSK Öğrenci : SİNEM ÖZDER Numarası : 118229001004
DetaylıÇoktan Seçmeli Değerlendirme Soruları Akış Şemaları İle Algoritma Geliştirme Örnekleri Giriş 39 1.Gündelik Hayattan Algoritma Örnekleri 39 2.Say
İÇİNDEKİLER 1. Bilgisayarın Yapısı Ve Programlama Dilleri Giriş 1 Bilgisayar ve Programlamanın Kısa Bir Tarihçesi 2 Donanım ve Yazılım Kavramları 3 Bilgisayarın Donanımsal yapısı 4 Giriş Birimi (Input
Detaylı11. SINIF. No Konular Kazanım Sayısı GEOMETRİ TRİGONOMETRİ Yönlü Açılar Trigonometrik Fonksiyonlar
11. SINIF No Konular Kazanım Sayısı GEOMETRİ Ders Saati Ağırlık (%) 11.1. TRİGONOMETRİ 7 56 26 11.1.1. Yönlü Açılar 2 10 5 11.1.2. Trigonometrik Fonksiyonlar 5 46 21 11.2. ANALİTİK GEOMETRİ 4 24 11 11.2.1.
DetaylıEğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir
Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi
DetaylıUzaktan Algılama Uygulamaları
Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ
Detaylı3.2. Raster Veriler. Satırlar. Sütunlar. Piksel/hücre büyüklüğü
3.2. Raster Veriler Satırlar Piksel/hücre büyüklüğü Sütunlar 1 Görüntü formatlı veriler Her piksel için gri değerleri kaydedilmiştir iki veya üç bant (RGB) çok sayıda bant Fotoğraf, uydu görüntüsü, ortofoto,
DetaylıÖDEV (Vize Dönemi) CEVAPLAR. 1. Ekrana Merhaba Dünya! yazdıran algoritmanın akış diyagramını çiziniz ve sözde kod olarak yazınız.
ÖDEV (Vize Dönemi) CEVAPLAR 1. Ekrana Merhaba Dünya! yazdıran algoritmanın akış diyagramını çiziniz ve sözde kod olarak yazınız. PROGRAM Soru1 PRINT Merhaba Dünya! ; 2. Klavyeden girilen negatif bir sayıyı
DetaylıİSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.
İSTATİSTİKSEL TAHMİNLEME Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir. 1 ŞEKİL: Evren uzay-örneklem uzay İstatistiksel tahmin
DetaylıDOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 5065
Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Güvenlik ve Gizlilik Mühendisliği Dersin Orjinal Adı: Security and Privacy Engineering Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora)
DetaylıAlgoritmalara Giriş 6.046J/18.401J
Algoritmalara Giriş 6.046J/18.401J Ders 17 En kısa yollar I En kısa yolların özellikleri Dijkstra algoritması Doğruluk Çözümleme Enine arama Prof. Erik Demaine November 14, 005 Copyright 001-5 by Erik
DetaylıALGORİTMA VE PROGRAMLAMA I
ALGORİTMA VE PROGRAMLAMA I YZM 1101 Celal Bayar Üniversitesi Hasan Ferdi Turgutlu Teknoloji Fakültesi Genel Bakış 2 Diziler Dizi Nedir? Dizilerin Bildirimi Dizilere Başlangıç Değeri Verme Dizilerde Arama
DetaylıSözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme
1 Cem Rıfkı Aydın, 1 Ali Erkan, 1 Tunga Güngör, 2 Hidayet Takçı 1 Boğaziçi Üniversitesi, 2 Cumhuriyet Üniversitesi Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme AB 14 7 Şubat 2014
Detaylıİstatistik Nedir? Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. İstatistiğin Konusu Olan Olaylar
ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI İstatistik Nedir? İstatistik kelimesi ilk olarak Almanyada devlet anlamına gelen status kelimesine dayanılarak kullanılmaya başlanmıştır. Ders 1 Minitab da
DetaylıTEMEL EXCEL. 1 - Excel e Giriş
TEMEL EXCEL 1 - Excel e Giriş Excel e Başlangıç Excel Ekranı Ribbon (Şerit) Kullanmak, başka Bilgisayarlara Uygulamak Backround (Arka Plan) Görünümünü Değiştirmek Kısa Yol Menülerini Kullanmak Diyalog
DetaylıVERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme
DetaylıYZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR
YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest
DetaylıBu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.
ÇOK ÖLÇÜTLÜ KARAR VERME TOPSIS (Technique For Order Preference By Similarity To Ideal Solution) PROF. DR. İBRAHİM ÇİL 1 Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.
DetaylıKümeleme Tekniklerinin Temel Bilimlerde Kullanımı
Akademik Bilişim 2013 Akdeniz Üniversitesi, Antalya, 23-25 Ocak 2013 Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı Oğuz Akpolat 1 *, Sinem Çağlar Odabaş 2, Gülçin Özevci 3, Nezahat İpteş 4 1 Muğla
DetaylıGözetimli & Gözetimsiz Öğrenme
Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)
DetaylıDENEY 3: DTMF İŞARETLERİN ÜRETİLMESİ VE ALGILANMASI
DENEY 3: DTMF İŞARETLERİN ÜRETİLMESİ VE ALGILANMASI AMAÇ: DTMF işaretlerin yapısının, üretim ve algılanmasının incelenmesi. MALZEMELER TP5088 ya da KS58015 M8870-01 ya da M8870-02 (diğer eşdeğer entegreler
DetaylıMatris İşlemleri Uygulaması
Matris İşlemleri Uygulaması Uygulama Konusu Uygulama 3x3 boyutlu matrislerle toplama, çıkarma ve çarpma işlemleri üzerinedir. Toplama İşlemi AA = aa iiii mmmmmm ve BB = bb iiii mmmmmm aynı tipte iki matris
DetaylıALGORİTMA VE PROGRAMLAMA I
ALGORİTMA VE PROGRAMLAMA I Yrd. Doç. Dr. Deniz KILINÇ deniz.kilinc@cbu.edu.tr YZM 1101 Celal Bayar Üniversitesi Hasan Ferdi Turgutlu Teknoloji Fakültesi Genel Bakış 2 Koşul Karşılaştırma Operatörleri Mantıksal
Detaylı127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ
127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi
DetaylıKümeleme Tekniklerinin Temel Bilimlerde Kullanımı
Kümeleme Tekniklerinin Temel Bilimlerde Kullanımı Oğuz Akpolat 1 *, Sinem Çağlar Odabaş 2, Gülçin Özevci 3, Nezahat Đpteş 4 1 Muğla SKÜ, Fen Fakültesi, Kimya Bölümü, Muğla, Türkiye 2 Muğla SKÜ Fen Bilimleri
DetaylıWEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ
WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ Doç.Dr Erhan Akyazı Marmara Üniversitesi Bilişim Bölümü eakyazi@marmara.edu.tr Şafak Kayıkçı Marmara Üniversitesi Bilişim Bölümü safak@safakkayikci.com
DetaylıDOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6003
Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Makina Öğrenmesi ve Akıl Yürütme Dersin Orjinal Adı: Machine Learning and Reasoning Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora)
DetaylıOYUN TEORİSİ. Özlem AYDIN. Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü
OYUN TEORİSİ Özlem AYDIN Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü TANIM ''Oyun Teorisi'', iki yada daha fazla rakibi belirli kurallar altında birleştirerek karşılıklı olarak çelişen olasılıklar
Detaylıİstatistik Laboratuvarı I Vize Ödevi Levent TERLEMEZ 30 Kasım 2016
İstatistik Laboratuvarı I Vize Ödevi Levent TERLEMEZ 30 Kasım 2016 İçindekiler 1 Soru 1 1.1 Veri Girişi............................................... 1 1.2 Boy Değişkeni.............................................
DetaylıYazılım Proje Yönetimi (SE 320) Ders Detayları
Yazılım Proje Yönetimi (SE 320) Ders Detayları Ders Adı Ders Kodu Dönemi Ders Saati Uygulama Saati Laboratuar Saati Kredi AKTS Yazılım Proje Yönetimi SE 320 Bahar 3 0 0 3 5 Ön Koşul Ders(ler)i Dersin Dili
DetaylıTürev Uygulamaları ÜNİTE. Amaçlar. İçindekiler. Yazar Prof.Dr. Vakıf CAFEROV
Türev Uygulamaları Yazar Prof.Dr. Vakıf CAFEROV ÜNİTE 10 Amaçlar Bu üniteyi çalıştıktan sonra; türev kavramı yardımı ile fonksiyonun monotonluğunu, ekstremum noktalarını, konvekslik ve konkavlığını, büküm
DetaylıÖ Z G E Ç M İ Ş. 1. Adı Soyadı: Mustafa GÖÇKEN. 2. Doğum Tarihi: 12 Haziran 1976. 3. Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D.
Ö Z G E Ç M İ Ş 1. Adı Soyadı: Mustafa GÖÇKEN 2. Doğum Tarihi: 12 Haziran 1976 3. Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D. Derece Alan Üniversite Yıl Lisans Endüstri Mühendisliği Çukurova Üniversitesi
DetaylıBÜLENT ECEVİT ÜNİVERSİTESİ BAĞIL DEĞERLENDİRME SİSTEMİNE İLİŞKİN ESASLAR
BÜLENT ECEVİT ÜNİVERSİTESİ BAĞIL DEĞERLENDİRME SİSTEMİNE İLİŞKİN ESASLAR Amaç * MADDE 1. Bu esasların amacı, Bülent Ecevit Üniversitesi Tıp ve Diş Hekimliği Fakülteleri ve Devlet Konservatuvarı dışındaki
DetaylıInstance Based Learning k-nn. YZM 3226 Makine Öğrenmesi
Instance Based Learning k-nn YZM 3226 Makine Öğrenmesi Outline Eager vs. Lazy Learning Instance Based Learning K-Nearest Neighbor Algorithm Nearest Neighbor Approach Basic k-nearest Neighbor Classification
DetaylıÖrnek 02: Amaç: Şekil Wizard yardımıyla yeni proje açılması.
Örnek 02: Amaç: Bu çalışmadaki amaç, şarap oluşumunda ve sonrasında oluşan kimyasal maddelerin şarap tadıcılarının değerlendirmelerine nasıl bir etkide bulunduğunu tespit etmek ve bu tespitler sonucunda
DetaylıProblem Set 1 Çözümler
Algoritmalara Giriş Eylül 30, 2005 Massachusetts Institute of Technology 6.046J/18.410J Profesörler Erik D. Demaine ve Charles E. Leiserson Dağıtım 8 0J Professors Erik D. Demaine ve Charles E. Leiserson
DetaylıKredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval
Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval İsmail Haberal Bilgisayar Mühendisliği Bölümü Başkent Üniversitesi ihaberal@baskent.edu.tr Umut
DetaylıDr. Hidayet Takçı. Veri Madenciliği Dersi G Y T E Dr. Hidayet Takçı 10/05/2008 1
Birinci Saat Veri Madenciliği: Giriş Dr. Hidayet Takçı Veri Madenciliği Dersi G Y T E Dr. Hidayet Takçı 10/05/2008 1 Neden Veri Madenciliği? Ticari Bakış Açısı Çok miktarda veri toplanmış ve ambarlanmıştır.
DetaylıBMB204. Veri Yapıları Ders 12. Dizgi Eşleme (String Matching) Algoritmaları İleri Veri Yapıları
BMB204. Veri Yapıları Ders 12. Dizgi Eşleme (String Matching) Algoritmaları İleri Veri Yapıları Erdinç Uzun NKÜ Çorlu Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü Dersin Planı Dizgi Eşleme Algoritmaları
DetaylıR ile Programlamaya Giriş ve Uygulamalar
R ile Programlamaya Giriş ve Uygulamalar İçerik R ye genel bakış R dili R nedir, ne değildir? Neden R? Arayüz Çalışma alanı Yardım R ile çalışmak Paketler Veri okuma/yazma İşleme Grafik oluşturma Uygulamalar
DetaylıZeki Optimizasyon Teknikleri
Zeki Optimizasyon Teknikleri Tabu Arama (Tabu Search) Doç.Dr. M. Ali Akcayol Tabu Arama 1986 yılında Glover tarafından geliştirilmiştir. Lokal minimum u elimine edebilir ve global minimum u bulur. Değerlendirme
DetaylıMann-Whitney U ve Wilcoxon T Testleri
Mann-Whitney U ve Wilcoxon T Testleri Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Konu Başlıkları Parametrik olmayan yöntem Mann-Whitney U testinin
DetaylıAlgoritma ve Akış Diyagramları
Algoritma ve Akış Diyagramları Bir problemin çözümüne ulaşabilmek için izlenecek ardışık mantık ve işlem dizisine ALGORİTMA, algoritmanın çizimsel gösterimine ise AKIŞ DİYAGRAMI adı verilir. 1 Akış diyagramları
Detaylı12. SINIF. Ağırlık (%) SAYILAR VE CEBİR ÜSTEL VE LOGARİTMİK FONKSİYONLAR Üstel Fonksiyon 1 8 4
12. SINIF No Konular Kazanım Sayısı Ders Saati Ağırlık (%) 12.1. ÜSTEL VE LOGARİTMİK FONKSİYONLAR 6 36 17 12.1.1. Üstel Fonksiyon 1 8 4 12.1.2. Logaritma Fonksiyonu 3 18 8 12.1.3 Üstel, Logaritmik Denklemler
DetaylıMühendislikte İstatistik Yöntemler
Mühendislikte İstatistik Yöntemler Referans Kitaplar Türkçe : Mühendisler için İstatistik, Mehmetçik Bayazıt, Beyhan Oğuz, Birsen Yayınevi Mühendislikte İstatistik Metodlar, Erdem KOÇ,ÇÜ, Müh.Mim.Fak.
DetaylıSıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5
Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Tek değişken için çizilen
Detaylıbitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ
bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ - 150110046 İÇERİK Uygulama ve uygulamaya ilişkin temel kavramların tanıtımı Uygulamanın yapısı Ön yüz Veritabanı Web Servisler K-Means Algoritması ile kategori
DetaylıSıralı Erişimli Dosyalar. Kütük Organizasyonu 1
Sıralı Erişimli Dosyalar Kütük Organizasyonu 1 Dosya Fiziksel depolama ortamlarında verilerin saklandığı mantıksal yapılara dosya denir. Dosyalar iki şekilde görülebilir. Byte dizisi şeklinde veya Alanlar
DetaylıBÖLÜM III: Şebeke Modelleri. Şebeke Kavramları. Şebeke Kavramları. Şebeke Kavramları. Yönlü Şebeke (Directed Network) Dal / ok
8.0.0 Şebeke Kavramları BÖLÜM III: Şebeke Modelleri Şebeke (Network) Sonlu sayıdaki düğümler kümesiyle, bunlarla bağlantılı oklar (veya dallar) kümesinin oluşturduğu yapı şeklinde tanımlanabilir ve (N,A)
DetaylıZaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması
Zaman Serileri Madenciliği Kullanılarak Nüfus Artışı Tahmin Uygulaması Maltepe Üniversitesi, Yazılım Mühendisliği Bölümü, İstanbul zeynepguven@maltepe.edu.tr, turgaybilgin@maltepe.edu.tr Özet: Zaman serileri
DetaylıGörsel Programlama (COMPE 422) Ders Detayları
Görsel Programlama (COMPE 422) Ders Detayları Ders Adı Ders Kodu Dönemi Ders Saati Uygulama Saati Laboratuar Kredi AKTS Saati Görsel Programlama COMPE 422 Her İkisi 2 2 0 3 5 Ön Koşul Ders(ler)i Dersin
DetaylıKümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir
Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş
DetaylıVeri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi. Hazırlayan: Nury Amanmadov
Veri madenciliği sınıflandırma ve kümeleme teknikleri yardımıyla Wisconsin veriseti üzerinde Göğüs Kanseri Teşhisi Hazırlayan: Nury Amanmadov Göğüs Kanseri Nedir? Gögüs Kanseri göğüs hücrelerinde başlayan
DetaylıMATLAB a GİRİŞ. Doç. Dr. Mehmet İTİK. Karadeniz Teknik Üniversitesi Makine Mühendisliği Bölümü
MATLAB a GİRİŞ Doç. Dr. Mehmet İTİK Karadeniz Teknik Üniversitesi Makine Mühendisliği Bölümü İçerik: MATLAB nedir? MATLAB arayüzü ve Bileşenleri (Toolbox) Değişkenler, Matris ve Vektörler Aritmetik işlemler
DetaylıMATEMATİK MÜHENDİSLİĞİ BÖLÜMÜ
İSTANBUL TEKNİK ÜNİVERSİTESİ FEN EDEBİYAT FAKÜLTESİ MATEMATİK MÜHENDİSLİĞİ BÖLÜMÜ K-MEANS KÜMELEME ALGORİTMASININ GENETİK ALGORİTMA KULLANILARAK GELİŞTİRİLMESİ BİTİRME ÖDEVİ Yunus YÜNEL Tez Danışmanı:
DetaylıT.C. MALTEPE ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ YAZILIM MÜHENDİSLİĞİ LİSANS PROGRAMI. 2011-12 Bahar Yarıyılı
T.C. MALTEPE ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ YAZILIM MÜHENDİSLİĞİ LİSANS PROGRAMI 2011-12 Bahar Yarıyılı ALGORİTMA VE PROGRAMLAMA BİL 133 5 AKTS Kredisi 1. yıl 1. yarıyıl Lisans Zorunlu 4 saat/hafta
DetaylıDOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: MME 1001
Dersi Veren Birim: Metalurji ve Malzeme Mühendisliği Dersin Adı: INTRODUCTION TO MATERIALS ENGINEERING Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora) Lisans Dersin Kodu: MME 00 Dersin Öğretim
DetaylıYÖNEYLEM ARAŞTIRMASI - III
YÖNEYLEM ARAŞTIRMASI - III Prof. Dr. Cemalettin KUBAT Yrd. Doç. Dr. Özer UYGUN İçerik Bu bölümde eşitsizlik kısıtlarına bağlı bir doğrusal olmayan kısıta sahip problemin belirlenen stasyoner noktaları
DetaylıULAŞTIRMA MODELİ VE ÇEŞİTLİ ULAŞTIRMA MODELLERİ
ULAŞTIRMA MODELİ VE ÇEŞİTLİ ULAŞTIRMA MODELLERİ Özlem AYDIN Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü ULAŞTIRMA MODELİNİN TANIMI Ulaştırma modeli, doğrusal programlama probleminin özel bir şeklidir.
DetaylıAPI v1.0 http://www.gazisms.com
API v1.0 http://www.gazisms.com GaziSMS API, GaziSMS müşterilerinin kendi geliştirdikleri programlar içerisinden SMS göndermelerine olanak sağlayan bir program parçasıdır. GaziSMS API kendisine gönderilen
Detaylıİleri Algoritma (COMPE 574) Ders Detayları
İleri Algoritma (COMPE 574) Ders Detayları Ders Adı Ders Kodu Dönemi Ders Saati Uygulama Saati Laboratuar Saati Kredi AKTS İleri Algoritma COMPE 574 Güz 3 0 0 3 7.5 Ön Koşul Ders(ler)i Dersin Dili Dersin
DetaylıK-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ
Fen Bilimleri Enstitüsü Dergisi, 22 (2) -8 Marmara Üniversitesi K-MEANS VE AŞIRI KÜRESEL C-MEANS ALGORITMALARI İLE BELGE MADENCİLİĞİ Meltem IŞIK ve Ali Yılmaz ÇAMURCU 2 Şişli Endüstri Meslek Lisesi, Bilgisayar
DetaylıVeri Madenciliği Süreci
Veri Madenciliği Eda Coşlu Mehmet Akif Ersoy Üniversitesi, Yönetim Bilişim Sistemleri Bölümü, BURDUR edacoslu@hotmail.com Büyük miktardaki veriler içerisinden önemli olanlarını bulup çıkarmaya Veri Madenciliği
DetaylıKimya Mühendisliğinde Uygulamalı Matematik
Fen Bilimleri Enstitüsü Kimya Mühendisliği Anabilim Dalı Kimya Mühendisliğinde Uygulamalı Matematik DERS BİLGİ FORMU DERS BİLGİLERİ Dersin Adı Kodu Yarıyıl Kimya Mühendisliğinde Uygulamalı Matematik T
Detaylı4.1. Grafik Sihirbazını kullanarak grafik oluşturma
BÖLÜM14 4. EXCEL DE GRAFİK Excel programının en üstün özelliklerinden bir diğeri de grafik çizim özelliğinin mükemmel olmasıdır. Excel grafik işlemleri için kullanıcıya çok geniş seçenekler sunar. Excel
DetaylıALTIN ORAN ARAMA (GOLDEN SECTION SEARCH) METODU
ALTIN ORAN ARAMA (GOLDEN SECTION SEARCH) METODU Tek değişkenli bir f(x) fonksiyonunu ele alalım. [Bazı x ler için f (x) bulunamayabilir.] Aşağıdaki DOP modelini çözmek istediğimizi var sayalım. Max f(x)
Detaylı