Veri madenciliği yöntemleri

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Veri madenciliği yöntemleri"

Transkript

1 Sınıflandırma ve Kümeleme Kavramları Giriş Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemi sınıflandırma olarak adlandırılır, veri madenciliği tekniklerinden en çok bilinenidir; veri tabanlarındaki gizli örüntüleri açığa çıkarmakta kullanılır. Kümeleme ise verinin kendi içindeki benzerliklerin göz önüne alınarak gruplandırılması işlemidir. Veri madenciliği yöntemleri Veri madenciliğinde kullanılan çok sayıda yöntem vardır. Bu yöntemlerin çoğu istatiksel tabanlıdır. Temel olarak üç gruba ayırabiliriz: Sınıflandırma(Classification) Kümeleme(Clustering) Birliktelik kuralları (Association rules)

2 Gözetimli öğrenme(supervised learning) ve Gözetimsiz öğrenme(unsupervised learning) Elimizdeki verinin sınıf sayısı belli, hangi girdilerin hangi sonuçları ürettiği mevcutsa ve bu bilgileri kullanarak bir öğrenme yapılıyorsa bu gözetimli(supervised) öğrenmeye girmektedir. Sınıflandırma işlemi örnek olarak verilebilir. Fakat elimizdeki verinin kaç sınıfa ayrıldığını, girdilerin hangi sonuçları ürettiğini bilmeden yani ham veriden bir anlam çıkarmaya çalışılıyorsa bu işlem gözetimsiz (unsupervised) öğrenmedir. Kümeleme işlemi örnek olarak verilebilir. Sınıflandırma(Classification) nedir? Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemine sınıflandırma denir. Veri madenciliğinde sıkça kullanılan bir yöntemdir. Veri tabanındaki gizli örüntüleri ortaya çıkarmakta kullanılır. Resim, örüntü tanıma, dolandırıcılık tespiti, kalite kontrol çalışmaları ve pazarlama alanlarında sınıflandırma tekniği sıkça kullanılır. Verinin sınıflandırılması için belirli bir süreç izlenir. Öncelikle var olan veri tabanının bir kısmı eğitim amacıyla kullanılarak sınıflandırma kurallarının oluşturulması sağlanır. Sınıflandırma süreci Verinin sınıflandırılma süreci iki adımdan oluşur. a) İlk adım, veri kümesine uygun bir modelin ortaya konulmasıdır.

3 Söz konusu model, veri tabanındaki kayıtların öznitelikleri kullanılarak gerçekleştirilir. Sınıflandırma modelinin elde edilmesi için veri tabanının belli bir kısmı eğitim verisi olarak kullanılır. Eğitim verisi veri tabanından rastgele seçilir. Veriye bir sınıflandırma algoritması uygulanarak sınıflama modeli elde edilir. Eğitim verisi Müşteri Borç Gelir Risk Mehmet Yüksek Yüksek Kötü Ece Yüksek Yüksek Kötü Ali Düşük Yüksek İyi Ayşe Yüksek Düşük Kötü Sinem Düşük Yüksek İyi Ahmet Düşük Düşük Kötü Eğitim verisine sınıflandırma algoritması uygulanır. Sınıflayıcı model Eğer borç = yüksek ise risk= kötü; Eğer borç = düşük ve gelir = düşük ise risk = kötü; Eğer borç = düşük ve gelir= yüksek ise risk= iyi; b) Test verisine dayanılarak sınıflandırma kuralları belirlenir. Söz konusu kurallar bu kez test verisine uygulanarak sınanır. Test verisi

4 Müşteri Borç Gelir Risk Alp Yüksek Düşük Kötü Merve Düşük Yüksek İyi Elif Düşük Düşük Kötü Cem Yüksek Yüksek Kötü Sınıflayıcı model Eğer borç = yüksek ise risk= kötü; Eğer borç = düşük ve gelir = düşük ise risk = kötü; Eğer borç = düşük ve gelir= yüksek ise risk= iyi; Kredi talep eden yeni müşteri Müşteri Borç Gelir Risk Hakan Düşük Yüksek? Risk = iyi Sınıflandırma Yöntemleri Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler: k en-yakın komşu (Instance Based Methods- k nearest neighbor) Bayes Sınıflandırıcı (Bayes Classifier) Yapay Sinir Ağları (Artificial Neural Networks) Genetik Algoritmalar (Genetic Algorithms) Karar Ağaçları(decision tree) ile sınıflandırma Karar ağaçları gözetimli öğrenme için çok yaygın bir yöntemdir.

5 Algoritmanın adımları: T öğrenme kümesini oluştur T kümesindeki örnekleri en iyi ayıran niteliği belirle Seçilen nitelik ile ağacın bir düğümünü oluştur ve bu düğümden çocuk düğümleri veya ağacın yapraklarını oluştur. Çocuk düğümlere ait alt veri kümesinin örneklerini belirle 3. adımda yaratılan her alt veri kümesi için Örneklerin hepsi aynı sınıfa aitse Örnekleri bölecek nitelik kalmamışsa Kalan niteliklerin değerini taşıyan örnek yoksa işlemi sonlandır. Diğer durumda alt veri kümesini ayırmak için 2. adımdan devam et. K- en yakın komşu(k nearest neighborhood) ile sınıflandırma Bütün örnekler n boyutlu uzayda bir nokta olarak alınır. Öklid mesafesi kullanılarak en yakın komşu belirlenir, dist(x 1,X 2 ) Hangi sınıfa ait olduğu bilinmeyen X q örneği, kendisine en yakın k örneğin sınıfına aittir denir. Örneğin xq noktasına en yakın beş komşu değerinden üç tanesi (-), iki tanesi (+) ise K =5 için bakıldığında xq (-) değerinde olur. Bayes Sınıflandırıcılar(Bayes Classifier) Bayes Sınıflayıcı Bayes teoremine göre istatistiksel kestirim yapar. Bir örneğin sınıf üyelik olasılığını kestirir. Naïve

6 Bayesian sınıflandırıcı (simple Bayesian classifier) oldukça başarılı bir sınıflayıcıdır. Bayes Kuralı p(x Cj) : Sınıf j den bir örneğin x olma olasılığı P(Cj) : Sınıf j nin ilk olasılığı p(x) : Herhangi bir örneğin x olma olasılığı P(Cj x) : x olan bir örneğin sınıf j den olma olasılığı (son olasılık) T öğrenme kümesinde bulunan her örnek n boyutlu uzayda tanımlı olsun, X = (x 1, x 2,, x n ) Veri kümesinde m adet sınıf bulunuyor olsun, C 1, C 2,, C m Sınıflamada son olasılığı en büyütme aranır ( the maximal P(C i X) ) Bayes teoreminden türetilebilir. P(X) olasılıgı bütün sınıflar için sabit olduğuna göre, sadece değer aranır. olasılığı için en büyük Eğer bu basitleştirilmiş ifadede bütün özellikler bağımsız ise

7 P(X C i ) aşağıdaki şekilde yazılabilir. Böylece hesap karmaşıklığı büyük ölçüde azaltılmış olur. Avantajları : Gerçekleşmesi kolaydır Çoğu durumda iyi sonuç verir. Dezavantajları: Varsayım: sınıf bilgisi verildiğinde niteliklerin bağımsız olması ve gerçek hayatta değişkenlerin birbirine bağımlı olması Değişkenler arası ilişkinin modellenememesi Kümeleme(Clustering) nedir? Kümeleme birbirlerine benzeyen veri parçalarını ayırma işlemidir. Kümeleme yöntemlerinin çoğu veri arasındaki uzaklıkları kullanır. Örneğin Öklid, manhattan ve minkowski uzaklık bağıntıları kümeleme işleminde alt işlem olarak kullanılır. Kümeleme yöntemlerinden en bilinenleri en yakın komşu algoritması ve en uzak komşu algoritmasıdır; bunlar hiyerarşik kümeleme yöntemleri olarak da bilinir. Hiyerarşik olmayan kümeleme yöntemleri arasında k-ortalamalar yöntemi sayılabilir. Uzaklık ölçüleri Kümeleme yöntemlerinin birçoğu, gözlem değerleri arasındaki uzaklıkların hesaplanması esasına dayanmaktadır. Bu nedenle

8 iki nokta arasındaki uzaklığı hesaplayan bağıntılara ihtiyaç duyulmaktadır. Bu bağıntılardan üç tanesi şunlardır: a) Öklid uzaklığı b) Manhattan uzaklığı c) Minkowski uzaklığı Öklid uzaklığı Uygulamada en çok kullanılan uzaklık ölçüsüdür. Bu uzaklık Pisagor teoreminin bir uygulamasıdır. Manhattan uzaklığı ve Minkowski uzaklığı Manhattan uzaklığı, gözlemler arasındaki mutlak uzaklıkların toplamı alınarak hesaplanır. Ve şu şekilde ifade edilir: P sayıda değişken göz önüne alınarak gözlem değerleri arasındaki uzaklığın hesaplanmasında minkowski uzaklık bağıntısı kullanılabilir.

9 Kümeleme(Clustering) Yöntemleri K-Means(k-ortalama) Kümeleme Hierarşik Kümeleme Yapay Sinir Ağları (SOM-Self Organized Feature Map) Genetik Algoritmalar K-Ortalama(K- means) Algoritması K Ortalama algoritması sürekli olarak kümelerin yenilendiği ve en uygun çözüme ulaşana kadar devam eden döngüsel bir algoritmadır. Bölümlemeli algoritmaların tipik özelliklerini taşır. İlk olarak 1967 yılında K- Ortalama algoritması ortaya atılmıştır[macqueen, 1967]. K Ortalama algoritması eldeki verileri k adet kümede ve kümelerin ortalamalarına göre kümelere ayırır. K küme sayısı kullanıcı tarafından verilir. Algoritmanın kaba kodu aşağıdaki gibidir: Girdiler: D ={t1,t2, tn} // eldeki veri tabanı K// verilen küme sayısı Adımlar: 1. Keyfi olarak m1,m2 m_kortalama belirle.

10 2. Her bir ti yi en yakın olduğu mi nin kümesine ata. 3. Kümelere ait m1,m2 m_k değerlerini yeniden hesapla. 4. Küme elemanlarında herhangi bir değişiklik yoksa dur. 5. İlk adımdan itibaren tekrar et. K-ortalama(k-means) örneği İlk adım olarak başlangıç değeri belirliyoruz. K=2 için birbirine uzak iki küme belirliyoruz. Nesneler arasındaki uzaklığı Öklid uzaklık bağıntısıyla buluyoruz. Örneğin Nesne 1 ile Nesne 2 arasındaki uzaklığı hesaplayalım. KareKök((1-1.5))^2+ (1-2))^2) = Tüm nesneler arasındaki uzaklığı hesapladıktan sonra en uzak iki nesneyi seçtik. Adım 2: Her nesneyi en uygun gruba ata ve her atama işleminden sonra atama yapılan k kitle merkezini hesapla. İterasyon

11 Nesne 1 ve Nesne 4 centroid(kitle noktası) olarak belirlendikleri için direkt gruplarına eklenirler. Nesneler için tekrar öklid uzaklıkları hesaplanır. Ancak öklid uzaklığı hesaplanırken her seferinde yeni centroid noktaları da hesaplanır. Yeni centroid noktası hesaplanırken küme elemanlarının aynı koordinatlarının değerleri toplamı bölü nesne sayısı şeklinde hesaplanmıştır. Örneğin Nesne 2 için birinci centroid e uzaklı iken ikinci centroid e uzaklık tür. Buna göre centroid biri seçeriz. Yeni centroid noktası X için (1+1.5)/2 = ve Y için (1+2)/2 = 1.5 tur. Tüm nesneler için işlemler yapıldıktan sonra gruplar ve yeni centroid(kitle) değerleri de ortaya çıkmıştır. İkinci iterasyonla tekrar bir grupları oluşturalım. Bunun için bir önceki iterasyonun centroid değerlerini alıyoruz. Tüm nesneler için tekrar grup belirleme işlemi yapıyoruz.

12 İki iterasyonun son bölümünde oluşan grupları kıyasladığımızda bir farklılık olduğunu görürüz. 3 nolu nesne ikinci kümeye girmeye karar vermiş. Bu durumda tekrar adım 2 ye döneriz. Adım 3: Yeni oluşan grubu geçmişteki grup ile kıyasla. Grupta değişim yok ise algoritmayı bitir, aksi takdirde adım 2 ye geri dön (1 defa adım 2 ye döndük). 3. iterasyon sonunda gruplarda değişim olmaz. Bu durumda algoritma sonladırılır. En son oluşan centroid değerleri küme 1 için (1.3, 1.5) iken küme 2 için (3.9, 5.1) dir. K ortalama algoritması sadece sayısal verilerde kullanılabilir; kategorik verilerde kullanılamaz. Çünkü bu verilerden elde edilecek ortalamalar bir kümeyi diğerinden ayıran anlamlı sayılar olmayacaktır. Sadece dışbükey şeklindeki kümelerin tespit edilmesinde kullanılabilir. Gürültülü ve uçtaki verilerden oldukça etkilenir.

13 En yakın komşu(k-nearest neighborhood) algoritması En yakın komşu yöntemine tek bağlantılı kümeleme yöntemi de denilmektedir. Başlangıçta tüm gözlem değerleri birer küme olarak değerlendirilir. Adım adım bu kümeler birleştirilerek yeni kümeler elde edilir. Bu yöntemle öncelikle gözlemler arasındaki uzaklıklar belirlenir. Şekilde k- en yakın komşu algoritmasının kümeleme aşamaları basitçe gösterilmiştir. Birliktelik kuralları(association rules) Veri tabanındaki bilgi miktarı arttıkça kurumlar sahip oldukları bilgiler arasında ilişkileri ortaya çıkarıp önemli sonuçlar elde etmişlerdir. İlişki analizi veri tabanındaki bir dizi bilgi ya da kaydın diğer kayıtlarla olan bağlantısını açıklayan işlemler dizisidir. Bir kayıt varken, herhangi bir başka kaydın var olma olasılığı nedir? Ya da bu iki kayıt varken, diğer üçüncü bir kaydın veri tabanına girme olasılığı nedir? İlişki analizi bu tür soruların cevaplarını verir ve verilerin birlikte olan

14 kurallarını ortaya çıkarır. İlişki analizi satış pazarlama, ürün katalog tasarımı gibi birçok alanda kullanılır. Örnek : Kola satın alan müşteriler 40% olasılıkla patates cipsi de alırlar. Birliktelik kuralları için kullanılan çok farklı algoritmalar bulunmaktadır. Bunlardan bazıları aşağıdaki gibidir. AIS: Agrawal tarafından 1993 yılında geliştirilmiştir, Apriori: Agrawal ve Srikant tarafından 1994 yılında geliştirilmiştir, SETM: Houtsma ve Swami tarafından 1995 yılında geliştirilmiştir, Partition: Savasere tarafından 1995 yılında geliştirilmiştir, FP-Growth: Han P.,Pei J.,Yin Y. Tarafından 2000 yılında geliştirilmiştir, RARM (Rapid Association Rule Mining): Das tarafından 2001 yılında geliştirilmiştir, CHARM: Zaki ve Hsiao tarafından 2002 yılında geliştirilmiştir. Bu algoritmalardan ilki AIS, en bilineni Apriori Algoritması dır Birliktelik kuralının matematiksel modeli Agrawal, Imielinski ve Swami tarafından 1993 yılında ortaya çıkarılmıştır. Birliktelik Kuralları nda Kullanılan Temel Kavramlar; Öğeler Kümesi (itemset): Bir veya daha çok öğeden oluşan kümedir. Destek sayısı (support count): Öğeler kümesinin veri kümesinde görülme sıklığıdır. Destek(support): Veride bağıntının ne kadar sık olduğunu tanımlar, öğeler kümesinin içinde bulunduğu birlikteliklerin

15 toplam birliktelik sayısına oranıdır. Destek(A=>B) şeklinde gösterilmektedir. Güven (confidence) : A malını almış bir kişinin B malını alma olasılığını vermektedir. Öğeler arasındaki birlikteliklerin doğruluğunu ifade etmektedir. Güven(A=>B) şeklinde gösterilmektedir. Yaygın öğeler (frequent itemsest): Destek değeri minimum destek değerinden büyük ya da eşit olan öğeler kümesidir. Destek (A)= Destek (A=>B)= Güven (A=>B)= Olasılık(B A) Yaygın Öğeler; 1-Elemanlı Öğeler Kümesi {Süt}à Destek Sayısı(Süt)=4; Tablo 1 deki örneğe göre 5 Pazar sepetinin 4 ünde {Süt} ürünü satın alınmış, bu yüzden {Süt} ürününün destek sayısı 4 dür. {Ekmek}-> Destek Sayısı(Ekmek)=3 {Yumurta}-> Destek Sayısı(Yumurta)=3 {Peynir}-> Destek Sayısı(Peynir)=3 Tablo1: farklı zamanlarda oluşturulmuş Pazar sepetleri A1 A2 A3 A4 Süt, Ekmek Ekmek, Yumurta Süt, Peynir Yumurta, Ekmek, Peynir, Süt A5 Peynir, Yumurta, Süt 2-Elemanlı Öğeler Kümesi

16 {Süt, Ekmek}-> Destek Sayısı(Süt, Ekmek)=2 {Ekmek, Yumurta}-> Destek Sayısı(Ekmek, Yumurta)=2 {Süt, Peynir}-> Destek Sayısı(Süt, Peynir)=3 {Yumurta, Peynir}-> Destek Sayısı(Yumurta, Peynir)=2 {Yumurta, Süt}-> Destek Sayısı(Yumurta, Süt)=2 3-Elemanlı Kümeler {Yumurta, Ekmek, Peynir}-> Destek Sayısı(Yumurta, Ekmek, Peynir)=1 {Yumurta, Ekmek, Süt}-> Destek Sayısı(Yumurta, Ekmek, Süt)=1 {Ekmek, Peynir, Süt}-> Destek Sayısı(Ekmek, Peynir, Süt)=1 {Peynir, Yumurta, Süt}-> Destek Sayısı(Peynir, Yumurta, Süt)=2 4-Elemanlı Kümeler {Yumurta, Ekmek, Peynir, Süt}-> Destek Sayısı(Yumurta, Ekmek, Peynir, Süt)=1 Hesaplamalar yapılırken minimum destek sayısı filtresi verilebilir. Örneğin minimum destek sayısı filtresi 2 ise hesaplamalara destek sayısı 1 olanlar dahil edilmez. Destek ve Güven sayılarının nasıl hesaplandığı aşağıdaki örnek ile anlaşılabilir: Destek({Yumurta}=>{Peynir})= Destek Sayısı(Yumurta,Peynir)/Toplam Alışveriş Sayısı=2/5 Güven ({Peynir, Süt}=>{Yumurta})=Destek Sayısı(Peynir,Yumurta,Süt)/Destek Sayısı(Peynir,Süt)=2/3 Bütün yaygın öğe kümeleri oluşturulduktan sonra minimum destek sayısı ve minimum güven değerlerine eşit ve büyük olan kümeler yaygın öğeler kümesine dahil edilir ve birliktelik kuralları oluşturulur.

17 Destek ve güven değerleri 0 ile 1 arasında değişmektedir. 1 e ne kadar yakınlarsa aralarındaki ilişki o kadar güçlüdür denilebilir. Güven değeri %100 ise kural kesin dir. Bu yüzden minimum güven kriterinin büyük verilmesi doğru sonucu vermesi açısından önemlidir. İki öğenin birlikteliğinin kesine yakın olabilmesi için hem destek hem de güven kriterinin yüksek olması gerekmektedir. Ayrıca minimum destek değeri küçük belirlenirse yöntem karmaşıklaşır ve çok sayıda yaygın öğe kümesi elde edilir. Kaynakça 1. Silahtaroğlu Gökhan Veri madenciliği kavram ve algoritmaları, papatya yayınları. 2. Özkan Yalçın Veri madenciliği yöntemleri, papatya yayınları. 3. Şadi evren şeker veri madenciliği youtube videoları: =PLh9ECzBB8tJNScCBWJFoMdpMkCdpnwUEl 4. ervised-ve-gozetimsiz-unsupervised-ogrenme-learningnedir/ 5. alari-k-means-algoritmasi 6.

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan

Detaylı

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME YZM 317 YAPAY ZEKA DERS#10: KÜMELEME Sınıflandırma (Classification) Eğiticili (supervised) sınıflandırma: Sınıflandırma: Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz (unsupervised)

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA

YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA Makine Öğrenmesi Çok büyük miktardaki verilerin elle işlenip analiz edilmesi mümkün değildir. Bu tür problemlere çözüm bulmak amacıyla makine öğrenmesi

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5

Detaylı

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama

Detaylı

Makine Öğrenmesi 2. hafta

Makine Öğrenmesi 2. hafta Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde

Detaylı

CBS ve Coğrafi Hesaplama

CBS ve Coğrafi Hesaplama Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr

Detaylı

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Birliktelik Kurallarının Tanımı Destek ve Güven Ölçütleri Apriori Algoritması Birliktelik Kuralları (Association

Detaylı

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir

Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi

Detaylı

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Birliktelik Kuralları Birliktelik Kurallarının Temelleri Support ve Confidence Apriori Algoritması

Detaylı

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları 1 Veri Tabanı, Veri Ambarı, Veri Madenciliği Bilgi Keşfi Aşamaları Apriori Algoritması Veri Madenciliği Yöntemleri Problemler Veri Madenciliği Uygulama Alanları 2 Bir bilgisayarda sistematik şekilde saklanmış,

Detaylı

Kümeleme Algoritmaları. Tahir Emre KALAYCI

Kümeleme Algoritmaları. Tahir Emre KALAYCI Tahir Emre KALAYCI 2010 Gündem En önemli gözetimsiz öğrenme (unsupervised learning) problemi olarak değerlendirilmektedir Bu türdeki diğer problemler gibi etiketsiz veri kolleksiyonları için bir yapı bulmakla

Detaylı

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ 127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi

Detaylı

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL VERİ MADENCİLİĞİ Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL SPRINT Algoritması ID3,CART, ve C4.5 gibi algoritmalar önce derinlik ilkesine göre çalışırlar ve en iyi dallara ayırma kriterine

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

Görüntü Sınıflandırma

Görüntü Sınıflandırma Görüntü Sınıflandırma Chapter 12 https://www.google.com.tr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0 CBwQFjAA&url=http%3A%2F%2Ffaculty.une.edu%2Fcas%2Fszeeman%2Frs%2Flect%2FCh%2 52012%2520Image%2520Classification.ppt&ei=0IA7Vd36GYX4Uu2UhNgP&usg=AFQjCNE2wG

Detaylı

Birliktelik Kuralları Analizi. Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT

Birliktelik Kuralları Analizi. Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT İş Zekası Çözümleri için i Çok Boyutlu Birliktelik Kuralları Analizi Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT İçerik 1 Veri Madenciliği 2 Birliktelik Kuralları Analizi 3 Uygulama 4 Algoritma 5 Sonuçlar

Detaylı

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II-

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II- Dr. Yalçın ÖZKAN Dr. Yalçın ÖZKAN PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Ankara Caddesi, Prof. Fahreddin Kerim Gökay Vakfı İşhanı Girişi, No: 11/3, Cağaloğlu (Fatih)/İstanbul Tel

Detaylı

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça.

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça. Apriori Algoritması Konu İçeriği Giriş Tarihçesi Apriori Nedir? Örnekler Algoritma Açıklama Weka İle Kullanımı Kaynakça Giriş Veri madenciliğinde kullanılan ve veri kümeleri veya veriler arasındaki ilişkiyi

Detaylı

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan.   blog.mustafabaydogan. Veri Madenciliği Yrd. Doç. Dr. Mustafa Gökçe Baydoğan mustafa.baydogan@boun.edu.tr www.mustafabaydogan.com blog.mustafabaydogan.com İçerik p Veri Madenciliği nedir? n Bir örnek p Boğaziçi Üniversitesi

Detaylı

Fonksiyon Optimizasyonunda Genetik Algoritmalar

Fonksiyon Optimizasyonunda Genetik Algoritmalar 01-12-06 Ümit Akıncı Fonksiyon Optimizasyonunda Genetik Algoritmalar 1 Fonksiyon Optimizasyonu Fonksiyon optimizasyonu fizikte karşımıza sık çıkan bir problemdir. Örneğin incelenen sistemin kararlı durumu

Detaylı

Veri Madenciliği Süreci

Veri Madenciliği Süreci Veri Madenciliği Eda Coşlu Mehmet Akif Ersoy Üniversitesi, Yönetim Bilişim Sistemleri Bölümü, BURDUR edacoslu@hotmail.com Büyük miktardaki veriler içerisinden önemli olanlarını bulup çıkarmaya Veri Madenciliği

Detaylı

APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ

APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ Murat KARABATAK 1, Melih Cevdet İNCE 2 1 Fırat Üniversitesi Teknik Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Bölümü 2 Fırat Üniversitesi Mühendislik

Detaylı

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları. Neleri göreceğiz?

Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları. Neleri göreceğiz? KÜMELEME Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları Neleri göreceğiz? Tanımı Veriyi birbirlerine benzeyen elemanlardan oluşan kümelere ayırarak, heterojen bir

Detaylı

Veri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir.

Veri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir. Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)

Detaylı

Büyük Veri Analitiği (Big Data Analytics)

Büyük Veri Analitiği (Big Data Analytics) Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David

Detaylı

BÖLÜM III: Şebeke Modelleri. Şebeke Kavramları. Şebeke Kavramları. Şebeke Kavramları. Yönlü Şebeke (Directed Network) Dal / ok

BÖLÜM III: Şebeke Modelleri. Şebeke Kavramları. Şebeke Kavramları. Şebeke Kavramları. Yönlü Şebeke (Directed Network) Dal / ok 8.0.0 Şebeke Kavramları BÖLÜM III: Şebeke Modelleri Şebeke (Network) Sonlu sayıdaki düğümler kümesiyle, bunlarla bağlantılı oklar (veya dallar) kümesinin oluşturduğu yapı şeklinde tanımlanabilir ve (N,A)

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

Gözetimli & Gözetimsiz Öğrenme

Gözetimli & Gözetimsiz Öğrenme Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)

Detaylı

inde Sepet Analizi Uygulamaları Market Basket Analysis for Data Mining

inde Sepet Analizi Uygulamaları Market Basket Analysis for Data Mining Veri Madenciliğ inde Sepet Analizi Uygulamaları Market Basket Analysis for Data Mining Mehmet Aydın Ula ş, Ethem Alpaydın (Boğaziçi Üniversitesi Bilgisayar Mühendisliği) Nasuhi Sönmez, Ataman Kalkan (GİMA

Detaylı

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ YAPAY SİNİR AĞLARI Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ İÇERİK Sinir Hücreleri Yapay Sinir Ağları Yapısı Elemanları Çalışması Modelleri Yapılarına Göre Öğrenme Algoritmalarına Göre Avantaj ve

Detaylı

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri Veri modelleri, veriler arasında ilişkisel ve sırasal düzeni gösteren kavramsal tanımlardır. Her program en azından bir veri modeline dayanır. Uygun

Detaylı

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi

Detaylı

İlişkilendirme kurallarının kullanım alanları

İlişkilendirme kurallarının kullanım alanları Bölüm 4. Birliktelik Kuralları http://ceng.gazi.edu.tr/~ozdemir İlişkilendirme/Birliktelik Kuralları - Association Rules Birliktelik kuralları olarak da bilinir İlişkilendirme kuralı madenciliği Veri kümesi

Detaylı

SOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL

SOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL SOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL Open Access Refereed E-Journal & Refereed & Indexed ISSN: 2630-631X Social Sciences Indexed www.smartofjournal.com / editorsmartjournal@gmail.com December

Detaylı

Hafta 05 - Karar Ağaçları/Kümeleme

Hafta 05 - Karar Ağaçları/Kümeleme BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler

Detaylı

VERİ MADENCİLİĞİ Kavram ve Algoritmaları

VERİ MADENCİLİĞİ Kavram ve Algoritmaları VERİ MADENCİLİĞİ Kavram ve Algoritmaları Doç. Dr. Gökhan SİLAHTAROĞLU PAPATYA YAYINCILIK EĞİTİM İstanbul, Ankara, İzmir, Adana PAPATYA YAYINCILIK EĞİTİM BİLGİSAYAR SİS. SAN. VE TİC. A.Ş. İnönü Cad. Hacıhanım

Detaylı

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme

BAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme BAYES ÖĞRENMESİ Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ Yapay Zeka-Bayes Öğrenme 1 İÇERİK Bayes Teoremi Bayes Sınıflandırma Örnek Kullanım Alanları Avantajları Dezavantajları Yapay Zeka-Bayes Öğrenme

Detaylı

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı Veri Madenciliği, örüntü tanıma, istatistik ve matematiksel yöntemlerin kullanımıyla devasa miktardaki güncel ya da geçmiş veri içerisinden ilgi çekici ( önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel

Detaylı

Türkçe Dokümanlar Ġçin Yazar Tanıma

Türkçe Dokümanlar Ġçin Yazar Tanıma Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:

Detaylı

Uzaktan Algılama Uygulamaları

Uzaktan Algılama Uygulamaları Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ

Detaylı

Algoritma ve Programlamaya Giriş

Algoritma ve Programlamaya Giriş Algoritma ve Programlamaya Giriş Algoritma Bir sorunu çözebilmek için gerekli olan sıralı ve mantıksal adımların tümüne Algoritma denir. Doğal dil ile yazılabilir. Fazlaca formal değildir. Bir algoritmada

Detaylı

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR Aç Gözlü (Hırslı) Algoritmalar (Greedy ) Bozuk para verme problemi Bir kasiyer 48 kuruş para üstünü nasıl verir? 25 kuruş, 10 kuruş,

Detaylı

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR VERİ MADENCİLİĞİ İSİMLER BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR MOLEKÜLER BİYOLOJİ ve GENETİK GEBZE TEKNİK ÜNİVERSİTESİ ARALIK 2015 İçindekiler ÖZET... iii 1.GİRİŞ... 1 1.1 Veri Ambarı, Veri

Detaylı

Olasılık, bir deneme sonrasında ilgilenilen olayın tüm olaylar içinde ortaya çıkma ya da gözlenme oranı olarak tanımlanabilir.

Olasılık, bir deneme sonrasında ilgilenilen olayın tüm olaylar içinde ortaya çıkma ya da gözlenme oranı olarak tanımlanabilir. 5.SUNUM Olasılık, bir deneme sonrasında ilgilenilen olayın tüm olaylar içinde ortaya çıkma ya da gözlenme oranı olarak tanımlanabilir. Günlük hayatta sıklıkla kullanılmakta olan olasılık bir olayın ortaya

Detaylı

Hafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları

Hafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları Hafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr

Detaylı

Destekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines)

Destekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines) Destekçi Vektör Makineleri Destekçi Vektör Makineleri(Support Vector Machines) Değişkenler arasındaki örüntülerin bilinmediği veri setlerindeki sınıflama problemleri için önerilmiş bir makine öğrenmesi

Detaylı

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu

Detaylı

Veri ve Metin Madenciliği. Zehra

Veri ve Metin Madenciliği. Zehra Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği

Detaylı

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Tek değişken için çizilen

Detaylı

Veri Madenciliği/E-Ticaret İçin Ürün Tavsiye Sistemi Geliştirilmesi

Veri Madenciliği/E-Ticaret İçin Ürün Tavsiye Sistemi Geliştirilmesi Veri Madenciliği/E-Ticaret İçin Ürün Tavsiye Sistemi Geliştirilmesi Elif Şafak SİVRİ Danışman Yrd. Doç. Mustafa Cem KASAPBAŞI Eş Danışman Doç. Dr. Fethullah KARABİBER YÜKSEK LİSANS TEZİ BİLGİSAYAR MÜHENDİSLİĞİ

Detaylı

Karar Ağacı Öğrenmesi(Decision Tree Learning)

Karar Ağacı Öğrenmesi(Decision Tree Learning) Karar Ağacı Öğrenmesi(Decision Tree Learning) Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt

Detaylı

Ağaç (Tree) Veri Modeli

Ağaç (Tree) Veri Modeli Ağaç (Tree) Veri Modeli 1 2 Ağaç Veri Modeli Temel Kavramları Ağaç, bir kök işaretçisi, sonlu sayıda düğümleri ve onları birbirine bağlayan dalları olan bir veri modelidir; aynı aile soyağacında olduğu

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Ders 1- Yapay Zekâya Giriş Erhan AKDOĞAN, Ph.D. Yapay Zekâ nedir?! İnsanın düşünme ve karar verme yeteneğini bilgisayarlar aracılığı ile taklit etmeye

Detaylı

tree) nedir? Karar Ağacı (Decision Decisiontree

tree) nedir? Karar Ağacı (Decision Decisiontree Karar Ağacı (Decision Decisiontree tree) nedir? Bir işletme yönetimi tarafından tercihlerin, risklerin, kazançların, hedeflerin tanımlanmasında yardımcı olabilen ve birçok önemli yatırım alanlarında uygulanabilen,

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Genetik Algoritma (Genetic Algorithm) Doç.Dr. M. Ali Akcayol Genetik Algoritma 1970 li yıllarda John Holland tarafından geliştirilmiştir. 1989 yılında David E. Goldberg Genetik

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Makine Öğrenmesi Erhan AKDOĞAN, Ph.D. Bu ders notunun hazırlanmasında Dr. U.Orhan ve Banu Diri nin ders notlarından yararlanılmıştır. Makine öğrenmesi

Detaylı

İleri Diferansiyel Denklemler

İleri Diferansiyel Denklemler MIT AçıkDersSistemi http://ocw.mit.edu 18.034 İleri Diferansiyel Denklemler 2009 Bahar Bu bilgilere atıfta bulunmak veya kullanım koşulları hakkında bilgi için http://ocw.mit.edu/terms web sitesini ziyaret

Detaylı

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma

Detaylı

Makine Öğrenmesi 3. hafta

Makine Öğrenmesi 3. hafta Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla

Detaylı

İSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.

İSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir. İSTATİSTİKSEL TAHMİNLEME Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir. 1 ŞEKİL: Evren uzay-örneklem uzay İstatistiksel tahmin

Detaylı

İSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI

İSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI İSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI Lineer Ayrılabilen Paternlerin Yapay Sinir Ağı ile Sınıflandırılması 1. Biyolojik Sinirin Yapısı Bilgi işleme

Detaylı

T.C. İSTANBUL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ

T.C. İSTANBUL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ T.C. İSTANBUL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ İŞ ZEKASI UYGULAMALARI VE PAZAR SEPETİ ANALİZİ Derya GÜNDÜZ Bilgisayar Mühendisliği Anabilim Dalı Bilgisayar Mühendisliği Programı

Detaylı

VERİ MADENCİLİĞİ MODELLERİ VE UYGULAMA ALANLARI

VERİ MADENCİLİĞİ MODELLERİ VE UYGULAMA ALANLARI VERİ MADENCİLİĞİ MODELLERİ VE UYGULAMA ALANLARI *Öğr. Gör. Serhat ÖZEKES Abstract: The major reason that data mining became one of the hottest current technologies of the information age is the wide availability

Detaylı

Görüntü Segmentasyonu (Bölütleme)

Görüntü Segmentasyonu (Bölütleme) Görüntü Segmentasyonu (Bölütleme) Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. 20 Aralık 2014 Cumartesi 1 Görüntü Segmentasyonu 20 Aralık 2014 Cumartesi 2 Gestalt kanunları Görüntü

Detaylı

İş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ

İş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ İş Zekası Hafta 6 Kestirimci Modelleme Teknikleri Business Intelligence and Analytics: Systems for Decision Support 10e isimli eserden adapte edilmiştir Bölüm Amaçları Yapay Sinir Ağları (YSA) kavramını

Detaylı

ISSN: El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 ( )

ISSN: El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 ( ) www.tubiad.org ISSN:2148-3736 El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 (315-323) El-Cezerî Journal of Science and Engineering Vol: 3, No: 2, 2016 (315-323) ECJSE Makale / Research Paper

Detaylı

Algoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması. Mustafa Kemal Üniversitesi

Algoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması. Mustafa Kemal Üniversitesi Algoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması Ağaç, verilerin birbirine sanki bir ağaç yapısı oluşturuyormuş gibi sanal olarak bağlanmasıyla elde edilen hiyararşik yapıya sahip

Detaylı

Mesleki Terminoloji II Veri Madenciliği

Mesleki Terminoloji II Veri Madenciliği Mesleki Terminoloji II Veri Madenciliği Burak Düşün - 14011055 Akif Berkay Gürcan - 14011023 Veri Madenciliği Nedir? Veri madenciliği, büyük miktarda verinin anlamlı örüntüler bulmak amacıyla otomatik

Detaylı

KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN

KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN Giriş Bilgi teknolojisindeki gelişmeler ve verilerin dijital ortamda saklanmaya başlanması ile yeryüzündeki bilgi miktarı her 20 ayda iki katına

Detaylı

EÜFBED - Fen Bilimleri Enstitüsü Dergisi Cilt-Sayı: 5-2 Yıl: 2012 191-212

EÜFBED - Fen Bilimleri Enstitüsü Dergisi Cilt-Sayı: 5-2 Yıl: 2012 191-212 EÜFBED - Fen Bilimleri Enstitüsü Dergisi Cilt-Sayı: 5-2 Yıl: 2012 191-212 BİRLİKTELİK KURALLARI İLE MEKÂNSAL-ZAMANSAL VERİ MADENCİLİĞİ SPATIO-TEMPORAL DATA MINING WITH ASSOCIATION RULES Muhammed Fatih

Detaylı

BİRLİKTELİK KURALI YÖNTEMİ İÇİN BİR VERİ MADENCİLİĞİ YAZILIMI TASARIMI VE UYGULAMASI

BİRLİKTELİK KURALI YÖNTEMİ İÇİN BİR VERİ MADENCİLİĞİ YAZILIMI TASARIMI VE UYGULAMASI İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi Yıl: 6 Sayı:12 Güz 2007/2 s. 21-37 BİRLİKTELİK KURALI YÖNTEMİ İÇİN BİR VERİ MADENCİLİĞİ YAZILIMI TASARIMI VE UYGULAMASI Feridun Cemal ÖZÇAKIR, A. Yılmaz

Detaylı

Genetik Algoritmalar. Bölüm 1. Optimizasyon. Yrd. Doç. Dr. Adem Tuncer E-posta:

Genetik Algoritmalar. Bölüm 1. Optimizasyon. Yrd. Doç. Dr. Adem Tuncer E-posta: Genetik Algoritmalar Bölüm 1 Optimizasyon Yrd. Doç. Dr. Adem Tuncer E-posta: adem.tuncer@yalova.edu.tr Optimizasyon? Optimizasyon Nedir? Eldeki kısıtlı kaynakları en iyi biçimde kullanmak olarak tanımlanabilir.

Detaylı

Metin Sınıflandırma. Akış

Metin Sınıflandırma. Akış Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle

Detaylı

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi

Detaylı

SÜREKLĠ OLASILIK DAĞILIMLARI

SÜREKLĠ OLASILIK DAĞILIMLARI SÜREKLĠ OLASILIK DAĞILIMLARI Sayı ekseni üzerindeki tüm noktalarda değer alabilen değişkenler, sürekli değişkenler olarak tanımlanmaktadır. Bu bölümde, sürekli değişkenlere uygun olasılık dağılımları üzerinde

Detaylı

İSTATİSTİK I KISA ÖZET KOLAYAOF

İSTATİSTİK I KISA ÖZET KOLAYAOF DİKKATİNİZE: BURADA SADECE ÖZETİN İLK ÜNİTESİ SİZE ÖRNEK OLARAK GÖSTERİLMİŞTİR. ÖZETİN TAMAMININ KAÇ SAYFA OLDUĞUNU ÜNİTELERİ İÇİNDEKİLER BÖLÜMÜNDEN GÖREBİLİRSİNİZ. İSTATİSTİK I KISA ÖZET KOLAYAOF 2 Kolayaof.com

Detaylı

Konular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi

Konular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi VERİ MADENCİLİĞİ Giriş Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Problem Tanımı Veri Madenciliği: Tarihçe teknolojinin gelişimiyle bilgisayar ortamında ve veritabanlarında tutulan veri miktarının da artması

Detaylı

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme

Detaylı

APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM

APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ Nesibe Yalçın 1 Emre Güngör 1 Nilüfer Yurtay ÖZET Bu çalışmada, Veri Madenciliği' nde Birliktelik Kuralı çıkarım algoritmalarından biri olan Apriori

Detaylı

Algoritma Geliştirme ve Veri Yapıları 10 Graf Veri Modeli. Mustafa Kemal Üniversitesi

Algoritma Geliştirme ve Veri Yapıları 10 Graf Veri Modeli. Mustafa Kemal Üniversitesi Algoritma Geliştirme ve Veri Yapıları 10 Graf Veri Modeli Graf, matematiksel anlamda, düğümler ve bu düğümler arasındaki ilişkiyi gösteren kenarlardan oluşan bir kümedir; mantıksal ilişki düğüm ile düğüm

Detaylı

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN Tanımlayıcı İstatistikler Yrd. Doç. Dr. Emre ATILGAN 1 Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri 2 3 Aritmetik Ortalama Aritmetik ortalama,

Detaylı

Esnek Hesaplamaya Giriş

Esnek Hesaplamaya Giriş Esnek Hesaplamaya Giriş J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Esnek Hesaplama Nedir? Esnek hesaplamanın temelinde yatan

Detaylı

KLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT

KLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT KLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT.. KENDİNE BENZERLİK VE AFİNİTE Fraktal özelliklerinden bir diğeri de kendine benzerlikdir. Geometrik açıdan, aynı şekle sahip olan geometrik şekiller birbirine

Detaylı

Akademik Personel ve Lisansüstü Eğitimi Giriş Sınavı. ALES / Đlkbahar / Sayısal II / 13 Mayıs Matematik Sorularının Çözümleri

Akademik Personel ve Lisansüstü Eğitimi Giriş Sınavı. ALES / Đlkbahar / Sayısal II / 13 Mayıs Matematik Sorularının Çözümleri Akademik Personel ve Lisansüstü Eğitimi Giriş Sınavı ALES / Đlkbahar / Sayısal II / 1 Mayıs 01 Matematik Sorularının Çözümleri 1. 9! 8! 7! 9! + 8! + 7! 7!.(9.8 8 1) 7!.(9.8+ 8+ 1) 6 81 9 7. 4, π, π π,14

Detaylı

VERİ MADENCİLİĞİ. İlişkilendirme Kuralları Bulma. Yaygın Nitelikler. İlişkilendirme Kuralları. nitelikler kümesi (Itemset) Destek s (Support)

VERİ MADENCİLİĞİ. İlişkilendirme Kuralları Bulma. Yaygın Nitelikler. İlişkilendirme Kuralları. nitelikler kümesi (Itemset) Destek s (Support) İlişkilendirme Kuralları Madenciliği VERİ MADENCİLİĞİ İlişkilendirme Kuralları Yrd. Doç. Dr. Şule Gündüz Öğüdücü İlişkilendirme kuralı madenciliği Veri kümesi içindeki yaygın örüntülerin, nesneleri oluşturan

Detaylı

BÖLÜM 13 HİPOTEZ TESTİ

BÖLÜM 13 HİPOTEZ TESTİ 1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin

Detaylı

Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir.

Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir. Veri Madenciliği Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir. istatistik + makine öğrenmesi + yapay zeka = veri madenciliği Veri madenciliği süreçleri CRISP-DM

Detaylı