Veri madenciliği yöntemleri
|
|
- Emel Kubat
- 5 yıl önce
- İzleme sayısı:
Transkript
1 Sınıflandırma ve Kümeleme Kavramları Giriş Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemi sınıflandırma olarak adlandırılır, veri madenciliği tekniklerinden en çok bilinenidir; veri tabanlarındaki gizli örüntüleri açığa çıkarmakta kullanılır. Kümeleme ise verinin kendi içindeki benzerliklerin göz önüne alınarak gruplandırılması işlemidir. Veri madenciliği yöntemleri Veri madenciliğinde kullanılan çok sayıda yöntem vardır. Bu yöntemlerin çoğu istatiksel tabanlıdır. Temel olarak üç gruba ayırabiliriz: Sınıflandırma(Classification) Kümeleme(Clustering) Birliktelik kuralları (Association rules)
2 Gözetimli öğrenme(supervised learning) ve Gözetimsiz öğrenme(unsupervised learning) Elimizdeki verinin sınıf sayısı belli, hangi girdilerin hangi sonuçları ürettiği mevcutsa ve bu bilgileri kullanarak bir öğrenme yapılıyorsa bu gözetimli(supervised) öğrenmeye girmektedir. Sınıflandırma işlemi örnek olarak verilebilir. Fakat elimizdeki verinin kaç sınıfa ayrıldığını, girdilerin hangi sonuçları ürettiğini bilmeden yani ham veriden bir anlam çıkarmaya çalışılıyorsa bu işlem gözetimsiz (unsupervised) öğrenmedir. Kümeleme işlemi örnek olarak verilebilir. Sınıflandırma(Classification) nedir? Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemine sınıflandırma denir. Veri madenciliğinde sıkça kullanılan bir yöntemdir. Veri tabanındaki gizli örüntüleri ortaya çıkarmakta kullanılır. Resim, örüntü tanıma, dolandırıcılık tespiti, kalite kontrol çalışmaları ve pazarlama alanlarında sınıflandırma tekniği sıkça kullanılır. Verinin sınıflandırılması için belirli bir süreç izlenir. Öncelikle var olan veri tabanının bir kısmı eğitim amacıyla kullanılarak sınıflandırma kurallarının oluşturulması sağlanır. Sınıflandırma süreci Verinin sınıflandırılma süreci iki adımdan oluşur. a) İlk adım, veri kümesine uygun bir modelin ortaya konulmasıdır.
3 Söz konusu model, veri tabanındaki kayıtların öznitelikleri kullanılarak gerçekleştirilir. Sınıflandırma modelinin elde edilmesi için veri tabanının belli bir kısmı eğitim verisi olarak kullanılır. Eğitim verisi veri tabanından rastgele seçilir. Veriye bir sınıflandırma algoritması uygulanarak sınıflama modeli elde edilir. Eğitim verisi Müşteri Borç Gelir Risk Mehmet Yüksek Yüksek Kötü Ece Yüksek Yüksek Kötü Ali Düşük Yüksek İyi Ayşe Yüksek Düşük Kötü Sinem Düşük Yüksek İyi Ahmet Düşük Düşük Kötü Eğitim verisine sınıflandırma algoritması uygulanır. Sınıflayıcı model Eğer borç = yüksek ise risk= kötü; Eğer borç = düşük ve gelir = düşük ise risk = kötü; Eğer borç = düşük ve gelir= yüksek ise risk= iyi; b) Test verisine dayanılarak sınıflandırma kuralları belirlenir. Söz konusu kurallar bu kez test verisine uygulanarak sınanır. Test verisi
4 Müşteri Borç Gelir Risk Alp Yüksek Düşük Kötü Merve Düşük Yüksek İyi Elif Düşük Düşük Kötü Cem Yüksek Yüksek Kötü Sınıflayıcı model Eğer borç = yüksek ise risk= kötü; Eğer borç = düşük ve gelir = düşük ise risk = kötü; Eğer borç = düşük ve gelir= yüksek ise risk= iyi; Kredi talep eden yeni müşteri Müşteri Borç Gelir Risk Hakan Düşük Yüksek? Risk = iyi Sınıflandırma Yöntemleri Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler: k en-yakın komşu (Instance Based Methods- k nearest neighbor) Bayes Sınıflandırıcı (Bayes Classifier) Yapay Sinir Ağları (Artificial Neural Networks) Genetik Algoritmalar (Genetic Algorithms) Karar Ağaçları(decision tree) ile sınıflandırma Karar ağaçları gözetimli öğrenme için çok yaygın bir yöntemdir.
5 Algoritmanın adımları: T öğrenme kümesini oluştur T kümesindeki örnekleri en iyi ayıran niteliği belirle Seçilen nitelik ile ağacın bir düğümünü oluştur ve bu düğümden çocuk düğümleri veya ağacın yapraklarını oluştur. Çocuk düğümlere ait alt veri kümesinin örneklerini belirle 3. adımda yaratılan her alt veri kümesi için Örneklerin hepsi aynı sınıfa aitse Örnekleri bölecek nitelik kalmamışsa Kalan niteliklerin değerini taşıyan örnek yoksa işlemi sonlandır. Diğer durumda alt veri kümesini ayırmak için 2. adımdan devam et. K- en yakın komşu(k nearest neighborhood) ile sınıflandırma Bütün örnekler n boyutlu uzayda bir nokta olarak alınır. Öklid mesafesi kullanılarak en yakın komşu belirlenir, dist(x 1,X 2 ) Hangi sınıfa ait olduğu bilinmeyen X q örneği, kendisine en yakın k örneğin sınıfına aittir denir. Örneğin xq noktasına en yakın beş komşu değerinden üç tanesi (-), iki tanesi (+) ise K =5 için bakıldığında xq (-) değerinde olur. Bayes Sınıflandırıcılar(Bayes Classifier) Bayes Sınıflayıcı Bayes teoremine göre istatistiksel kestirim yapar. Bir örneğin sınıf üyelik olasılığını kestirir. Naïve
6 Bayesian sınıflandırıcı (simple Bayesian classifier) oldukça başarılı bir sınıflayıcıdır. Bayes Kuralı p(x Cj) : Sınıf j den bir örneğin x olma olasılığı P(Cj) : Sınıf j nin ilk olasılığı p(x) : Herhangi bir örneğin x olma olasılığı P(Cj x) : x olan bir örneğin sınıf j den olma olasılığı (son olasılık) T öğrenme kümesinde bulunan her örnek n boyutlu uzayda tanımlı olsun, X = (x 1, x 2,, x n ) Veri kümesinde m adet sınıf bulunuyor olsun, C 1, C 2,, C m Sınıflamada son olasılığı en büyütme aranır ( the maximal P(C i X) ) Bayes teoreminden türetilebilir. P(X) olasılıgı bütün sınıflar için sabit olduğuna göre, sadece değer aranır. olasılığı için en büyük Eğer bu basitleştirilmiş ifadede bütün özellikler bağımsız ise
7 P(X C i ) aşağıdaki şekilde yazılabilir. Böylece hesap karmaşıklığı büyük ölçüde azaltılmış olur. Avantajları : Gerçekleşmesi kolaydır Çoğu durumda iyi sonuç verir. Dezavantajları: Varsayım: sınıf bilgisi verildiğinde niteliklerin bağımsız olması ve gerçek hayatta değişkenlerin birbirine bağımlı olması Değişkenler arası ilişkinin modellenememesi Kümeleme(Clustering) nedir? Kümeleme birbirlerine benzeyen veri parçalarını ayırma işlemidir. Kümeleme yöntemlerinin çoğu veri arasındaki uzaklıkları kullanır. Örneğin Öklid, manhattan ve minkowski uzaklık bağıntıları kümeleme işleminde alt işlem olarak kullanılır. Kümeleme yöntemlerinden en bilinenleri en yakın komşu algoritması ve en uzak komşu algoritmasıdır; bunlar hiyerarşik kümeleme yöntemleri olarak da bilinir. Hiyerarşik olmayan kümeleme yöntemleri arasında k-ortalamalar yöntemi sayılabilir. Uzaklık ölçüleri Kümeleme yöntemlerinin birçoğu, gözlem değerleri arasındaki uzaklıkların hesaplanması esasına dayanmaktadır. Bu nedenle
8 iki nokta arasındaki uzaklığı hesaplayan bağıntılara ihtiyaç duyulmaktadır. Bu bağıntılardan üç tanesi şunlardır: a) Öklid uzaklığı b) Manhattan uzaklığı c) Minkowski uzaklığı Öklid uzaklığı Uygulamada en çok kullanılan uzaklık ölçüsüdür. Bu uzaklık Pisagor teoreminin bir uygulamasıdır. Manhattan uzaklığı ve Minkowski uzaklığı Manhattan uzaklığı, gözlemler arasındaki mutlak uzaklıkların toplamı alınarak hesaplanır. Ve şu şekilde ifade edilir: P sayıda değişken göz önüne alınarak gözlem değerleri arasındaki uzaklığın hesaplanmasında minkowski uzaklık bağıntısı kullanılabilir.
9 Kümeleme(Clustering) Yöntemleri K-Means(k-ortalama) Kümeleme Hierarşik Kümeleme Yapay Sinir Ağları (SOM-Self Organized Feature Map) Genetik Algoritmalar K-Ortalama(K- means) Algoritması K Ortalama algoritması sürekli olarak kümelerin yenilendiği ve en uygun çözüme ulaşana kadar devam eden döngüsel bir algoritmadır. Bölümlemeli algoritmaların tipik özelliklerini taşır. İlk olarak 1967 yılında K- Ortalama algoritması ortaya atılmıştır[macqueen, 1967]. K Ortalama algoritması eldeki verileri k adet kümede ve kümelerin ortalamalarına göre kümelere ayırır. K küme sayısı kullanıcı tarafından verilir. Algoritmanın kaba kodu aşağıdaki gibidir: Girdiler: D ={t1,t2, tn} // eldeki veri tabanı K// verilen küme sayısı Adımlar: 1. Keyfi olarak m1,m2 m_kortalama belirle.
10 2. Her bir ti yi en yakın olduğu mi nin kümesine ata. 3. Kümelere ait m1,m2 m_k değerlerini yeniden hesapla. 4. Küme elemanlarında herhangi bir değişiklik yoksa dur. 5. İlk adımdan itibaren tekrar et. K-ortalama(k-means) örneği İlk adım olarak başlangıç değeri belirliyoruz. K=2 için birbirine uzak iki küme belirliyoruz. Nesneler arasındaki uzaklığı Öklid uzaklık bağıntısıyla buluyoruz. Örneğin Nesne 1 ile Nesne 2 arasındaki uzaklığı hesaplayalım. KareKök((1-1.5))^2+ (1-2))^2) = Tüm nesneler arasındaki uzaklığı hesapladıktan sonra en uzak iki nesneyi seçtik. Adım 2: Her nesneyi en uygun gruba ata ve her atama işleminden sonra atama yapılan k kitle merkezini hesapla. İterasyon
11 Nesne 1 ve Nesne 4 centroid(kitle noktası) olarak belirlendikleri için direkt gruplarına eklenirler. Nesneler için tekrar öklid uzaklıkları hesaplanır. Ancak öklid uzaklığı hesaplanırken her seferinde yeni centroid noktaları da hesaplanır. Yeni centroid noktası hesaplanırken küme elemanlarının aynı koordinatlarının değerleri toplamı bölü nesne sayısı şeklinde hesaplanmıştır. Örneğin Nesne 2 için birinci centroid e uzaklı iken ikinci centroid e uzaklık tür. Buna göre centroid biri seçeriz. Yeni centroid noktası X için (1+1.5)/2 = ve Y için (1+2)/2 = 1.5 tur. Tüm nesneler için işlemler yapıldıktan sonra gruplar ve yeni centroid(kitle) değerleri de ortaya çıkmıştır. İkinci iterasyonla tekrar bir grupları oluşturalım. Bunun için bir önceki iterasyonun centroid değerlerini alıyoruz. Tüm nesneler için tekrar grup belirleme işlemi yapıyoruz.
12 İki iterasyonun son bölümünde oluşan grupları kıyasladığımızda bir farklılık olduğunu görürüz. 3 nolu nesne ikinci kümeye girmeye karar vermiş. Bu durumda tekrar adım 2 ye döneriz. Adım 3: Yeni oluşan grubu geçmişteki grup ile kıyasla. Grupta değişim yok ise algoritmayı bitir, aksi takdirde adım 2 ye geri dön (1 defa adım 2 ye döndük). 3. iterasyon sonunda gruplarda değişim olmaz. Bu durumda algoritma sonladırılır. En son oluşan centroid değerleri küme 1 için (1.3, 1.5) iken küme 2 için (3.9, 5.1) dir. K ortalama algoritması sadece sayısal verilerde kullanılabilir; kategorik verilerde kullanılamaz. Çünkü bu verilerden elde edilecek ortalamalar bir kümeyi diğerinden ayıran anlamlı sayılar olmayacaktır. Sadece dışbükey şeklindeki kümelerin tespit edilmesinde kullanılabilir. Gürültülü ve uçtaki verilerden oldukça etkilenir.
13 En yakın komşu(k-nearest neighborhood) algoritması En yakın komşu yöntemine tek bağlantılı kümeleme yöntemi de denilmektedir. Başlangıçta tüm gözlem değerleri birer küme olarak değerlendirilir. Adım adım bu kümeler birleştirilerek yeni kümeler elde edilir. Bu yöntemle öncelikle gözlemler arasındaki uzaklıklar belirlenir. Şekilde k- en yakın komşu algoritmasının kümeleme aşamaları basitçe gösterilmiştir. Birliktelik kuralları(association rules) Veri tabanındaki bilgi miktarı arttıkça kurumlar sahip oldukları bilgiler arasında ilişkileri ortaya çıkarıp önemli sonuçlar elde etmişlerdir. İlişki analizi veri tabanındaki bir dizi bilgi ya da kaydın diğer kayıtlarla olan bağlantısını açıklayan işlemler dizisidir. Bir kayıt varken, herhangi bir başka kaydın var olma olasılığı nedir? Ya da bu iki kayıt varken, diğer üçüncü bir kaydın veri tabanına girme olasılığı nedir? İlişki analizi bu tür soruların cevaplarını verir ve verilerin birlikte olan
14 kurallarını ortaya çıkarır. İlişki analizi satış pazarlama, ürün katalog tasarımı gibi birçok alanda kullanılır. Örnek : Kola satın alan müşteriler 40% olasılıkla patates cipsi de alırlar. Birliktelik kuralları için kullanılan çok farklı algoritmalar bulunmaktadır. Bunlardan bazıları aşağıdaki gibidir. AIS: Agrawal tarafından 1993 yılında geliştirilmiştir, Apriori: Agrawal ve Srikant tarafından 1994 yılında geliştirilmiştir, SETM: Houtsma ve Swami tarafından 1995 yılında geliştirilmiştir, Partition: Savasere tarafından 1995 yılında geliştirilmiştir, FP-Growth: Han P.,Pei J.,Yin Y. Tarafından 2000 yılında geliştirilmiştir, RARM (Rapid Association Rule Mining): Das tarafından 2001 yılında geliştirilmiştir, CHARM: Zaki ve Hsiao tarafından 2002 yılında geliştirilmiştir. Bu algoritmalardan ilki AIS, en bilineni Apriori Algoritması dır Birliktelik kuralının matematiksel modeli Agrawal, Imielinski ve Swami tarafından 1993 yılında ortaya çıkarılmıştır. Birliktelik Kuralları nda Kullanılan Temel Kavramlar; Öğeler Kümesi (itemset): Bir veya daha çok öğeden oluşan kümedir. Destek sayısı (support count): Öğeler kümesinin veri kümesinde görülme sıklığıdır. Destek(support): Veride bağıntının ne kadar sık olduğunu tanımlar, öğeler kümesinin içinde bulunduğu birlikteliklerin
15 toplam birliktelik sayısına oranıdır. Destek(A=>B) şeklinde gösterilmektedir. Güven (confidence) : A malını almış bir kişinin B malını alma olasılığını vermektedir. Öğeler arasındaki birlikteliklerin doğruluğunu ifade etmektedir. Güven(A=>B) şeklinde gösterilmektedir. Yaygın öğeler (frequent itemsest): Destek değeri minimum destek değerinden büyük ya da eşit olan öğeler kümesidir. Destek (A)= Destek (A=>B)= Güven (A=>B)= Olasılık(B A) Yaygın Öğeler; 1-Elemanlı Öğeler Kümesi {Süt}à Destek Sayısı(Süt)=4; Tablo 1 deki örneğe göre 5 Pazar sepetinin 4 ünde {Süt} ürünü satın alınmış, bu yüzden {Süt} ürününün destek sayısı 4 dür. {Ekmek}-> Destek Sayısı(Ekmek)=3 {Yumurta}-> Destek Sayısı(Yumurta)=3 {Peynir}-> Destek Sayısı(Peynir)=3 Tablo1: farklı zamanlarda oluşturulmuş Pazar sepetleri A1 A2 A3 A4 Süt, Ekmek Ekmek, Yumurta Süt, Peynir Yumurta, Ekmek, Peynir, Süt A5 Peynir, Yumurta, Süt 2-Elemanlı Öğeler Kümesi
16 {Süt, Ekmek}-> Destek Sayısı(Süt, Ekmek)=2 {Ekmek, Yumurta}-> Destek Sayısı(Ekmek, Yumurta)=2 {Süt, Peynir}-> Destek Sayısı(Süt, Peynir)=3 {Yumurta, Peynir}-> Destek Sayısı(Yumurta, Peynir)=2 {Yumurta, Süt}-> Destek Sayısı(Yumurta, Süt)=2 3-Elemanlı Kümeler {Yumurta, Ekmek, Peynir}-> Destek Sayısı(Yumurta, Ekmek, Peynir)=1 {Yumurta, Ekmek, Süt}-> Destek Sayısı(Yumurta, Ekmek, Süt)=1 {Ekmek, Peynir, Süt}-> Destek Sayısı(Ekmek, Peynir, Süt)=1 {Peynir, Yumurta, Süt}-> Destek Sayısı(Peynir, Yumurta, Süt)=2 4-Elemanlı Kümeler {Yumurta, Ekmek, Peynir, Süt}-> Destek Sayısı(Yumurta, Ekmek, Peynir, Süt)=1 Hesaplamalar yapılırken minimum destek sayısı filtresi verilebilir. Örneğin minimum destek sayısı filtresi 2 ise hesaplamalara destek sayısı 1 olanlar dahil edilmez. Destek ve Güven sayılarının nasıl hesaplandığı aşağıdaki örnek ile anlaşılabilir: Destek({Yumurta}=>{Peynir})= Destek Sayısı(Yumurta,Peynir)/Toplam Alışveriş Sayısı=2/5 Güven ({Peynir, Süt}=>{Yumurta})=Destek Sayısı(Peynir,Yumurta,Süt)/Destek Sayısı(Peynir,Süt)=2/3 Bütün yaygın öğe kümeleri oluşturulduktan sonra minimum destek sayısı ve minimum güven değerlerine eşit ve büyük olan kümeler yaygın öğeler kümesine dahil edilir ve birliktelik kuralları oluşturulur.
17 Destek ve güven değerleri 0 ile 1 arasında değişmektedir. 1 e ne kadar yakınlarsa aralarındaki ilişki o kadar güçlüdür denilebilir. Güven değeri %100 ise kural kesin dir. Bu yüzden minimum güven kriterinin büyük verilmesi doğru sonucu vermesi açısından önemlidir. İki öğenin birlikteliğinin kesine yakın olabilmesi için hem destek hem de güven kriterinin yüksek olması gerekmektedir. Ayrıca minimum destek değeri küçük belirlenirse yöntem karmaşıklaşır ve çok sayıda yaygın öğe kümesi elde edilir. Kaynakça 1. Silahtaroğlu Gökhan Veri madenciliği kavram ve algoritmaları, papatya yayınları. 2. Özkan Yalçın Veri madenciliği yöntemleri, papatya yayınları. 3. Şadi evren şeker veri madenciliği youtube videoları: =PLh9ECzBB8tJNScCBWJFoMdpMkCdpnwUEl 4. ervised-ve-gozetimsiz-unsupervised-ogrenme-learningnedir/ 5. alari-k-means-algoritmasi 6.
VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan
DetaylıYZM 3217 YAPAY ZEKA DERS#10: KÜMELEME
YZM 317 YAPAY ZEKA DERS#10: KÜMELEME Sınıflandırma (Classification) Eğiticili (supervised) sınıflandırma: Sınıflandırma: Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz (unsupervised)
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing
DetaylıVERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr
VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıK En Yakın Komşu Methodu (KNearest Neighborhood)
K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre
DetaylıYZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA
YZM 3217 YAPAY ZEKA DERS#9: ÖĞRENME VE SINIFLANDIRMA Makine Öğrenmesi Çok büyük miktardaki verilerin elle işlenip analiz edilmesi mümkün değildir. Bu tür problemlere çözüm bulmak amacıyla makine öğrenmesi
DetaylıVERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5
DetaylıKümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir
Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş
DetaylıBüyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)
Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data
DetaylıPARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara
PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama
DetaylıMakine Öğrenmesi 2. hafta
Makine Öğrenmesi 2. hafta Uzaklığa dayalı gruplandırma K-means kümeleme K-NN sınıflayıcı 1 Uzaklığa dayalı gruplandırma Makine öğrenmesinde amaç birbirine en çok benzeyen veri noktalarını aynı grup içerisinde
DetaylıCBS ve Coğrafi Hesaplama
Yıldız Teknik Üniversitesi CBS ve Coğrafi Hesaplama 2. Bölüm Yrd. Doç. Dr. Alper ŞEN Harita Mühendisliği Bölümü Kartografya Anabilim Dalı web: http://www.yarbis.yildiz.edu.tr/alpersen/ E mail: alpersen@yildiz.edu.tr
DetaylıVERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıUzaktan Algılama Teknolojileri
Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve
DetaylıVERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Birliktelik Kurallarının Tanımı Destek ve Güven Ölçütleri Apriori Algoritması Birliktelik Kuralları (Association
DetaylıEğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir
Eğiticili (supervised) öğrenme: Sınıflandırma (classification) Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğu bilinir Eğiticisiz (unsupervised) öğrenme: Kümeleme (clustering) Hangi nesnenin hangi
DetaylıYZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR
YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR Sınıflandırma Yöntemleri: Karar Ağaçları (Decision Trees) Örnek Tabanlı Yöntemler (Instance Based Methods): k en yakın komşu (k nearest
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Birliktelik Kuralları Birliktelik Kurallarının Temelleri Support ve Confidence Apriori Algoritması
DetaylıVeri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları
1 Veri Tabanı, Veri Ambarı, Veri Madenciliği Bilgi Keşfi Aşamaları Apriori Algoritması Veri Madenciliği Yöntemleri Problemler Veri Madenciliği Uygulama Alanları 2 Bir bilgisayarda sistematik şekilde saklanmış,
DetaylıKümeleme Algoritmaları. Tahir Emre KALAYCI
Tahir Emre KALAYCI 2010 Gündem En önemli gözetimsiz öğrenme (unsupervised learning) problemi olarak değerlendirilmektedir Bu türdeki diğer problemler gibi etiketsiz veri kolleksiyonları için bir yapı bulmakla
Detaylı127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ
127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi
DetaylıVERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL
VERİ MADENCİLİĞİ Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL SPRINT Algoritması ID3,CART, ve C4.5 gibi algoritmalar önce derinlik ilkesine göre çalışırlar ve en iyi dallara ayırma kriterine
DetaylıEğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir
sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt
DetaylıGörüntü Sınıflandırma
Görüntü Sınıflandırma Chapter 12 https://www.google.com.tr/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&uact=8&ved=0 CBwQFjAA&url=http%3A%2F%2Ffaculty.une.edu%2Fcas%2Fszeeman%2Frs%2Flect%2FCh%2 52012%2520Image%2520Classification.ppt&ei=0IA7Vd36GYX4Uu2UhNgP&usg=AFQjCNE2wG
DetaylıBirliktelik Kuralları Analizi. Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT
İş Zekası Çözümleri için i Çok Boyutlu Birliktelik Kuralları Analizi Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT İçerik 1 Veri Madenciliği 2 Birliktelik Kuralları Analizi 3 Uygulama 4 Algoritma 5 Sonuçlar
DetaylıPAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II-
Dr. Yalçın ÖZKAN Dr. Yalçın ÖZKAN PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Ankara Caddesi, Prof. Fahreddin Kerim Gökay Vakfı İşhanı Girişi, No: 11/3, Cağaloğlu (Fatih)/İstanbul Tel
DetaylıApriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça.
Apriori Algoritması Konu İçeriği Giriş Tarihçesi Apriori Nedir? Örnekler Algoritma Açıklama Weka İle Kullanımı Kaynakça Giriş Veri madenciliğinde kullanılan ve veri kümeleri veya veriler arasındaki ilişkiyi
DetaylıVeri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.
Veri Madenciliği Yrd. Doç. Dr. Mustafa Gökçe Baydoğan mustafa.baydogan@boun.edu.tr www.mustafabaydogan.com blog.mustafabaydogan.com İçerik p Veri Madenciliği nedir? n Bir örnek p Boğaziçi Üniversitesi
DetaylıFonksiyon Optimizasyonunda Genetik Algoritmalar
01-12-06 Ümit Akıncı Fonksiyon Optimizasyonunda Genetik Algoritmalar 1 Fonksiyon Optimizasyonu Fonksiyon optimizasyonu fizikte karşımıza sık çıkan bir problemdir. Örneğin incelenen sistemin kararlı durumu
DetaylıVeri Madenciliği Süreci
Veri Madenciliği Eda Coşlu Mehmet Akif Ersoy Üniversitesi, Yönetim Bilişim Sistemleri Bölümü, BURDUR edacoslu@hotmail.com Büyük miktardaki veriler içerisinden önemli olanlarını bulup çıkarmaya Veri Madenciliği
DetaylıAPRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ
APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ Murat KARABATAK 1, Melih Cevdet İNCE 2 1 Fırat Üniversitesi Teknik Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Bölümü 2 Fırat Üniversitesi Mühendislik
DetaylıBÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ
1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel
DetaylıVERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme
DetaylıTanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları. Neleri göreceğiz?
KÜMELEME Tanımı Amacı Özellikleri Kullanım Alanları Varsayımları Yöntemleri Uygulama aşamaları Neleri göreceğiz? Tanımı Veriyi birbirlerine benzeyen elemanlardan oluşan kümelere ayırarak, heterojen bir
DetaylıVeri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir.
Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)
DetaylıBüyük Veri Analitiği (Big Data Analytics)
Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David
DetaylıBÖLÜM III: Şebeke Modelleri. Şebeke Kavramları. Şebeke Kavramları. Şebeke Kavramları. Yönlü Şebeke (Directed Network) Dal / ok
8.0.0 Şebeke Kavramları BÖLÜM III: Şebeke Modelleri Şebeke (Network) Sonlu sayıdaki düğümler kümesiyle, bunlarla bağlantılı oklar (veya dallar) kümesinin oluşturduğu yapı şeklinde tanımlanabilir ve (N,A)
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall
DetaylıGözetimli & Gözetimsiz Öğrenme
Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)
Detaylıinde Sepet Analizi Uygulamaları Market Basket Analysis for Data Mining
Veri Madenciliğ inde Sepet Analizi Uygulamaları Market Basket Analysis for Data Mining Mehmet Aydın Ula ş, Ethem Alpaydın (Boğaziçi Üniversitesi Bilgisayar Mühendisliği) Nasuhi Sönmez, Ataman Kalkan (GİMA
DetaylıYAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ
YAPAY SİNİR AĞLARI Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ İÇERİK Sinir Hücreleri Yapay Sinir Ağları Yapısı Elemanları Çalışması Modelleri Yapılarına Göre Öğrenme Algoritmalarına Göre Avantaj ve
DetaylıAlgoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi
Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri Veri modelleri, veriler arasında ilişkisel ve sırasal düzeni gösteren kavramsal tanımlardır. Her program en azından bir veri modeline dayanır. Uygun
DetaylıK-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi
K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi
Detaylıİlişkilendirme kurallarının kullanım alanları
Bölüm 4. Birliktelik Kuralları http://ceng.gazi.edu.tr/~ozdemir İlişkilendirme/Birliktelik Kuralları - Association Rules Birliktelik kuralları olarak da bilinir İlişkilendirme kuralı madenciliği Veri kümesi
DetaylıSOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL
SOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL Open Access Refereed E-Journal & Refereed & Indexed ISSN: 2630-631X Social Sciences Indexed www.smartofjournal.com / editorsmartjournal@gmail.com December
DetaylıHafta 05 - Karar Ağaçları/Kümeleme
BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler
DetaylıVERİ MADENCİLİĞİ Kavram ve Algoritmaları
VERİ MADENCİLİĞİ Kavram ve Algoritmaları Doç. Dr. Gökhan SİLAHTAROĞLU PAPATYA YAYINCILIK EĞİTİM İstanbul, Ankara, İzmir, Adana PAPATYA YAYINCILIK EĞİTİM BİLGİSAYAR SİS. SAN. VE TİC. A.Ş. İnönü Cad. Hacıhanım
DetaylıBAYES ÖĞRENMESİ BİLECİK ÜNİVERSİTESİ. Araş. Gör. Nesibe YALÇIN. Yapay Zeka-Bayes Öğrenme
BAYES ÖĞRENMESİ Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ Yapay Zeka-Bayes Öğrenme 1 İÇERİK Bayes Teoremi Bayes Sınıflandırma Örnek Kullanım Alanları Avantajları Dezavantajları Yapay Zeka-Bayes Öğrenme
DetaylıVERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı
Veri Madenciliği, örüntü tanıma, istatistik ve matematiksel yöntemlerin kullanımıyla devasa miktardaki güncel ya da geçmiş veri içerisinden ilgi çekici ( önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel
DetaylıTürkçe Dokümanlar Ġçin Yazar Tanıma
Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:
DetaylıUzaktan Algılama Uygulamaları
Aksaray Üniversitesi Uzaktan Algılama Uygulamaları Doç.Dr. Semih EKERCİN Harita Mühendisliği Bölümü sekercin@aksaray.edu.tr 2010-2011 Bahar Yarıyılı Uzaktan Algılama Uygulamaları GÖRÜNTÜ İŞLEME TEKNİKLERİ
DetaylıAlgoritma ve Programlamaya Giriş
Algoritma ve Programlamaya Giriş Algoritma Bir sorunu çözebilmek için gerekli olan sıralı ve mantıksal adımların tümüne Algoritma denir. Doğal dil ile yazılabilir. Fazlaca formal değildir. Bir algoritmada
DetaylıYZM ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR
YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR Aç Gözlü (Hırslı) Algoritmalar (Greedy ) Bozuk para verme problemi Bir kasiyer 48 kuruş para üstünü nasıl verir? 25 kuruş, 10 kuruş,
DetaylıBAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR
VERİ MADENCİLİĞİ İSİMLER BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR MOLEKÜLER BİYOLOJİ ve GENETİK GEBZE TEKNİK ÜNİVERSİTESİ ARALIK 2015 İçindekiler ÖZET... iii 1.GİRİŞ... 1 1.1 Veri Ambarı, Veri
DetaylıOlasılık, bir deneme sonrasında ilgilenilen olayın tüm olaylar içinde ortaya çıkma ya da gözlenme oranı olarak tanımlanabilir.
5.SUNUM Olasılık, bir deneme sonrasında ilgilenilen olayın tüm olaylar içinde ortaya çıkma ya da gözlenme oranı olarak tanımlanabilir. Günlük hayatta sıklıkla kullanılmakta olan olasılık bir olayın ortaya
DetaylıHafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları
Hafta 03/04 - Uzaklık/Benzerlik - En Yakın Komşular - Karar Ağaçları BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr
DetaylıDestekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines)
Destekçi Vektör Makineleri Destekçi Vektör Makineleri(Support Vector Machines) Değişkenler arasındaki örüntülerin bilinmediği veri setlerindeki sınıflama problemleri için önerilmiş bir makine öğrenmesi
DetaylıVeri ve Metin Madenciliği
Veri ve Metin Madenciliği Zehra Taşkın Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Fikirler? Veri Madenciliği Data Information Knowledge Veri madenciliği; Büyük yoğunluklu
DetaylıVeri ve Metin Madenciliği. Zehra
Veri ve Metin Madenciliği Zehra Taşkın @zehrataskin Büyük Veri https://www.youtube.com/watch?v=tzxmjbl-i4y Veri Madenciliği Bir kutu toplu iğne İçine 3 boncuk düşürdünüz Nasıl alacağız? Veri Madenciliği
DetaylıSıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5
Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5 Sıklık Tabloları Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Tek değişken için çizilen
DetaylıVeri Madenciliği/E-Ticaret İçin Ürün Tavsiye Sistemi Geliştirilmesi
Veri Madenciliği/E-Ticaret İçin Ürün Tavsiye Sistemi Geliştirilmesi Elif Şafak SİVRİ Danışman Yrd. Doç. Mustafa Cem KASAPBAŞI Eş Danışman Doç. Dr. Fethullah KARABİBER YÜKSEK LİSANS TEZİ BİLGİSAYAR MÜHENDİSLİĞİ
DetaylıKarar Ağacı Öğrenmesi(Decision Tree Learning)
Karar Ağacı Öğrenmesi(Decision Tree Learning) Bu yazımızda karar ağacı öğrenmesini inceleyeceğiz. Öncelikle karar ağacı öğrenmesi danışmanlı öğrenmenin, danışmanlı öğrenme de makine öğrenmesinin bir alt
DetaylıAğaç (Tree) Veri Modeli
Ağaç (Tree) Veri Modeli 1 2 Ağaç Veri Modeli Temel Kavramları Ağaç, bir kök işaretçisi, sonlu sayıda düğümleri ve onları birbirine bağlayan dalları olan bir veri modelidir; aynı aile soyağacında olduğu
DetaylıMekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D.
Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Ders 1- Yapay Zekâya Giriş Erhan AKDOĞAN, Ph.D. Yapay Zekâ nedir?! İnsanın düşünme ve karar verme yeteneğini bilgisayarlar aracılığı ile taklit etmeye
Detaylıtree) nedir? Karar Ağacı (Decision Decisiontree
Karar Ağacı (Decision Decisiontree tree) nedir? Bir işletme yönetimi tarafından tercihlerin, risklerin, kazançların, hedeflerin tanımlanmasında yardımcı olabilen ve birçok önemli yatırım alanlarında uygulanabilen,
DetaylıZeki Optimizasyon Teknikleri
Zeki Optimizasyon Teknikleri Genetik Algoritma (Genetic Algorithm) Doç.Dr. M. Ali Akcayol Genetik Algoritma 1970 li yıllarda John Holland tarafından geliştirilmiştir. 1989 yılında David E. Goldberg Genetik
DetaylıMekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.
Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Makine Öğrenmesi Erhan AKDOĞAN, Ph.D. Bu ders notunun hazırlanmasında Dr. U.Orhan ve Banu Diri nin ders notlarından yararlanılmıştır. Makine öğrenmesi
Detaylıİleri Diferansiyel Denklemler
MIT AçıkDersSistemi http://ocw.mit.edu 18.034 İleri Diferansiyel Denklemler 2009 Bahar Bu bilgilere atıfta bulunmak veya kullanım koşulları hakkında bilgi için http://ocw.mit.edu/terms web sitesini ziyaret
DetaylıBÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ
1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma
DetaylıMakine Öğrenmesi 3. hafta
Makine Öğrenmesi 3. hafta Entropi Karar Ağaçları (Desicion Trees) ID3 C4.5 Sınıflandırma ve Regresyon Ağaçları (CART) Karar Ağacı Nedir? Temel fikir, giriş verisinin bir kümeleme algoritması yardımıyla
DetaylıİSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.
İSTATİSTİKSEL TAHMİNLEME Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir. 1 ŞEKİL: Evren uzay-örneklem uzay İstatistiksel tahmin
DetaylıİSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI
İSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI Lineer Ayrılabilen Paternlerin Yapay Sinir Ağı ile Sınıflandırılması 1. Biyolojik Sinirin Yapısı Bilgi işleme
DetaylıT.C. İSTANBUL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ
T.C. İSTANBUL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ İŞ ZEKASI UYGULAMALARI VE PAZAR SEPETİ ANALİZİ Derya GÜNDÜZ Bilgisayar Mühendisliği Anabilim Dalı Bilgisayar Mühendisliği Programı
DetaylıVERİ MADENCİLİĞİ MODELLERİ VE UYGULAMA ALANLARI
VERİ MADENCİLİĞİ MODELLERİ VE UYGULAMA ALANLARI *Öğr. Gör. Serhat ÖZEKES Abstract: The major reason that data mining became one of the hottest current technologies of the information age is the wide availability
DetaylıGörüntü Segmentasyonu (Bölütleme)
Görüntü Segmentasyonu (Bölütleme) Segmentasyon, görüntüyü aynı cinsten obje ve bölgelere ayırmaktır. 20 Aralık 2014 Cumartesi 1 Görüntü Segmentasyonu 20 Aralık 2014 Cumartesi 2 Gestalt kanunları Görüntü
Detaylıİş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ
İş Zekası Hafta 6 Kestirimci Modelleme Teknikleri Business Intelligence and Analytics: Systems for Decision Support 10e isimli eserden adapte edilmiştir Bölüm Amaçları Yapay Sinir Ağları (YSA) kavramını
DetaylıISSN: El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 ( )
www.tubiad.org ISSN:2148-3736 El-Cezerî Fen ve Mühendislik Dergisi Cilt: 3, No: 2, 2016 (315-323) El-Cezerî Journal of Science and Engineering Vol: 3, No: 2, 2016 (315-323) ECJSE Makale / Research Paper
DetaylıAlgoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması. Mustafa Kemal Üniversitesi
Algoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması Ağaç, verilerin birbirine sanki bir ağaç yapısı oluşturuyormuş gibi sanal olarak bağlanmasıyla elde edilen hiyararşik yapıya sahip
DetaylıMesleki Terminoloji II Veri Madenciliği
Mesleki Terminoloji II Veri Madenciliği Burak Düşün - 14011055 Akif Berkay Gürcan - 14011023 Veri Madenciliği Nedir? Veri madenciliği, büyük miktarda verinin anlamlı örüntüler bulmak amacıyla otomatik
DetaylıKABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN
KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN Giriş Bilgi teknolojisindeki gelişmeler ve verilerin dijital ortamda saklanmaya başlanması ile yeryüzündeki bilgi miktarı her 20 ayda iki katına
DetaylıEÜFBED - Fen Bilimleri Enstitüsü Dergisi Cilt-Sayı: 5-2 Yıl: 2012 191-212
EÜFBED - Fen Bilimleri Enstitüsü Dergisi Cilt-Sayı: 5-2 Yıl: 2012 191-212 BİRLİKTELİK KURALLARI İLE MEKÂNSAL-ZAMANSAL VERİ MADENCİLİĞİ SPATIO-TEMPORAL DATA MINING WITH ASSOCIATION RULES Muhammed Fatih
DetaylıBİRLİKTELİK KURALI YÖNTEMİ İÇİN BİR VERİ MADENCİLİĞİ YAZILIMI TASARIMI VE UYGULAMASI
İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi Yıl: 6 Sayı:12 Güz 2007/2 s. 21-37 BİRLİKTELİK KURALI YÖNTEMİ İÇİN BİR VERİ MADENCİLİĞİ YAZILIMI TASARIMI VE UYGULAMASI Feridun Cemal ÖZÇAKIR, A. Yılmaz
DetaylıGenetik Algoritmalar. Bölüm 1. Optimizasyon. Yrd. Doç. Dr. Adem Tuncer E-posta:
Genetik Algoritmalar Bölüm 1 Optimizasyon Yrd. Doç. Dr. Adem Tuncer E-posta: adem.tuncer@yalova.edu.tr Optimizasyon? Optimizasyon Nedir? Eldeki kısıtlı kaynakları en iyi biçimde kullanmak olarak tanımlanabilir.
DetaylıMetin Sınıflandırma. Akış
Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle
DetaylıRASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN
RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi
DetaylıSÜREKLĠ OLASILIK DAĞILIMLARI
SÜREKLĠ OLASILIK DAĞILIMLARI Sayı ekseni üzerindeki tüm noktalarda değer alabilen değişkenler, sürekli değişkenler olarak tanımlanmaktadır. Bu bölümde, sürekli değişkenlere uygun olasılık dağılımları üzerinde
DetaylıİSTATİSTİK I KISA ÖZET KOLAYAOF
DİKKATİNİZE: BURADA SADECE ÖZETİN İLK ÜNİTESİ SİZE ÖRNEK OLARAK GÖSTERİLMİŞTİR. ÖZETİN TAMAMININ KAÇ SAYFA OLDUĞUNU ÜNİTELERİ İÇİNDEKİLER BÖLÜMÜNDEN GÖREBİLİRSİNİZ. İSTATİSTİK I KISA ÖZET KOLAYAOF 2 Kolayaof.com
DetaylıKonular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi
VERİ MADENCİLİĞİ Giriş Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Problem Tanımı Veri Madenciliği: Tarihçe teknolojinin gelişimiyle bilgisayar ortamında ve veritabanlarında tutulan veri miktarının da artması
DetaylıVERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme
DetaylıAPRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM
APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ Nesibe Yalçın 1 Emre Güngör 1 Nilüfer Yurtay ÖZET Bu çalışmada, Veri Madenciliği' nde Birliktelik Kuralı çıkarım algoritmalarından biri olan Apriori
DetaylıAlgoritma Geliştirme ve Veri Yapıları 10 Graf Veri Modeli. Mustafa Kemal Üniversitesi
Algoritma Geliştirme ve Veri Yapıları 10 Graf Veri Modeli Graf, matematiksel anlamda, düğümler ve bu düğümler arasındaki ilişkiyi gösteren kenarlardan oluşan bir kümedir; mantıksal ilişki düğüm ile düğüm
DetaylıTanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN
Tanımlayıcı İstatistikler Yrd. Doç. Dr. Emre ATILGAN 1 Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri 2 3 Aritmetik Ortalama Aritmetik ortalama,
DetaylıEsnek Hesaplamaya Giriş
Esnek Hesaplamaya Giriş J E O L O J İ M Ü H E N D İ S L İ Ğ İ A. B. D. E S N E K H E S A P L A M A Y Ö N T E M L E R İ - I DOÇ. DR. ERSAN KABALCI Esnek Hesaplama Nedir? Esnek hesaplamanın temelinde yatan
DetaylıKLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT
KLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT.. KENDİNE BENZERLİK VE AFİNİTE Fraktal özelliklerinden bir diğeri de kendine benzerlikdir. Geometrik açıdan, aynı şekle sahip olan geometrik şekiller birbirine
DetaylıAkademik Personel ve Lisansüstü Eğitimi Giriş Sınavı. ALES / Đlkbahar / Sayısal II / 13 Mayıs Matematik Sorularının Çözümleri
Akademik Personel ve Lisansüstü Eğitimi Giriş Sınavı ALES / Đlkbahar / Sayısal II / 1 Mayıs 01 Matematik Sorularının Çözümleri 1. 9! 8! 7! 9! + 8! + 7! 7!.(9.8 8 1) 7!.(9.8+ 8+ 1) 6 81 9 7. 4, π, π π,14
DetaylıVERİ MADENCİLİĞİ. İlişkilendirme Kuralları Bulma. Yaygın Nitelikler. İlişkilendirme Kuralları. nitelikler kümesi (Itemset) Destek s (Support)
İlişkilendirme Kuralları Madenciliği VERİ MADENCİLİĞİ İlişkilendirme Kuralları Yrd. Doç. Dr. Şule Gündüz Öğüdücü İlişkilendirme kuralı madenciliği Veri kümesi içindeki yaygın örüntülerin, nesneleri oluşturan
DetaylıBÖLÜM 13 HİPOTEZ TESTİ
1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin
DetaylıÇok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir.
Veri Madenciliği Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir. istatistik + makine öğrenmesi + yapay zeka = veri madenciliği Veri madenciliği süreçleri CRISP-DM
Detaylı