Dr. Hidayet Takçı. Veri Madenciliği Eğitimi GYTE Dr. Hidayet Takçı 10/05/2008 #
|
|
- Emine Kimyacıoğlu
- 7 yıl önce
- İzleme sayısı:
Transkript
1 Birliktelik Kuralları: Temel Kavramlar ve Algoritmalar Dr. Hidayet Takçı
2 Birliktelik Kuralı Madenciliği Bir işlem kaydında bir elemanın meydana gelme olasılığını, diğer elemanların meydana gelme olasılıklarından tahmin etmek için kurallar bulunmasıdır. Market-Basket transactions TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke Birliktelik kuralları için örnekler {Diaper} {Beer}, {Milk, Bread} {Eggs,Coke}, {Beer, Bread} {Milk},
3 Tanım: Frequent Itemset Itemset Bir veya daha fazla elemanın bir koleksiyonudur Örnek: {Milk, Bread, Diaper} k-itemset Bir itemset eğer k tane elaman içeriyorsa buna k-itemset adı verilir. Support count (σ) Bir itemset in kaç defa meydana geldiğinin sayısıdır Örnek. σ({milk, Bread,Diaper}) = 2 Support Bir itemset içeren transaction ların oranıdır Örnek. s({milk, Bread, Diaper}) = 2/5 Frequent Itemset Bir itemset in support değeri minsup eşik değerinden daha büyük ise o Frequent Itemset olarak bilinir. TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke
4 Tanım: Birliktelik Kuralı Birliktelik Kuralı Bir karıştırma deyimi X Y formunda olup burada X ve Y eleman kümeleridir (itemsets). Örnek: {Milk, Diaper} {Beer} TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke Kural Değerlendirme Metrikleri Support (s) X ve Y değerlerini birlikte içerenlerin oranıdır Confidence (c) X değerini içeren işlem kayıtları içerisinde X ve Y değerlerinin birlikte hangi sıklıkta ortaya çıktığının ölçümüdür. Örnek : { Milk, Diaper} (Milk, Diaper, Beer) s = σ = T σ (Milk,Diaper,Beer) c = = σ (Milk, Diaper) Beer = 0.4 = 0.67
5 Birliktelik Kuralı Madenciliği Görevi Verilen işlem kayıtları kümesi T olmak üzere, birliktelik kuralları madenciliğinin amacı aşağıdaki kuralları sağlayan bütün kuralların bulunmasıdır support minsup eşiği confidence minconf eşiği Brute-force yaklaşımı: Olası bütün birliktelik kurallarını listeleyin Her bir kural için support ve confidence değerlerini hesaplayın minsup ve minconf eşikleri hataya sebep oluyorsa kuralları buda
6 Birliktelik Kuralları Madenciliği TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke Kuralların örnekleri: {Milk,Diaper} {Beer} (s=0.4, c=0.67) {Milk,Beer} {Diaper} (s=0.4, c=1.0) {Diaper,Beer} {Milk} (s=0.4, c=0.67) {Beer} {Milk,Diaper} (s=0.4, c=0.67) {Diaper} {Milk,Beer} (s=0.4, c=0.5) {Milk} {Diaper,Beer} (s=0.4, c=0.5) Gözlemler: Yukarıdaki bütün kurallar aynı itemset in ikili bölmeleridir: {Milk, Diaper, Beer} Aynı itemset den kaynaklanan kurallar benzer support değerine fakat farklı confidence değerine sahiptirler. Böylece, biz support ve confidence ihtiyaçlarını birleştirebiliriz.
7 Birliktelik Kuralları Madenciliği İki adımlı yaklaşım: 1. Frequent Itemset Üretimi support minsup şartını sağlayan bütün itemset leri üret 2. Kural Üretimi Her bir frequent itemset den yüksek confidence değerine sahip, bir frequent itemset in ikili bölümlemesini içeren kuralları üret. Frequent itemset üretimi hala hesaplamalı olarak maliyetlidir.
8 Frequent Itemset Üretimi null A B C D E AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE ABCD ABCE ABDE ACDE BCDE ABCDE Verilen d adet eleman için 2 d adet olası aday itemset vardır.
9 Frequent Itemset Üretimi Brute-force yaklaşım: Kafes içerisindeki her bir itemset bir frequent itemset adayıdır. Veritabanını tarayarak her bir adayın support değerini sayın Transactions TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke Her adayı her bir transaction ile eşleştir Karmaşıklık ~ O(NMw) => M = 2 d den dolayı maliyetli!!!
10 Computational Complexity Verilen d adet tekil eleman için: Toplam itemset sayısı = 2 d Olası birliktelik kurallarının toplam sayısı: = = + = = d d d k k d j j k d k d R Eğer d=6, R = 602 kural
11 Frequent Itemset Üretim Stratejileri Adayların sayısını azalt (M) Tam arama: M=2 d M değerini azaltmak için budama teknikleri kullan Transaction ların sayısını azalt (N) Itemset boyutlarının artması için N değerinin boyutu azaltılır DHP ve dikey-tabanlı madencilik algoritmaları kullanılır Karşılaştırmaların sayısı azaltılır (NM) Adayları veya transaction ları saklamak için etkili veri yapıları kullanın Her transaction için her aday ile eşleşme ihtiyacı kalmasın
12 Adayların Sayısını Azaltma Apriori prensibi: Eğer bir itemset sık ise, o zaman onun bütün altkümeleri de sık olacaktır Apriori prensibi support ölçümünün aşağıdaki özelliğini kapsar: X, Y : ( X Y ) s( X ) s( Y ) Bir itemset in support değeri hiçbir zaman kendi altkümelerinin support değerini aşmaz Örnek : itemset {beer, diaper} sub1 {beer} sub2{diaper} Bu support değerinin anti-monotone özelliği olarak bilinir
13 Apriori Prensibinin Örneklemesi Found to be Infrequent Pruned supersets
14 Apriori Prensibinin Örneklemesi Item Count Bread 4 Coke 2 Milk 4 Beer 3 Diaper 4 Eggs 1 Minimum Support = 3 Items (1-itemsets) Itemset Count {Bread,Milk} 3 {Bread,Beer} 2 {Bread,Diaper} 3 {Milk,Beer} 2 {Milk,Diaper} 3 {Beer,Diaper} 3 Pairs (2-itemsets) (Coke veya Eggs içeren adaylar üretmeye ihtiyaç yoktur. Triplets (3-itemsets) Ite m s e t C o u n t {B re a d,m ilk,d ia p e r} 3
15 Apriori Algoritması Method: Let k=1 Boyutu 1 olan frequent itemset ler üret Yeni hiçbir frequent itemsets bulunmayana kadar tekrar et k boyutlu frequent itemset lerden (k+1) boyutlu aday itemset ler üret Aday itemset ler eğer yeteri kadar sık değilse buda Veritabanını tarayarak her bir aday itemset için support değerini hesapla Sık olmayan adayları ele ve sadece sık olanlarla devam et
16 Karşılaştırmaların Azaltılması Aday sayma: Her bir aday itemset in support değerini belirlemek için transaction veritabanı taranır. Karşılaştırmaların sayısını azaltmak için, bir hash yapısında adaylar depolanır Her bir transaction u bütün transaction larla eşleştirme yerine, hash edilmiş buketlerdeki adaylarla transcation karşılaştırma yapılılır. Transactions TID Items 1 Bread, Milk 2 Bread, Diaper, Beer, Eggs 3 Milk, Diaper, Beer, Coke 4 Bread, Milk, Diaper, Beer 5 Bread, Milk, Diaper, Coke
17 Hash Tree Üretimi Varsayalım ki 3 boyutlu 15 tane aday itemset iniz var: {1 4 5}, {1 2 4}, {4 5 7}, {1 2 5}, {4 5 8}, {1 5 9}, {1 3 6}, {2 3 4}, {5 6 7}, {3 4 5}, {3 5 6}, {3 5 7}, {6 8 9}, {3 6 7}, {3 6 8} İhtiyacınız: Hash fonksiyonu maksimum yaprak boyu: bir yaprak düğümünde depolanan itemset lerin maksimum sayısı (eğer aday itemset lerin sayısı maksimum yaprak boyutunu aşarsa, düğüm bölünür) Hash function 3,6,9 1,4,7 2,5,
18 Association Rule Discovery: Hash tree Hash Function Candidate Hash Tree 1,4,7 3,6,9 2,5,8 Hash on 1, 4 or
19 Association Rule Discovery: Hash tree Hash Function Candidate Hash Tree 1,4,7 3,6,9 2,5,8 Hash on 2, 5 or
20 Association Rule Discovery: Hash tree Hash Function Candidate Hash Tree 1,4,7 3,6,9 2,5,8 Hash on 3, 6 or
21 Subset Operation Verilen bir t transaction için Üç değerli olası altkümeler nelerdir?
22 Karmaşıklığa Etki Eden Faktörler Minimum support threshold seçimi Düşen support eşiği ile daha çok sayıda frequent itemset meydana gelir. Bu durum adayların sayısını ve frequent itemset boyunu artırabilir Veri setinin boyutu (elemanların sayısı) Her bir elemanın support sayısını depolamak için daha fazla belleğe ihtiyaç vardır Eğer sık elemanların sayısı artarsa hem hesaplama hem de I/O maliyetleri artabilir Veritabanı boyutu Apriori çok sayıda geçiş yaptığı için transaction sayıları ile birlikte algoritmanın çalışma zamanı artar Ortalama transaction genişliği Daha yoğun veri setleri ile transaction genişliği artar Bu durum frequent itemset in maksimum boyutunu ve hash tree üzerinden geçme maliyetini artırabilir (bir transaction daki alt kümelerin sayısı onun genişliği ile artar)
23 Maximal Frequent Itemset Eğer bir itemset in supersetlerinden (altkümeleri) hiç biri sık değilse o itemset maximal itemset olarak adlandırılır. Maximal Itemsets Infrequent Itemsets Border
24 Closed Itemset Bir itemset in supersetlerinden hiçbiri itemset in kendisi ile aynı support değerine sahip değilse ilgili itemset closed itemset adını alır. TID Items 1 {A,B} 2 {B,C,D} 3 {A,B,C,D} 4 {A,B,D} 5 {A,B,C,D} Itemset {A} 4 {B} 5 {C} 3 {D} 4 {A,B} 4 {A,C} 2 {A,D} 3 {B,C} 3 {B,D} 4 {C,D} 3 Support Itemset Support {A,B,C} 2 {A,B,D} 3 {A,C,D} 2 {B,C,D} 3 {A,B,C,D} 2
25 Maximal ve Closed Itemset ler Karşı Karşıya TID Items 1 ABC 2 ABCD 3 BCE 4 ACDE 5 DE null Transaction Ids A B C D E AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE 2 4 ABCD ABCE ABDE ACDE BCDE Hiçbir transaction tarafından desteklenmeyenler ABCDE
26 Maximal ve Closed Frequent Itemsets Minimum support = 2 null Closed but not maximal A B C D E Closed and maximal AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE 2 4 ABCD ABCE ABDE ACDE BCDE # Closed = 9 # Maximal = 4 ABCDE
27 Alternative Methods for Frequent Itemset Generation Itemset kafesi üzerinde gezinti Genelden özele, özelden genele yaklaşımına karşı
28 Alternative Methods for Frequent Itemset Generation Itemset kafesi üzerinde gezinti Eş sınıflar
29 Alternative Methods for Frequent Itemset Generation Itemset kafesi üzerinde gezinti Breadth-first ve Depth-first karşı karşıya
30 Alternative Methods for Frequent Itemset Generation Veritabanının sunumu Yatay yerleşim dikey yerleşime karşı TID Items 1 A,B,E 2 B,C,D 3 C,E 4 A,C,D 5 A,B,C,D 6 A,E 7 A,B 8 A,B,C 9 A,C,D 10 B A B C D E
31 FP-growth Algorithm Bir FP-tree yardımıyla veritabanının sıkıştırılmış bir sunumu kullanılır. FP-tree inşasında, frequent itemset madenciliği için recursive divide-and-conquer yaklaşımı kullanılır.
32 FP-tree construction TID=1 okumadan sonra: null TID Items 1 {A,B} 2 {B,C,D} 3 {A,C,D,E} 4 {A,D,E} 5 {A,B,C} 6 {A,B,C,D} 7 {B,C} 8 {A,B,C} 9 {A,B,D} 10 {B,C,E} B:1 TID=2 okumadan sonra: null A:1 B:1 A:1 B:1 C:1 D:1
33 FP-Tree Construction TID Items 1 {A,B} 2 {B,C,D} 3 {A,C,D,E} 4 {A,D,E} 5 {A,B,C} 6 {A,B,C,D} 7 {B,C} 8 {A,B,C} 9 {A,B,D} 10 {B,C,E} Transaction Veritabanı B:5 A:7 C:1 null D:1 B:3 C:3 Header table Item A B C D E Pointer C:3 D:1 D:1 D:1 E:1 E:1 D:1 Pointer lar frequent itemset üretimini desteklemek için kullanılır E:1
34 FP-growth D:1 C:3 B:5 A:7 D:1 null C:1 D:1 D:1 B:1 C:1 D:1 D için şartlı pattern tabanı: P = {(A:1,B:1,C:1), (A:1,B:1), (A:1,C:1), (A:1), (B:1,C:1)} Rekursif olarak P üzerinde FP-growth uygulanır Frequent Itemset ler (sup > 1 ile) bulunur: AD, BD, CD, ACD, BCD
35 Tree Projection Sayım (enumeration) ağacınının set edilmesi: Olası ifade: E(A) = {B,C,D,E} null A B C D E AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE Olası ifade: E(ABC) = {D,E} ABCD ABCE ABDE ACDE BCDE ABCDE
36 Tree Projection Item lar lexicographic sırada listelenir Her bir P düğümü aşağıdaki bilgiyi saklar: P için Itemset P nin olası lexicographic ifadelerinin listesi : E(P) Onun ata düğümünün tasarlandığı veritabanı için pointer Bitvector; itemset ı içeren tasarlanmış veritabanındaki transaction lar hakkında bilgi içerir.
37 Tasarlanmış (Projected) Database Original Database: TID Items 1 {A,B} 2 {B,C,D} 3 {A,C,D,E} 4 {A,D,E} 5 {A,B,C} 6 {A,B,C,D} 7 {B,C} 8 {A,B,C} 9 {A,B,D} 10 {B,C,E} A düğümü için tasarlanmış Database: TID Items 1 {B} 2 {} 3 {C,D,E} 4 {D,E} 5 {B,C} 6 {B,C,D} 7 {} 8 {B,C} 9 {B,D} 10 {} Her bir T transaction u için, A düğümündeki tasarlanmış transaction T E(A) dur.
38 ECLAT Her bir item için, transaction id lerinin (tids) bir listesini depola Horizontal Data Layout TID Items 1 A,B,E 2 B,C,D 3 C,E 4 A,C,D 5 A,B,C,D 6 A,E 7 A,B 8 A,B,C 9 A,C,D 10 B Vertical Data Layout A B C D E TID-list
39 ECLAT Herhangi bir k-itemset in (k-1) boyutlu altkümelerinin ikili tid-listelerini kesiştirerek k-itemset desteğini belirleyin. A B geçiş yaklaşımı: top-down, bottom-up ve hybrid Avantaj: support sayımı çok hızlıdır Dezavantaj: tid-listeleri bellek için çok büyük olabilir. AB
40 Kural Üretimi L bir frequent itemset olsun, L tarafından kapsanan ve boş olmayan, aynı zamanda minimum confidence ile f L f kuralını sağlayan bütün altkümeleri bulunuz. Eğer {A,B,C,D} bir frequent itemset ise, aday kurallar: ABC D, ABD C, ACD B, BCD A, A BCD, B ACD, C ABD, D ABC AB CD, AC BD, AD BC, BC AD, BD AC, CD AB, Eğer L = k ise, o zaman 2 k 2 adet aday birliktelik kuralı vardır (L ve L haricinde)
41 Kural Üretimi Frequent itemset lerden kuralları etkin olarak nasıl çıkarırız Genelde, confidence bir anti-monotone özelliğe sahip değildir. c(abc D), c(ab D) den büyük veya küçük olabilir Fakat, aynı itemset ten üretilen kuralların confidence değerini bir anti-monotone özelliği vardır Örnek, L = {A,B,C,D}: c(abc D) c(ab CD) c(a BCD)
42 Apriori Algorithm için Kural Üretimi Kuralların kafesi Düşük Confidence Kuralı Budanmış Kurallar
43 Apriori Algorithm için Kural Üretimi Aday kural, kural sonucunda aynı ön eki paylaşan iki kuralın birleştirilmesi yoluyla üretilir. join(cd=>ab,bd=>ac) aday üretimi sonucu kural D => ABC CD=>AB BD=>AC Eğer onun alt kümesi AD=>BC yüksek confidence değerine sahip değilse D=>ABC kuralını buda D=>ABC
44 Support Dağılımının Etkisi Birçok gerçek veri kümesi yatık support dağılımına sahiptir. Gerçek bir perakendeci veri setinin support dağılımı
45 Support Dağılımının Etkisi Uygun minsup eşik değerini nasıl set ederiz? Eğer minsup çok yüksek olarak set edilirse, ilginç fakat seyrek item ları kapsayan itemset leri kaçırırız. (Örnek, pahalı ürünler) Eğer minsup çok düşük ise, hesaplamalı olarak maliyet ve itemset sayısı çok artar Tek bir minimum support eşiği kullanımı etkin olmayabilir
46 Çoklu Minimum Support Çoklu minimum support ları nasıl uygularız? MS(i): item i için minimum support Örnek.:MS(Milk)=5%, MS(Coke) = 3%, MS(Broccoli)=0.1%, MS(Salmon)=0.5% MS({Milk, Broccoli}) = min (MS(Milk), MS(Broccoli)) = 0.1% Aksilik: Support anti-monotone özellikte değildir Varsayalım: Support(Milk, Coke) = 1.5% ve Support(Milk, Coke, Broccoli) = 0.5% {Milk,Coke} sık değildir fakat {Milk,Coke,Broccoli} sıktır. Çünkü %1.5 kendi minsup değerinden düşük %0.5 kendi minsup değerinden büyüktür.
47 Çoklu Minimum Support Item MS(I) Su p(i) AB ABC A 0.10% 0.25% A AC AD ABD ABE B 0.20% 0.26% B AE ACD C 0.30% 0.29% C BC BD ACE ADE D 0.50% 0.05% D BE BCD E 3% 4.20% E CD CE BCE BDE DE CDE
48 Çoklu Minimum Support Item MS(I) Sup(I) A 0.10% 0.25% A AB AC AD ABC ABD ABE B 0.20% 0.26% C 0.30% 0.29% B C AE BC BD ACD ACE ADE D 0.50% 0.05% E 3% 4.20% D E BE CD CE BCD BCE BDE DE CDE
49 Çoklu Minimum Support (Liu 1999) Item ları onların minimum support değerlerine göre sırala (artan sırada) Örnek.:MS(Milk)=5%, MS(Coke) = 3%, MS(Broccoli)=0.1%, MS(Salmon)=0.5% Sıralama: Broccoli, Salmon, Coke, Milk Apriori düzeltmesine ihtiyaç vardır: L 1 : frequent items kümesi F 1 : support MS(1)şartını sağlayan item kümesi orada MS(1)=min i ( MS(i) ) C 2 : L 1 yerine F 1 den 2 boyutlu aday itemset ler üretilir
50 Çoklu Minimum Support (Liu 1999) Apriori için düzeltmeler: Geleneksel Apriori algoritmasında, Bir aday (k+1)-itemset k boyutlu frequent itemset lerin ikişerli birleştirmesi ile üretilir Aday, eğer k boyutlu sık olmayan herhangi bir altküme içerirse budanır Budama adımı düzenlenmelidir: Budama sadece altküme ilk item ı içeriyorsa yapılır Örnek.: Aday={Broccoli, Coke, Milk} (minimum support değerine göre sıralı) {Broccoli, Coke} ve {Broccoli, Milk} sıktır fakat {Coke, Milk} seyrektir. Aday budanmaz çünkü {Coke,Milk} ilk item olan Broccoli içermez.
51 Pattern Evaluation Birliktelik kuralı algoritmaları çok fazla kural üretmeye eğilimlidir. Onların çoğu ilginç olmayan veya gereksiz kurallardır Eğer {A,B,C} {D} ve {A,B} {D} durumu aynı support ve confidence değerine sahip ise gereksiz İlginçlik ölçümleri çıkarılmış örüntüleri budama için kullanılabilir. Birliktelik kurallarının orijinal formülasyonunda, sadece support & confidence ölçümleri kullanılır
52 Application of Interestingness Measure İlginçlik Ölçümleri Preprocessed Data Patterns Knowledge Postprocessing Selected Data Featur Featur Featur e e Featur Featur e e Featur Featur e Featur e e Featur Featur e e e Prod Prod uct Prod uct Prod uct Prod uct Prod uct Prod uct Prod uct Prod uct Prod uct uct Mining Data Preprocessing Selection
53 Computing Interestingness Measure Verilen bir X Y kuralı için, olasılık tablosundan kural ilginçlikleri elde edebilmeye ihtiyaç vardır. X Y için olasılık tablosu Y Y X f 11 f 10 f 1+ X f 01 f 00 f o+ f +1 f +0 T f 11 : support of X and Y f 10 : support of X and Y f 01 : support of X and Y f 00 : support of X and Y Çeşitli ölçümleri tanımlamak için kullanılır support, confidence, lift, Gini, J-measure, etc.
54 Confidence ın Sorunu Coffee Coffee Tea Tea Association Rule: Tea Coffee Confidence= P(Coffee Tea) = 0.75 fakat P(Coffee) = 0.9 confidence yüksek olmasına rağmen, kural yanılıyor P(Coffee Tea) =
55 İstatistiksel Bağımsızlık 1000 kişilik bir popülasyonda 600 öğrenci yüzmeyi biliyor (S) 700 öğrenci bisiklet kullanmayı biliyor (B) 420 öğrenci her ikisini de biliyor (S,B) P(S B) = 420/1000 = 0.42 P(S) P(B) = = 0.42 P(S B) = P(S) P(B) => istatistiksel bağımsız P(S B) > P(S) P(B) => pozitif korelasyon P(S B) < P(S) P(B) => negatif korelasyon
56 İstatistik Tabanlı Ölçümler İstatistik bağımsızlığı tanımlayan ölçümler )] ( )[1 ( )] ( )[1 ( ) ( ) ( ), ( ) ( ) ( ), ( ) ( ) ( ), ( ) ( ) ( Y P Y P X P X P Y P X P Y X P coefficient Y P X P Y X P PS Y P X P Y X P Interest Y P X Y P Lift = = = = φ
57 Örnek: Lift/Interest Coffee Coffee Tea Tea Association Rule: Tea Coffee Confidence= P(Coffee Tea) = 0.75 fakat P(Coffee) = 0.9 Lift = 0.75/0.9= (< 1, bu yüzden negatif uyumlu)
58 Lift & Interest ölçümünün Sorunu Y Y X X Y Y X X Lift = = Lift = = (0.1)(0.1) (0.9)(0.9) İstatistiksel Bağımsızlık: Eğer P(X,Y)=P(X)P(Y) => Lift = 1
59 Support-based Pruning association rule mining algoritmalarının çoğunda kuralları ve itemset leri budama için support ölçümü kullanılır. Itemset lerin korelasyonu üzerinde support tabanlı budamanın etkisini çalışalım rasgele olasılık tablosu üretin Her bir tablo için ikili korelasyon ve support değeri hesap edilir support-tabanlı budama uygulanır ve budama sonrası silinen tablolar üzerinde çalışılır
İlişkilendirme kurallarının kullanım alanları
Bölüm 4. Birliktelik Kuralları http://ceng.gazi.edu.tr/~ozdemir İlişkilendirme/Birliktelik Kuralları - Association Rules Birliktelik kuralları olarak da bilinir İlişkilendirme kuralı madenciliği Veri kümesi
DetaylıVeri Madenciliği. Bölüm 4. Birliktelik Kuralları. Doç. Dr. Suat Özdemir.
Bölüm 4. Birliktelik Kuralları http://ceng.gazi.edu.tr/~ozdemir Örüntü / Pattern Örüntü: Bir veri setinde sıklıkla birlikte ortaya çıkan bir dizi öğe, alt dizin veya alt yapılar Örüntüler, veri setlerinin
DetaylıVERİ MADENCİLİĞİ. İlişkilendirme Kuralları Bulma. Yaygın Nitelikler. İlişkilendirme Kuralları. nitelikler kümesi (Itemset) Destek s (Support)
İlişkilendirme Kuralları Madenciliği VERİ MADENCİLİĞİ İlişkilendirme Kuralları Yrd. Doç. Dr. Şule Gündüz Öğüdücü İlişkilendirme kuralı madenciliği Veri kümesi içindeki yaygın örüntülerin, nesneleri oluşturan
DetaylıVERİ MADENCİLİĞİ. İlişkilendirme Kuralları Bulma. İlişkilendirme Kuralları. Yaygın Öğeler. İlişkilendirme Kuralları Madenciliği
İlişkilendirme Kuralları Madenciliği VERİ MADENCİLİĞİ İlişkilendirme Kuralları Yrd. Doç. Dr. Şule Gündüz Öğüdücü İlişkilendirme kuralı madenciliği Veri kümesi içindeki yaygın örüntülerin, nesneleri oluşturan
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Birliktelik Kuralları Birliktelik Kurallarının Temelleri Support ve Confidence Apriori Algoritması
DetaylıBüyük Veri Analitiği (Big Data Analytics)
Büyük Veri Analitiği (Big Data Analytics) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, Mining of Massive Datasets, Jure Leskovec, Anand Rajaraman, Jeffrey David
DetaylıEğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir
sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sıralı Örüntülerin Temelleri GSP Tabanlı Sıralı Örüntü Madenciliği Algoritma Sıralı Örüntülerden
DetaylıSOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL
SOCIAL MENTALITY AND RESEARCHER THINKERS JOURNAL Open Access Refereed E-Journal & Refereed & Indexed ISSN: 2630-631X Social Sciences Indexed www.smartofjournal.com / editorsmartjournal@gmail.com December
Detaylıinde Sepet Analizi Uygulamaları Market Basket Analysis for Data Mining
Veri Madenciliğ inde Sepet Analizi Uygulamaları Market Basket Analysis for Data Mining Mehmet Aydın Ula ş, Ethem Alpaydın (Boğaziçi Üniversitesi Bilgisayar Mühendisliği) Nasuhi Sönmez, Ataman Kalkan (GİMA
DetaylıHARUN GÖKÇE YÜKSEK LİSANS TEZİ
AĞAÇ VE ÇİZGE VERİTABANLARINDA HASSAS BİLGİ GİZLEME HARUN GÖKÇE YÜKSEK LİSANS TEZİ BİLGİSAYAR MÜHENDİSLİĞİ TOBB EKONOMİ VE TEKNOLOJİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ KASIM 2010 ANKARA Fen Bilimleri
DetaylıApriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça.
Apriori Algoritması Konu İçeriği Giriş Tarihçesi Apriori Nedir? Örnekler Algoritma Açıklama Weka İle Kullanımı Kaynakça Giriş Veri madenciliğinde kullanılan ve veri kümeleri veya veriler arasındaki ilişkiyi
DetaylıTanım Bir A kümesinin her elemanı, bir B kümesinin de elamanı ise, A kümesine B kümesinin alt kümesi denir.
BÖLÜM 1 KÜMELER CEBİRİ Küme, iyi tanımlanmış ve farklı olan nesneler topluluğudur. Yani küme, belli bir kurala göre verilmiş nesnelerin listesidir. Nesneler reel veya kavramsal olabilir. Kümede bulunan
DetaylıPARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara
PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI BAŞARIM 09, 15-18 Nisan 2009, ODTÜ, Ankara Veri Madenciliğine Genel Bir Bakış Veri Madenciliğinin Görevleri Sınıflama Seri Sınıflama Algoritmaları Paralel Sınıflama
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimsiz Öğrenmenin Temelleri Kümeleme Uzaklık Fonksiyonları Öklid Uzaklığı Manhattan
DetaylıVERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Sınıflandırma yöntemleri Karar ağaçları ile sınıflandırma Entropi Kavramı ID3 Algoritması C4.5
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing
DetaylıAPRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ
APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ Murat KARABATAK 1, Melih Cevdet İNCE 2 1 Fırat Üniversitesi Teknik Eğitim Fakültesi Elektronik Bilgisayar Eğitimi Bölümü 2 Fırat Üniversitesi Mühendislik
DetaylıSERİMYA II. MATEMATİK YARIŞMASI I. AŞAMA SORULARI
SERİMYA - 4 II. MATEMATİK YARIŞMASI I. AŞAMA SORULARI. 4? 4 4. A B denkleminde A ve B birbirinden farklı pozitif tam sayılar olduğuna göre, A + B toplamı kaçtır? işleminin sonucu kaçtır? A) 6 B) 8 C) D)
DetaylıSAYILAR MATEMATİK KAF03 BASAMAK KAVRAMI TEMEL KAVRAM 01. İki basamaklı en küçük sayı : İki basamaklı en büyük negatif sayı :.
SAYILAR BASAMAK KAVRAMI İki basamaklı en küçük sayı : İki basamaklı en büyük negatif sayı :. Üç basamaklı rakamları farklı en küçük sayı :. SORU 5 MATEMATİK KAF03 TEMEL KAVRAM 01 Üç basamaklı birbirinden
DetaylıBÖLÜM III: Şebeke Modelleri. Şebeke Kavramları. Şebeke Kavramları. Şebeke Kavramları. Yönlü Şebeke (Directed Network) Dal / ok
8.0.0 Şebeke Kavramları BÖLÜM III: Şebeke Modelleri Şebeke (Network) Sonlu sayıdaki düğümler kümesiyle, bunlarla bağlantılı oklar (veya dallar) kümesinin oluşturduğu yapı şeklinde tanımlanabilir ve (N,A)
DetaylıVERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıBiL416 Hafta-1 Veri Madenciliği:Giriş
BiL416 Hafta-1 Veri Madenciliği:Giriş Neden Veri Madenciliği? Ticari Bakış Açısı Çok miktarda veri toplanmış ve ambarlanmıştır. Web verisi, e-ticaret Bölüm ve dükkanlardaki ödemeler Banka/Kredi kartı işlemleri
DetaylıBMT 206 Ayrık Matematik. Yük. Müh. Köksal GÜNDOĞDU 1
BMT 206 Ayrık Matematik Yük. Müh. Köksal GÜNDOĞDU 1 Fonksiyonlar Yük. Müh. Köksal GÜNDOĞDU 2 Fonksiyonlar Tanım: A ve B boş olmayan kümeler. A dan B ye bir f fonksiyonu f: A B ile gösterilir ve A nın her
DetaylıSAYILAR DOĞAL VE TAM SAYILAR
1 SAYILAR DOĞAL VE TAM SAYILAR RAKAM: Sayıları ifade etmek için kullandığımız 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 sembollerinden her birine rakam denir. Soru: a ve b farklı rakamlar olmak üzere a + b nin alabileceği
DetaylıAlgoritmalar. Doğrusal Zamanda Sıralama. Bahar 2017 Doç. Dr. Suat Özdemir 1
Algoritmalar Doğrusal Zamanda Sıralama Bahar 2017 Doç. Dr. Suat Özdemir 1 Sıralama Özet - Insertion sort Kodlaması kolay Küçük veri setleri için hızlı (~50 element) Neredeyse sıralı veri setleri için en
DetaylıWeek 9: Trees 1. TREE KAVRAMI 3. İKİLİ AĞAÇ DİZİLİMİ 4. İKİLİ ARAMA AĞACI 2. İKİLİ AĞAÇ VE SUNUMU > =
Week 9: Trees 1. TREE KAVRAMI 2. İKİLİ AĞAÇ VE SUNUMU 3. İKİLİ AĞAÇ DİZİLİMİ 4. İKİLİ ARAMA AĞACI < 6 2 > = 1 4 8 9 1. TREES KAVRAMI Bir ağaç bir veya daha fazla düğümün (T) bir kümesidir : Spesifik olarak
DetaylıVERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine
DetaylıWeb Madenciliği (Web Mining)
Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall
DetaylıYZM YAPAY ZEKA DERS#4: BİLGİSİZ ARAMA YÖNTEMLERİ
YZM 327 - YAPAY ZEKA DERS#4: BİLGİSİZ ARAMA YÖNTEMLERİ Bilgisiz Arama Stratejisi Sadece problem formülasyonundaki mevcut bilgiyi kullanır Durum bilgisinden yararlanmazlar Çözüme ulaşmak için hiçbir bilgi
DetaylıVERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Birliktelik Kurallarının Tanımı Destek ve Güven Ölçütleri Apriori Algoritması Birliktelik Kuralları (Association
DetaylıF(A, N, K) // A dizi; N, K integer if N<0 then return K; if A[N]>K then K = A[N]; return F(A, N-1, K);
2009-2010 BAHAR DÖNEMİ MC 689 ALGORİTMA TASARIMI ve ANALİZİ I. VİZE ÇÖZÜMLERİ 1. a) Böl ve yönet (divide & conquer) tarzındaki algoritmaların genel özelliklerini (çalışma mantıklarını) ve aşamalarını kısaca
DetaylıBüyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)
Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data
DetaylıVERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme
DetaylıTEOG. Sayma Sayıları ve Doğal Sayılar ÇÖZÜM ÖRNEK ÇÖZÜM ÖRNEK SAYI BASAMAKLARI VE SAYILARIN ÇÖZÜMLENMESİ 1. DOĞAL SAYILAR.
TEOG Sayma Sayıları ve Doğal Sayılar 1. DOĞAL SAYILAR 0 dan başlayıp artı sonsuza kadar giden sayılara doğal sayılar denir ve N ile gösterilir. N={0, 1, 2, 3,...,n, n+1,...} a ve b doğal sayılar olmak
DetaylıBirliktelik Kuralları Analizi. Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT
İş Zekası Çözümleri için i Çok Boyutlu Birliktelik Kuralları Analizi Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT İçerik 1 Veri Madenciliği 2 Birliktelik Kuralları Analizi 3 Uygulama 4 Algoritma 5 Sonuçlar
DetaylıVeri madenciliği yöntemleri
Sınıflandırma ve Kümeleme Kavramları Giriş Verinin içerdiği ortak özelliklere göre ayrıştırılması işlemi sınıflandırma olarak adlandırılır, veri madenciliği tekniklerinden en çok bilinenidir; veri tabanlarındaki
DetaylıYZM 3217 YAPAY ZEKA DERS#10: KÜMELEME
YZM 317 YAPAY ZEKA DERS#10: KÜMELEME Sınıflandırma (Classification) Eğiticili (supervised) sınıflandırma: Sınıflandırma: Sınıf sayısı ve bir grup örneğin hangi sınıfa ait olduğunu bilinir Eğiticisiz (unsupervised)
DetaylıVeri Madenciliği. Bölüm 5. Sınıflandırma 1. Doç. Dr. Suat Özdemir.
Bölüm 5. Sınıflandırma 1 http://ceng.gazi.edu.tr/~ozdemir Gözetimli & Gözetimsiz Öğrenme Predictive Data Mining vs. Descriptive Data Mining Gözetimli (Supervised) öğrenme= sınıflandırma (clasification)
DetaylıBMB204. Veri Yapıları Ders 9. B+ Ağacı, Hash, Heap. Erdinç Uzun NKÜ Çorlu Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü
BMB204. Veri Yapıları Ders 9. B+ Ağacı, Hash, Heap Erdinç Uzun NKÜ Çorlu Mühendislik Fakültesi Bilgisayar Mühendisliği Bölümü Dersin Planı B+ Tree Temel bir veritabanı çalışma kodu Hash (Karma) Heap Ağaçlar
Detaylıİş Zekası Çözümleri için Çok Boyutlu Birliktelik Kuralları Analizi
İş Zekası Çözümleri için Çok Boyutlu Birliktelik Kuralları Analizi Derya Birant 1, Alp Kut 1, Medi Ventura 2, Hakan Altınok 2, Benal Altınok 2, Elvan Altınok 2, Murat Ihlamur 2 1 Dokuz Eylül Üniversitesi,
DetaylıKÜMELER Test -1. 5. A a,b,c, 1,2, 5. 1. A a,b,c,d 2. A,1,2,3, 1. 7. s(a) = 10 ve s(b) = 7. 4. B x:0 x 40 ve x 5k, k. 8. s(a) = 9 ve s(b) = 4
KÜMELER Test -1 1. A a,b,c,d kümesi için aşağıdakilerden hangisi yanlıştır? A) A B) a A C) d A D) {a, c} A E) {a} A 5. A a,b,c, 1,2, 5 kümesi için aşağıdakilerden hangisi doğrudur? A) s(a) = 6 B) b A C)
DetaylıBLM-431 YAPAY ZEKA. Ders-5 Bilgili Arama Yöntemleri. Yrd. Doç. Dr. Ümit ATİLA
BLM-431 YAPAY ZEKA Ders-5 Bilgili Arama Yöntemleri Yrd. Doç. Dr. Ümit ATİLA umitatila@karabuk.edu.tr http://web.karabuk.edu.tr/umitatilla/ Arama Grafları Eğer arama uzayı ağaç yapısından değil de graf
Detaylı2004 II. MATEMATİK YARIŞMASI I. AŞAMA SORULARI
4 II MATEMATİK YARIŞMASI I AŞAMA SORULARI 4? 4 4 A B denkleminde A ve B birbirinden farklı pozitif tam sayılar olduğuna göre, A + B toplamı kaçtır? işleminin sonucu kaçtır? 5 A) B) C) - D) E) - 8 4 x x
DetaylıFinal Sınavı Soruları Bahar 2018
Sayfa#1 Manisa Celal Bayar Üniversitesi Yazılım Mühendisliği Bölümü YZM 2116 Veri Yapıları Dersi Final Sınavı Soruları Bahar 2018 Süre: 70 Dakika Adı ve Soyadı YANIT ANAHTARI Öğrenci Numarası Grubu İmza
Detaylı#$% &'#(# Konular. Direct File Organization. Computed Chaining Comparison of Collision Resolution Methods Perfect Hashing Cichelli s Algorithm
!" #$% &'#(# Konular Comparison of Collision Resolution Methods Perfect Hashing Cichelli s Algorithm Link kullanarak çakıma çözümü yapan metodlar (colaesced hashing) ve link kullanmadan çözüm yapan metodlar
DetaylıVI. OLİMPİYAT SINAVI SORULAR
SORULAR 1. N sayısı 1998 basamaklı ve tüm basamakları 1 olan bir doğal sayıdır. Buna göre N sayısının virgülden sonraki 1000. basamağı kaçtır? A)0 B)1 C)3 D)6 E) Hiçbiri. n Z olmak üzere, n sayısı n sayısına
Detaylı1. BÖLÜM Mantık BÖLÜM Sayılar BÖLÜM Rasyonel Sayılar BÖLÜM I. Dereceden Denklemler ve Eşitsizlikler
ORGANİZASYON ŞEMASI 1. BÖLÜM Mantık... 7. BÖLÜM Sayılar... 13 3. BÖLÜM Rasyonel Sayılar... 93 4. BÖLÜM I. Dereceden Denklemler ve Eşitsizlikler... 103 5. BÖLÜM Mutlak Değer... 113 6. BÖLÜM Çarpanlara Ayırma...
DetaylıDr. Hidayet Takçı. Veri Madenciliği Dersi G Y T E Dr. Hidayet Takçı 10/05/2008 1
Birinci Saat Veri Madenciliği: Giriş Dr. Hidayet Takçı Veri Madenciliği Dersi G Y T E Dr. Hidayet Takçı 10/05/2008 1 Neden Veri Madenciliği? Ticari Bakış Açısı Çok miktarda veri toplanmış ve ambarlanmıştır.
DetaylıYZM ALGORİTMA ANALİZİ VE TASARIM DERS#6: AZALT VE FETHET YÖNTEMİ
YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#6: AZALT VE FETHET YÖNTEMİ Azalt ve Fethet Algoritmaları Problemi daha küçük bir örneğine çevir: Küçük örneği çöz Çözümü asıl probleme genişlet 3 tipi vardır:
Detaylı127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ
127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ Veri Madenciliği : Bir sistemin veri madenciliği sistemi olabilmesi
DetaylıBİRLİKTELİK KURALI YÖNTEMİ İÇİN BİR VERİ MADENCİLİĞİ YAZILIMI TASARIMI VE UYGULAMASI
İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi Yıl: 6 Sayı:12 Güz 2007/2 s. 21-37 BİRLİKTELİK KURALI YÖNTEMİ İÇİN BİR VERİ MADENCİLİĞİ YAZILIMI TASARIMI VE UYGULAMASI Feridun Cemal ÖZÇAKIR, A. Yılmaz
DetaylıAlgoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi
Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri Veri modelleri, veriler arasında ilişkisel ve sırasal düzeni gösteren kavramsal tanımlardır. Her program en azından bir veri modeline dayanır. Uygun
Detaylıb) Algoritmanızın en kötü durumda işlem zamanını asimptotik olarak bulunuz
2014 Soru 1. (15 puan) 5,2,4,1,15,8,11,13,7,6 dizisinin elemanlarından maksimum özellikli bir yığın(heap) oluşturulmasını adım adım yazınız. Heapsort algoritmasının yardımıyla yapılacak sıralamayı anlatınız.
DetaylıPTOLEMY EŞİTSİZLİĞİ ÜZERİNE 1 Geometrideki ilginç eşitsizliklerinden biri de Ptolemy Eşitsizliği dir. Bu yazımızda Ptolemy eşitsizliğini ve birkaç uygulamasını sunacağız. SORU 1: A, B, C, D herhangi dört
DetaylıDENİZ HARP OKULU BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ
DENİZ HARP OKULU BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ Dersin Adı Kodu Sınıf/Y.Y. Ders Saati (T+U+L) Kredi AKTS Veri Yapıları ve Algoritmalar BİM-221 2/II 2+0+2 3 3,5 Dersin Dili
DetaylıMesleki Terminoloji II Veri Madenciliği
Mesleki Terminoloji II Veri Madenciliği Burak Düşün - 14011055 Akif Berkay Gürcan - 14011023 Veri Madenciliği Nedir? Veri madenciliği, büyük miktarda verinin anlamlı örüntüler bulmak amacıyla otomatik
DetaylıKAHKAHA TANIMA İÇİN RASSAL ORMANLAR
KAHKAHA TANIMA İÇİN RASSAL ORMANLAR Heysem Kaya, A. Mehdi Erçetin, A. Ali Salah, S. Fikret Gürgen Bilgisayar Mühendisliği Bölümü Boğaziçi Üniversitesi / Istanbul Akademik Bilişim'14, Mersin, 05.02.2014
DetaylıULUSAL MATEMATİK OLİMPİYATLARI DENEMESİ( OCAK 2010)
ULUSAL MATEMATİK OLİMPİYATLARI DENEMESİ( OCAK 2010) 1) Bir ABC dik üçgeninde B açısı diktir. AB kenarı üzerinde alınan bir D noktası için m( BCD) m( DCA) dır. BC kenarı üzerinde alınan bir E noktası için
DetaylıDosya Sıkıştırma (File Compression) Kütük Organizasyonu 1
Dosya Sıkıştırma (File Compression) Kütük Organizasyonu İçerik Dosya sıkıştırma nedir? Dosya sıkıştırma yöntemleri nelerdir? Run-Length Kodlaması Huffman Kodlaması Kütük Organizasyonu 2 Dosya Sıkıştırma
DetaylıSıralı Örüntü Madenciliği ile e-bankacılıkta Kullanıcı Davranışlarının Modellenmesi
Akademik Bilişim 4 - XVI. Akademik Bilişim Konferansı Bildirileri 5-7 Şubat 204 Mersin Üniversitesi Sıralı Örüntü Madenciliği ile e-bankacılıkta Kullanıcı Davranışlarının Modellenmesi Eren Berk Aytaç,
DetaylıVERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr
VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma
DetaylıVERİ KÜMELERİNİ BETİMLEME
BETİMLEYİCİ İSTATİSTİK VERİ KÜMELERİNİ BETİMLEME Bir amaç için derlenen verilerin tamamının olduğu, veri kümesindeki birimlerin sayısal değerlerinden faydalanarak açık ve net bir şekilde ilgilenilen özellik
DetaylıYrd. Doç. Dr. Ümit ATİLA
Yrd. Doç. Dr. Ümit ATİLA Sıralama Bir grup veriyi azalan veya artan şekilde yerleştirme. Bilgisayar sistemleri için veri sıralama çok önemlidir. Sıralama işlemi, hem arama işlemlerini hem de bir grup veriyi
DetaylıToplam Olasılık Prensibi
1 Toplam Olasılık Prensibi A 1, A 2,, A n karşılıklı kapsamayan ve birlikte tamamlayan olaylar kümesi olsun: A k A A j 0 = 0 k j j nn j j 1 = 1 B, S içinde herhangi bir olay ise k j AA j = ise S ise Pr[A
Detaylı1994 ÖYS. 6. x, y, z sıfırdan büyük birer tam sayı ve 2x+3y-z=94 olduğuna göre, x in en küçük değeri kaçtır?
99 ÖYS. Üç basamaklı abc sayısının birler basamağı tür. Birler basamağı ile yüzler basamağı değiştirildiğinde oluşan yeni sayı, abc sayısından 97 küçüktür. Buna göre, abc sayısının yüzler basamağı kaçtır?.,
DetaylıAB yönlü doğru parçası belirtilmiş olur. Doğrultusu, uzunluğu ve yönünden söz edilebilir.
HAZİNE-1 HAZİNE-2 Doğrunun A ve B noktaları ile bunların arasında kalan bütün noktalarından oluşan kümeye [AB] DOĞRU PARÇASI denir. Doğrultusu (üzerinde bulunduğu doğru) ve uzunluğundan söz edilebilir.
DetaylıÖZEL EGE LİSESİ 12. OKULLAR ARASI MATEMATİK YARIŞMASI 9. SINIF ELEME SINAVI TEST SORULARI. 4. c tabanındaki iki basamaklı ardışık üç
1. Rakamları toplamından büyük olan kaç tane doğal sayı vardır? A) 0 B) 1 C) 3 D) 8 E) 10 4. c tabanındaki iki basamaklı ardışık üç sayının toplamı (0) cc ise c nin alamayacağı en büyük değer kaçtır? A)
DetaylıBLM-431 YAPAY ZEKA. Ders-4 Bilgisiz Arama Yöntemleri. Yrd. Doç. Dr. Ümit ATİLA
BLM-431 YAPAY ZEKA Ders-4 Bilgisiz Arama Yöntemleri Yrd. Doç. Dr. Ümit ATİLA umitatila@karabuk.edu.tr http://web.karabuk.edu.tr/umitatilla/ Dersin Hedefleri Aşağıda verilen arama stratejilerini anlamak
DetaylıAğaç (Tree) Veri Modeli
Ağaç (Tree) Veri Modeli 1 2 Ağaç Veri Modeli Temel Kavramları Ağaç, bir kök işaretçisi, sonlu sayıda düğümleri ve onları birbirine bağlayan dalları olan bir veri modelidir; aynı aile soyağacında olduğu
DetaylıYZM ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ
YZM 3207- ALGORİTMA ANALİZİ VE TASARIM DERS#2: ALGORİTMA ANALİZİ Algoritma Analizi Çerçevesi Algoritma Analizinde Göz Önünde Bulundurulması Gerekenler Neler? Algoritmanın Doğruluğu (Correctness) Zaman
DetaylıVERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN
VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma Kümeleme
DetaylıYZM YAPAY ZEKA DERS#6: REKABET ORTAMINDA ARAMA
YZM 3217- YAPAY ZEKA DERS#6: REKABET ORTAMINDA ARAMA Oyun Oynama Çoklu vekil ortamı-her bir vekil karar verirken diğer vekillerin de hareketlerini dikkate almalı ve bu vekillerin onun durumunu nasıl etkileyeceğini
DetaylıSözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme
1 Cem Rıfkı Aydın, 1 Ali Erkan, 1 Tunga Güngör, 2 Hidayet Takçı 1 Boğaziçi Üniversitesi, 2 Cumhuriyet Üniversitesi Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme AB 14 7 Şubat 2014
DetaylıKümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir
Kümeleme Analizi: Temel Kavramlar ve Algoritmalar Kümeleme Analizi Nedir? Her biri bir dizi öznitelik ile, veri noktalarının bir kümesi ve noktalar arasındaki benzerliği ölçen bir benzerlik ölçümü verilmiş
DetaylıKÜMELER. İyi tanımlanmış nesneler topluluğuna küme denir. Bir küme, birbirinden farklı nesnelerden oluşur. Bu nesneler somut veya soyut olabilir.
1 KÜMELER İyi tanımlanmış nesneler topluluğuna küme denir. ir küme, birbirinden farklı nesnelerden oluşur. u nesneler somut veya soyut olabilir. Kümeyi oluşturan nesnelerin her birine eleman(öğe) denir.
DetaylıTANI TESTLERINE GIRIŞ & ROC ANALİZİ
TANI TESTLERINE GIRIŞ & ROC ANALİZİ Yrd.Doç.Dr. Selçuk Korkmaz Trakya Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Turcosa Analitik Çözümlemeler selcukorkmaz@gmail.com ÇOCUK NEFROLOJİ DERNEĞİ
DetaylıSINAV TARİHİ VE SAATİ : 25 Nisan 2009 Cumartesi, OKULU / SINIFI :
TÜBİTAK TÜRKİYE BİLİMSEL VE TEKNOLOJİK ARAŞTIRMA KURUMU BİLİM İNSANI DESTEKLEME DAİRE BAŞKANLIĞI 14. ULUSAL İLKÖĞRETİM MATEMATİK OLİMPİYATI SINAVI - 2009 Birinci Bölüm Soru kitapçığı türü SINAV TARİHİ
DetaylıSINAV TARİHİ VE SAATİ : 25 Nisan 2009 Cumartesi, OKULU / SINIFI :
TÜBİTAK TÜRKİYE BİLİMSEL VE TEKNOLOJİK ARAŞTIRMA KURUMU BİLİM İNSANI DESTEKLEME DAİRE BAŞKANLIĞI 14. ULUSAL İLKÖĞRETİM MATEMATİK OLİMPİYATI SINAVI - 2009 Birinci Bölüm Soru kitapçığı türü SINAV TARİHİ
DetaylıRASTGELE SAYI ÜRETİMİ VE UYGULANAN TESTLER HAZIRLAYAN: ÖZLEM AYDIN
RASTGELE SAYI ÜRETİMİ VE UYGULANAN TESTLER HAZIRLAYAN: ÖZLEM AYDIN RASTGELE SAYILARIN ÜRETİLMESİ Rastgele değişimler yapay tablolardan veya parametreleri verilen teorik dağılım fonksiyonlarından elde edilir.
Detaylı6.Hafta Kıyım Fonksiyonu (Hashing), BST. Doğrudan erişim tabloları Çarpışmaları ilmekleme ile çözmek Kıyım fonksiyonu seçimi Açık adresleme
1 6.Hafta Kıyım Fonksiyonu (Hashing), BST Doğrudan erişim tabloları Çarpışmaları ilmekleme ile çözmek Kıyım fonksiyonu seçimi Açık adresleme Sembol-tablosu problemi 2 Doğrudan erişim tablosu 3 4 Çözüm
DetaylıGraflar bilgi parçaları arasındaki ilişkileri gösterirler.
Graflar (Graphs) Graf gösterimi Uygulama alanları Graf terminolojisi Depth first dolaşma Breadth first dolaşma Topolojik sıralama Yrd.Doç.Dr. M. Ali Akcayol Graflar Graflar bilgi parçaları arasındaki ilişkileri
DetaylıApriori Algoritmasının Farklı Veri Kümelerine Uygulanması
Apriori Algoritmasının Farklı Veri Kümelerine Uygulanması M. Emin Eker 1, Recai Oktaş 2, Gökhan Kayhan 3 1 Ondokuz Mayıs Üniversitesi, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalı, Samsun
DetaylıAlgoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması. Mustafa Kemal Üniversitesi
Algoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması Ağaç, verilerin birbirine sanki bir ağaç yapısı oluşturuyormuş gibi sanal olarak bağlanmasıyla elde edilen hiyararşik yapıya sahip
DetaylıULAŞTIRMA MODELİ VE ÇEŞİTLİ ULAŞTIRMA MODELLERİ
ULAŞTIRMA MODELİ VE ÇEŞİTLİ ULAŞTIRMA MODELLERİ Özlem AYDIN Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü ULAŞTIRMA MODELİNİN TANIMI Ulaştırma modeli, doğrusal programlama probleminin özel bir şeklidir.
DetaylıTANI TESTLERİNİN İSTATİSTİKSEL DEĞERLENDİRİLMESİ
TANI TESTLERİNİN İSTATİSTİKSEL DEĞERLENDİRİLMESİ İÇERİK Tanı testi Altın Standart Test Tanı Testi ile Altın Standart Testin Karşılaştırması İstatistiksel Değerlendirme Duyarlık, Seçicilik,Yanlış Negatif
DetaylıMATEMATİK. Doç Dr Murat ODUNCUOĞLU
MATEMATİK Doç Dr Murat ODUNCUOĞLU Mesleki Matematik 1 TEMEL KAVRAMLAR RAKAM Sayıları yazmak için kullandığımız işaretlere rakam denir. Sayıları ifade etmeye yarayan sembollere rakam denir. Rakamlar 0,1,2,3,4,5,6,7,8,9
DetaylıÜNİTE 1: TEMEL KAVRAMLAR
MATEMATİK ÜNİTE : TEMEL KAVRAMLAR Temel Kavramlar ADF 0 RAKAM Sayı oluşturmak için kullanılan sembollere... denir. 0 luk sayma düzenindeki rakamlar 0,,,... 8 ve 9 olup 0 tanedir. örnek a, b, c sıfırdan
DetaylıBLM 221 MANTIK DEVRELERİ
6. HAFTA BLM 221 MANTIK DEVRELERİ Prof Dr Mehmet AKBABA mehmetakbaba@karabuk.edu.tr Temel Kavramlar KARNO HARITALARI İki ve Üç değişkenli Karno Haritaları Dört değişkenli Karno Haritaları Beş değişkenli
Detaylı14. LİSELERARASI MATEMATİK YARIŞMASI EKİP FİNAL SORULARI
14. LİSELERARASI MATEMATİK YARIŞMASI EKİP FİNAL SORULARI - 008 SORU -1 1 0.7 0.1 0.48 = 0.018 0.8 0. eşitliğini sağlayan sayısı kaçtır? [ 0.15] SORU - c d d c a b 4 c d b b a ifadesinin i i sayısal ldeğeri
DetaylıAPRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ SELECTION BEHAVIOR ANALYSIS OF TECHNICAL ELECTIVE COURSES USING APRIORI ALGORITHM
APRİORİ ALGORİTMASI İLE TEKNİK SEÇMELİ DERS SEÇİM ANALİZİ Nesibe Yalçın 1 Emre Güngör 1 Nilüfer Yurtay ÖZET Bu çalışmada, Veri Madenciliği' nde Birliktelik Kuralı çıkarım algoritmalarından biri olan Apriori
DetaylıKonular. VERİ MADENCİLİĞİ Veri Önişleme. Değer Kümeleri. Veri Nedir? Nitelik Türleri. Konular. Veri Veri Önişleme Benzerlik ve farklılık
0 VERİ MADENCİLİĞİ Veri Önişleme Yrd. Doç. Dr. Şule Gündüz Öğüdücü Veri Nedir? nesneler ve nesnelerin niteliklerinden oluşan küme kayıt (record), varlık (entity), örnek (sample, instance) nesne için kullanılabilir.
DetaylıFiziksel Tasarım Konuları. Dosya Organizasyon Teknikleri Kayıt Erişim Yöntemleri Veri Yapıları
Fiziksel Tasarım Konuları Dosya Organizasyon Teknikleri Kayıt Erişim Yöntemleri Veri Yapıları Fiziksel Tasarım İyi performans için Hızlı cevap zamanı Minimum disk erişimi Disk Yapısı İz(Track) Silindir
DetaylıXII. Ulusal Matematik Olimpiyatı Birinci Aşama Sınavı
XII. Ulusal Matematik Olimpiyatı Birinci Aşama Sınavı A 1. Köşeleri, yarıçapı 1 olan çemberin üstünde yer alan düzgün bir n-genin çevre uzunluğunun alanına oranı 4 3 ise, n kaçtır? 3 a) 3 b) 4 c) 5 d)
DetaylıDr. Hidayet Takçı. Veri Madenciliği Dersi GYTE Dr. Hidayet Takçı 10/05/2008 1
İkinci Ders Veri Madenciliği: Veri Dr. Hidayet Takçı Veri Madenciliği Dersi GYTE Dr. Hidayet Takçı 10/05/2008 1 Veri Nedir? Sayısal veya mantıksal her türlü değer bir veridir. Öznitelik Bir nesneye ait
DetaylıTemel Kavramlar. (r) Sıfırdan farklı kompleks sayılar kümesi: C. (i) Rasyonel sayılar kümesi: Q = { a b
Bölüm 1 Temel Kavramlar Bu bölümde bağıntı ve fonksiyon gibi bazı temel kavramlar üzerinde durulacak, tamsayıların bazı özellikleri ele alınacaktır. Bu çalışma boyunca kullanılacak bazı kümelerin gösterimleri
DetaylıBölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e
Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler Fundamentals, Design, and Implementation, 9/e Üç Şema Modeli Üç şema modeli 1975 de ANSI/SPARC tarafından geliştirildi Veri modellemeninç ve rolünü
Detaylı26 Nisan 2009 Pazar,
TÜBİTAK TÜRKİYE BİLİMSEL VE TEKNOLOJİK ARAŞTIRMA KURUMU BİLİM İNSANI DESTEKLEME DAİRE BAŞKANLIĞI 17. ULUSAL MATEMATİK OLİMPİYATI - 2009 BİRİNCİ AŞAMA SINAVI Soru kitapçığı türü A 26 Nisan 2009 Pazar, 13.00-15.30
DetaylıYönetim Bilişim Sistemleri Alanında Metin Madenciliği ile Bilgi Haritalama
Yönetim Bilişim Sistemleri Alanında Metin Madenciliği ile Bilgi Haritalama Öğr. Gör. Dr. Ufuk ÇELİK Bandırma Onyedi Eylül Üniversitesi ucelik001@gmail.com Yrd. Doç. Dr. Deniz HERAND Türk Alman Üniversitesi
Detaylı