KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN
Giriş Bilgi teknolojisindeki gelişmeler ve verilerin dijital ortamda saklanmaya başlanması ile yeryüzündeki bilgi miktarı her 20 ayda iki katına çıkmaktadır. Dünya üzerinde hızla artan bu veri akla hemen mevcut verilerden daha verimli bir sekil de nasıl faydalanırız? sorusunu getirmektedir. Veri tabanlarındaki bu veriler üzerinde analiz yapmak ve karar destek aşamasında kullanmak, herhangi bir araç kullanmaksızın imkânsız hale gelmiştir. Bu noktada akıllı veri işleme metotları diğer adıyla veri madenciliği (Data Mining) karşımıza çıkmaktadır. Kaba küme teorisi Pawlak tarafından 1985 de ortaya atılmıştır (Pawlak, 2002). Kaba küme teorisi, bulanık (Fuzzy) kümeler gibi kesin olmayan yapıların analizinde kullanılmaktadır.
Bilgi Sistemi Bilgi sistemini tablo olarak düşürsek, tablonun kolonları nitelikleri (attiribute), satırları ise nesneleri (object) temsil etmektedir. IS = (U,A) U evrensel küme, A nitelik kümesi Her nitelik a A bir değere Va ve bir değer uzayına (value domain) sahiptir. Bilgi sisteminde niteliklere ait bir bilgi fonksiyonu (Information Function) fa bulunmaktadır. fa = U Va Karar niteliğine sahip bilgi sistemlerine Karar Sistemleri (Decision System) denir. DS = (U,A {d}) U evrensel küme, A nitelik kümesi, d karar niteliği
Bilgi Sistemi (Devam) U a 1 a 2 a 3 d U = {X1, X2, X3,,X11}. A = {a1, a2, a3}, V1 = {1, 2, 3}, X 1 2 1 3 1 X 2 3 2 1 2 X 3 2 1 3 1 X 4 2 2 3 2 V2 = {1, 2, 3}, V3 = {1, 2, 3, 4} X 5 1 1 4 3 X 6 1 1 2 3 X 7 3 2 1 2 X 8 1 1 4 3 X 9 2 1 3 1 X 10 3 2 1 2
Benzerlik (indiscerniblity) Benzerlik İlişkisi: İki nesne arasında seçilen nitelik alt kümesindeki bütün niteliklerin değeri aynı ise aralarında benzerlik ilişkisi vardır. Benzerlik ilişkisi herhangi bir B (B A) nitelik alt kümesi için Ind(B) şeklinde gösterilmektedir. U/A a 1 a 2 a 3 Z 1 ={ X 1, X 3, X 9 } 1 3 1 Z 2 ={ X 2, X 7, X 10 } 2 1 2 Her b B için b(xi) = b(xj) olur. Aralarında benzerlik ilişkisi bulunan nesnelerin oluşturduğu kümeye temel küme (Elementary Set) denir. Xi nesnesini Ind(B) ilişkisi ile ait olduğu temel küme [Xi]Ind(B) şeklinde gösterilir. Z 3 ={ X 4 } 1 1 3 Z 4 ={ X 5, X 8 } 2 2 3 Z 5 ={ X 6 } 2 2 3
Yaklaşım Kümeleri Düşük Yaklaşım Yüksek Yaklaşım Düşük Yaklaşım kümesi: Düşük yaklaşım kümesindeki nesneler kesin olarak bulundukları kümeye aittir. Yüksek Yaklaşım kümesi: Yüksek yaklaşım kümesindeki neneler ise bulundukları kümeye kesin olarak ait değildirler. X (X U) evrensel kümenin bir alt kümesi, B (B A) ise nitelik kümesini bir alt kümesi olsun BX * = { Xi U [Xi]Ind(B) X } BX * = { Xi U [Xi]Ind(B) X 0 }
Bilgi sisteminin İndirgenmesi İndirgenmiş nitelikler Kümesi: bilgi sistemindeki veri yapısını temsil edecek minimum nitelik kümeleridir. Çekirdek nitelikler kümesi: indirgenmiş nitelikler kümelerinin ortak elemanlarından oluşur. Benzerlik matrisi :İndirgenmiş nitelik kümeleri benzerlik matrisi kullanılarak bulunmaktadır. Benzerlik matrisi nxn boyutuna bir matris olup, n ise temel küme sayısıdır. Benzerlik matrisinin dij elemanını hesaplarken i ve j inci temel kümelerin niteliklerinin aldığı değerlere bakılır. Değerleri farklı olan nitelikler, matrisin dij elemanını oluşturmaktadır. Benzerlik Fonksiyonu : Bu fonksiyon lojik bir fonksiyondur. Benzerlik matrisindeki elemanlar kendi aralarında VEYA (+) işlemi, birbirleri arasında ise VE (*) işlenme tabidir. Benzerlik fonksiyonu indirgenerek indirgenmiş nitelik kümeleri bulunur.
Benzerlik Matrisi Z 1 Z 2 Z 3 Z 4 Z 5 Z 1 Z 2 a1,a2,a3 Z 3 a2 a1,a3 Z 4 a1,a3 a1,a2,a3 a1,a2,a3 Z 5 a1,a3 a1,a2,a3 a1,a2,a3 a3
Benzerlik Fonksiyonu f(a) = (a1+a2+a3)(a2)(a1+a3)(a1+a3) (a1+a3)(a1+a2+a3)(a1+a2+a3) (a1+a2+a3)(a1+a2+a3) (a3) = a1a2 +a2a3 indirgenmiş nitelik kümesi ile bilgi sistemi daha az sayıda nitelik ile tanımlanır. Oluşturulan minimum nitelik kümesi ile kurallar tabanı oluşturulur.
İndirgenmiş Bilgi Sistemi U a 1 a 2 d X 1 2 1 1 X 2 3 2 2 X 3 2 1 1 X 4 2 2 2 X 5 1 1 3 X 6 1 1 3 X 7 3 2 2 X 8 1 1 3 X 9 2 1 1 X 10 3 2 2
Benzerlik Matrisi 1 2 3 4 5 6 7 8 9 10 1 - a1,a2 - a2 a1 a1 a1,a2 a1 - a1,a2 2 a1,a2 - a1,a2 - a1,a2 a1,a2 - a1,a2 a1,a2-3 - a1,a2 - a2 a1 a1 a1,a2 a1 - a1,a2 4 a2 - a2 - a1,a2 a1,a2 - a1,a2 a2-5 a1 a1,a2 a1 a1,a2 - - a1,a2 - a1 a1,a2 6 a1 a1,a2 a1 a1,a2 - - a1,a2 - a1 a1,a2 7 a1,a2 - a1,a2 - a1,a2 a1,a2 - a1,a2 a1,a2-8 a1 a1,a2 a1 a1,a2 - - a1,a2 - a1 a1,a2 9 - a1,a2 - a2 a1 a1 a1,a2 a1 - a1,a2 10 a1,a2 - a1,a2 - a1,a2 a1,a2 - a1,a2 a1,a2 -
Benznerlik Fonksiyonları f1=(a1+a2)a2a1a1(a1+a2)a1(a1+a2)=a1a2 f2=(a1+a2) (a1+a2) (a1+a2) (a1+a2) (a1+a2) (a1+a2)=a1+a2 f3=(a1+a2)a2a1a1(a1+a2)a1(a1+a2)=a1a2 f4=a2a2(a1+a2) (a1+a2) (a1+a2)a2=a2 f5=a1(a1+a2)a1(a1+a2) (a1+a2)a1(a1+a2)=a1 f6=a1(a1+a2)a1(a1+a2) (a1+a2)a1(a1+a2)=a1 f7=(a1+a2) (a1+a2) (a1+a2) (a1+a2) (a1+a2) (a1+a2)=a1+a2 f8=a1(a1+a2)a1(a1+a2) (a1+a2)a1(a1+a2)=a1 f9=(a1+a2)a2a1a1(a1+a2)a1(a1+a2)=a1a2 f10=(a1+a2) (a1+a2) (a1+a2) (a1+a2) (a1+a2) (a1+a2)=a1+a2
Kural Tablosu U a 1 a 2 d X 1 2 1 1 X 2 * 2 2 X 3 2 1 1 X 4 * 2 2 X 5 1 * 3 X 6 1 * 3 X 7 * 2 2 X 8 1 * 3 X 9 2 1 1 X 10 * 2 2
Sınıflandırma Her karar tablosu aynı zamanda kurallar tabanıdır. Kurallar, Eğer şart ise sonuç ifadeleridir. Şart, koşul niteliklerinin aldığı değerleri, sonuç ise karar niteliklerinin değerini göstermektedir. Bilgi sistemi indirgendiğinde sistemin temelini oluşturan kurallar ortaya çıkmış olur. Yeni bir nesnenin sınıflandırılmasında 3 durum söz konusu olmaktadır. 1. Nesnenin kurallar tarafından kesin olarak sınıflandırılması durumudur 2. Nesne kurallar tarafından kesin olarak sınıflandırılamaması durumudur. 3. Nesne hiçbir kural tarafından sınıflandırılamaması durumudur.
TEŞEKKÜRLER